KR20240045297A - 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체 효소 - Google Patents
조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체 효소 Download PDFInfo
- Publication number
- KR20240045297A KR20240045297A KR1020247008368A KR20247008368A KR20240045297A KR 20240045297 A KR20240045297 A KR 20240045297A KR 1020247008368 A KR1020247008368 A KR 1020247008368A KR 20247008368 A KR20247008368 A KR 20247008368A KR 20240045297 A KR20240045297 A KR 20240045297A
- Authority
- KR
- South Korea
- Prior art keywords
- engineered
- sequence
- polypeptide
- nucleoside
- nucleoside deoxyribosyltransferase
- Prior art date
Links
- 108020004207 Nucleoside deoxyribosyltransferase Proteins 0.000 title claims abstract description 316
- 102000004190 Enzymes Human genes 0.000 title abstract description 116
- 108090000790 Enzymes Proteins 0.000 title abstract description 116
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 406
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 399
- 229920001184 polypeptide Polymers 0.000 claims abstract description 397
- 238000000034 method Methods 0.000 claims abstract description 139
- 150000001875 compounds Chemical class 0.000 claims abstract description 114
- 239000002157 polynucleotide Substances 0.000 claims abstract description 112
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 111
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 111
- 230000000694 effects Effects 0.000 claims abstract description 54
- 239000000203 mixture Substances 0.000 claims abstract description 37
- 238000004519 manufacturing process Methods 0.000 claims abstract description 24
- 239000000758 substrate Substances 0.000 claims description 93
- 238000006467 substitution reaction Methods 0.000 claims description 67
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 60
- 239000002777 nucleoside Substances 0.000 claims description 36
- 239000013604 expression vector Substances 0.000 claims description 28
- 108020004705 Codon Proteins 0.000 claims description 24
- 150000003833 nucleoside derivatives Chemical class 0.000 claims description 17
- 239000012634 fragment Substances 0.000 claims description 10
- 238000012258 culturing Methods 0.000 claims description 8
- 241000186604 Lactobacillus reuteri Species 0.000 claims description 3
- 229940001882 lactobacillus reuteri Drugs 0.000 claims description 3
- 239000013598 vector Substances 0.000 abstract description 37
- 210000004027 cell Anatomy 0.000 description 196
- 235000001014 amino acid Nutrition 0.000 description 168
- 229940024606 amino acid Drugs 0.000 description 143
- 150000001413 amino acids Chemical class 0.000 description 135
- 229940088598 enzyme Drugs 0.000 description 111
- 238000006243 chemical reaction Methods 0.000 description 102
- 108090000623 proteins and genes Proteins 0.000 description 90
- 239000000047 product Substances 0.000 description 54
- -1 MK-8591 (Merck) Chemical class 0.000 description 48
- 150000007523 nucleic acids Chemical class 0.000 description 43
- 230000014509 gene expression Effects 0.000 description 42
- 102000004169 proteins and genes Human genes 0.000 description 32
- 235000018102 proteins Nutrition 0.000 description 28
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 26
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 26
- 239000007787 solid Substances 0.000 description 26
- 230000001580 bacterial effect Effects 0.000 description 25
- 108091026890 Coding region Proteins 0.000 description 23
- 108091028043 Nucleic acid sequence Proteins 0.000 description 23
- 230000008569 process Effects 0.000 description 22
- 239000000243 solution Substances 0.000 description 21
- 238000011068 loading method Methods 0.000 description 20
- 102200118255 rs33931779 Human genes 0.000 description 20
- 230000015572 biosynthetic process Effects 0.000 description 19
- 102000039446 nucleic acids Human genes 0.000 description 19
- 108020004707 nucleic acids Proteins 0.000 description 19
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 239000000126 substance Substances 0.000 description 18
- 125000000539 amino acid group Chemical group 0.000 description 17
- 125000001072 heteroaryl group Chemical group 0.000 description 17
- 241000894007 species Species 0.000 description 17
- 108010076504 Protein Sorting Signals Proteins 0.000 description 16
- 125000000217 alkyl group Chemical group 0.000 description 16
- 125000003835 nucleoside group Chemical group 0.000 description 16
- 230000010076 replication Effects 0.000 description 16
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 15
- 125000003118 aryl group Chemical group 0.000 description 15
- 230000002538 fungal effect Effects 0.000 description 15
- 102200005858 rs137852476 Human genes 0.000 description 15
- 239000002253 acid Substances 0.000 description 14
- 230000002255 enzymatic effect Effects 0.000 description 14
- 239000006166 lysate Substances 0.000 description 14
- 238000002703 mutagenesis Methods 0.000 description 14
- 231100000350 mutagenesis Toxicity 0.000 description 14
- 239000002773 nucleotide Substances 0.000 description 14
- 125000003729 nucleotide group Chemical group 0.000 description 14
- 102000053602 DNA Human genes 0.000 description 13
- 108020004414 DNA Proteins 0.000 description 13
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 13
- 125000004432 carbon atom Chemical group C* 0.000 description 13
- 229960005091 chloramphenicol Drugs 0.000 description 13
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 13
- 238000004128 high performance liquid chromatography Methods 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 13
- 239000002904 solvent Substances 0.000 description 13
- 238000003556 assay Methods 0.000 description 12
- 239000000872 buffer Substances 0.000 description 12
- 238000000855 fermentation Methods 0.000 description 12
- 230000004151 fermentation Effects 0.000 description 12
- 230000002209 hydrophobic effect Effects 0.000 description 12
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 11
- 239000002609 medium Substances 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 11
- 238000000746 purification Methods 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 10
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 125000001424 substituent group Chemical group 0.000 description 10
- WKMPTBDYDNUJLF-UHFFFAOYSA-N 2-fluoroadenine Chemical compound NC1=NC(F)=NC2=C1N=CN2 WKMPTBDYDNUJLF-UHFFFAOYSA-N 0.000 description 9
- 240000006439 Aspergillus oryzae Species 0.000 description 9
- 235000014469 Bacillus subtilis Nutrition 0.000 description 9
- 108700010070 Codon Usage Proteins 0.000 description 9
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 9
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 9
- 230000002378 acidificating effect Effects 0.000 description 9
- 125000000304 alkynyl group Chemical group 0.000 description 9
- 239000011324 bead Substances 0.000 description 9
- 230000002210 biocatalytic effect Effects 0.000 description 9
- 229910052799 carbon Inorganic materials 0.000 description 9
- 102220140316 rs200681141 Human genes 0.000 description 9
- 102220095194 rs876660470 Human genes 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical group N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 8
- 150000007513 acids Chemical class 0.000 description 8
- 102220345957 c.58G>A Human genes 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 125000000623 heterocyclic group Chemical group 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 230000008488 polyadenylation Effects 0.000 description 8
- 239000011541 reaction mixture Substances 0.000 description 8
- 239000004382 Amylase Substances 0.000 description 7
- 108010065511 Amylases Proteins 0.000 description 7
- 102000013142 Amylases Human genes 0.000 description 7
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 7
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 7
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 7
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 7
- GSEJCLTVZPLZKY-UHFFFAOYSA-N Triethanolamine Chemical compound OCCN(CCO)CCO GSEJCLTVZPLZKY-UHFFFAOYSA-N 0.000 description 7
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 7
- 235000019418 amylase Nutrition 0.000 description 7
- 125000000753 cycloalkyl group Chemical group 0.000 description 7
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 7
- 238000006911 enzymatic reaction Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 239000004094 surface-active agent Substances 0.000 description 7
- 238000001890 transfection Methods 0.000 description 7
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 6
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 6
- 241000351920 Aspergillus nidulans Species 0.000 description 6
- 241000193830 Bacillus <bacterium> Species 0.000 description 6
- 244000063299 Bacillus subtilis Species 0.000 description 6
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 6
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 6
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 6
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 6
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 125000004429 atom Chemical group 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 6
- 102000037865 fusion proteins Human genes 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 125000005842 heteroatom Chemical group 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 239000008188 pellet Substances 0.000 description 6
- 239000000843 powder Substances 0.000 description 6
- 239000000376 reactant Substances 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- 230000028327 secretion Effects 0.000 description 6
- 210000005253 yeast cell Anatomy 0.000 description 6
- GHCZTIFQWKKGSB-UHFFFAOYSA-N 2-hydroxypropane-1,2,3-tricarboxylic acid;phosphoric acid Chemical compound OP(O)(O)=O.OC(=O)CC(O)(C(O)=O)CC(O)=O GHCZTIFQWKKGSB-UHFFFAOYSA-N 0.000 description 5
- 241000228245 Aspergillus niger Species 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 241000194108 Bacillus licheniformis Species 0.000 description 5
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 5
- YLQBMQCUIZJEEH-UHFFFAOYSA-N Furan Chemical group C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 5
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 5
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 5
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 5
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 5
- 125000003342 alkenyl group Chemical group 0.000 description 5
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical group [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 239000005549 deoxyribonucleoside Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000001952 enzyme assay Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 229910052751 metal Inorganic materials 0.000 description 5
- 239000002184 metal Substances 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 230000035484 reaction time Effects 0.000 description 5
- 239000011347 resin Substances 0.000 description 5
- 229920005989 resin Polymers 0.000 description 5
- 102220091201 rs148363262 Human genes 0.000 description 5
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 5
- 239000000377 silicon dioxide Substances 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 208000030507 AIDS Diseases 0.000 description 4
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 4
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 241000223218 Fusarium Species 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 4
- 102000005720 Glutathione transferase Human genes 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- 150000008575 L-amino acids Chemical class 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- KSPIYJQBLVDRRI-UHFFFAOYSA-N N-methylisoleucine Chemical compound CCC(C)C(NC)C(O)=O KSPIYJQBLVDRRI-UHFFFAOYSA-N 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical group C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 4
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical group C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 4
- 241000235402 Rhizomucor Species 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 4
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 4
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 4
- YTPLMLYBLZKORZ-UHFFFAOYSA-N Thiophene Chemical group C=1C=CSC=1 YTPLMLYBLZKORZ-UHFFFAOYSA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 229960003767 alanine Drugs 0.000 description 4
- 108090000637 alpha-Amylases Proteins 0.000 description 4
- 102000004139 alpha-Amylases Human genes 0.000 description 4
- 229940024171 alpha-amylase Drugs 0.000 description 4
- 239000013592 cell lysate Substances 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 239000005289 controlled pore glass Substances 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 239000001177 diphosphate Substances 0.000 description 4
- 235000011180 diphosphates Nutrition 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 125000001820 oxy group Chemical group [*:1]O[*:2] 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 235000021317 phosphate Nutrition 0.000 description 4
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 4
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 102200061298 rs1064795967 Human genes 0.000 description 4
- 102200027696 rs587777403 Human genes 0.000 description 4
- 239000007921 spray Substances 0.000 description 4
- 239000011593 sulfur Chemical group 0.000 description 4
- 229910052717 sulfur Chemical group 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- SXGMVGOVILIERA-UHFFFAOYSA-N 2,3-diaminobutanoic acid Chemical compound CC(N)C(N)C(O)=O SXGMVGOVILIERA-UHFFFAOYSA-N 0.000 description 3
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 3
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 3
- PECYZEOJVXMISF-UHFFFAOYSA-N 3-aminoalanine Chemical compound [NH3+]CC(N)C([O-])=O PECYZEOJVXMISF-UHFFFAOYSA-N 0.000 description 3
- JJDJLFDGCUYZMN-QMMMGPOBSA-N 3-chloro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(Cl)=C1 JJDJLFDGCUYZMN-QMMMGPOBSA-N 0.000 description 3
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 108010037870 Anthranilate Synthase Proteins 0.000 description 3
- 241000194107 Bacillus megaterium Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 241000186216 Corynebacterium Species 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 3
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical group C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- 102100034343 Integrase Human genes 0.000 description 3
- 102100027612 Kallikrein-11 Human genes 0.000 description 3
- 241000235058 Komagataella pastoris Species 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 3
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 3
- SBKRTALNRRAOJP-BWSIXKJUSA-N N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methylheptanamide (6S)-N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methyloctanamide sulfuric acid Chemical compound OS(O)(=O)=O.CC(C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O.CC[C@H](C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O SBKRTALNRRAOJP-BWSIXKJUSA-N 0.000 description 3
- 229930182474 N-glycoside Natural products 0.000 description 3
- 241000520272 Pantoea Species 0.000 description 3
- 241000235648 Pichia Species 0.000 description 3
- 108010093965 Polymyxin B Proteins 0.000 description 3
- 239000004743 Polypropylene Substances 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 101710152431 Trypsin-like protease Proteins 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 241000235013 Yarrowia Species 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- 125000001931 aliphatic group Chemical group 0.000 description 3
- 125000003545 alkoxy group Chemical group 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 239000002518 antifoaming agent Substances 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- GFZWHAAOIVMHOI-UHFFFAOYSA-N azetidine-3-carboxylic acid Chemical compound OC(=O)C1CNC1 GFZWHAAOIVMHOI-UHFFFAOYSA-N 0.000 description 3
- XSCHRSMBECNVNS-UHFFFAOYSA-N benzopyrazine Natural products N1=CC=NC2=CC=CC=C21 XSCHRSMBECNVNS-UHFFFAOYSA-N 0.000 description 3
- 239000011942 biocatalyst Substances 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 239000007979 citrate buffer Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 229920001577 copolymer Polymers 0.000 description 3
- 239000006184 cosolvent Substances 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 150000002341 glycosylamines Chemical class 0.000 description 3
- 125000004447 heteroarylalkenyl group Chemical group 0.000 description 3
- 125000005312 heteroarylalkynyl group Chemical group 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Chemical group C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 239000003960 organic solvent Substances 0.000 description 3
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical class [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 239000008363 phosphate buffer Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 229920000193 polymethacrylate Polymers 0.000 description 3
- 229960003548 polymyxin b sulfate Drugs 0.000 description 3
- 229920001155 polypropylene Polymers 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 125000004076 pyridyl group Chemical group 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 125000006413 ring segment Chemical group 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 102220214817 rs757622849 Human genes 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 125000000547 substituted alkyl group Chemical group 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- FQRURPFZTFUXEZ-MRVPVSSYSA-N (2s)-2,3,3,3-tetrafluoro-2-(n-fluoroanilino)propanoic acid Chemical compound OC(=O)[C@](F)(C(F)(F)F)N(F)C1=CC=CC=C1 FQRURPFZTFUXEZ-MRVPVSSYSA-N 0.000 description 2
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 2
- PECGVEGMRUZOML-AWEZNQCLSA-N (2s)-2-amino-3,3-diphenylpropanoic acid Chemical compound C=1C=CC=CC=1C([C@H](N)C(O)=O)C1=CC=CC=C1 PECGVEGMRUZOML-AWEZNQCLSA-N 0.000 description 2
- GDMOHOYNMWWBAU-QMMMGPOBSA-N (2s)-2-amino-3-(3-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(Br)=C1 GDMOHOYNMWWBAU-QMMMGPOBSA-N 0.000 description 2
- BURBNIPKSRJAIQ-QMMMGPOBSA-N (2s)-2-amino-3-[3-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(C(F)(F)F)=C1 BURBNIPKSRJAIQ-QMMMGPOBSA-N 0.000 description 2
- YTHDRUZHNYKZGF-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(3-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC([N+]([O-])=O)=C1 YTHDRUZHNYKZGF-QMMMGPOBSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- 238000005160 1H NMR spectroscopy Methods 0.000 description 2
- HBEDSQVIWPRPAY-UHFFFAOYSA-N 2,3-dihydrobenzofuran Chemical compound C1=CC=C2OCCC2=C1 HBEDSQVIWPRPAY-UHFFFAOYSA-N 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N 2,4-diaminobutyric acid Chemical compound NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- WTOFYLAWDLQMBZ-UHFFFAOYSA-N 2-azaniumyl-3-thiophen-2-ylpropanoate Chemical compound OC(=O)C(N)CC1=CC=CS1 WTOFYLAWDLQMBZ-UHFFFAOYSA-N 0.000 description 2
- MLLSSTJTARJLHK-UHFFFAOYSA-N 3-aminocyclopentane-1-carboxylic acid Chemical compound NC1CCC(C(O)=O)C1 MLLSSTJTARJLHK-UHFFFAOYSA-N 0.000 description 2
- JZRBSTONIYRNRI-VIFPVBQESA-N 3-methylphenylalanine Chemical compound CC1=CC=CC(C[C@H](N)C(O)=O)=C1 JZRBSTONIYRNRI-VIFPVBQESA-N 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- JJMDCOVWQOJGCB-UHFFFAOYSA-N 5-aminopentanoic acid Chemical compound [NH3+]CCCCC([O-])=O JJMDCOVWQOJGCB-UHFFFAOYSA-N 0.000 description 2
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 2
- UJOBWOGCFQCDNV-UHFFFAOYSA-N 9H-carbazole Chemical compound C1=CC=C2C3=CC=CC=C3NC2=C1 UJOBWOGCFQCDNV-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 241000186063 Arthrobacter Species 0.000 description 2
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 2
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241001328122 Bacillus clausii Species 0.000 description 2
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 2
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 2
- 241000194103 Bacillus pumilus Species 0.000 description 2
- 101000755953 Bacillus subtilis (strain 168) Ribosome maturation factor RimP Proteins 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 241001453698 Buchnera <proteobacteria> Species 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 102000010911 Enzyme Precursors Human genes 0.000 description 2
- 108010062466 Enzyme Precursors Proteins 0.000 description 2
- 241000588698 Erwinia Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 2
- 108091060211 Expressed sequence tag Proteins 0.000 description 2
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 108010078851 HIV Reverse Transcriptase Proteins 0.000 description 2
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 2
- JPXZQMKKFWMMGK-KQYNXXCUSA-N IDP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(N=CNC2=O)=C2N=C1 JPXZQMKKFWMMGK-KQYNXXCUSA-N 0.000 description 2
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 2
- QUOGESRFPZDMMT-UHFFFAOYSA-N L-Homoarginine Natural products OC(=O)C(N)CCCCNC(N)=N QUOGESRFPZDMMT-UHFFFAOYSA-N 0.000 description 2
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 2
- QUOGESRFPZDMMT-YFKPBYRVSA-N L-homoarginine Chemical compound OC(=O)[C@@H](N)CCCCNC(N)=N QUOGESRFPZDMMT-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000589323 Methylobacterium Species 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 241001467552 Mycobacterium bovis BCG Species 0.000 description 2
- VEYYWZRYIYDQJM-ZETCQYMHSA-N N(2)-acetyl-L-lysine Chemical compound CC(=O)N[C@H](C([O-])=O)CCCC[NH3+] VEYYWZRYIYDQJM-ZETCQYMHSA-N 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- AKCRVYNORCOYQT-YFKPBYRVSA-N N-methyl-L-valine Chemical compound CN[C@@H](C(C)C)C(O)=O AKCRVYNORCOYQT-YFKPBYRVSA-N 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 2
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 2
- 241000588912 Pantoea agglomerans Species 0.000 description 2
- 241000588696 Pantoea ananatis Species 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 241000529953 Phaffomyces thermotolerans Species 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 239000004698 Polyethylene Substances 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- KYQCOXFCLRTKLS-UHFFFAOYSA-N Pyrazine Chemical group C1=CN=CC=N1 KYQCOXFCLRTKLS-UHFFFAOYSA-N 0.000 description 2
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical compound N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 2
- 102220558209 Ras association domain-containing protein 1_Q69L_mutation Human genes 0.000 description 2
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 2
- 241000190932 Rhodopseudomonas Species 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 108010077895 Sarcosine Proteins 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000256248 Spodoptera Species 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 241000588901 Zymomonas Species 0.000 description 2
- 108010048241 acetamidase Proteins 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 125000002252 acyl group Chemical group 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000004453 alkoxycarbonyl group Chemical group 0.000 description 2
- 125000003282 alkyl amino group Chemical group 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 230000000840 anti-viral effect Effects 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- 229960003121 arginine Drugs 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 125000003710 aryl alkyl group Chemical group 0.000 description 2
- 229960000190 bacillus calmette–guérin vaccine Drugs 0.000 description 2
- 125000000051 benzyloxy group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])O* 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 230000036983 biotransformation Effects 0.000 description 2
- 125000001246 bromo group Chemical group Br* 0.000 description 2
- 102220405733 c.18C>G Human genes 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- 125000005518 carboxamido group Chemical group 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 125000001309 chloro group Chemical group Cl* 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 125000004093 cyano group Chemical group *C#N 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 125000001153 fluoro group Chemical group F* 0.000 description 2
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 2
- 238000004108 freeze drying Methods 0.000 description 2
- 230000005714 functional activity Effects 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 239000008187 granular material Substances 0.000 description 2
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 229910052736 halogen Inorganic materials 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 150000002367 halogens Chemical class 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 125000004404 heteroalkyl group Chemical group 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 125000002883 imidazolyl group Chemical group 0.000 description 2
- 230000003100 immobilizing effect Effects 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- AWJUIBRHMBBTKR-UHFFFAOYSA-N isoquinoline Chemical compound C1=NC=CC2=CC=CC=C21 AWJUIBRHMBBTKR-UHFFFAOYSA-N 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 229940124280 l-arginine Drugs 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 229960003136 leucine Drugs 0.000 description 2
- 125000005647 linker group Chemical group 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 230000002934 lysing effect Effects 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- VWHRYODZTDMVSS-QMMMGPOBSA-N m-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(F)=C1 VWHRYODZTDMVSS-QMMMGPOBSA-N 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 125000001624 naphthyl group Chemical group 0.000 description 2
- 239000006225 natural substrate Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000012074 organic phase Substances 0.000 description 2
- 229920000620 organic polymer Polymers 0.000 description 2
- 229960003104 ornithine Drugs 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- RDOWQLZANAYVLL-UHFFFAOYSA-N phenanthridine Chemical compound C1=CC=C2C3=CC=CC=C3C=NC2=C1 RDOWQLZANAYVLL-UHFFFAOYSA-N 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- HXEACLLIILLPRG-UHFFFAOYSA-N pipecolic acid Chemical compound OC(=O)C1CCCCN1 HXEACLLIILLPRG-UHFFFAOYSA-N 0.000 description 2
- 125000003386 piperidinyl group Chemical group 0.000 description 2
- 229910052697 platinum Inorganic materials 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229920000573 polyethylene Polymers 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 125000006239 protecting group Chemical group 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Chemical group COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000002342 ribonucleoside Substances 0.000 description 2
- 102220195310 rs1057517867 Human genes 0.000 description 2
- 102220261096 rs775847689 Human genes 0.000 description 2
- 102220277134 rs776745497 Human genes 0.000 description 2
- 102220093746 rs876661027 Human genes 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 125000005420 sulfonamido group Chemical group S(=O)(=O)(N*)* 0.000 description 2
- 230000008961 swelling Effects 0.000 description 2
- 230000002522 swelling effect Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 229930192474 thiophene Chemical group 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 229960004295 valine Drugs 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- DTGKSKDOIYIVQL-WEDXCCLWSA-N (+)-borneol Chemical group C1C[C@@]2(C)[C@@H](O)C[C@@H]1C2(C)C DTGKSKDOIYIVQL-WEDXCCLWSA-N 0.000 description 1
- NMDDZEVVQDPECF-LURJTMIESA-N (2s)-2,7-diaminoheptanoic acid Chemical compound NCCCCC[C@H](N)C(O)=O NMDDZEVVQDPECF-LURJTMIESA-N 0.000 description 1
- ZENNTZUZBRESKJ-ZETCQYMHSA-N (2s)-2-(1-benzothiophen-2-ylamino)propanoic acid Chemical compound C1=CC=C2SC(N[C@@H](C)C(O)=O)=CC2=C1 ZENNTZUZBRESKJ-ZETCQYMHSA-N 0.000 description 1
- IYKLZBIWFXPUCS-VIFPVBQESA-N (2s)-2-(naphthalen-1-ylamino)propanoic acid Chemical compound C1=CC=C2C(N[C@@H](C)C(O)=O)=CC=CC2=C1 IYKLZBIWFXPUCS-VIFPVBQESA-N 0.000 description 1
- MRTPISKDZDHEQI-YFKPBYRVSA-N (2s)-2-(tert-butylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC(C)(C)C MRTPISKDZDHEQI-YFKPBYRVSA-N 0.000 description 1
- NPDBDJFLKKQMCM-SCSAIBSYSA-N (2s)-2-amino-3,3-dimethylbutanoic acid Chemical compound CC(C)(C)[C@H](N)C(O)=O NPDBDJFLKKQMCM-SCSAIBSYSA-N 0.000 description 1
- WBZIGVCQRXJYQD-YFKPBYRVSA-N (2s)-2-amino-3-(1,3-thiazol-4-yl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CSC=N1 WBZIGVCQRXJYQD-YFKPBYRVSA-N 0.000 description 1
- JFVLNTLXEZDFHW-QMMMGPOBSA-N (2s)-2-amino-3-(2-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1Br JFVLNTLXEZDFHW-QMMMGPOBSA-N 0.000 description 1
- NHBKDLSKDKUGSB-VIFPVBQESA-N (2s)-2-amino-3-(2-methylphenyl)propanoic acid Chemical compound CC1=CC=CC=C1C[C@H](N)C(O)=O NHBKDLSKDKUGSB-VIFPVBQESA-N 0.000 description 1
- NRCSJHVDTAAISV-QMMMGPOBSA-N (2s)-2-amino-3-(3,4-dichlorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Cl)C(Cl)=C1 NRCSJHVDTAAISV-QMMMGPOBSA-N 0.000 description 1
- ZHUOMTMPTNZOJE-VIFPVBQESA-N (2s)-2-amino-3-(3-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(C#N)=C1 ZHUOMTMPTNZOJE-VIFPVBQESA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- KWIPUXXIFQQMKN-VIFPVBQESA-N (2s)-2-amino-3-(4-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C#N)C=C1 KWIPUXXIFQQMKN-VIFPVBQESA-N 0.000 description 1
- DQLHSFUMICQIMB-VIFPVBQESA-N (2s)-2-amino-3-(4-methylphenyl)propanoic acid Chemical compound CC1=CC=C(C[C@H](N)C(O)=O)C=C1 DQLHSFUMICQIMB-VIFPVBQESA-N 0.000 description 1
- IOABLDGLYOGEHY-QMMMGPOBSA-N (2s)-2-amino-3-[2-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1C(F)(F)F IOABLDGLYOGEHY-QMMMGPOBSA-N 0.000 description 1
- GNVNKFUEUXUWDV-VIFPVBQESA-N (2s)-2-amino-3-[4-(aminomethyl)phenyl]propanoic acid Chemical compound NCC1=CC=C(C[C@H](N)C(O)=O)C=C1 GNVNKFUEUXUWDV-VIFPVBQESA-N 0.000 description 1
- GAJBPZXIKZXTCG-VIFPVBQESA-N (2s)-2-amino-3-[4-(azidomethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(CN=[N+]=[N-])C=C1 GAJBPZXIKZXTCG-VIFPVBQESA-N 0.000 description 1
- CRFFPDBJLGAGQL-QMMMGPOBSA-N (2s)-2-amino-3-[4-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C(F)(F)F)C=C1 CRFFPDBJLGAGQL-QMMMGPOBSA-N 0.000 description 1
- SDZGVFSSLGTJAJ-ZETCQYMHSA-N (2s)-2-azaniumyl-3-(2-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1[N+]([O-])=O SDZGVFSSLGTJAJ-ZETCQYMHSA-N 0.000 description 1
- ADJZXDVMJPTFKT-JTQLQIEISA-N (2s)-2-azaniumyl-4-(1h-indol-3-yl)butanoate Chemical compound C1=CC=C2C(CC[C@H](N)C(O)=O)=CNC2=C1 ADJZXDVMJPTFKT-JTQLQIEISA-N 0.000 description 1
- FMUMEWVNYMUECA-LURJTMIESA-N (2s)-2-azaniumyl-5-methylhexanoate Chemical compound CC(C)CC[C@H](N)C(O)=O FMUMEWVNYMUECA-LURJTMIESA-N 0.000 description 1
- XOZMVGJVSFVJGA-VIFPVBQESA-N (2s)-3-phenyl-2-(phosphonomethylamino)propanoic acid Chemical compound OP(=O)(O)CN[C@H](C(=O)O)CC1=CC=CC=C1 XOZMVGJVSFVJGA-VIFPVBQESA-N 0.000 description 1
- LJRDOKAZOAKLDU-UDXJMMFXSA-N (2s,3s,4r,5r,6r)-5-amino-2-(aminomethyl)-6-[(2r,3s,4r,5s)-5-[(1r,2r,3s,5r,6s)-3,5-diamino-2-[(2s,3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-6-hydroxycyclohexyl]oxy-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl]oxyoxane-3,4-diol;sulfuric ac Chemical compound OS(O)(=O)=O.N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)N)O[C@@H]1CO LJRDOKAZOAKLDU-UDXJMMFXSA-N 0.000 description 1
- ASWBNKHCZGQVJV-UHFFFAOYSA-N (3-hexadecanoyloxy-2-hydroxypropyl) 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(O)COP([O-])(=O)OCC[N+](C)(C)C ASWBNKHCZGQVJV-UHFFFAOYSA-N 0.000 description 1
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 1
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- BWKMGYQJPOAASG-UHFFFAOYSA-N 1,2,3,4-tetrahydroisoquinoline-3-carboxylic acid Chemical compound C1=CC=C2CNC(C(=O)O)CC2=C1 BWKMGYQJPOAASG-UHFFFAOYSA-N 0.000 description 1
- WJFKNYWRSNBZNX-UHFFFAOYSA-N 10H-phenothiazine Chemical compound C1=CC=C2NC3=CC=CC=C3SC2=C1 WJFKNYWRSNBZNX-UHFFFAOYSA-N 0.000 description 1
- TZMSYXZUNZXBOL-UHFFFAOYSA-N 10H-phenoxazine Chemical compound C1=CC=C2NC3=CC=CC=C3OC2=C1 TZMSYXZUNZXBOL-UHFFFAOYSA-N 0.000 description 1
- BAXOFTOLAUCFNW-UHFFFAOYSA-N 1H-indazole Chemical group C1=CC=C2C=NNC2=C1 BAXOFTOLAUCFNW-UHFFFAOYSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- GWHQTNKPTXDNRM-UHFFFAOYSA-N 2-azaniumyl-3-(2,4-dichlorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=C(Cl)C=C1Cl GWHQTNKPTXDNRM-UHFFFAOYSA-N 0.000 description 1
- UEFLPVKMPDEMFW-UHFFFAOYSA-N 2-azaniumyl-3-(2,4-difluorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=C(F)C=C1F UEFLPVKMPDEMFW-UHFFFAOYSA-N 0.000 description 1
- CVZZNRXMDCOHBG-UHFFFAOYSA-N 2-azaniumyl-3-(2-chlorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=CC=C1Cl CVZZNRXMDCOHBG-UHFFFAOYSA-N 0.000 description 1
- OCDHPLVCNWBKJN-UHFFFAOYSA-N 2-azaniumyl-3-(2-cyanophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=CC=C1C#N OCDHPLVCNWBKJN-UHFFFAOYSA-N 0.000 description 1
- PRAWYXDDKCVZTL-UHFFFAOYSA-N 2-azaniumyl-3-(3,4-difluorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=C(F)C(F)=C1 PRAWYXDDKCVZTL-UHFFFAOYSA-N 0.000 description 1
- NYCRCTMDYITATC-UHFFFAOYSA-N 2-fluorophenylalanine Chemical compound OC(=O)C(N)CC1=CC=CC=C1F NYCRCTMDYITATC-UHFFFAOYSA-N 0.000 description 1
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 1
- VLRSADZEDXVUPG-UHFFFAOYSA-N 2-naphthalen-1-ylpyridine Chemical compound N1=CC=CC=C1C1=CC=CC2=CC=CC=C12 VLRSADZEDXVUPG-UHFFFAOYSA-N 0.000 description 1
- VHMICKWLTGFITH-UHFFFAOYSA-N 2H-isoindole Chemical group C1=CC=CC2=CNC=C21 VHMICKWLTGFITH-UHFFFAOYSA-N 0.000 description 1
- MGADZUXDNSDTHW-UHFFFAOYSA-N 2H-pyran Chemical compound C1OC=CC=C1 MGADZUXDNSDTHW-UHFFFAOYSA-N 0.000 description 1
- CJJYCYZKUNRKFP-UHFFFAOYSA-N 3-azaniumyl-5-phenylpentanoate Chemical compound OC(=O)CC(N)CCC1=CC=CC=C1 CJJYCYZKUNRKFP-UHFFFAOYSA-N 0.000 description 1
- BXRLWGXPSRYJDZ-UHFFFAOYSA-N 3-cyanoalanine Chemical compound OC(=O)C(N)CC#N BXRLWGXPSRYJDZ-UHFFFAOYSA-N 0.000 description 1
- IRZQDMYEJPNDEN-UHFFFAOYSA-N 3-phenyl-2-aminobutanoic acid Natural products OC(=O)C(N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-UHFFFAOYSA-N 0.000 description 1
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 1
- XWHHYOYVRVGJJY-QMMMGPOBSA-N 4-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-QMMMGPOBSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-UHFFFAOYSA-N 4-nitrophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-UHFFFAOYSA-N 0.000 description 1
- GDRVFDDBLLKWRI-UHFFFAOYSA-N 4H-quinolizine Chemical group C1=CC=CN2CC=CC=C21 GDRVFDDBLLKWRI-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 102220540310 5-hydroxytryptamine receptor 7_E72V_mutation Human genes 0.000 description 1
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241001578974 Achlya <moth> Species 0.000 description 1
- 241001134629 Acidothermus Species 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 241001135511 Agrobacterium rubi Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 241000185996 Arthrobacter citreus Species 0.000 description 1
- 241000186074 Arthrobacter globiformis Species 0.000 description 1
- 241000235349 Ascomycota Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- 241000981365 Aspergillus sulphureus Species 0.000 description 1
- 241000223651 Aureobasidium Species 0.000 description 1
- 108090000145 Bacillolysin Proteins 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000193747 Bacillus firmus Species 0.000 description 1
- 241000006382 Bacillus halodurans Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 108010045681 Bacillus stearothermophilus neutral protease Proteins 0.000 description 1
- 241000151861 Barnettozyma salicaria Species 0.000 description 1
- 108091005658 Basic proteases Proteins 0.000 description 1
- 241000221198 Basidiomycota Species 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000186000 Bifidobacterium Species 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241001274890 Boeremia exigua Species 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000149420 Bothrometopus brevis Species 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- 241000605902 Butyrivibrio Species 0.000 description 1
- 101000928995 Caenorhabditis elegans Putative deoxyribose-phosphate aldolase Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241001619326 Cephalosporium Species 0.000 description 1
- 241000146399 Ceriporiopsis Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000190831 Chromatium Species 0.000 description 1
- 241000123346 Chrysosporium Species 0.000 description 1
- 241000193401 Clostridium acetobutylicum Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000429427 Clostridium saccharobutylicum Species 0.000 description 1
- 241001552623 Clostridium tetani E88 Species 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- 241001464948 Coprococcus Species 0.000 description 1
- 101710199851 Copy number protein Proteins 0.000 description 1
- 241000222356 Coriolus Species 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 1
- 241000186226 Corynebacterium glutamicum Species 0.000 description 1
- 241000221755 Cryphonectria Species 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical group 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 102100037802 Deoxyribose-phosphate aldolase Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000935926 Diplodia Species 0.000 description 1
- 101100085603 Drosophila melanogaster nclb gene Proteins 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000194033 Enterococcus Species 0.000 description 1
- 240000000664 Eriochloa polystachya Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 241001608234 Faecalibacterium Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- NIGWMJHCCYYCSF-UHFFFAOYSA-N Fenclonine Chemical compound OC(=O)C(N)CC1=CC=C(Cl)C=C1 NIGWMJHCCYYCSF-UHFFFAOYSA-N 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 102220566478 GDNF family receptor alpha-1_Q69M_mutation Human genes 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 241000896533 Gliocladium Species 0.000 description 1
- 241001401556 Glutamicibacter mysorens Species 0.000 description 1
- SXRSQZLOMIGNAQ-UHFFFAOYSA-N Glutaraldehyde Chemical compound O=CCCCC=O SXRSQZLOMIGNAQ-UHFFFAOYSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- MBZXSJWDBIIBLL-GDVGLLTNSA-N Homoisoleucine Chemical compound CCC(C)C[C@H](N)C(O)=O MBZXSJWDBIIBLL-GDVGLLTNSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-O Htris Chemical compound OCC([NH3+])(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-O 0.000 description 1
- 241000223198 Humicola Species 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- 102220511074 Hydroxycarboxylic acid receptor 3_E31D_mutation Human genes 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- WRYCSMQKUKOKBP-UHFFFAOYSA-N Imidazolidine Chemical compound C1CNCN1 WRYCSMQKUKOKBP-UHFFFAOYSA-N 0.000 description 1
- 108010093096 Immobilized Enzymes Proteins 0.000 description 1
- 241000186984 Kitasatospora aureofaciens Species 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- OYIFNHCXNCRBQI-BYPYZUCNSA-N L-2-aminoadipic acid Chemical compound OC(=O)[C@@H](N)CCCC(O)=O OYIFNHCXNCRBQI-BYPYZUCNSA-N 0.000 description 1
- LOOZZTFGSTZNRX-VIFPVBQESA-N L-Homotyrosine Chemical compound OC(=O)[C@@H](N)CCC1=CC=C(O)C=C1 LOOZZTFGSTZNRX-VIFPVBQESA-N 0.000 description 1
- QWCKQJZIFLGMSD-VKHMYHEASA-N L-alpha-aminobutyric acid Chemical compound CC[C@H](N)C(O)=O QWCKQJZIFLGMSD-VKHMYHEASA-N 0.000 description 1
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 1
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 description 1
- JTTHKOPSMAVJFE-VIFPVBQESA-N L-homophenylalanine Chemical compound OC(=O)[C@@H](N)CCC1=CC=CC=C1 JTTHKOPSMAVJFE-VIFPVBQESA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- DGYHPLMPMRKMPD-UHFFFAOYSA-N L-propargyl glycine Natural products OC(=O)C(N)CC#C DGYHPLMPMRKMPD-UHFFFAOYSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- 240000002605 Lactobacillus helveticus Species 0.000 description 1
- 235000013967 Lactobacillus helveticus Nutrition 0.000 description 1
- 241001468191 Lactobacillus kefiri Species 0.000 description 1
- 241001134654 Lactobacillus leichmannii Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000970829 Mesorhizobium Species 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101100032166 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pyr5 gene Proteins 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 241000489469 Ogataea kodamae Species 0.000 description 1
- 241000489470 Ogataea trehalophila Species 0.000 description 1
- 241000826199 Ogataea wickerhamii Species 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- ZCQWOFVYLHDMMC-UHFFFAOYSA-N Oxazole Chemical group C1=COC=N1 ZCQWOFVYLHDMMC-UHFFFAOYSA-N 0.000 description 1
- 101150096038 PTH1R gene Proteins 0.000 description 1
- 241000157908 Paenarthrobacter aurescens Species 0.000 description 1
- 241001524178 Paenarthrobacter ureafaciens Species 0.000 description 1
- 241000194109 Paenibacillus lautus Species 0.000 description 1
- 240000002390 Pandanus odoratissimus Species 0.000 description 1
- 235000005311 Pandanus odoratissimus Nutrition 0.000 description 1
- 241000237988 Patellidae Species 0.000 description 1
- 241000588701 Pectobacterium carotovorum Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 241000530350 Phaffomyces opuntiae Species 0.000 description 1
- PCNDJXKNXGMECE-UHFFFAOYSA-N Phenazine Chemical group C1=CC=CC2=NC3=CC=CC=C3N=C21 PCNDJXKNXGMECE-UHFFFAOYSA-N 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000192608 Phormidium Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 241000235062 Pichia membranifaciens Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241000221945 Podospora Species 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 101710101148 Probable 6-oxopurine nucleoside phosphorylase Proteins 0.000 description 1
- 241000192138 Prochlorococcus Species 0.000 description 1
- 241000157935 Promicromonospora citrea Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241001453299 Pseudomonas mevalonii Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 102000030764 Purine-nucleoside phosphorylase Human genes 0.000 description 1
- WTKZEGDFNFYCGP-UHFFFAOYSA-N Pyrazole Chemical group C=1C=NNC=1 WTKZEGDFNFYCGP-UHFFFAOYSA-N 0.000 description 1
- 241000231139 Pyricularia Species 0.000 description 1
- 108010054917 Pyrimidine Phosphorylases Proteins 0.000 description 1
- 102000001853 Pyrimidine Phosphorylases Human genes 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100292548 Rattus norvegicus Adi1 gene Proteins 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000187561 Rhodococcus erythropolis Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000190967 Rhodospirillum Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000186567 Romboutsia lituseburensis Species 0.000 description 1
- 241000605947 Roseburia Species 0.000 description 1
- 241000187792 Saccharomonospora Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 101900006077 Saccharomyces cerevisiae Alcohol dehydrogenase 1 Proteins 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000195663 Scenedesmus Species 0.000 description 1
- 241000235060 Scheffersomyces stipitis Species 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000015473 Schizothorax griseus Species 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 244000191761 Sida cordifolia Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000521540 Starmera quercuum Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000194054 Streptococcus uberis Species 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241000187758 Streptomyces ambofaciens Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000971005 Streptomyces fungicidicus Species 0.000 description 1
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 102100027918 Sucrase-isomaltase, intestinal Human genes 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241001137870 Thermoanaerobacterium Species 0.000 description 1
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- 241000223258 Thermomyces lanuginosus Species 0.000 description 1
- 241001313706 Thermosynechococcus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- FZWLAAWBMGSTSO-UHFFFAOYSA-N Thiazole Chemical group C1=CSC=N1 FZWLAAWBMGSTSO-UHFFFAOYSA-N 0.000 description 1
- 241001494489 Thielavia Species 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000222354 Trametes Species 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241000203807 Tropheryma Species 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 241000202898 Ureaplasma Species 0.000 description 1
- 102000006405 Uridine phosphorylase Human genes 0.000 description 1
- 108010019092 Uridine phosphorylase Proteins 0.000 description 1
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 1
- 241000607291 Vibrio fluvialis Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241001507667 Volvariella Species 0.000 description 1
- 241000370136 Wickerhamomyces pijperi Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 241000204366 Xylella Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 241000758405 Zoopagomycotina Species 0.000 description 1
- 241000588902 Zymomonas mobilis Species 0.000 description 1
- DGEZNRSVGBDHLK-UHFFFAOYSA-N [1,10]phenanthroline Chemical compound C1=CN=C2C3=NC=CC=C3C=CC2=C1 DGEZNRSVGBDHLK-UHFFFAOYSA-N 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 125000004442 acylamino group Chemical group 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 125000004183 alkoxy alkyl group Chemical group 0.000 description 1
- 150000003973 alkyl amines Chemical class 0.000 description 1
- 150000008051 alkyl sulfates Chemical class 0.000 description 1
- 125000004644 alkyl sulfinyl group Chemical group 0.000 description 1
- 125000004390 alkyl sulfonyl group Chemical group 0.000 description 1
- 125000004656 alkyl sulfonylamino group Chemical group 0.000 description 1
- 125000004414 alkyl thio group Chemical group 0.000 description 1
- WNNNWFKQCKFSDK-UHFFFAOYSA-N allylglycine Chemical compound OC(=O)C(N)CC=C WNNNWFKQCKFSDK-UHFFFAOYSA-N 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 125000005428 anthryl group Chemical group [H]C1=C([H])C([H])=C2C([H])=C3C(*)=C([H])C([H])=C([H])C3=C([H])C2=C1[H] 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 125000006615 aromatic heterocyclic group Chemical group 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000005018 aryl alkenyl group Chemical group 0.000 description 1
- 125000005015 aryl alkynyl group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 102220351961 c.43G>T Human genes 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 125000003739 carbamimidoyl group Chemical group C(N)(=N)* 0.000 description 1
- 125000002837 carbocyclic group Chemical group 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 125000003636 chemical group Chemical class 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- WCZVZNOTHYJIEI-UHFFFAOYSA-N cinnoline Chemical compound N1=NC=CC2=CC=CC=C21 WCZVZNOTHYJIEI-UHFFFAOYSA-N 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000003431 cross linking reagent Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- 125000000000 cycloalkoxy group Chemical group 0.000 description 1
- 125000001316 cycloalkyl alkyl group Chemical group 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- CKIDTYWBOZNDIH-UHFFFAOYSA-N diethylamino-[(dimethylamino)methyl]-dimethylazanium Chemical compound CCN(CC)[N+](C)(C)CN(C)C CKIDTYWBOZNDIH-UHFFFAOYSA-N 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000004205 dimethyl polysiloxane Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical group OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 125000003700 epoxy group Chemical group 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 125000002541 furyl group Chemical group 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 125000004438 haloalkoxy group Chemical group 0.000 description 1
- 125000001188 haloalkyl group Chemical group 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 125000005553 heteroaryloxy group Chemical group 0.000 description 1
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 150000002430 hydrocarbons Chemical group 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 125000002768 hydroxyalkyl group Chemical group 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- MTNDZQHUAFNZQY-UHFFFAOYSA-N imidazoline Chemical compound C1CN=CN1 MTNDZQHUAFNZQY-UHFFFAOYSA-N 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003317 immunochromatography Methods 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Chemical group CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 1
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Chemical group C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 1
- 125000003387 indolinyl group Chemical group N1(CCC2=CC=CC=C12)* 0.000 description 1
- HOBCFUWDNJPFHB-UHFFFAOYSA-N indolizine Chemical group C1=CC=CN2C=CC=C21 HOBCFUWDNJPFHB-UHFFFAOYSA-N 0.000 description 1
- 125000003406 indolizinyl group Chemical group C=1(C=CN2C=CC=CC12)* 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960004717 insulin aspart Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 125000002346 iodo group Chemical group I* 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- ZLTPDFXIESTBQG-UHFFFAOYSA-N isothiazole Chemical compound C=1C=NSC=1 ZLTPDFXIESTBQG-UHFFFAOYSA-N 0.000 description 1
- CTAPFRYPJLPFDF-UHFFFAOYSA-N isoxazole Chemical compound C=1C=NOC=1 CTAPFRYPJLPFDF-UHFFFAOYSA-N 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 229940054346 lactobacillus helveticus Drugs 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000012263 liquid product Substances 0.000 description 1
- 230000007762 localization of cell Effects 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 230000001320 lysogenic effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000006178 methyl benzyl group Chemical group 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- ZAHQPTJLOCWVPG-UHFFFAOYSA-N mitoxantrone dihydrochloride Chemical compound Cl.Cl.O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO ZAHQPTJLOCWVPG-UHFFFAOYSA-N 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- NHLUVTZJQOJKCC-UHFFFAOYSA-N n,n-dimethylhexadecan-1-amine Chemical compound CCCCCCCCCCCCCCCCN(C)C NHLUVTZJQOJKCC-UHFFFAOYSA-N 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 125000001400 nonyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- VOMXSOIBEJBQNF-UTTRGDHVSA-N novorapid Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 VOMXSOIBEJBQNF-UTTRGDHVSA-N 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 229960001639 penicillamine Drugs 0.000 description 1
- 210000001428 peripheral nervous system Anatomy 0.000 description 1
- 239000012450 pharmaceutical intermediate Substances 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 229950000688 phenothiazine Drugs 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- LFSXCDWNBUNEEM-UHFFFAOYSA-N phthalazine Chemical compound C1=NN=CC2=CC=CC=C21 LFSXCDWNBUNEEM-UHFFFAOYSA-N 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 description 1
- 229920000447 polyanionic polymer Polymers 0.000 description 1
- 229920000151 polyglycol Polymers 0.000 description 1
- 239000010695 polyglycol Substances 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- KCXFHTAICRTXLI-UHFFFAOYSA-N propane-1-sulfonic acid Chemical compound CCCS(O)(=O)=O KCXFHTAICRTXLI-UHFFFAOYSA-N 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000030788 protein refolding Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- CPNGPNLZQNNVQM-UHFFFAOYSA-N pteridine Chemical compound N1=CN=CC2=NC=CN=C21 CPNGPNLZQNNVQM-UHFFFAOYSA-N 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- PBMFSQRYOILNGV-UHFFFAOYSA-N pyridazine Chemical group C1=CC=NN=C1 PBMFSQRYOILNGV-UHFFFAOYSA-N 0.000 description 1
- 125000005344 pyridylmethyl group Chemical group [H]C1=C([H])C([H])=C([H])C(=N1)C([H])([H])* 0.000 description 1
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 1
- JWVCLYRUEFBMGU-UHFFFAOYSA-N quinazoline Chemical compound N1=CN=CC2=CC=CC=C21 JWVCLYRUEFBMGU-UHFFFAOYSA-N 0.000 description 1
- 125000004621 quinuclidinyl group Chemical group N12C(CC(CC1)CC2)* 0.000 description 1
- 235000008001 rakum palm Nutrition 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 102200001734 rs11568520 Human genes 0.000 description 1
- 102220288073 rs151218932 Human genes 0.000 description 1
- 102220005481 rs36024711 Human genes 0.000 description 1
- 102200037023 rs387907270 Human genes 0.000 description 1
- 102220267418 rs746063190 Human genes 0.000 description 1
- 102220085717 rs864309676 Human genes 0.000 description 1
- 102200140207 rs9290264 Human genes 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 229940043230 sarcosine Drugs 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 125000004079 stearyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000005415 substituted alkoxy group Chemical group 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 125000000475 sulfinyl group Chemical group [*:2]S([*:1])=O 0.000 description 1
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 1
- IBBLKSWSCDAPIF-UHFFFAOYSA-N thiopyran Chemical compound S1C=CC=C=C1 IBBLKSWSCDAPIF-UHFFFAOYSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000010891 toxic waste Substances 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 229910052723 transition metal Inorganic materials 0.000 description 1
- 150000003624 transition metals Chemical class 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- ZMANZCXQSJIPKH-UHFFFAOYSA-O triethylammonium ion Chemical compound CC[NH+](CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-O 0.000 description 1
- 125000000876 trifluoromethoxy group Chemical group FC(F)(F)O* 0.000 description 1
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1077—Pentosyltransferases (2.4.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/02—Pentosyltransferases (2.4.2)
- C12Y204/02006—Nucleoside deoxyribosyltransferase (2.4.2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
Abstract
본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT) 효소, NDT 활성을 갖는 폴리펩티드, 및 이들 효소를 코딩하는 폴리뉴클레오티드, 뿐만 아니라 이들 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. NDT 효소를 생산하는 방법도 제공된다. 본 발명은 NDT 효소를 포함하는 조성물 및 조작된 NDT 효소를 사용하는 방법을 추가로 제공한다. 본 발명은 약제학적 화합물의 생산에 있어서 특정 용도를 발견하였다.
Description
본원은 2021년 8월 13일에 출원된 미국 가출원 번호 제63/232,725호에 대한 우선권을 주장하며, 이는 모든 목적을 위해 이의 전체 내용이 본원에 참조로 포함된다.
발명의 분야
본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT) 효소, NDT 활성을 갖는 폴리펩티드, 및 이들 효소를 코딩하는 폴리뉴클레오티드, 뿐만 아니라 이들 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. NDT 효소를 생산하는 방법이 또한 제공된다. 본 발명은 NDT 효소를 포함하는 조성물 및 조작된 NDT 효소를 사용하는 방법을 추가로 제공한다. 본 발명은 약제학적 화합물의 생산에 있어서 특정 용도를 발견하였다.
서열 목록, 표 또는 컴퓨터 프로그램에 대한 참조
서열 목록의 공식 사본은 "CX2-175WO1_ST26.xml"의 파일명으로, 2022년 8월 9일의 작성되고, 344킬로바이트의 크기를 갖는 XML로 명세서와 동시에 제출되었다. 서열 목록은 명세서의 일부이며 본원에 참조로 그 전체가 포함된다.
인간 면역결핍 바이러스(HIV)로 명명된 레트로바이러스는 감염된 개체의 면역 체계의 점진적인 파괴와 중추 및 말초 신경계의 퇴행을 수반하는 복합 질환인 후천성 면역 결핍 증후군(AIDS)의 병인체이다. 레트로바이러스 복제의 일반적인 특징은 바이러스 복제에 필요한 HIV 서열의 DNA 카피를 생성하기 위해 바이러스로 코딩된 역전사효소에 의한 바이러스 RNA 게놈의 역전사이다. MK-8591(Merck)과 같은 일부 화합물은 역전사 억제제로 알려져 있으며 AIDS 및 유사한 질병의 치료에서의 용도가 발견되었다. HIV 역전사효소를 억제하는 것으로 알려진 일부 화합물이 있지만, 이 효소를 억제하여 AIDS의 효과를 개선하는 데 더 효과적인 추가 화합물이 관련 기술분야에서 여전히 필요하다.
MK-8591(아래에 설명된 화합물(1))과 같은 뉴클레오시드 유사체는 DNA 합성에 사용되는 천연 뉴클레오시드와의 유사성으로 인해 HIV 역전사 효소의 효과적인 억제제이다. 역전사 효소에 의한 이들 유사체의 결합은 역전사 효소의 진행성을 억제함으로써 DNA 합성을 정지시킨다. 효소의 정지는 DNA 분자의 조기 종료를 초래하여 효과가 없게 만든다. 그러나, 표준 화학적 합성 기술을 통한 뉴클레오시드 유사체 생산은 화학적 복잡성으로 인해 어려움을 겪을 수 있다.
본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT) 효소, NDT 활성을 갖는 폴리펩티드, 및 이들 효소를 코딩하는 폴리뉴클레오티드, 뿐만 아니라 이들 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. NDT 효소를 생산하는 방법이 또한 제공된다. 본 발명은 NDT 효소를 포함하는 조성물 및 조작된 NDT 효소를 사용하는 방법을 추가로 제공한다. 본 발명은 약제학적 화합물의 생산에 있어서 특정 용도를 발견하였다.
본 발명은 뉴클레오시드 교환에 의한 뉴클레오시드 유사체 및 관련 화합물의 합성을 위한 신규 생체촉매 및 관련 사용 방법을 제공한다. 본 개시내용의 생체촉매는 락토바실러스 루테리(Lactobacillus reuteri)로부터의 야생형 유전자의 조작된 폴리펩티드 변이체이며, 이는 서열번호: 2의 아미노산 서열(이는 N-말단 히스티딘(6개 잔기) 태그도 포함함)을 갖는 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩한다. M104A의 서열번호: 2와 비교하여 잔기 차이를 포함하는 야생형 뉴클레오시드 데옥시리보실트랜스퍼라제의 변이체(서열번호: 4)를 단백질 공학의 출발점으로 사용하였다. 이들 조작된 폴리펩티드는 알키닐 데옥시우리딘 및 관련 화합물을 유용한 항바이러스 특성을 갖는 뉴클레오시드 유사체로 전환시키는 것을 촉매할 수 있다.
본 발명은 서열번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열 또는 이의 기능적 단편을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 상기 폴리펩티드 서열에 적어도 하나의 치환 또는 치환 세트를 포함하는 폴리펩티드를 포함하며, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4, 14, 및/또는 126을 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 폴리펩티드 서열은 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 가지며, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 15, 17, 18, 18/19/22/91/104, 18/19/22/ 104, 18/22/62/91/104, 19/91/104, 19/104, 20, 20/63/101/104, 20/101, 20/101/104, 20/104, 22, 22/ 62, 22/62/91/104, 22/91, 22/91/104, 22/91/108, 22/104, 22/108, 30, 50, 53, 55/133, 56, 61, 62/ 104, 72, 75, 76, 91/104, 93, 101/104, 104, 104/139, 108, 109, 114, 134, 136 및 138로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4를 참조하여 번호가 매겨져 있다. 일부 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 가지며, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 15F, 15L, 17L, 18A/19G/22W/91M/104G, 18A/19G/22W/104G, 18G/19G/22W/91M/104G, 18G/22W/62H/91M/104G, 18S, 19G/91M/104G, 19G/104G, 20E/101G, 20E/101G/104T, 20E/101G/104V, 20E/101N/104S, 20P/104G, 20S, 20S/63G/101G/104S, 20S/101A/104T, 20S/101G/104G, 20S/101G/104S, 20S/101N/104G, 20S/104G, 20S/104S, 22W, 22W/62H, 22W/62H/91M/104G, 22W/91M, 22W/ 91M/104G, 22W/91M/108V, 22W/104G, 22W/108V, 30I, 30L, 50E, 53V, 55R/133Q, 56H, 61A, 62H/104G, 72H, 72I, 72L, 72V, 75H, 76G, 91M/104G, 93C, 101N/104T, 104G, 104S, 104S/139T, 108A, 108M, 109A, 109S, 109T, 114V, 134G, 136A, 및 138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4를 참조하여 번호가 매겨진다. 일부 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 가지며, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 V15F, V15L, F17L, C18A/A19G/F22W/L91M/A104G, C18A/A19G/F22W/A104G, C18G/A19G/F22W/L91M/A104G, C18G/F22W/D62H/L91M/A104G, C18S, A19G/L91M/A104G, A19G/A104G, G20E/D101G, G20E/D101G/A104T, G20E/D101G/A104V, G20E/D101N/A104S, G20P/A104G, G20S, G20S/E63G/D101G/A 104S, G20S/D101A/A104T, G20S/D101G/A104G, G20S/D101G/A104S, G20S/D101N/A104G, G20S/A104G, G20S/A104S, F22W, F22W/D62H, F22W/D62H/L91M/A104G, F22W/L91M, F22W/L91M/A104G, F22W/L91M/L108V, F22W/A104G, F22W/L108V, Y30I, Y30L, V50E, Q53V, Q55R/L133Q, Y56H, V61A, D62H/A104G, E72H, E72I, E72L, E72V, T75H, A7 6G, L91M /A104G, A93C, D101N/A104T, A104G, A104S, A104S/A139T, L108A, L108M, G109A, G109S, G109T, L114V, M134G, W136A, 및 I138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4를 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 4와 적어도 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.
일부 실시양태에서, 본 발명은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성인 폴리펩티드 서열을 갖는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 22/75/108, 22/108, 22/108/109, 50/61, 50/75, 53/108/109, 61, 61/108/109, 75/108, 75/108/114, 108, 108/109, 및 108/138로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 실시양태에서, 본 발명은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성인 폴리펩티드 서열을 갖는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 22W/75H/108M, 22W/108M, 22W/108M/109A, 22W/108M/109S, 50E/61A, 50E/75H, 53V/108M/109S, 61A, 61A/108M/109S, 75H/108M, 75H/108M/114V, 108M, 108M/109T, 및 108M/138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 실시양태에서, 본 발명은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성인 폴리펩티드 서열을 갖는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 F22W, F22W/T75H, F22W/T75H/L108M, F22W/A76G, F22W/L108M, F22W/L108M/G109A, F22W/L108M/G109S, F22W/L108M/G109T, F22W/G109A, V50E/T75H, Q53H/I138H, Q53V/L108M/G109S, Q53V/L108M/G109T, Q53V/L108M/I138H, V61A, V61A/A76G, V61A/L108M/G109S, T75H/L108M, T75H/L108M/I138H, L108M, L108M/G109T, L108M/I138H, 및 I138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨져 있다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.
일부 추가의 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하고, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 22/108/109, 31/76, 50/75, 61/108/109, 75, 108, 108/109, 및 108/138로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하고, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 22W/108M/109S, 31D/76G, 50E/75H, 61A/108M/109S, 75H, 108M, 108M/109T, 및 108M/138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하고, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 F22W/L108M/G109S, E31D/A76G, V50E/T75H, V61A/L108M/G109S, T75H, L108M, L108M/G109T, 및 L108M/I138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.
일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 12/35/61/69, 12/35/61/157, 20, 20/50/149, 20/149/157, 28/39/61, 28/61, 35, 35/39/61에서 선택된 순서 /149/157, 35/50/149/157, 35/69, 35/157, 39/50, 39/61, 39/61/149, 39/69/149/157, 39/149, 39/157 , 50/61/149, 61/69, 61/69/149, 61/69/157, 61/157, 69/149/157, 149, 및 149/157로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 12T/35C/61A/69T, 12T/35C/61A/157T, 20N, 20N/50F/149D, 20N/149D/157T, 28R/39C/61A, 28R/61A, 35C, 35C/39C/61A/149S/157T, 35C/50F/149D/157T, 35C/69T, 35C/157T, 39C/50F, 39C/61A, 39C/61A/149D, 39C/69T/149D/157T, 39C/149S, 39C/157T, 50F/61A/149S, 61A/69I, 61A/69L, 61A/69L/149D, 61A/69M, 61A/69T, 61A/69T/157T, 61A/157T, 69T/149D/157T, 149D, 및 149D/157T로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 S12T/N35C/V61A/Q69T, S12T/N35C/V61A/S157T, E20N, E20N/V50F/P149D, E20N/P149D/S157T, K28R/A39C/V61A, K28R/V61A, N35C, N35C/A39C/V61A/P149S/S157T, N35C/V50F/P149D/S157T, N35C/Q69T, N35C/S157T, A39C/V50F, A39C/V61A, A39C/V61A/P149D, A39C/Q69T/P149D/S157T, A39C/P149S, A39C/S157T, V50F/V61A/P149S, V61A/Q69I, V61A/Q69L, V61A/Q69L/P149D, V61A/Q69M, V61A/Q69T, V61A/Q69T/S157T, V61A/S157T, Q69T/P149D/S157T, P149D, 및 P149D/S157T로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.
일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 20/50/149 및 39/157로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 20N/50F/149D 및 39C/157T로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 E20N/V50F/P149D 및 A39C/S157T로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.
일부 추가의 실시양태에서, 본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 표 5-1, 6-1, 6-2, 7-1, 및/또는 7-2에 제시된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체의 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상 동일한 폴리펩티드 서열을 포함한다.
일부 추가의 실시양태에서, 본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열식별번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 폴리펩티드 서열을 포함한다. 일부 추가의 실시양태에서, 본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열식별번호: 4, 14, 및/또는 126에 제시된 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체를 포함한다.
본 발명은 또한 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 6-214의 짝수 번호에 제시된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체의 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함한다.
본 발명은 추가로 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 야생형 락토바실러스 루테리 뉴클레오시드 데옥시리보실트랜스퍼라제에 비해 적어도 하나의 개선된 특성을 포함한다. 일부 실시양태에서, 개선된 특성은 기질에 대한 개선된 활성을 포함한다. 일부 추가 실시양태에서, 기질은 화합물(2) 및/또는 화합물(3)을 포함한다. 일부 추가 실시양태에서, 개선된 특성은 화합물(1)의 개선된 생산을 포함한다. 일부 추가 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 정제된다. 본 발명은 또한 본원에 제공된 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 적어도 하나 포함하는 조성물을 제공한다.
본 발명은 또한 본원에 제공된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열을 제공한다. 일부 실시양태에서, 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열은 서열번호: 3, 13, 및/또는 125와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열은 서열번호: 3, 13, 및/또는 125와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리뉴클레오티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리뉴클레오티드 서열은 하나 이상의 위치에 적어도 하나의 치환을 포함한다. 일부 추가의 실시양태에서, 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열은 서열번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리뉴클레오티드 서열을 포함한다. 또 다른 일부 추가 실시양태에서, 폴리뉴클레오티드 서열은 제어 서열에 작동가능하게 연결된다. 일부 추가 실시양태에서, 폴리뉴클레오티드 서열은 코돈 최적화된다. 일부 추가 실시양태에서, 폴리뉴클레오티드 서열은 서열번호: 5-213의 홀수 번호에 있는 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 본원에 제공된 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 제공한다. 본 발명은 본원에 제공된 적어도 하나의 발현 벡터를 포함하는 숙주 세포를 추가로 제공한다. 일부 실시양태에서, 본 발명은 본원에 제공된 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 숙주 세포를 제공한다.
본 발명은 또한 숙주 세포에서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 생산하는 방법을 제공하는데, 이 방법은 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 생산되기에 적합한 조건 하에서 본원에 제공된 숙주 세포를 배양하는 단계를 포함한다. 일부 실시양태에서, 상기 방법은 배양물 및/또는 숙주 세포로부터 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 회수하는 단계를 추가로 포함한다. 일부 추가 실시양태에서, 상기 방법은 상기 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 정제하는 단계를 추가로 포함한다.
본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT) 효소, NDT 활성을 갖는 폴리펩티드, 및 이들 효소를 코딩하는 폴리뉴클레오티드, 뿐만 아니라 이들 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. NDT 효소를 생산하는 방법도 제공된다. 본 발명은 NDT 효소를 포함하는 조성물 및 조작된 NDT 효소를 사용하는 방법을 추가로 제공한다. 본 발명은 약제학적 화합물의 생산에 있어서 특정 용도를 발견하였다.
다르게 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 기술분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 일반적으로, 본원에 사용된 명명법과 아래에 기술된 세포 배양, 분자 유전학, 미생물학, 유기 화학, 분석 화학 및 핵산 화학의 실험실 절차는 관련 기술분야에 잘 알려져 있고 일반적으로 사용되는 것들이다. 이러한 기술은 잘 알려져 있으며, 관련 기술분야의 기술자에게 잘 알려진 수많은 텍스트 및 참고 논문에 설명되어 있다. 화학 합성 및 화학 분석에서의 표준 기술 또는 이의 변형이 사용된다. 본원의 위 및 아래에 언급된 모든 특허, 특허 출원, 논문 및 간행물은 참조로 본원에 명시적으로 포함된다.
본원에 기술된 것과 유사하거나 등가인 임의의 적합한 방법 및 재료가 본 발명의 실시에 사용되지만, 일부 방법 및 재료가 본원에 기술되어 있다. 본 발명은 설명된 특정 방법론, 프로토콜 및 시약에 제한되지 않는 것으로 이해되어야 하며, 이는 관련 기술분야의 통상의 기술자가 사용하는 상황에 따라 달라질 수 있기 때문이다. 따라서, 바로 아래에 정의된 용어들은 본 발명 전체를 참조하여 더욱 완전하게 설명된다.
전술한 일반적인 설명과 다음의 상세한 설명은 단지 예시적이고 설명하기 위한 것이며 본 발명을 제한하지 않음이 이해되어야 한다. 여기에 사용된 섹션 제목은 구성 목적으로만 사용되며 설명된 주제를 제한하는 것으로 해석되어서는 안된다. 숫자 범위에는 범위를 정의하는 숫자가 포함된다. 따라서, 본원에 개시된 모든 수치 범위는 그러한 더 좁은 수치 범위가 본원에 모두 명시적으로 기재된 것처럼 더 넓은 수치 범위 내에 속하는 모든 더 좁은 수치 범위를 포괄하도록 의도된다. 또한, 본원에 개시된 모든 최대(또는 최소) 수치 제한은 그러한 더 낮은(또는 더 높은) 수치 제한이 본원에 명시적으로 기록된 것처럼 모든 더 낮은(또는 더 높은) 수치 제한을 포함하도록 의도된다.
약어 및 정의
유전적으로 코딩된 아미노산에 사용되는 약어는 통상적이며 다음과 같다: 알라닌(Ala 또는 A), 아르기닌(Arg 또는 R), 아스파라긴(Asn 또는 N), 아스파르테이트(Asp 또는 D), 시스테인(Cys) 또는 C), 글루타메이트(Glu 또는 E), 글루타민(Gln 또는 Q), 히스티딘(His 또는 H), 이소류신(Ile 또는 I), 류신(Leu 또는 L), 라이신(Lys 또는 K), 메티오닌(Met 또는 M), 페닐알라닌(Phe 또는 F), 프롤린(Pro 또는 P), 세린(Ser 또는 S), 트레오닌(Thr 또는 T), 트립토판(Trp 또는 W), 티로신(Tyr 또는 Y), 및 발린(Val 또는 V).
3글자 약어가 사용되는 경우, "L" 또는 "D"가 특별히 앞에 없거나 약어가 사용되는 문맥에서 명확하지 않는 한, 아미노산은 α-탄소(Cα)에 대해 L- 또는 D-배위 일 수 있다. 예를 들어, "Ala"는 α-탄소에 대한 배위를 지정하지 않고 알라닌을 지정하는 반면, "D-Ala" 및 "L-Ala"는 각각 D-알라닌 및 L-알라닌을 지정한다. 한 글자 약어가 사용되는 경우, 대문자는 α-탄소에 대한 L-배위의 아미노산을 나타내고 소문자는 α-탄소에 대한 D-배위의 아미노산을 나타낸다. 예를 들어, "A"는 L-알라닌을 나타내고 "a"는 D-알라닌을 나타낸다. 폴리펩티드 서열이 한 글자 또는 세 글자 약어(또는 이들의 혼합물)의 문자열로 제시되는 경우, 서열은 일반적인 관례에 따라 아미노(N)에서 카르복시(C) 방향으로 제시된다.
유전적으로 코딩하는 뉴클레오시드에 사용되는 약어는 통상적이며 다음과 같다: 아데노신(A); 구아노신(G); 시티딘(C); 티미딘(T); 및 우리딘(U). 상세하게 기술되지 않는 한, 약칭된 뉴클레오시드는 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드일 수 있다. 뉴클레오시드는 개별 기준으로 또는 집합 기준으로 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드로 지정될 수 있다. 핵산 서열이 한 글자 약어의 문자열로 표시되는 경우, 일반적인 관례에 따라 서열이 5'에서 3' 방향으로 표시되고, 포스페이트는 표시되지 않는다.
본 발명과 관련하여, 본원의 설명에 사용된 기술 및 과학 용어는 달리 구체적으로 정의되지 않는 한, 관련 기술분야의 통상의 기술자에 의해 일반적으로 이해되는 의미를 가질 것이다. 따라서, 다음의 용어들은 다음과 같은 의미를 갖도록 의도된다.
본원에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 문맥상 달리 명확하게 나타내지 않는 한 복수형을 포함한다. 따라서, 예를 들어 "폴리펩티드"에 대한 언급은 하나 이상의 폴리펩티드를 포함한다.
유사하게, "포함하다", "포함한다", "포함하는", "포함한다" 및 "포함하는"은 상호교환 가능하며 제한하려는 의도가 아니다. 따라서, 본원에 사용된 용어 "포함하는" 및 그 동족어는 포괄적인 의미로 사용된다(즉, "포함하는"이라는 용어 및 이의 상응하는 동족어와 대등함).
다양한 실시양태의 설명이 "포함하는"이라는 용어를 사용하는 경우, 관련 기술분야의 통상의 기술자는 일부 특정한 경우에 실시예가 "본질적으로 구성되는" 또는 "로 구성되는"이라는 언어를 사용하여 대안적으로 설명될 수 있음을 이해할 것임이 추가로 이해되어야 한다.
본원에 사용된 용어 "약"은 특정 값에 대해 허용 가능한 오차를 의미한다. 일부 경우에 "약"은 주어진 값 범위의 0.05%, 0.5%, 1.0%, 또는 2.0% 이내를 의미한다. 일부 경우에, "약"은 주어진 값의 1, 2, 3 또는 4 표준 편차 이내를 의미한다.
본원에 사용된 바와 같이, "EC" 번호는 국제 생화학 및 분자생물학 연맹(NC-IUBMB) 명명법 위원회의 효소 명명법을 의미한다. IUBMB 생화학적 분류는 효소가 촉매하는 화학 반응을 기반으로 한 효소의 수치적 분류 시스템이다.
본원에 사용된 바와 같이, "ATCC"는 생물저장소 컬렉션이 유전자 및 균주를 포함하는 American Type Culture Collection을 의미한다.
본원에 사용된 바와 같이, "NCBI"는 미국 국립생물정보센터(National Center for Biological Information) 및 여기에 제공된 서열 데이터베이스를 의미한다.
본원에 사용된 바와 같이, 본원에서 "뉴클레오시드 데옥시리보실트랜스퍼라제 변이체", "뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드" 및 "NDT"와 상호교환적으로 사용되는 "뉴클레오시드 데옥시리보실트랜스퍼라제"("NDT") 효소는 유리 퓨린 또는 피리미딘 염기(또는 염기 유사체) 및 2'-데옥시리보뉴클레오시드의 퓨린 또는 피리미딘 염기(또는 염기 유사체) 사이의 가역적 뉴클레오시드 교환을 촉매하는 효소이다. 한 가지 비제한적인 예는 알키닐-데옥시우리딘(화합물(2))과 2-플루오로-아데닌(화합물(3))의 NDT 촉매된 뉴클레오시드 교환에 의한 화합물(1)의 알키닐 데옥시아데노신 생성물의 합성이다. 본원에 사용된 바와 같이, "뉴클레오시드 데옥시리보실트랜스퍼라제"는 자연 발생 효소와 조작된 효소를 모두 포함할 수 있다.
"단백질", "폴리펩티드" 및 "펩티드"는 길이 또는 번역 후 변형(예를 들어 글리코실화 또는 인산화)에 관계없이, 아미드 결합에 의해 공유결합 연결된 적어도 2개의 아미노산의 중합체를 나타내기 위해 본원에서 상호교환적으로 사용된다. 이 정의에는 D- 및 L-아미노산, 및 D- 및 L-아미노산의 혼합물뿐만 아니라, D- 및 L-아미노산, 및 D- 및 L-아미노산의 혼합물을 포함하는 중합체가 포함된다.
"아미노산"은 일반적으로 알려진 3문자 기호 또는 IUPAC-IUB 생화학 명명법 위원회에서 권장하는 1문자 기호로 본원에서 지칭된다. 마찬가지로 뉴클레오티드도 이들의 일반적으로 허용되는 단일 문자 코드로 지칭될 수 있다.
본원에 사용된 바와 같이, "친수성 아미노산 또는 잔기"는 Eisenberg 등(문헌: Eisenberg et al., J. Mol. Biol., 179:125-142 [1984])의 정규화된 공통 소수성 척도에 따라서 제로(0)보다 작은 소수성을 나타내는 측쇄를 갖는 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 친수성 아미노산에는 L-Thr(T), L- Ser(S), L-His(H), L-Glu(E), L-Asn(N), L-Gln(Q), L-Asp(D), L-Lys(K) 및 L-Arg(R)이 포함된다.
본원에 사용된 바와 같이, "산성 아미노산 또는 잔기"는 아미노산이 펩티드 또는 폴리펩티드에 포함될 때 약 6 미만의 pKa 값을 나타내는 측쇄를 갖는 친수성 아미노산 또는 잔기를 지칭한다. 산성 아미노산은 일반적으로 수소 이온의 손실로 인해 생리학적 pH에서 음으로 하전된 측쇄를 갖는다. 유전적으로 코딩된 산성 아미노산에는 L-Glu(E) 및 L-Asp(D)가 포함된다.
본원에 사용된 바와 같이, "염기성 아미노산 또는 잔기"는 아미노산이 펩티드 또는 폴리펩티드에 포함될 때 약 6 초과의 pKa 값을 나타내는 측쇄를 갖는 친수성 아미노산 또는 잔기를 지칭한다. 염기성 아미노산은 일반적으로 하이드로늄 이온과의 회합으로 인해 생리학적 pH에서 양으로 하전된 측쇄를 갖는다. 유전적으로 코딩된 염기성 아미노산에는 L-Arg(R) 및 L-Lys(K)가 포함된다.
본원에 사용된 바와 같이, "극성 아미노산 또는 잔기"는 생리학적 pH에서는 전하가 없지만, 2개의 원자에 의해 함께 공유되는 전자쌍이 2개의 원자 중 하나에 의해 더 밀접하게 유지되는 결합을 적어도 하나 갖는 측쇄를 갖는 친수성 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 극성 아미노산에는 L-Asn(N), L-Gln(Q), L-Ser(S) 및 L-Thr(T)가 포함된다.
본원에 사용된 바와 같이, "소수성 아미노산 또는 잔기"는 Eisenberg 등(문헌: Eisenberg et al., J. Mol. Biol., 179:125-142 [1984])의 정규화된 공통 소수성 척도에 따라서 제로(0)보다 큰 소수성을 나타내는 측쇄를 갖는 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 소수성 아미노산에는 L-Pro(P), L-Ile(I), L-Phe(F), L-Val(V), L-Leu(L), L-Trp(W), L-Met(M), L-Ala(A) 및 L-Tyr(Y)가 포함된다.
본원에 사용된 바와 같이, "방향족 아미노산 또는 잔기"는 적어도 하나의 방향족 또는 헤테로방향족 고리를 포함하는 측쇄를 갖는 친수성 또는 소수성 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 방향족 아미노산에는 L-Phe(F), L-Tyr(Y) 및 L-Trp(W)가 포함된다. 헤테로방향족 질소 원자의 pKa로 인해 L-His(H)가 때때로 염기성 잔기로 분류되거나 측쇄가 헤테로방향족 고리를 포함하므로 방향족 잔기로 분류되지만, 본원에서 히스티딘은 친수성 잔기 또는 "구속된 잔기"(아래 참조)로 분류된다.
본원에 사용된 바와 같이, "구속된 아미노산 또는 잔기"는 구속된 기하학적 구조를 갖는 아미노산 또는 잔기를 지칭한다. 여기서, 구속된 잔기에는 L-Pro(P) 및 L-His(H)가 포함된다. 히스티딘은 상대적으로 작은 이미다졸 고리를 갖고 있기 때문에 구속된 기하학적 구조를 가지고 있다. 프롤린은 5원 고리를 갖고 있기 때문에 구속된 기하학적 구조를 가지고 있다.
본원에 사용된 바와 같이, "비극성 아미노산 또는 잔기"는 생리학적 pH에서 전하를 띠지 않고 두 원자가 공유하는 전자쌍이 일반적으로 두 원자 각각에 의해 동일하게 유지되는 결합을 갖는 측쇄(즉, 측쇄는 극성이 아님)를 갖는 소수성 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 비극성 아미노산에는 L-Gly(G), L-Leu(L), L-Val(V), L-Ile(I), L-Met(M) 및 L-Ala(A)가 포함된다.
본원에 사용된 바와 같이, "지방족 아미노산 또는 잔기"는 지방족 탄화수소 측쇄를 갖는 소수성 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 지방족 아미노산에는 L-Ala(A), L-Val(V), L-Leu(L) 및 L-Ile(I)이 포함된다. 시스테인(또는 "L-Cys" 또는 "[C]")은 다른 L-Cys(C) 아미노산 또는 다른 술파닐- 또는 술프히드릴-함유 아미노산과 이황화 가교를 형성할 수 있다는 점에서 특이한 것으로 알려져 있다. "시스테인 유사 잔기"에는 시스테인 및 이황화 가교 형성에 사용할 수 있는 술프히드릴 잔기를 함유하는 기타 아미노산이 포함된다. L Cys(C)(및 -SH 함유 측쇄를 갖는 기타 아미노산)의 환원된 유리 -SH 또는 산화된 이황화 가교 형태로 펩티드에 존재하는 능력은 L-Cys(C)가 펩티드에 순 소수성 또는 친수성 특성에 기여하는지 여부에 영향을 준다. L-Cys(C)는 Eisenberg의 정규화된 공통 척도(Eisenberg et al., 1984, 상기 참조)에 따라 0.29의 소수성을 나타내지만, 본 개시내용의 목적을 위해 L-Cys(C)는 자신만의 고유 그룹으로 분류되는 것으로 이해되어야 한다.
본원에 사용된 바와 같이, "작은 아미노산 또는 잔기"는 총 3개 이하의 탄소 및/또는 헤테로원자( 탄소 및 수소 제외)로 구성된 측쇄를 갖는 아미노산 또는 잔기를 지칭한다. 작은 아미노산 또는 잔기는 위의 정의에 따라 지방족, 비극성, 극성 또는 산성의 작은 아미노산 또는 잔기로 추가로 분류될 수 있다. 유전적으로 코딩된 작은 아미노산에는 L-Ala(A), L-Val(V), L-Cys(C), L-Asn(N), L-Ser(S), L-Thr(T) 및 L-Asp(D)가 포함된다.
본원에 사용된 바와 같이, "히드록실 함유 아미노산 또는 잔기"는 히드록실(-OH) 부분을 함유하는 아미노산을 지칭한다. 유전적으로 코딩된 히드록실 함유 아미노산에는 L-Ser(S), L-Thr(T) 및 L-Tyr(Y)가 포함된다.
본원에 사용된 바와 같이, "폴리뉴클레오티드" 및 "핵산"은 함께 공유적으로 연결된 2개 이상의 뉴클레오티드를 지칭한다. 폴리뉴클레오티드는 전체적으로 리보뉴클레오티드(즉, RNA)로 구성되거나, 전체적으로 2' 데옥시리보뉴클레오티드(즉, DNA)로 구성되거나, 리보- 및 2' 데옥시리보뉴클레오티드의 혼합물로 구성될 수 있다. 뉴클레오시드는 일반적으로 표준 포스포디에스테르 연결을 통해 함께 연결되지만, 폴리뉴클레오티드는 하나 이상의 비표준 연결을 포함할 수 있다. 폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있거나, 단일 가닥 영역과 이중 가닥 영역을 모두 포함할 수 있다. 더욱이, 폴리뉴클레오티드는 전형적으로 자연 발생 코딩 핵염기(즉, 아데닌, 구아닌, 우라실, 티민 및 시토신)로 구성되지만, 이는 예를 들어 이노신과 같은 하나 이상의 변형 및/또는 합성 핵염기, 예컨대, 예를 들어 이노신, 잔틴, 하이포잔틴 등을 포함할 수 있다. 일부 실시양태에서, 이러한 변형 또는 합성 핵염기는 아미노산 서열을 코딩하는 핵염기이다.
본원에 사용된 바와 같이, "뉴클레오시드"는 핵염기(즉, 질소성 염기), 및 5-탄당(예: 리보스 또는 데옥시리보스)을 포함하는 글리코실아민을 지칭한다. 뉴클레오시드의 비제한적인 예에는 시티딘, 우리딘, 아데노신, 구아노신, 티미딘 및 이노신이 포함된다. 대조적으로, 용어 "뉴클레오티드"는 핵염기, 5-탄당, 및 하나 이상의 인산염기를 포함하는 글리코실아민을 지칭한다. 일부 실시양태에서, 뉴클레오시드는 키나제에 의해 인산화되어 뉴클레오티드를 생성할 수 있다.
본원에 사용된 바와 같이, "뉴클레오시드 디포스페이트"는 핵염기(즉, 질소성 염기), 5-탄당(예를 들어, 리보스 또는 데옥시리보스) 및 디포스페이트(즉, 피로포스페이트) 모이어티를 포함하는 글리코실아민을 지칭한다. 본원의 일부 실시양태에서, "뉴클레오시드 디포스페이트"는 "NDP"로 약칭된다. 뉴클레오시드 디포스페이트의 비제한적인 예에는 시티딘 디포스페이트(CDP), 우리딘 디포스페이트(UDP), 아데노신 디포스페이트(ADP), 구아노신 디포스페이트(GDP), 티미딘 디포스페이트(TDP), 및 이노신 디포스페이트(IDP)가 포함된다. "뉴클레오시드" 및 "뉴클레오티드"라는 용어는 일부 상황에서는 상호교환적으로 사용될 수 있다.
본원에 사용된 바와 같이, "코딩 서열"은 단백질의 아미노산 서열을 코딩하는 핵산(예를 들어, 유전자)의 부분을 지칭한다.
본원에 사용된 바와 같이, "생체촉매", "생체촉매적", "생체내변환" 및 "생합성"은 유기 화합물에 대한 화학 반응을 수행하기 위한 효소의 사용을 지칭한다.
본원에 사용된 바와 같이, "야생형" 및 "자연 발생형"은 자연에서 발견되는 형태를 지칭한다. 예를 들어, 야생형 폴리펩티드 또는 폴리뉴클레오티드 서열은 자연의 공급원으로부터 단리될 수 있고 인간 조작에 의해 의도적으로 변형되지 않은 유기체에 존재하는 서열이다.
본원에 사용된 바와 같이, 세포, 핵산, 또는 폴리펩티드와 관련하여 사용될 때 "재조합", "조작된", "변이체", 및 "비-천연 발생"은 자연에 존재하지 않는 방식으로 변형된 물질의 자연적 또는 본래의 형태의 물질, 또는 이에 상응하는 물질을 지칭하다. 일부 실시양태에서, 세포, 핵산 또는 폴리펩티드는 자연 발생 세포, 핵산 또는 폴리펩티드와 동일하지만, 합성 물질로부터 및/또는 재조합 기술을 사용한 조작에 의해 생산되거나 유래된다. 비제한적 예에는 무엇보다도 세포의 본래(비재조합) 형태 내에서 발견되지 않는 유전자를 발현하는 재조합 세포 또는 다른 수준에서 달리 발현되는 본래의 유전자를 발현하는 재조합 세포가 포함된다.
용어 "서열 동일성 퍼센트(%)"는 폴리뉴클레오티드 또는 폴리펩티드 사이의 비교를 지칭하기 위해 본원에서 사용되며, 비교 창을 통해 최적으로 정렬된 2개의 서열을 비교함으로써 결정되고, 여기서 비교창의 폴리뉴클레오티드 또는 폴리펩티드 서열의 부분은 두 서열의 최적 정렬을 위해 기준 서열과 비교하여 첨가 또는 결실(즉, 갭)를 포함할 수 있다. 백분율은 일치하는 위치의 수를 산출하기 위해 두 서열 모두에서 동일한 핵산 염기 또는 아미노산 잔기가 발생하는 위치의 수를 결정하고, 일치하는 위치의 수를 비교 창 내의 위치의 총 수로 나누어 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산할 수 있다. 대안적으로, 동일한 핵산 염기 또는 아미노산 잔기가 두 서열 모두에서 발생하거나 핵산 염기 또는 아미노산 잔기가 갭으로 정렬되어 일치하는 위치의 수를 산출하는 위치의 수를 결정하고, 일치하는 위치 수를 비교 창의 전체 위치 수로 나누어 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 백분율을 계산할 수 있다. 관련 기술분야의 기술자는 2개의 서열을 정렬하는데 이용 가능한 다수의 확립된 알고리즘이 있음을 알고 있다. 비교를 위한 서열의 최적 정렬은 Smith 및 Waterman의 국소 상동성 알고리즘(Smith and Waterman, Adv. Appl. Math., 2:482 [1981]), Needleman 및 Wunsch의 상동성 정렬 알고리즘(Needleman and Wunsch, J. Mol. Biol., 48:443 [1970]), Pearson 및 Lipman의 유사성 방법 검색(Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]), 이러한 알고리즘의 컴퓨터화된 구현(예를 들어, GCG 위스콘신 소프트웨어 패키지의 GAP, BESTFIT, FASTA 및 TFASTA)에 의해, 또는 관련 기술분야에 알려진 육안 검사를 포함하지만 이에 제한되지 않는 임의의 적합한 방법에 의해 수행될 수 있다. 서열 동일성 및 서열 유사성 백분율을 결정하는데 적합한 알고리즘의 예는 Altschul 등에 의해 기술된 BLAST 및 BLAST 2.0 알고리즘(각각 Altschul et al., J. Mol. Biol., 215: 403-410 [1990]; 및 Altschul et al., Nucl. Acids Res., 3389-3402 [1977])을 포함하지만 이에 제한되지 않는다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명공학 정보 센터 웹사이트를 통해 공개적으로 제공된다. 이 알고리즘은 먼저 쿼리 서열에서 길이 W의 짧은 단어를 식별하여 높은 점수의 서열 쌍(HSP)을 식별하는 작업을 포함하며, 이는 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 일부 양수 임계값 점수 T와 일치하거나 이를 만족시킨다. T는 이웃 단어 점수 임계값으로 지칭된다(상기 Altschul 등, 참조). 이러한 초기 이웃 단어 적중은 이를 포함하는 더 긴 HSP를 찾기 위한 검색을 시작하기 위한 시드 역할을 한다. 그런 다음 단어 적중은 누적 정렬 점수가 증가할 수 있는 한 각 서열을 따라 양방향으로 확장된다. 누적 점수는 뉴클레오티드 서열의 경우 매개변수 M(일치하는 잔기 쌍에 대한 보상 점수; 항상 >0) 및 N(일치하지 않는 잔기에 대한 페널티 점수; 항상 <0)을 사용하여 계산된다. 아미노산 서열의 경우, 점수 매트릭스를 사용하여 누적 점수를 계산한다. 다음과 같은 경우 각 방향의 단어 적중 확장이 중단된다: 누적 정렬 점수가 최대 달성 값에서 수량 X만큼 떨어질 때; 하나 이상의 음의 점수 잔기 정렬의 누적으로 인해 누적 점수가 0 이하가 될 때; 또는 두 서열 중 하나의 끝에 도달했을 때. BLAST 알고리즘 매개변수 W, T, 및 X는 정렬의 민감도와 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열용)은 기본값으로 단어 길이(W) 11, 기대치(E) 10, M=5, N=-4, 및 두 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 기본값으로 단어 길이(W) 3, 기대값(E) 10, 및 BLOSUM62 점수 매트릭스(Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915[1989] 참조)를 사용한다. 서열 정렬 및 % 서열 동일성의 예시적인 결정은 제공된 기본 매개변수를 사용하여 GCG 위스콘신 소프트웨어 패키지(Accelrys, Madison WI)의 BESTFIT 또는 GAP 프로그램을 사용할 수 있다.
본원에 사용된 바와 같이, "기준 서열"은 서열 및/또는 활성 비교를 위한 기초로 사용되는 정의된 서열을 지칭한다. 기준 서열은 더 큰 서열의 하위세트, 예를 들어 전장 유전자 또는 폴리펩티드 서열의 절편일 수 있다. 일반적으로, 기준 서열은 길이가 적어도 20개의 뉴클레오티드 또는 아미노산 잔기, 길이가 적어도 25개의 잔기, 길이가 적어도 50개의 잔기, 길이가 적어도 100개의 잔기 또는 전체 길이의 핵산 또는 폴리펩티드이다. 2개의 폴리뉴클레오티드 또는 폴리펩티드는 각각 (1) 2개의 서열 간에 유사한 서열(즉, 완전한 서열의 일부)을 포함할 수 있고, (2) 2개의 서열 간에 분기되는 서열을 추가로 포함할 수 있으므로, 2개(또는 그 이상) 폴리뉴클레오티드 또는 폴리펩티드 사이의 서열 비교는 전형적으로 서열 유사성의 국소 영역을 확인하고 비교하기 위해 "비교 창"을 통해 2개의 폴리뉴클레오티드 또는 폴리펩티드의 서열을 비교함으로써 수행된다. 일부 실시양태에서, "기준 서열"은 1차 아미노산 서열에 기초할 수 있으며, 여기서 기준 서열은 1차 서열에 하나 이상의 변화를 가질 수 있는 서열이다.
본원에 사용된 바와 같이, "비교 창"은 적어도 약 20개의 연속 뉴클레오티드 위치 또는 아미노산 잔기의 개념적 절편을 지칭하며, 여기서 서열은 적어도 20개의 연속 뉴클레오티드 또는 아미노산의 기준 서열과 비교될 수 있으며 비교 창의 서열 부분은 두 서열의 최적 정렬을 위해 기준 서열(첨가 또는 결실을 포함하지 않음)과 비교하여 20% 이하의 첨가 또는 결실(즉, 갭)를 포함할 수 있다. 비교 창은 20개의 연속 잔기보다 길 수 있으며, 선택적으로 30, 40, 50, 100개 또는 더 긴 창을 포함한다.
본원에 사용된 바와 같이, 주어진 아미노산 또는 폴리뉴클레오티드 서열의 번호매김과 관련하여 사용된 "에 대응하는", "에 대한 참조" 및 "에 상대적인"은 주어진 아미노산 또는 폴리뉴클레오티드 서열이 기준 서열과 비교될 때 특정 기준 서열의 잔기의 번호매김을 지칭한다. 즉, 주어진 중합체의 잔기 번호 또는 잔기 위치는 주어진 아미노산 또는 폴리뉴클레오티드 서열 내의 잔기의 실제 수치적 위치보다는 기준 서열과 관련하여 지정된다. 예를 들어, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 것과 같은 주어진 아미노산 서열은 두 서열 사이의 잔기 일치를 최적화하기 위해 갭을 도입함으로써 기준 서열에 정렬될 수 있다. 이러한 경우, 갭이 존재하더라도 주어진 아미노산 또는 폴리뉴클레오티드 서열의 잔기 번호매김은 정렬된 기준 서열을 기준으로 이루어진다
본원에 사용된 바와 같이, "실질적 동일성"은 적어도 20개 잔기 위치의 비교 창, 빈번하게는 적어도 30 내지 50개 잔기의 창에 걸쳐 기준 서열과 비교하여, 적어도 80% 서열 동일성, 적어도 85% 동일성, 적어도 89 내지 95% 서열 동일성, 또는 보다 일반적으로 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭하며, 여기서 서열 동일성 백분율은 기준 서열을 비교 창에 걸쳐 기준 서열의 총 20% 이하인 결실 또는 첨가를 포함하는 서열과 비교함으로써 계산된다. 폴리펩티드에 적용되는 일부 특정 실시양태에서, 용어 "실질적 동일성"은 기본값 갭 가중치를 사용하는 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬될 때 2개의 폴리펩티드 서열이 적어도 80%, 바람직하게는 적어도 89%의 서열 동일성, 적어도 95% 서열 동일성 또는 그 이상(예를 들어, 99% 서열 동일성)을 공유한다는 것을 의미한다. 일부 실시양태에서, 비교되는 서열에서 동일하지 않은 잔기 위치는 보존적 아미노산 치환과 다르다.
본원에 사용된 바와 같이, "아미노산 차이" 및 "잔기 차이"는 기준 서열의 상응하는 위치에 있는 아미노산 잔기와 비교하여 폴리펩티드 서열의 위치에 있는 아미노산 잔기의 차이를 지칭한다. 어떤 경우에는, 기준 서열에 N 말단 히스티딘 태그가 있고, 번호 매기기에는 N 말단 히스티딘 잔기가 포함된다. 아미노산 차이의 위치는 일반적으로 본원에서 "Xn"으로 지칭되며, 여기서 n은 잔기 차이의 기초가 되는 기준 서열의 상응하는 위치를 나타낸다. 예를 들어, "서열번호: 4와 비교하여 위치 X93의 잔기 차이"는 서열번호: 4의 위치 93에 상응하는 폴리펩티드 위치의 아미노산 잔기의 차이를 지칭한다. 따라서, 서열번호: 4의 기준 폴리펩티드가 위치 93에 세린을 갖는 경우, "서열번호: 4와 비교하여 위치 X93의 잔기 차이"는 서열번호: 4의 위치 93에 상응하는 폴리펩티드의 위치에서 세린 이외의 임의의 잔기의 아미노산 치환을 지칭한다. 본원의 대부분의 경우, 특정 위치의 특정 아미노산 잔기 차이는 "XnY"로 표시되며, 여기서 "Xn"은 위에서 설명한 대로 해당 위치를 지정하고, "Y"는 조작된 폴리펩티드에서 발견된 아미노산의 단일 문자 식별자이다(즉, 참조 폴리펩티드와 다른 잔기). 일부 경우(예를 들어, 실시예에 제시된 표에서), 본 발명은 또한 통상적인 표기법 "AnB"로 표시되는 특정 아미노산 차이를 제공하며, 여기서 A는 기준 서열에서 잔기의 단일 문자 식별자이고, "n"은 기준 서열의 잔기 위치 번호이며, B는 조작된 폴리펩티드 서열의 잔기 치환에 대한 단일 문자 식별자이다. 일부 예에서, 본 발명의 폴리펩티드는 기준 서열과 비교하여 하나 이상의 아미노산 잔기 차이를 포함할 수 있으며, 이는 기준 서열과 비교하여 잔기 차이가 존재하는 특정 위치의 목록으로 표시된다. 하나 이상의 아미노산이 폴리펩티드의 특정 잔기 위치에 사용될 수 있는 일부 실시양태에서, 사용될 수 있는 다양한 아미노산 잔기는 "/"로 구분된다(예를 들어, X307H/X307P 또는 X307H/P). 슬래시는 또한 주어진 변종 내의 다중 치환을 나타내는 데 사용될 수 있다(즉, 조합 변종과 같이 주어진 서열에 하나 이상의 치환이 존재함). 일부 실시양태에서, 본 발명은 보존적 또는 비보존적 아미노산 치환을 포함하는 하나 이상의 아미노산 차이를 포함하는 조작된 폴리펩티드 서열을 포함한다. 일부 추가의 실시양태에서, 본 발명은 보존적 및 비보존적 아미노산 치환을 둘 다 포함하는 조작된 폴리펩티드 서열을 제공한다.
본원에 사용된 바와 같이, "보존적 아미노산 치환"은 잔기를 유사한 측쇄를 갖는 다른 잔기로 치환하는 것을 지칭하며, 따라서 일반적으로 폴리펩티드 내 아미노산을 동일하거나 유사한 부류로 정의된 아미노산으로 치환하는 것을 포함한다. 예로서 제한 없이, 일부 실시양태에서, 지방족 측쇄를 갖는 아미노산은 또 다른 지방족 아미노산(예를 들어, 알라닌, 발린, 류신, 및 이소류신)으로 치환되고; 히드록실 측쇄를 갖는 아미노산은 히드록실 측쇄를 갖는 또 다른 아미노산(예를 들어, 세린 및 트레오닌)으로 치환되며; 방향족 측쇄를 갖는 아미노산이 방향족 측쇄를 갖는 다른 아미노산(예를 들어, 페닐알라닌, 티로신, 트립토판, 및 히스티딘)으로 치환되고; 염기성 측쇄를 갖는 아미노산은 염기성 측쇄를 갖는 또 다른 아미노산(예를 들어, 라이신 및 아르기닌)으로 치환되며; 산성 측쇄를 갖는 아미노산은 산성 측쇄를 갖는 또 다른 아미노산(예를 들어, 아스파르트산 또는 글루탐산)으로 치환되고/되거나; 소수성 또는 친수성 아미노산은 각각 다른 소수성 또는 친수성 아미노산으로 대체된다.
본원에 사용된 바와 같이, "비보존적 치환"은 폴리펩티드 내의 아미노산이 측쇄 특성이 상당히 다른 아미노산으로 치환되는 것을 지칭한다. 비보존적 치환은 정의된 그룹 내보다는 정의된 그룹 사이의 아미노산을 사용할 수 있으며 (a) 치환 영역의 펩티드 백본 구조(예: 글리신의 경우 프롤린) (b) 전하 또는 소수성, 또는 (c) 측쇄의 대부분에 영향을 준다. 예를 들어 제한 없이, 예시적인 비보존적 치환은 산성 아미노산을 염기성 또는 지방족 아미노산으로; 방향족 아미노산을 작은 아미노산으로; 그리고 친수성 아미노산을 소수성 아미노산으로 치환하는 것일 수 있다.
본원에 사용된 바와 같이, "결실"은 기준 폴리펩티드로부터 하나 이상의 아미노산을 제거함으로써 폴리펩티드에 대한 변형을 지칭한다. 결실은 효소 활성을 유지하고/하거나 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 효소의 향상된 특성을 유지하면서 1개 이상의 아미노산, 2개 이상의 아미노산, 5개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산, 기준 효소를 구성하는 아미노산 총 수의 최대 10%, 아미노산 총 수의 최대 20% 제거를 포함할 수 있다. 결실은 폴리펩티드의 내부 부분 및/또는 말단 부분으로 지시될 수 있다. 다양한 실시양태에서, 결실은 연속적인 절편을 포함할 수 있거나 불연속적일 수 있다. 결실은 일반적으로 아미노산 서열에서 "-"로 표시된다.
본원에 사용된 바와 같이, "삽입"은 참조 폴리펩티드에 하나 이상의 아미노산을 첨가함으로써 폴리펩티드에 대한 변형을 지칭한다. 삽입은 폴리펩티드의 내부 부분에 있을 수도 있거나, 카르복시 또는 아미노 말단에 있을 수도 있다. 본원에 사용된 바와 같은 삽입에는 관련 기술분야에 공지된 융합 단백질이 포함된다. 삽입은 아미노산의 연속적인 절편일 수 있거나 자연 발생 폴리펩티드 내 하나 이상의 아미노산에 의해 분리될 수 있다.
용어 "아미노산 치환 세트" 또는 "치환 세트"는 기준 서열과 비교하여 폴리펩티드 서열의 아미노산 치환 그룹을 지칭한다. 치환 세트는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 아미노산 치환을 가질 수 있다. 일부 실시양태에서, 치환 세트는 실시예에 제공된 표에 나열된 임의의 변이 뉴클레오시드 데옥시리보실트랜스퍼라제에 존재하는 아미노산 치환 세트를 지칭한다.
"기능적 단편" 및 "생물학적 활성 단편"은 아미노-말단 및/또는 카르복시-말단 결실(들) 및/또는 내부 결실을 갖지만 나머지 아미노산 서열은 비교되는 서열(예를 들어, 본 발명의 전장 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제)의 상응하는 위치와 동일하고 전장 폴리펩티드의 활성을 실질적으로 모두 유지하는 폴리펩티드를 지칭하기 위해 상호교환적으로 사용된다.
본원에 사용된 바와 같이, "단리된 폴리펩티드"는 자연적으로 동반되는 다른 오염물(예를 들어, 단백질, 지질 및 폴리뉴클레오티드)로부터 실질적으로 분리된 폴리펩티드를 지칭한다. 이 용어는 자연 발생 환경 또는 발현 시스템(예: 숙주 세포 내에서 또는 시험관 내 합성을 통해)에서 제거되거나 정제된 폴리펩티드를 포함한다. 재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드는 세포 내에 존재할 수도 있고, 세포 배지에 존재할 수도 있거나, 용해물 또는 단리된 제제와 같은 다양한 형태로 제조될 수도 있다. 따라서, 일부 실시양태에서, 재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드는 단리된 폴리펩티드일 수 있다.
본원에 사용된 바와 같이, "실질적으로 순수한 폴리펩티드" 또는 "정제된 단백질"은 폴리펩티드 종이 존재하는 우세한 종인 조성물을 지칭하며(즉, 몰 또는 중량 기준으로 이는 조성물에서 임의의 다른 개별 거대분자 종보다 더 풍부하다), 이는 일반적으로 대상 종이 몰 또는 중량%로 존재하는 거대분자 종의 적어도 약 50%를 차지하는 경우 실질적으로 정제된 조성물이다. 그러나, 일부 실시양태에서, 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함하는 조성물은 50% 미만(예를 들어, 약 10%, 약 20%, 약 30%, 약 40%, 또는 약 50%)으로 순수한 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함한다. 일반적으로, 실질적으로 순수한 뉴클레오시드 데옥시리보실트랜스퍼라제 조성물은 조성물에 존재하는 모든 거대분자 종의 몰 또는 중량%로 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 및 약 98% 이상을 포함한다. 일부 실시양태에서, 대상 종은 본질적인 균질성으로 정제되며(즉, 오염 종은 기존의 검출 방법에 의해 조성물에서 검출될 수 없음). 여기서 조성물은 본질적으로 단일 거대분자 종으로 구성된다. 용매 종, 소분자(<500 달톤), 및 원소 이온 종은 거대분자 종으로 간주되지 않는다. 일부 실시양태에서, 단리된 재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드는 실질적으로 순수한 폴리펩티드 조성물이다.
본원에 사용된 바와 같이, "개선된 효소 특성"은 효소의 적어도 하나의 개선된 특성을 지칭한다. 일부 실시양태에서, 본 발명은 기준 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드 및/또는 야생형 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드, 및/또는 또 다른 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드와 비교하여 임의의 효소 특성의 개선을 나타내는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 제공한다. 따라서, "개선" 수준을 결정하고 야생형, 뿐만 아니라 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함한, 다양한 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드간에 비교를 할 수 있다. 개선된 특성에는 단백질 발현 증가, 열활성 증가, 열안정성 증가, pH 활성 증가, 안정성 증가, 효소 활성 증가, 기질 특이성 또는 친화성 증가, 특이적 활성 증가, 기질 또는 최종-생성물 억제에 대한 내성 증가, 화학적 안정성 증가, 화학선택성 개선, 용매 안정성 개선, 산성 pH에 대한 내성 증가, 단백질 분해 활성에 대한 내성 증가(즉, 단백질 분해에 대한 민감성 감소), 응집 감소, 용해도 증가, 및 온도 프로파일 변경과 같은 특성이 포함되지만 이에 제한되지 않는다. 추가의 실시양태에서, 상기 용어는 뉴클레오시드 데옥시리보실트랜스퍼라제 효소의 적어도 하나의 개선된 특성과 관련하여 사용된다. 일부 실시양태에서, 본 발명은 기준 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드 및/또는 야생형 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드, 및/또는 또 다른 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드와 비교하여 임의의 효소 특성의 개선을 나타내는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 제공한다. 따라서, "개선" 수준을 결정하고 야생형, 뿐만 아니라 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함한, 다양한 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드간에 비교를 할 수 있다.
본원에 사용된 바와 같이, "증가된 효소 활성" 및 "향상된 촉매 활성"은 조작된 폴리펩티드의 개선된 특성을 지칭하며, 이는 특이적 활성(예를 들어 생산된 생성물/시간/중량 단백질) 또는 기준 효소와 비교하여 기질의 생성물로의 전환율(예: 특정 양의 효소를 사용하여 특정 기간 동안 기질의 출발량에서 생성물로의 전환율)에서의 증가로 표시될 수 있다. 일부 실시양태에서, 상기 용어는 기준 뉴클레오시드 데옥시리보실트랜스퍼라제 효소와 비교하여 특이적 활성(예를 들어, 생산된 생성물/시간/중량 단백질)의 증가 또는 기질의 생성물로의 전환율(%)(예를 들어, 특정 양의 뉴클레오시드 데옥시리보실트랜스퍼라제를 사용하여 특정 기간 동안 기질의 시작 양을 생성물로 전환시키는 백분률)의 증가로 나타낼 수 있는, 본원에 제공된 조작된 p 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드의 개선된 특성을 지칭한다. 일부 실시양태에서, 상기 용어는 본원에 제공된 개선된 뉴클레오시드 데옥시리보실트랜스퍼라제 효소와 관련하여 사용된다. 본 발명의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 효소 활성을 결정하는 예시적인 방법이 실시예에 제공되어 있다. K m , V max 또는 k cat 의 고전적인 효소 특성을 포함하여 효소 활성과 관련된 모든 특성이 영향을 받을 수 있으며, 이러한 변화로 인해 효소 활성이 증가할 수 있다. 예를 들어, 효소 활성의 개선은 자연 발생 뉴클레오시드 데옥시리보실트랜스퍼라제 또는 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드가 유래된 또 다른 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제보다 상응하는 야생형 효소의 효소 활성의 약 1.1배에서부터 2배, 5배, 10배, 20배, 25배, 50배, 75배, 100배, 150배, 200배 또는 그 이상의 효소 활성까지 될 수 있다.
본원에 사용된 바와 같이, "전환"은 기질(들)의 상응하는 생성물(들)로의 효소적 전환(또는 생체내변환)을 지칭한다. "전환율(%)"은 특정 조건 하에서 일정 기간 내에 생성물로 전환되는 기질의 비율을 나타낸다. 따라서, 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드의 "효소 활성" 또는 "활성"은 특정 기간 동안 기질에서 생성물로의 "전환율(%)"로 표현될 수 있다.
"일반성 특성"(또는 "일반성 효소")을 갖는 효소는 부모 서열과 비교하여 광범위한 기질에 대해 개선된 활성을 나타내는 효소를 지칭한다. 일반성 효소는 가능한 모든 기질에 대해 향상된 활성을 반드시 나타내는 것은 아니다. 일부 실시양태에서, 본 발명은 광범위한 입체적 및 전자적으로 다양한 기질에 대해 부모 유전자에 비해 유사하거나 향상된 활성을 입증한다는 점에서 일반성을 갖는 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체를 제공한다. 또한, 본원에 제공된 일반성 효소는 대사산물/생성물의 생산을 증가시키기 위해 광범위한 다양한 분자에 걸쳐 개선되도록 조작되었다.
용어 "엄격한 하이브리드화 조건"은 핵산 하이브리드가 안정한 조건을 지칭하기 위해 본원에서 사용된다. 관련 기술분야의 기술자에게 공지된 바와 같이, 하이브리드의 안정성은 하이브리드의 용융 온도(T m )에 반영된다. 일반적으로 하이브리드의 안정성은 이온 강도, 온도, G/C 함량, 및 카오트로픽제의 존재 여부에 따라 달라진다. 폴리뉴클레오티드의 T m 값은 용융 온도를 예측하기 위한 공지된 방법을 사용하여 계산할 수 있다(예를 들어, 문헌: Baldino et al., Meth. Enzymol., 168:761-777 [1989]; Bolton et al., Proc. Natl. Acad. Sci. USA 48:1390 [1962]; Bresslauer et al., Proc. Natl. Acad. Sci. USA 83:8893-8897 [1986]; Freier et al., Proc. Natl. Acad. Sci. USA 83:9373- 9377 [1986]; Kierzek et al., Biochem., 25:7840-7846 [1986]; Rychlik et al., Nucl. Acids Res., 18:6409-6412 [1990] (erratum, Nucl. Acids Res., 19:698 [1991]); Sambrook et al., supra); Suggs et al., 1981, in Developmental Biology Using Purified Genes, Brown et al. [eds.], pp. 683-693, Academic Press, Cambridge, MA [1981]; 및 Wetmur, Crit. Rev. Biochem. Mol. Biol. 26:227-259 [1991] 참조). 일부 실시양태에서, 폴리뉴클레오타이드는 본원에 개시된 폴리펩티드를 코딩하고 정의된 조건, 예컨대 적당히 엄격한 조건 또는 매우 엄격한 조건 하에서 본 발명의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 효소를 코딩하는 서열의 상보체에 하이브리화된다.
본원에 사용된 바와 같이, "하이브리화 엄격성"은 핵산의 하이브리드화에서 세척 조건과 같은 하이브리드화 조건에 관한 것이다. 일반적으로 하이브리드화 반응은 낮은 엄격도 조건에서 수행된 후 다양하지만 더 높은 엄격도의 세척이 수행된다. "중간 정도 엄격한 하이브리드화"라는 용어는 표적 DNA가 표적 DNA에 대해 약 60% 동일성, 바람직하게는 약 75% 동일성, 약 85% 동일성, 표적-폴리뉴클레오티드에 대해 약 90% 초과 동일성을 갖는 상보적 핵산에 결합하도록 허용하는 조건을 지칭한다. 예시적인 적당히 엄격한 조건은 42℃에서 50% 포름아미드, 5×Denhart 용액, 5×SSPE, 0.2% SDS에서의 하이브리드화에 이어, 42℃에서 0.2×SSPE, 0.2% SDS로 세척하는 것과 대등한 조건이다. "높은 엄격성 하이브리드화"는 일반적으로 정의된 폴리뉴클레오티드 서열에 대한 용액 조건 하에서 결정된 열 용융 온도 T m 으로부터 약 10℃이하인 조건을 지칭한다. 일부 실시양태에서, 높은 엄격성 조건은 65℃의 0.018M NaCl에서 안정한 하이브리드를 형성하는 핵산 서열만의 하이브리드화를 허용하는 조건을 지칭한다(즉, 하이브리드가 65℃의 0.018M NaCl에서 안정하지 않은 경우, 본원에서 고려되는 바와 같이, 높은 엄격도 조건 하에서는 안정하지 않을 것이다). 높은 엄격성 조건은 예를 들어 42℃에서 50% 포름아미드, 5× Denhart 용액, 5×SSPE, 0.2% SDS와 대등한 조건에서 하이브리드화한 후, 0.1×SSPE, 및 65℃에서 0.1% SDS로 세척하여 제공될 수 있다. 또 다른 높은 엄격성 조건은 65℃에서 0.1%(w/v) SDS를 함유한 5X SSC에서 하이브리드화하고 65℃에서 0.1% SDS를 함유한 0.1x SSC에서 세척하는 것과 대등한 조건에서 하이브리드화하는 것이다. 다른 매우 엄격한 하이브리드화 조건은 물론 중간 정도의 엄격한 조건도 위에 인용된 참조 문헌에 설명되어 있다.
본원에 사용된 바와 같이, "코돈 최적화"는 코딩된 단백질이 관심 유기체에서 효율적으로 발현되도록 특정 유기체에서 우선적으로 사용되는 코돈에 대한 단백질을 코딩하는 폴리뉴클레오티드의 코돈의 변화를 지칭한다. 대부분의 아미노산이 "동의어" 또는 "동의적" 코돈이라고 불리는 여러 코돈으로 표시된다는 점에서 유전자 코드가 퇴화되었지만, 특정 유기체에 의한 코돈 사용은 무작위가 아니며 특정 코돈 삼중항에 편향되어 있다는 것은 잘 알려져 있다. 이러한 코돈 사용률 편향은 주어진 유전자, 공통 기능 또는 조상 기원의 유전자, 고도로 발현된 단백질 대 낮은 카피수 단백질, 유기체 게놈의 응집체 단백질 코딩 영역과 관련하여 더 높을 수 있다. 일부 실시양태에서, 뉴클레오시드 데옥시리보실트랜스퍼라제 효소를 코딩하는 폴리뉴클레오타이드는 발현을 위해 선택된 숙주 유기체에서의 최적 생산을 위해 코돈 최적화될 수 있다.
본원에 사용된 바와 같이, "바람직한", "최적" 및 "높은 코돈 사용률 편향" 코돈은 단독으로 또는 조합하여 사용될 때 동일한 아미노산을 코딩하는 다른 코돈보다 단백질 코딩 영역에서 더 높은 빈도로 사용되는 코돈에 대해 상호교환적으로 지칭한다. 바람직한 코돈은 단일 유전자에서의 코돈 사용빈도, 공통 기능 또는 기원의 유전자 세트, 고도로 발현된 유전자, 전체 유기체의 응집체 단백질 코딩 영역에서의 코돈 빈도, 관련 유기체의 응집체 단백질에서의 코돈 빈도, 또는 이의 조합과 관련하여 결정될 수 있다. 유전자 발현 수준에 따라 빈도가 증가하는 코돈은 일반적으로 발현에 최적인 코돈이다. 예를 들어 군집 분석 또는 대응 분석(예를 들어, 문헌: GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, Peden, University of Nottingham; McInerney, Bioinform., 14:372-73 [1998]; Stenico et al., Nucl. Acids Res., 222437-46 [1994]; 및 Wright, Gene 87:23-29 [1990] 참조)을 사용하는 다변량 분석을 포함하여, 특정 유기체에서 코돈 빈도(예: 코돈 사용률, 상대 동의어 코돈 사용) 및 코돈 선호도, 및 유전자에 사용되는 코돈의 유효 수를 결정하기 위한 다양한 방법이 알려져 있다. 코돈 사용률 표는 다양한 유기체에 대해 이용 가능하다(예를 들어, 문헌: Wada et al., Nucl. Acids Res., 20:2111-2118 [1992]; Nakamura et al., Nucl. Acids Res., 28:292 [2000]; Duret, et al., 상기; Henaut and Danchin, in Escherichia coli and Salmonella , Neidhardt, et al.(eds.), ASM Press, Washington D.C., p. 2047-2066 [1996] 참조). 코돈 사용률를 얻기 위한 데이터 소스는 단백질을 코딩할 수 있는 임의의 이용 가능한 뉴클레오티드 서열에 의존할 수 있다. 이러한 데이터 세트에는 실제로 발현된 단백질을 코딩하는 것으로 알려진 핵산 서열(예: 완전한 단백질 코딩 서열-CDS), 발현된 서열 태그(ESTS), 또는 게놈 서열의 예측된 코딩 영역이 포함된다(예를 들어, 문헌: Mount, Bioinformatics: Sequence and Genome Analysis, Chapter 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. [2001]; Uberbacher, Meth. Enzymol., 266:259-281 [1996]; 및 Tiwari et al., Comput. Appl. Biosci., 13: 263-270 [1997] 참조).
본원에 사용된 바와 같이, "제어 서열"은 본 발명의 폴리뉴클레오티드 및/또는 폴리펩티드의 발현에 필요하거나 유리한 모든 성분을 포함한다. 각각의 제어 서열은 폴리펩티드를 코딩하는 핵산 서열에 대해 고유하거나 외래일 수 있다. 이러한 제어 서열에는 리더, 폴리아데닐화 서열, 프로펩티드 서열, 프로모터 서열, 신호 펩티드 서열, 개시 서열 및 전사 종결자가 포함되나 이에 제한되지 않는다. 최소한, 제어 서열에는 프로모터와 전사 및 번역 정지 신호가 포함된다. 제어 서열에는 폴리펩티드를 코딩하는 핵산 서열의 코딩 영역과 제어 서열의 연결을 촉진하는 특정 제한 부위를 도입할 목적으로 링커가 제공될 수 있다.
"작동가능하게 연결된"은 제어 서열이 관심 폴리뉴클레오티드에 대한 위치에 적절하게 배치되어(즉, 기능적 관계로) 제어 서열이 관심 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 지시하거나 조절하도록 하는 구성으로 본원에서 정의된다.
"프로모터 서열"은 코딩 서열과 같은 관심 폴리뉴클레오티드의 발현을 위해 숙주 세포에 의해 인식되는 핵산 서열을 지칭한다. 프로모터 서열은 관심 폴리뉴클레오티드의 발현을 매개하는 전사 제어 서열을 함유한다. 프로모터는 돌연변이체, 절단형 및 하이브리드 프로모터를 포함하여 선택된 숙주 세포에서 전사 활성을 나타내는 임의의 핵산 서열일 수 있고, 숙주 세포에 동종 또는 이종인 세포외 또는 세포내 폴리펩티드를 코딩하는 유전자로부터 얻어질 수 있다.
"적절한 반응 조건"이라는 어구는 본 발명의 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드가 기질을 원하는 생성물 화합물로 전환시킬 수 있는, 효소 전환 반응 용액에서의 조건(예를 들어, 효소 부하량, 기질 부하량, 온도, pH, 완충제, 공용매 등의 범위)을 지칭한다. 일부 예시적인 "적절한 반응 조건"이 본원에 제공된다.
본원에 사용된 바와 같은, "화합물 부하량" 또는 "효소 부하량"과 같은 "부하량"은 반응 시작 시 반응 혼합물 중 성분의 농도 또는 양을 지칭한다.
본원에 사용된 바와 같이, 효소 전환 반응 과정의 맥락에서 "기질"은 본원에 제공된 조작된 효소(예를 들어 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드)에 의해 작용받는 화합물 또는 분자를 지칭한다.
본원에 사용된 바와 같이, 반응으로부터 생성물(예를 들어, 데옥시리보스 포스페이트 유사체)의 수율 "증가"는 반응 동안 존재하는 특정 성분(예를 들어, 뉴클레오시드 데옥시리보실트랜스퍼라제 효소)이 동일한 기질과 다른 치환기를 사용하여 동일한 조건에서 수행되지만 관심 있는 성분이 없는 반응과 비교하여 더 많은 생성물을 생산하게 할 때 발생한다.
반응을 촉매하는 데 참여하는 다른 효소와 비교하여 특정 효소의 양이 약 2%, 약 1%, 또는 약 0.1%(중량/중량) 미만인 경우 반응은 특정 효소가 "실질적으로 없다"고 한다.
본원에 사용된 바와 같이, 액체(예를 들어, 배양 브로쓰)를 "분별"한다는 것은 분리 공정(예를 들어, 염 침전, 컬럼 크로마토그래피, 크기 배제, 및 여과) 또는 이러한 공정의 조합을 적용하여 원하는 단백질이 초기 액체 제품보다 용액에서 총 단백질의 더 큰 비율을 차지하는 용액을 제공하는 것을 의미한다.
본원에 사용된 바와 같이, "출발 조성물"은 적어도 하나의 기질을 포함하는 임의의 조성물을 지칭한다. 일부 실시양태에서, 출발 조성물은 임의의 적합한 기질을 포함한다.
본원에 사용된 바와 같이, 효소 전환 공정의 맥락에서 "생성물"은 기질에 대한 효소 폴리펩티드의 작용으로부터 생성되는 화합물 또는 분자를 지칭한다.
본원에 사용된 바와 같이, 본원에서 사용되는 바와 같은 "평형화"는 화학 또는 효소 반응의 순방향 속도 상수와 역방향 속도 상수에 의해 결정되는 바와 같이, 입체이성질체의 상호전환을 포함하여 화학 또는 효소 반응(예를 들어 두 종 A 및 B의 상호전환)에서 화학종의 정상 상태 농도를 초래하는 공정을 지칭한다.
본원에 사용된 바와 같이, "알킬"은 직쇄 또는 분지형의, 탄소 원자 1 내지 18개, 보다 바람직하게는 탄소 원자 1 내지 8개, 가장 바람직하게는 탄소 원자 1 내지 6개의 포화 탄화수소 기를 지칭한다. 특정 수의 탄소 원자를 갖는 알킬은 괄호 안에 표시된다(예: (C1-C4)알킬은 탄소 원자 1 내지 4개의 알킬을 나타냄).
본원에 사용된 바와 같이, "알케닐"은 적어도 하나의 이중 결합을 함유하지만 선택적으로 하나 이상의 이중 결합을 함유하는 직쇄 또는 분지형 탄소 원자 2 내지 12개의 기를 지칭한다.
본원에 사용된 바와 같이, "알키닐"은 적어도 하나의 삼중 결합을 함유하지만 선택적으로 하나 이상의 삼중결합을 함유하고, 추가로 선택적으로 하나 이상의 이중 결합된 모이어티를 함유하는 직쇄 또는 분지형의 2 내지 12개 탄소 원자의 기를 지칭한다.
본원에 사용된 바와 같이, "헤테로알킬, "헤테로알케닐", 및 헤테로알키닐"은 하나 이상의 탄소 원자가 각각 독립적으로 동일하거나 다른 헤테로원자 또는 헤테로원자 기로 대체된 본원에 정의된 알킬, 알케닐 및 알키닐을 지칭한다. 탄소 원자를 대체할 수 있는 헤테로원자 및/또는 헤테로원자 기에는 이들의 조합을 포함하여, -O-, -S-, -S-O-, -NRα-, -PH-, -S(O)-, -S(O)2-, -S(O)NRα-, -S(O)2NRα- 등이 포함되지만 이에 제한되지 않으며, 여기서 각 Rα는 독립적으로 수소, 알킬, 헤테로알킬, 사이클로알킬, 헤테로사이클로알킬, 아릴, 및 헤테로아릴 중에서 선택된다.
본원에 사용된 바와 같이, "알콕시"는 -ORβ기를 지칭하며 여기서, Rβ는 본원에 정의된 선택적으로 치환된 알킬기를 포함하며 알킬기는 상기 정의된 바와 같다.
본원에 사용된 바와 같이, "아릴"은 단일 고리(예를 들어, 페닐) 또는 다중 축합 고리(예를 들어, 나프틸 또는 안트릴)를 갖는 6 내지 12개의 탄소 원자의 불포화 방향족 카르보사이클릭기를 지칭한다. 예시적인 아릴에는 페닐, 피리딜, 나프틸 등이 포함된다.
본원에 사용된 바와 같이, "아미노"는 -NH2기를 지칭한다. 치환된 아미노는 -NHRδ, NRδRδ 및 NRδRδRδ기를 지칭하며, 여기서 각 Rδ는 치환되거나 비치환된 알킬, 사이클로알킬, 사이클로헤테로알킬, 알콕시, 아릴, 헤테로아릴, 헤테로아릴알킬, 아실, 알콕시카르보닐, 술파닐, 술피닐, 술포닐 등으로부터 독립적으로 선택된다. 전형적인 아미노기에는 디메틸아미노, 디에틸아미노, 트리메틸암모늄, 트리에틸암모늄, 메틸술포닐아미노, 푸라닐-옥시-술프아미노 등이 포함되지만 이에 제한되지 않는다.
본원에 사용된 바와 같이, "옥소"는 =O를 지칭한다.
본원에 사용된 바와 같이, "옥시"는 에테르 및 에스테르를 포함하여, 다양한 옥시기를 형성하기 위해 다양한 치환기를 가질 수 있는 2가 기 -O-를 지칭한다.
본원에 사용된 바와 같이, "카르복시"는 -COOH를 지칭한다.
본원에 사용된 바와 같이, "카르보닐"은 산, 산 할로겐화물, 알데히드, 아미드, 에스테르 및 케톤을 포함하여 다양한 카르보닐기를 형성하기 위해 다양한 치환기를 가질 수 있는 -C(O)-를 지칭한다.
본원에 사용된 바와 같이, "알킬옥시카르보닐"은 -C(O)ORε를 지칭하며, 여기서 Rε는 선택적으로 치환될 수 있는 본원에 정의된 바와 같은 알킬기이다.
본원에 사용된 바와 같이, "아미노카르보닐"은 -C(O)NH2를 지칭한다. 치환된 아미노카르보닐은 -C(O)NRδRδ를 지칭하며, 여기서 아미노기 NRδRδ는 본원에 정의된 바와 같다.
본원에 사용된 바와 같이, "할로겐" 및 "할로"는 플루오로, 클로로, 브로모 및 요오도를 지칭한다.
본원에 사용된 바와 같이, "히드록시"는 -OH를 지칭한다.
본원에 사용된 바와 같이, "시아노"는 -CN을 지칭한다.
본원에 사용된 바와 같이, "헤테로아릴"은 고리 내에 탄소 원자 1 내지 10개 및 산소, 질소 및 황으로부터 선택된 헤테로원자 1 내지 4개의 방향족 헤테로사이클릭기를 지칭한다. 이러한 헤테로아릴기는 단일 고리(예: 피리딜 또는 푸릴) 또는 다중 축합 고리(예: 인돌리지닐 또는 벤조티에닐)를 가질 수 있다.
본원에 사용된 바와 같이, "헤테로아릴알킬"은 헤테로아릴로 치환된 알킬(즉, 헤테로아릴-알킬-기)을 지칭하며, 알킬 모이어티에서 1 내지 6개의 탄소 원자를 갖고, 헤에토아릴 모이어티에서 5 내지 12개의 고리 원자를 갖는 것이 바람직하다. 이러한 헤테로아릴알킬기의 예로는 피리딜메틸 등이 있다.
본원에 사용된 바와 같이, "헤테로아릴알케닐"은 헤테로아릴로 치환된 알케닐(즉, 헤테로아릴-알케닐-기)을 지칭하며, 알케닐 모이어티에 2 내지 6개의 탄소 원자 및 헤테로아릴 모이어티에 5 내지 12개의 고리 원자를 갖는 것이 바람직하다.
본원에 사용된 바와 같은, "헤테로아릴알키닐"은 헤테로아릴로 치환된 알키닐(즉, 헤테로아릴-알키닐-기)을 지칭하며, 알키닐 모이어티에 2 내지 6개의 탄소 원자 및 헤테로아릴 모이어티에 5 내지 12개의 고리 원자를 갖는 것이 바람직하다.
본원에 사용된 바와 같이, "헤테로사이클", "헤테로사이클릭", 및 상호교환적으로 "헤테로사이클로알킬"은 단일 고리 또는 다중 축합 고리를 가지며, 2 내지 10개의 탄소 고리 원자 및 고리 내에 질소, 황 또는 산소로부터 선택된 헤테로 고리 원자를 1 내지 4개 갖는 포화 또는 불포화기를 지칭한다. 이러한 헤테로사이클릭기는 단일 고리(예를 들어, 피페리디닐 또는 테트라히드로푸릴) 또는 다중 축합 고리(예를 들어, 인돌리닐, 디히드로벤조푸란 또는 퀴누클리디닐)를 가질 수 있다. 헤테로사이클의 예에는 푸란, 티오펜, 티아졸, 옥사졸, 피롤, 이미다졸, 피라졸, 피리딘, 피라진, 피리미딘, 피리다진, 인돌리진, 이소인돌, 인돌, 인다졸, 퓨린, 퀴놀리진, 이소퀴놀린, 퀴놀린, 프탈라진, 나프틸피리딘, 퀴녹살린, 퀴나졸린, 신놀린, 프테리딘, 카르바졸, 카르볼린, 페난트리딘, 아크리딘, 페난트롤린, 이소티아졸, 페나진, 이속사졸, 페녹사진, 페노티아진, 이미다졸리딘, 이미다졸린, 피페리딘, 피페라진, 피롤리딘, 인돌린 등이 포함되지만 이에 제한되지 않는다.
본원에 사용된 바와 같이, "~원 고리"는 임의의 사이클릭 구조를 포함하는 것을 의미한다. "~원"이라는 용어 앞의 숫자는 고리를 구성하는 골격 원자의 수를 나타낸다. 따라서, 예를 들어 사이클로헥실, 피리딘, 피란 및 티오피란은 6원 고리이고 사이클로펜틸, 피롤, 푸란 및 티오펜은 5원 고리이다.
달리 명시하지 않는 한, 상기 기에서 수소가 차지하는 위치는 히드록시, 옥소, 니트로, 메톡시, 에톡시, 알콕시, 치환된 알콕시, 트리플루오로메톡시, 할로알콕시, 플루오로, 클로로, 브로모, 요오도, 할로, 메틸, 에틸, 프로필, 부틸, 알킬, 알케닐, 알키닐, 치환된 알킬, 트리플루오로메틸, 할로알킬, 히드록시알킬, 알콕시알킬, 티오, 알킬티오, 아실, 카르복시, 알콕시카르보닐, 카르복스아미도, 치환된 카르복스아미도, 알킬술포닐, 알킬술피닐, 알킬술포닐아미노, 술폰아미도, 치환된 술폰아미도, 시아노, 아미노, 치환된 아미노, 알킬아미노, 디알킬아미노, 아미노알킬, 아실아미노, 아미디노, 아미독시모, 히드록사모일, 페닐, 아릴, 치환된 아릴, 아릴옥시, 아릴알킬, 아릴알케닐, 아릴알키닐, 피리딜, 이미다졸릴, 헤테로아릴, 치환된 헤테로아릴, 헤테로아릴옥시, 헤테로아릴알킬, 헤테로아릴알케닐, 헤테로아릴알키닐, 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실, 사이클로알킬, 사이클로알케닐, 사이클로알킬알킬, 치환된 사이클로알킬, 사이클로알킬옥시, 피롤리디닐, 피페리디닐, 모르폴리노, 헤테로사이클, (헤테로사이클)옥시 및 (헤테로사이클)알킬로 예시되지만, 이들로 제한되지 않는 치환기로 추가로 치환될 수 있으며; 바람직한 헤테로원자는 산소, 질소 및 황이다. 이러한 치환기에 개방 원자가가 존재하는 경우 이들은 알킬, 사이클로알킬, 아릴, 헤테로아릴 및/또는 헤테로사이클기로 추가로 치환될 수 있고, 이러한 개방 원자가가 탄소에 존재하는 경우 할로겐 및 산소-, 질소-, 또는 황-결합된 치환기에 의해 추가로 치환될 수 있으며, 이러한 개방 원자가가 여러 개 존재하는 경우, 이러한 그룹은 결합을 직접 형성하거나 새로운 헤테로원자, 바람직하게는 산소, 질소, 또는 황에 대한 결합을 형성함으로써 연결되어 고리를 형성할 수 있는 것으로 이해된다. 수소를 치환기로 대체하는 것이 본 발명의 분자에 허용될 수 없는 불안정성을 도입하지 않고 달리 화학적으로 타당하다면 상기 치환이 이루어질 수 있다는 것이 추가로 이해된다.
본원에 사용된 바와 같이, 용어 "배양"은 임의의 적합한 조건(예를 들어, 액체, 겔 또는 고체 배지 사용) 하에서 미생물 세포 집단을 성장시키는 것을 지칭한다.
재조합 폴리펩티드는 관련 기술분야에 공지된 임의의 적합한 방법을 사용하여 생산될 수 있다. 관심 있는 야생형 폴리펩티드를 코딩하는 유전자는 플라스미드와 같은 벡터에서 클로닝될 수 있고, 이. 콜리 등과 같은 원하는 숙주에서 발현될 수 있다. 재조합 폴리펩티드의 변이체는 관련 기술분야에 공지된 다양한 방법에 의해 생성될 수 있다. 실제로, 관련 기술분야의 기술자에게 잘 알려진 다양한 돌연변이 유발 기술이 존재한다. 또한, 돌연변이 유발 키트는 많은 상업용 분자생물학 공급업체에서도 구입할 수 있다. 정의된 아미노산의 특정 치환(부위 지시), 유전자의 국소 영역에서의 특정 또는 무작위 돌연변이(위치 특이적), 또는 전체 유전자에 대한 무작위 돌연변이 유발(예: 포화 돌연변이 유발)을 수행하는 방법을 사용할 수 있다. PCR을 이용한 단일 가닥 DNA 또는 이중 가닥 DNA의 부위 지시 돌연변이 유발, 카세트 돌연변이 유발, 유전자 합성, 오류가 발생하기 쉬운 PCR, 셔플링, 및 화학적 포화 돌연변이 유발, 또는 관련 기술분야에 공지된 임의의 다른 적합한 방법을 포함하지만 제한되지 않는, 효소 변이체를 생성하기 위한 수많은 적합한 방법이 관련 기술분야에 알려져 있다. 돌연변이 유발 및 지시된 진화 방법은 효소 코딩 폴리뉴클레오티드에 쉽게 적용되어 발현, 스크리닝 및 검정할 수 있는 변이체 라이브러리를 생성할 수 있다. 임의의 적합한 돌연변이 유발 및 지시된 진화 방법은 본 발명에 사용되며 관련 기술분야에 잘 알려져 있다(예를 들어, 미국 특허 제5,605,793호, 제5,811,238호, 제5,830,721호, 제5,834,252호, 제5,837,458호, 제5,928,905호, 제6,096,548호, 제6,117,679호, 제6,132,970호, 제6,165,793호, 제6,180,406호, 제6,251,674호, 제6,265,201호, 제6,277,638호, 제6,287,861호, 제6,287,862호, 제6,291,242호, 제6,297,053호, 제6,303,344호, 제6,309,883호, 제6,319,713호, 제6,319,714호, 제6,323,030호, 제6,326,204호, 제6,335,160호, 제6,335,198호, 제6,344,356호, 제6,352,859호, 제6,355,484호, 제6,358,740호, 제6,358,742호, 제6,365,377호, 제6,365,408호, 제6,368,861호, 제6,372,497호, 제6,337,186호, 제6,376,246호, 제6,379,964호, 제6,387,702호, 제6,391,552호, 제6,391,640호, 제6,395,547호, 제6,406,855호, 제6,406,910호, 제6,413,745호, 제6,413,774호, 제6,420,175호, 제6,423,542호, 제6,426,224호, 제6,436,675호, 제6,444,468호, 제6,455,253호, 제6,479,652호, 제6,482,647호, 제6,483,011호, 제6,484,105호, 제6,489,146호, 제6,500,617호, 제6,500,639호, 제6,506,602호, 제6,506,603호, 제6,518,065호, 제6,519,065호, 제6,521,453호, 제6,528,311호, 제6,537,746호, 제6,573,098호, 제6,576,467호, 제6,579,678호, 제6,586,182호, 제6,602,986호, 제6,605,430호, 제6,613,514호, 제6,653,072호, 제6,686,515호, 제6,703,240호, 제6,716,631호, 제6,825,001호, 제6,902,922호, 제6,917,882호, 제6,946,296호, 제6,961,664호, 제6,995,017호, 제7,024,312호, 제7,058,515호, 제7,105,297호, 제7,148,054호, 제7,220,566호, 제7,288,375호, 제7,384,387호, 제7,421,347호, 제7,430,477호, 제7,462,469호, 제7,534,564호, 제7,620,500호, 제7,620,502호, 제7,629,170호, 제7,702,464호, 제7,747,391호, 제7,747,393호, 제7,751,986호, 제7,776,598호, 제7,783,428호, 제7,795,030호, 제7,853,410호, 제7,868,138호, 제7,783,428호, 제7,873,477호, 제7,873,499호, 제7,904,249호, 제7,957,912호, 제7,981,614호, 제8,014,961호, 제8,029,988호, 제 8,048,674호, 제8,058,001호, 제8,076,138호, 제8,108,150호, 제8,170,806호, 제8,224,580호, 제8,377,681호, 제8,383,346호, 제8,457,903호, 제8,504,498호, 제8,589,085호, 제8,762,066호, 제8,768,871호, 제9,593,326호, 및 미국은 물론 PCT 및 미국 외 대응 국가의 모든 관련 특허; Ling et al, Anal. Biochem., 254(2):157-78 [1997]; Dale et al.,Meth. Mol. Biol., 57:369-74 [1996]; Smith, Ann. Rev. Genet., 19:423-462 [1985]; Botstein et al.,Science, 229:1193-1201 [1985]; Carter, Biochem. J., 237:1-7 [1986]; Kramer et al., Cell, 38:879-887 [1984]; Wellset al., Gene, 34:315-323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christianet al., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al., Nature, 391:288-291 [1998]; Crameri, et al., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. 미국, 94:4504-4509 [1997]; Crameriet al., Nat. Biotechnol., 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767; 및 WO 2009/152336를 참조하며, 모두 본원에 참조로 포함된다).
일부 실시양태에서, 돌연변이 유발 처리 후 얻은 효소 클론은 효소 제제를 정의된 온도(또는 다른 분석 조건)에 적용하고 열 처리 또는 다른 적합한 분석 조건 후에 남아 있는 효소 활성의 양을 측정하여 스크리닝된다. 그런 다음, 폴리펩티드를 코딩하는 폴리뉴클레오티드를 함유하는 클론을 유전자로부터 분리하고, 서열을 분석하여 뉴클레오티드 서열 변화(있는 경우)를 확인하고, 숙주 세포에서 효소를 발현하는 데 사용한다. 발현 라이브러리로부터 효소 활성을 측정하는 것은 관련 기술분야에 공지된 임의의 적합한 방법(예를 들어, HPLC 분석과 같은 표준 생화학 기술)을 사용하여 수행될 수 있다.
변이체가 생성된 후, 임의의 원하는 특성(예를 들어, 높거나 증가된 활성, 또는 낮거나 감소된 활성, 증가된 열 활성, 증가된 열 안정성, 및/또는 산성 pH 안정성 등)에 대해 스크리닝될 수 있다. 일부 실시양태에서, "재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드"(본원에서는 "조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드", "변이체 뉴클레오시드 데옥시리보실트랜스퍼라제 효소", "뉴클레오시드 데옥시리보실트랜스퍼라제 변이체" 및 "뉴클레오시드 데옥시리보실트랜스퍼라제 조합 변이체"라고도 함)가 용도를 발견하게 된다. 일부 실시양태에서, "재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드"("조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드", "변이체 뉴클레오시드 데옥시리보실트랜스퍼라제 효소", "뉴클레오시드 데옥시리보실트랜스퍼라제 변이체" 및 "뉴클레오시드 데옥시리보실트랜스퍼라제 조합 변이체"라고도 함)가 용도를 발견하게 된다.
본원에 사용된 바와 같이, "벡터"는 DNA 서열을 세포 내로 도입하기 위한 DNA 작제물이다. 일부 실시양태에서, 벡터는 DNA 서열에 코딩된 폴리펩티드의 적합한 숙주에서의 발현을 달성할 수 있는 적합한 제어 서열에 작동가능하게 연결된 발현 벡터이다. 일부 실시양태에서, "발현 벡터"는 숙주 세포에서 발현을 유도하기 위해 DNA 서열(예를 들어, 이식유전자)에 작동가능하게 연결된 프로모터 서열을 가지며, 일부 실시양태에서는 전사 종결자 서열도 포함한다.
본원에 사용된 바와 같이, 용어 "발현"은 전사, 전사후 변형, 번역, 및 번역후 변형을 포함하지만 이에 제한되지 않는 폴리펩티드 생산에 관련된 모든 단계를 포함한다. 일부 실시양태에서, 이 용어는 또한 세포로부터 폴리펩티드의 분비를 포함한다.
본원에 사용된 바와 같이, 용어 "생산하다"는 세포에 의한 단백질 및/또는 다른 화합물의 생산을 지칭한다. 이 용어는 전사, 전사후 변형, 번역, 및 번역후 변형을 포함하지만 이에 제한되지 않는 폴리펩티드 생산에 관련된 모든 단계를 포괄하는 것으로 의도된다. 일부 실시양태에서, 이 용어는 또한 세포로부터 폴리펩티드의 분비를 포함한다.
본원에 사용된 바와 같이, 아미노산 또는 뉴클레오티드 서열(예를 들어, 프로모터 서열, 신호 펩티드, 종결자 서열 등)은 두 서열이 자연에서 회합되지 않은 경우 작동가능하게 연결된 또 다른 서열에 대해 "이종"이다. 예를 들어, "이종 폴리뉴클레오티드"는 실험실 기술에 의해 숙주 세포 내로 도입되는 임의의 폴리뉴클레오티드이며, 숙주 세포로부터 제거되어 실험실 조작을 거친 후 숙주 세포 내로 재도입되는 폴리뉴클레오티드를 포함한다.
본원에 사용된 바와 같이, 용어 "숙주 세포" 및 "숙주 균주"는 본원에 제공된 DNA(예를 들어, 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체를 코딩하는 폴리뉴클레오티드)를 포함하는 발현 벡터용으로 적합한 숙주를 지칭한다. 일부 실시양태에서, 숙주 세포는 관련 기술분야에 공지된 재조합 DNA 기술을 사용하여 작제된 벡터로 형질전환되거나 형질감염된 원핵 또는 진핵 세포이다.
용어 "유사체"는 기준 폴리펩티드와의 서열 동일성이 70%초과이지만 100% 미만(예를 들어, 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 초과의 서열 동일성)인 폴리펩티드를 의미한다. 일부 실시양태에서, 유사체는 호모아르기닌, 오르니틴 및 노르발린뿐만 아니라 자연 발생 아미노산을 포함하지만 이에 제한되지 않는 하나 이상의 비천연 발생 아미노산 잔기를 함유하는 폴리펩티드를 의미한다. 일부 실시양태에서, 유사체는 또한 하나 이상의 D-아미노산 잔기 및 2개 이상의 아미노산 잔기 사이의 비펩티드 연결을 포함한다. 유사체라는 용어는 다른 화합물의 구조와 유사하지만 하나 이상의 차이점이 있는 화학 구조, 예를 들어 천연 치환기 또는 기가 비천연 치환기 또는 기로 치환되는 것을 포함할 수 있는 화학 구조를 지칭하는 데에도 사용될 수 있다.
"유효량"이라는 용어는 원하는 결과를 생성하기에 충분한 양을 의미한다. 관련 기술분야의 기술자는 일상적인 실험을 사용하여 유효량이 얼마인지 결정할 수 있다.
"단리된" 및 "정제된"이라는 용어는 분자(예를 들어, 단리된 핵산, 폴리펩티드 등) 또는 자연적으로 회합되어 있는 적어도 하나의 다른 성분으로부터 제거된 다른 성분을 지칭하는 데 사용된다. "정제된”이라는 용어는 절대적인 순도를 요구하는 것이 아니라 상대적인 정의를 의도한다.
본원에 사용된 바와 같이, "입체선택성"은 하나의 입체이성질체의 화학적 또는 효소적 반응에서 다른 것보다 우선적인 형성을 지칭한다. 입체선택성은 하나의 입체이성질체의 형성이 다른 것보다 선호되는 부분적일 수도 있고, 단지 하나의 입체이성질체만 형성되는 완전할 수도 있다. 입체이성질체가 거울상이성질체인 경우, 입체선택성은 거울상선택성, 즉 두 거울상이성질체의 합계에서 하나의 거울상이성질체의 분율(일반적으로 백분율로 보고됨)으로 지칭된다. 이는 일반적으로 [주 거울상 이성질체 - 소수 거울상 이성질체]/[주 거울상 이성질체 + 소수 거울상 이성질체] 공식에 따라 계산된 거울상 이성질체 과량("e.e.")으로서 관련 기술분야에 일반적으로 보고된다(일반적으로 백분율로 보고됨). 입체이성질체가 부분입체이성질체인 경우, 입체선택성은 부분입체선택성, 즉 두 개의 부분입체이성질체의 혼합물에서 하나의 부분입체이성질체의 분율(일반적으로 백분율로 보고됨)로 지칭되며, 일반적으로 부분입체이성질체 과량("d.e.")으로 보고된다. 거울상이성질체 과량 및 부분입체이성질체 과량은 입체이성질체 과량의 유형이다.
본원에 사용된 바와 같이, "위치선택성" 및 "위치선택적 반응"은 결합 생성 또는 파괴의 한 방향이 다른 모든 가능한 방향보다 우선적으로 발생하는 반응을 지칭한다. 반응은 구별이 완전한 경우 완전히(100%) 위치선택적일 수 있고, 한 부위에서의 반응 생성물이 다른 부위에서의 반응 생성물보다 우세한 경우 실질적으로 위치선택적(적어도 75%), 또는 부분적 위치선택적(×%, 여기서 백분율은 관심 반응에 의존적인 세트이다)일 수 있다.
본원에 사용된 바와 같이, "화학선택성"은 한 생성물이 화학적 또는 효소적 반응에서 다른 생성물보다 우선적으로 형성되는 것을 지칭한다.
본원에 사용된 바와 같이, "pH 안정"은 높거나 낮은 pH(예를 들어, 4.5 내지 6 또는 8 내지 12)에 일정 기간(예: 0.5-24시간) 동안 노출된 후에도 처리되지 않은 효소와 비교하여 유사한 활성(예를 들어, 60% 내지 80% 이상)을 유지하는 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 지칭한다.
본원에 사용된 바와 같이, "열안정"은 일정 기간 동안(예를 들어, 0.5-24시간) 승온(예를 들어, 40-80℃)에 노출된 후에도 동일한 상승된 온도에 노출된 야생형 효소와 비교하여 유사한 활성(예를 들어 60% 내지 80% 이상)을 유지하는 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 지칭한다.
본원에 사용된 바와 같이, "용매 안정"은 다양한 농도(예를 들어, 5-99%)의 용매(에탄올, 이소프로필 알코올, 디메틸술폭사이드[DMSO], 테트라히드로푸란, 2-메틸테트라히드로푸란, 아세톤, 톨루엔, 부틸 아세테이트, 메틸 3급-부틸 에테르 등)에 일정 기간(예: 0.5-24시간) 동안 노출된 후 동일한 농도의 동일한 용매에 노출된 야생형 효소와 비교하여 유사한 활성(예를 들어 60% 내지 80% 이상)을 유지하는 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 지칭한다.
본원에 사용된 바와 같이, "열안정성 및 용매안정성"은 열안정성 및 용매안정성 둘 다인 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 지칭한다.
본원에 사용된 바와 같이, "선택적" 및 "선택적으로"는 이후에 설명되는 사건 또는 상황이 발생할 수도 있고 발생하지 않을 수도 있고, 설명이 사건 또는 상황이 발생하는 경우와 발생하지 않는 경우를 포함한다는 것을 의미한다. 관련 기술분야의 기술자는 하나 이상의 선택적인 치환기를 함유하는 것으로 기술된 임의의 분자와 관련하여 입체적으로 실용적인 및/또는 합성적으로 가능한 화합물만이 포함되는 것을 의미함을 이해할 것이다.
본원에 사용된 바와 같이, "선택적으로 치환된"은 용어 또는 일련의 화학 그룹 내의 모든 후속 변형자를 지칭한다. 예를 들어, "선택적으로 치환된 아릴알킬"이라는 용어에서, 분자의 "알킬" 부분 및 "아릴" 부분은 치환될 수도 있고 치환되지 않을 수도 있으며, "선택적으로 치환된 알킬, 사이클로알킬, 아릴 및 헤테로아릴" 시리즈의 경우, 알킬, 사이클로알킬, 아릴 및 헤테로아릴기는 서로 독립적으로 치환되거나 치환되지 않을 수 있다.
발명의 상세한 설명
본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT) 효소, NDT 활성을 갖는 폴리펩티드, 및 이들 효소를 코딩하는 폴리뉴클레오티드, 뿐만 아니라 이들 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. NDT 효소를 생산하는 방법이 또한 제공된다. 본 발명은 NDT 효소를 포함하는 조성물 및 조작된 NDT 효소를 사용하는 방법을 추가로 제공한다. 본 발명은 약제학적 화합물의 생산에 있어서 특정 용도를 발견하였다.
일부 실시양태에서, 본 발명은 화합물(1)의 비천연 뉴클레오시드 유사체(아래에 도시됨, MK-8591로도 알려짐)의 시험관내 효소 합성에 유용한 효소를 제공한다. 본 발명은 뉴클레오시드 유사체를 생산하기 위한 생체촉매 효소의 사용을 다루기 위해 개발되었다. 그러나 이 접근법의 한 가지 과제는 야생형 효소가 이러한 화합물의 합성에 필요한 비천연 기질에 대해 제한된 활성을 갖는다는 것이다.
비천연 뉴클레오시드는 암 및 바이러스 감염 치료를 위한 약물을 포함하여 많은 중요한 종류의 약물에 필수적인 구성 요소이다. 시판 중이거나 임상 시험 중인 뉴클레오시드 유사체 약물은 적어도 12가지가 있다(Jordheim et al., Nat. Rev. Drug Discovery 12:447-464 [2013]). 화합물(1)의 비천연 뉴클레오시드는 강력한 항바이러스 활성을 가지며 인간 면역결핍 바이러스 및 기타 질병의 치료에 유용할 수 있다.
그러나, 화합물(1)의 전통적인 화학적 합성은 비효율적이며, 매우 낮은 수율로 12개 이상의 단계가 필요하다. 최근에는, 수율을 향상시키고, 합성 단계 수를 줄이며, 입체 선택성을 향상시키고, 독성 폐기물을 줄이기 위해 제약 중간체를 합성하는 데 생체촉매 방법이 사용되었다.
비천연 뉴클레오시드를 합성하기 위한 여러 생체촉매 방법이 제안되었다(Fresco-Taboada et al. Appl Microbiol Biotechnol 97, 3773-3785 (2013)). 한 가지 접근법은 퓨린 뉴클레오시드 포스포릴라제와 피리미딘 뉴클레오시드 포스포릴라제 또는 우리딘 포스포릴라제로 구성된 두 가지 효소 시스템을 사용하는 것이다. 그러나, 뉴클레오시드 디옥시리보실트랜스퍼라제(NDT) 효소는 단일 단계 공정을 허용할 수 있다. NDT는 유리 퓨린 또는 피리미딘 염기와 2'-데옥시리보뉴클레오시드의 퓨린 또는 피리미딘 염기 사이의 뉴클레오시드 교환을 촉매하는 것으로 알려져 있다. 따라서, 알키닐-데옥시우리딘(화합물(2))과 2-플루오로-아데닌(화합물 (3))의 NDT 촉매 뉴클레오시드 교환에 의한 화합물(1)의 알키닐 데옥시아데노신 생성물의 합성은 전통적인 화학 방법에 대한 매력적인 대안을 제시할 수 있다. 아래의 반응식 1을 참조한다.
반응식 1. 화합물(1)의 제안된 생체촉매 합성
그러나, 비천연 알키닐 기질인 화합물 (2)에 대한 야생형 NDT의 활성은 제한적이다. NDT 동족체의 여러 결정 구조를 사용할 수 있다(Lactobacillus helveticus, PDB 코드, 1S2L, 및 Lactobacillus leichmannii, PDB 코드, 1F8X, 특히). 이러한 결정 구조를 조사한 결과 기질 결합 포켓에 있는 잔기의 돌연변이가 알키닐 기질을 수용할 수 있음을 알 수 있다.
NDT 결합 포켓에 있는 비천연 기질의 제한된 수용으로 인해, 기질 특이성이 변경되고 비천연 뉴클레오시드 유사체의 생성이 개선된 조작된 NDT가 필요하다. 본 발명은 이러한 필요성을 해결하고 산업 조건 하에서 이러한 반응에 사용하기에 적합한 조작된 NDT를 제공한다.
조작된 NDT 폴리펩티드
본 발명은 조작된 NDT 폴리펩티드, 폴리펩티드를 코딩하는 폴리뉴클레오티드, 폴리펩티드 제조 방법, 및 폴리펩티드 사용 방법을 제공한다. 설명이 폴리펩티드에 관한 경우, 폴리펩티드를 코딩하는 폴리뉴클레오티드도 설명하는 것으로 이해되어야 한다.
일부 실시양태에서, 본 발명은 야생형 NDT 효소와 비교하여 개선된 특성을 갖는 조작된 비천연 발생 NDT 효소를 제공한다. 일부 실시양태에서, 조작된 NDT 효소는 화합물(2)의 알키닐 데옥시우리딘을 포함하여, 비천연 뉴클레오시드 유사체 및 중간체에 대한 향상된 기질 특이성을 포함한다. 일부 실시양태에서, NDT 효소는 화합물(2)에 대한 증가된 활성을 포함한다. 일부 실시양태에서, NDT 효소는 야생형 또는 기준 효소와 비교하여 증가된 열안정성을 포함한다. 일부 실시양태에서, NDT 효소는 야생형 또는 기준 효소와 비교하여 증가된 입체선택성을 포함한다. 일부 실시양태에서, NDT 효소는 야생형 또는 기준 효소와 비교하여 산업적으로 관련된 공정 조건 하에서 증가된 활성을 포함한다.
본 발명의 예시적인 비천연 발생(또는 조작된) 폴리펩티드에 대한 구조 및 기능 정보는 화합물(2) 및 화합물(3)의 화합물(1)로의 전환을 기반으로 하며, 그 결과는 하기 표 5-1, 6-1, 6-2, 7-1, 및/또는 7-2에 기재되어 있고, 실시예에 추가로 기재되어 있다. 이들 표의 홀수 번호 서열 식별자(즉, 서열번호)는 이들 표의 짝수 번호 서열번호에 의해 제공되는 아미노산 서열을 코딩하는 뉴클레오티드 서열을 지칭한다. 예시적인 서열은 본 발명에 수반되는 전자 서열 목록 파일에 제공되며, 이는 본원에 참조로 포함된다. 아미노산 잔기 차이는 표시된 바와 같이 서열번호 4, 14, 및/또는 126의 기준 서열과의 비교에 기초한다.
조작된 폴리펩티드의 상기 기재된 개선된 특성이 폴리펩티드의 농도 또는 양, 기질, 완충제, pH, 및/또는 온도 및 반응 시간을 포함하는 조건과 관련하여 결정될 수 있는 일부 적합한 반응 조건이 본원에 제공된다. 일부 실시양태에서, 적합한 반응 조건은 하기 및 실시예에 기술된 검정 조건을 포함한다.
관련 기술분야의 기술자에게 명백한 바와 같이, 전술한 잔기 위치 및 각 잔기 위치에 대한 특정 아미노산 잔기는 무엇보다도 효소 활성, 기질/생성물 선호도, 입체 선택성, 기질/생성물 내성 및 증가된 온도, 용매 및/또는 pH와 같은 다양한 조건 하에서의 안정성을 포함하여, 원하는 개선된 특성을 갖는 NDT 폴리펩티드를 합성하기 위해 개별적으로 또는 다양한 조합으로 사용될 수 있다.
관련 기술분야의 기술자가 이해하는 바와 같이, 일부 실시양태에서, 선택된 것 중 하나 또는 선택된 잔기 차이 중 하나 또는 조합은 조작된 NDT에서 핵심 특징으로서 일정하게 보존(즉, 유지)될 수 있고, 다른 잔기 위치에서의 추가적인 잔기 차이는 서열에 통합되어 개선된 특성을 갖는 추가적인 조작된 NDT 폴리펩티드를 생성시킬 수 있다. 따라서, 위의 잔기 차이 중 하나 또는 하위세트를 포함하는 임의의 조작된 NDT에 대해, 본 발명은 잔기 차이 중 하나 또는 하위세트와, 추가적으로 본원에 개시된 다른 잔기 위치에서의 하나 이상의 잔기 차이를 포함하는 다른 조작된 NDT를 고려하는 것으로 이해되어야 한다.
위에서 언급한 바와 같이, 조작된 NDT 폴리펩티드는 기질(예를 들어, 화합물(2) 및 화합물(3))을 생성물(예를 들어, 화합물(1))로 전환시킬 수 있다. 일부 실시양태에서, 조작된 NDT 폴리펩티드는 서열번호: 4, 14, 및/또는 126의 기준 폴리펩티드의 활성에 비해 적어도 1.2배, 1.45배, 2.5배, 3배, 4배, 5배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배 이상의 활성으로 기질 화합물을 생성물 화합물로 전환시킬 수 있다.
일부 실시양태에서, 서열번호: 4, 14, 및/또는 126에 비해 적어도 1.45배의 활성으로 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 6-214의 짝수 번호 서열로부터 선택된 아미노산 서열을 포함한다.
일부 실시양태에서, 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 4에 비해 적어도 1.45배의 활성을 가지며, 서열번호: 4와 비교하여 위치 X20, X101, 및/또는 X104에 하나 이상의 치환이 있는, 서열번호: 4와 서열 동일성이 적어도 80%인 아미노산 서열을 포함한다.
일부 실시양태에서, 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 4에 비해 적어도 3.5배의 활성을 가지며, 서열번호: 4와 비교하여 위치 X20, X101, 및/또는 X104에 하나 이상의 치환이 있는, 서열번호: 4와 서열 동일성이 적어도 80%인 아미노산 서열을 포함한다.
일부 실시양태에서, 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 4에 비해 적어도 1.45배의 활성을 가지며, 서열번호: 4와 비교하여 위치 X20, X101, 및/또는 X104에 하나 이상의 치환이 있는, 서열번호: 4와 서열 동일성이 적어도 95%인 아미노산 서열을 포함한다.
일부 실시양태에서, 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 4에 비해 적어도 3.5배의 활성을 가지며, 서열번호: 4와 비교하여 위치 X20, X101, 및/또는 X104에 하나 이상의 치환이 있는, 서열번호: 4와 서열 동일성이 적어도 95%인 아미노산 서열을 포함한다.
일부 실시양태에서, 본 발명은 또한 조작된 NDT 폴리펩티드의 기능적 NDT 활성 및/또는 개선된 특성을 유지하는, 본원에 기술된 임의의 조작된 NDT 폴리펩티드의 단편을 포함하는 조작된 NDT 폴리펩티드를 제공한다. 따라서, 일부 실시양태에서, 본 발명은 NDT 활성(예를 들어, 적합한 반응 조건 하에서 화합물(2) 및 화합물(3)을 화합물 (1)로 전환시킬 수 있음)을 갖는 폴리펩티드 단편을 제공하며, 여기서 상기 단편은 서열번호: 6-214의 짝수 번호 서열 식별자를 갖는 예시적인 조작된 폴리펩티드와 같은, 본 발명의 조작된 폴리펩티드의 전장 아미노산 서열의 적어도 80%, 90%, 95%, 98%, 또는 99%를 포함한다.
일부 실시양태에서, 본 발명의 조작된 NDT 폴리펩티드는 서열번호: 6-214의 짝수 번호 서열 식별자를 갖는 예시적인 조작된 폴리펩티드 서열과 같이 본원에 기술된 조작된 NDT 폴리펩티드 서열 중 어느 하나와 비교하여 결실을 포함하는 아미노산 서열을 포함한다. 따라서, 본 발명의 조작된 NDT 폴리펩티드의 각각의 모든 실시양태에 대해, 아미노산 서열은 1개 이상의 아미노산, 2개 이상의 아미노산, 3개 이상의 아미노산, 4개 이상의 아미노산, 5개 이상의 아미노산, 6개 이상의 아미노산, 8개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산 결실, NDT 폴리펩티드의 아미노산 총수의 최대 10%, 아미노산 총수의 최대 15%, 아미노산 총수의 최대 20%, 또는 아미노산 총수의 최대 30%를 포함하며, 여기서 본원에 기술된 조작된 NDT 폴리펩티드의 관련 기능적 활성 및/또는 개선된 특성은 유지된다. 일부 실시양태에서, 결실은 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55 또는 1-60개의 아미노산 잔기를 포함할 수 있다. 일부 실시양태에서, 결실의 수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45, 50, 55 또는 60개의 아미노산 잔기일 수 있다. 일부 실시양태에서, 결실은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24, 25 또는 30개의 아미노산 잔기의 결실을 포함할 수 있다.
일부 실시양태에서, 본 발명은 서열번호: 6-214의 짝수 번호 서열 식별자를 갖는 예시적인 조작된 폴리펩티드 서열과 같이, 본원에 기술된 조작된 NDT 폴리펩티드 서열 중 어느 하나와 비교하여 삽입을 포함하는 아미노산 서열을 갖는 조작된 NDT 폴리펩티드를 제공한다. 따라서, 본 발명의 조작된 NDT 폴리펩티드의 각각의 모든 실시양태에 대해, 아미노산 서열은 1개 이상의 아미노산, 2개 이상의 아미노산, 3개 이상의 아미노산, 4개 이상의 아미노산, 5개 이상의 아미노산, 6개 이상의 아미노산, 8개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산을 포함할 수 있고, 여기서 본원에 기술된 조작된 NDT 폴리펩티드의 관련 기능적 활성 및/또는 개선된 특성은 유지된다. 삽입은 아미노 또는 카르복시 말단 또는 NDT 폴리펩티드의 내부 부분에서 이루어질 수 있다.
일부 실시양태에서, 본 발명의 폴리펩티드는 조작된 폴리펩티드가 다른 폴리펩티드, 예컨대, 예를 들어 비제한적으로, 항체 태그(예를 들어, myc 에피토프), 정제 서열(예: 금속 결합을 위한 His 태그), 및 세포 국소화 신호(예: 분비 신호)에 융합된 융합 폴리펩티드의 형태이다. 따라서, 본원에 기술된 조작된 폴리펩티드는 다른 폴리펩티드와의 융합과 함께 또는 융합 없이 사용될 수 있다.
본원에 기술된 조작된 NDT 폴리펩티드는 유전적으로 코딩된 아미노산으로 제한되지 않는다. 따라서, 유전적으로 코딩된 아미노산 이외에, 본원에 기술된 폴리펩티드는 전체 또는 부분적으로 자연 발생 및/또는 합성 비-코딩된 아미노산으로 구성될 수 있다. 본원에 기술된 폴리펩티드가 포함될 수 있는 일반적으로 접하는 비-코딩된 아미노산에는 유전적으로 코딩된 아미노산의 D-입체이성질체; 2,3-디아미노프로피온산(Dpr); α-아미노이소부티르산(Aib); ε-아미노헥사노산(Aha); δ-아미노발레르산(Ava); N-메틸글리신 또는 사르코신(MeGly 또는 Sar); 오르니틴(Orn); 시트룰린(Cit); t-부틸알라닌(Bua); t-부틸글리신(Bug); N-메틸이소류신(MeIle); 페닐글리신(Phg); 사이클로헥실알라닌(Cha); 노르류신(Nle); 나프틸알라닌(Nal); 2-클로로페닐알라닌(Ocf); 3-클로로페닐알라닌(Mcf); 4-클로로페닐알라닌(Pcf); 2-플루오로페닐알라닌(Off); 3-플루오로페닐알라닌(Mff); 4-플루오로페닐알라닌(Pff); 2-브로모페닐알라닌(Obf); 3-브로모페닐알라닌(Mbf); 4-브로모페닐알라닌(Pbf); 2-메틸페닐알라닌(Omf); 3-메틸페닐알라닌(Mmf); 4-메틸페닐알라닌(Pmf); 2-니트로페닐알라닌(Onf); 3-니트로페닐알라닌(Mnf); 4-니트로페닐알라닌(Pnf); 2-시아노페닐알라닌(Ocf); 3-시아노페닐알라닌(Mcf); 4-시아노페닐알라닌(Pcf); 2-트리플루오로메틸페닐알라닌(Otf); 3-트리플루오로메틸페닐알라닌(Mtf); 4-트리플루오로메틸페닐알라닌(Ptf); 4-아미노페닐알라닌(Paf); 4-요오도페닐알라닌(Pif); 4-아미노메틸페닐알라닌(Pamf); 2,4-디클로로페닐알라닌(Opef); 3,4-디클로로페닐알라닌(Mpcf); 2,4-디플루오로페닐알라닌(Opff); 3,4-디플루오로페닐알라닌(Mpff); 피리드-2-일알라닌(2pAla); 피리드-3-일알라닌(3pAla); 피리드-4-일알라닌(4pAla); 나프트-1-일알라닌(1nAla); 나프트-2-일알라닌(2nAla); 티아졸릴알라닌(taAla); 벤조티에닐알라닌(bAla); 티에닐알라닌(tAla); 푸릴알라닌(fAla); 호모페닐알라닌(hPhe); 호모티로신(hTyr); 호모트립토판(hTrp); 펜타플루오로페닐알라닌(5ff); 스티릴칼라닌(sAla); 아우트릴알라닌(aAla); 3,3-디페닐알라닌(Dfa); 3-아미노-5-페닐펜탄산(Afp); 페니실라민(Pen); 1,2,3,4-테트라히드로이소퀴놀린-3-카르복실산 (Tic); 2-티에닐알라닌(Thi); 메티오닌 술폭시드(Mso); N(w)-니트로아르기닌(nArg); 호모라이신(hLys); 포스포노메틸페닐알라닌(pmPhe); 포스포세린(pSer); 포스포트레오닌(pThr); 호모아스파르트산(hAsp); 호모글루탐산(hGlu); 1-아미노사이클로펜트-(2 또는 3)-엔-4 카르복실산; 피페콜산(PA), 아제티딘-3-카르복실산(ACA); 1-아미노사이클로펜탄-3-카르복실산; 알릴글리신(aOly); 프로파르길글리신(pgGly); 호모알라닌(hAla); 노르발린(nVal); 호모류신(hLeu), 호모발린(hVal); 호모이소류신(hIle); 호모아르기닌(hArg); N-아세틸 라이신(AcLys); 2,4 디아미노부티르산(Dbu); 2,3-디아미노부티르산(Dab); N-메틸발린(MeVal); 호모시스테인(hCys); 호모세린(hSer); 히드록시프롤린(Hyp)과 호모프롤린(hPro)이 포함되지만, 이들로 제한되는 것은 아니다. 본원에 기술된 폴리펩티드가 포함될 수 있는 추가적인 비-코딩 아미노산은 관련 기술분야의 기술자에게 명백할 것이다. 이들 아미노산은 L 또는 D 배열일 수 있다.
관련 기술분야의 기술자는 측쇄 보호기를 보유하는 아미노산 또는 잔기가 또한 본원에 기술된 폴리펩티드를 포함할 수 있음을 인식할 것이다. 이러한 경우 방향족 범주에 속하는 보호된 아미노산의 비제한적 예에는 Arg(tos), Cys(메틸벤질), Cys(니트로피리딘술페닐), Glu(δ-벤질에스테르), Gln(크산틸), Asn(N-δ-크산틸), His(bom), His(벤질), His(tos), Lys(fmoc), Lys(tos), Ser(O-벤질), Thr(O-벤질) 및 Tyr(O-벤질)이 포함되지만(괄호 안에 나열된 보호기), 이들로 제한되지 않는다.
본원에 기재된 폴리펩티드가 구성될 수 있는 형태적으로 제한된 비-코딩 아미노산에는 N-메틸 아미노산(L-배열); 1-아미노사이클로펜트-(2 또는 3)-엔-4-카르복실산; 피페콜산; 아제티딘-3-카르복실산; 호모프롤린(hPro); 및 1 아미노사이클로펜탄-3-카르복실산이 포함되지만, 이들로 제한되지 않는다.
일부 실시양태에서, 조작된 폴리펩티드는 막, 수지, 고체 담체, 또는 기타 고체상 물질과 같은 고체 지지체 상에 제공될 수 있다. 고체 지지체는 폴리스티렌, 폴리에틸렌, 폴리프로필렌, 폴리플루오로에틸렌, 폴리에틸렌옥시, 및 폴리아크릴아미드와 같은 유기 중합체뿐만 아니라 이들의 공중합체 및 그래프트로 구성될 수 있다. 고체 지지체는 유리, 실리카, 제어된 공극 유리(CPG), 역상 실리카 또는 금이나 백금과 같은 금속과 같은 무기물일 수도 있다. 고체 지지체의 구조는 비드, 구형, 입자, 과립, 겔, 막 또는 표면의 형태일 수 있다. 표면은 평면형, 실질적으로 평면형 또는 비평면형일 수 있다. 고체 지지체는 다공성 또는 비다공성일 수 있으며 팽윤 또는 비팽창 특성을 가질 수 있다. 고체 지지체는 웰, 함몰 또는 기타 용기, 베슬, 피쳐 또는 위치의 형태로 구성될 수 있다.
일부 실시양태에서, NDT 활성을 갖는 조작된 폴리펩티드는 기준 폴리펩티드(예를 들어, 서열번호: 4, 14, 및/또는 126)와 비교하여 이들이 개선된 활성, 거울상선택성, 입체선택성, 및/또는 기타 개선된 특성을 갖도록 고체 지지체에 결합되거나 고정화된다. 이러한 실시양태에서, 고정화된 폴리펩티드는 기질 화합물의 원하는 생성물로의 생체촉매적 전환을 촉진할 수 있고, 반응이 완료된 후 쉽게 유지되고(예를 들어, 폴리펩티드가 고정된 비드를 유지함으로써) 후속 반응에서 재사용되거나 재활용될 수 있다. 이러한 고정화 효소 공정은 추가적인 효율성과 비용 절감을 가능하게 한다. 따라서, 본 발명의 조작된 NDT 폴리펩티드를 사용하는 임의의 방법은 고체 지지체 상에 결합되거나 고정화된 동일한 NDT 폴리펩티드를 사용하여 수행될 수 있음이 추가로 고려된다.
조작된 NDT 폴리펩티드는 비공유적으로 또는 공유적으로 결합될 수 있다. 고체 지지체(예를 들어, 수지, 막, 비드, 유리 등)에 대한 효소의 접합 및 고정화를 위한 다양한 방법은 해당 분야에 잘 알려져 있다. 특히, PCT 공개 공보 제WO2012/177527 A1호에는 고정화된 폴리펩티드를 제조하는 방법이 개시되어 있으며, 여기서 폴리펩티드는 소수성 상호작용 또는 공유 결합에 의해 수지에 물리적으로 부착되고 적어도 최대 100% 유기 용매를 포함하는 용매 시스템에서 안정하다. 고체 지지체(예를 들어, 수지, 막, 비드, 유리 등)에 대한 효소의 접합 및 고정화를 위한 다른 방법은 관련 분야에 잘 알려져 있다(예를 들어, 문헌: Yi et al., Proc. Biochem., 42: 895-898 [2007]; Martin 등, Appl. Microbiol. Biotechnol., 76: 843-851 [2007]; Koszelewski 등, J. Mol. Cat. B: Enz., 63: 39-44 [2010]; Truppo 등, Org. Proc. Res. Development, 온라인 출판: dx.doi.org/10.1021/op200157c; 및 Mateo 등, Biotechnol. Prog., 18:629-34 [2002] 등을 참조한다).
본 발명의 조작된 NDT 폴리펩티드를 고정시키는 데 유용한 고체 지지체에는 에폭사이드 작용기를 갖는 폴리메타크릴레이트, 아미노 에폭사이드 작용기를 갖는 폴리메타크릴레이트, 스티렌/DVB 공중합체 또는 옥타데실 작용기를 갖는 폴리메타크릴레이트를 포함하는 비드 또는 수지가 포함되지만, 이에 제한되지 않는다. 본 발명의 조작된 NDT 폴리펩티드를 고정시키는 데 유용한 예시적인 고체 지지체에는 다음과 같은 다양한 유형의 SEPABEAD: EC-EP, EC-HFA/ S, EXA252, EXE119 및 EXE120를 포함하여, 키토산 비드, Eupergit C, 및 SEPABEAD(Mitsubishi)가 포함되지만, 이에 제한되지 않는다.
일부 실시양태에서, 조작된 NDT 폴리펩티드는 폴리펩티드가 위치상으로 구별되는 위치에 배열되어 있는 어레이의 형태로 제공된다. 일부 실시양태에서, 위치적으로 구별되는 위치는 96개-웰 플레이트와 같은 고체 지지체중의 웰이다. 복수의 지지체는 시약의 로봇식 운반을 위해, 또는 검출 방법 및/또는 기구에 의해 주소 지정이 가능한 다양한 위치의 어레이에 구성될 수 있다. 이러한 어레이는 폴리펩티드에 의한 전환을 위한 다양한 기질 화합물을 테스트하는 데 사용될 수 있다.
일부 실시양태에서, 본원에 기재된 조작된 폴리펩티드는 키트 형태로 제공된다. 키트 내의 폴리펩티드는 개별적으로 또는 다수의 폴리펩티드로서 존재할 수 있다. 키트에는 효소 반응을 수행하기 위한 시약, 폴리펩티드의 활성을 평가하기 위한 기질, 뿐만 아니라 생성물을 검출하기 위한 시약이 추가로 포함될 수 있다. 키트에는 또한 시약 디스펜서와 키트 사용 지침이 포함될 수 있다. 일부 실시양태에서, 본 발명의 키트는 서로 다른 주소 지정 가능 위치에 다수의 서로 다른 조작된 NDT 폴리펩티드를 포함하는 어레이를 포함하며, 여기서 서로 다른 폴리펩티드는 각각 적어도 하나의 서로 다른 개선된 효소 특성을 갖는 기준 서열의 서로 다른 변이체이다. 복수의 조작된 폴리펩티드를 포함하는 이러한 어레이 및 이의 사용 방법은 공지되어 있다(예를 들어, WO2009/008908A2 참조).
조작된 NDT 효소를 사용하는 방법
일부 실시양태에서, 본원에 기술된 NDT 효소는 화합물(2) 및 화합물(3)을 화합물(1)로 전환시키는 공정에서 용도를 찾는다. 일부 실시양태에서, 뉴클레오시드 교환 반응을 수행하는 방법은 단일 단계 또는 원포트 합성을 포함한다.
임의의 적합한 반응 조건이 본 발명에 사용된다. 일부 실시양태에서, 뉴클레오시드 교환 반응을 수행하기 위해 조작된 폴리펩티드의 개선된 특성을 분석하는 방법이 사용된다. 일부 실시양태에서, 반응 조건은 조작된 NDT의 농도 또는 양, 기질(들), 완충액(들), 용매(들), pH, 온도 및 반응 시간을 포함한 조건, 및/또는 고체 지지체상에 고정화된 조작된 NDT에 대한 조건과 관련하여, 아래 및 실시예에 추가로 설명되는 바와 같이 수정된다.
일부 실시양태에서, 반응 조건을 보충하기 위해 추가적인 반응 성분 또는 추가적인 기술이 활용된다. 일부 실시양태에서, 여기에는 효소의 불활성화를 안정화 또는 방지하고, 생성물 억제를 감소시키며, 반응 평형을 원하는 생성물 형성으로 이동시키기 위한 조치를 취하는 것이 포함된다.
본원에 제공되고 실시예에 예시된 실시양태에서, 공정에 사용될 수 있는 다양한 범위의 적합한 반응 조건에는 기질 부하량, 보조 기질 부하량, 환원제, 2가 전이 금속, pH, 온도, 완충액, 용매 시스템, 폴리펩티드 부하량 및 반응 시간이 포함되지만 이에 제한되지 않는다. 본원에 기술된 조작된 NDT 폴리펩티드를 사용하여 기질 화합물을 생성물 화합물로 생체촉매적으로 전환하는 공정을 수행하기 위한 추가의 적합한 반응 조건은 농도, pH, 온도 및 용매 조건의 실험적 반응 조건 하에서 조작된 NDT 폴리펩티드 및 기질 화합물을 접촉시키고, 생성물 화합물을 검출하는 것을 포함하지만, 이들로 제한되지 않는 통상의 실험에 의해 본원에 제공되는 지침면에서 용이하게 최적화될 수 있다.
반응 혼합물 중 기질 화합물은 예를 들어 원하는 생성물 화합물의 양, 기질 농도가 효소 활성에 미치는 영향, 반응 조건 하에서 효소의 안정성 및 기질의 생성물로의 기질 전환율을 고려하여 변화될 수 있다. 일부 실시양태에서, 적합한 반응 조건은 적어도 약 0.5 내지 약 200 g/ℓ, 1 내지 약 200 g/ℓ, 5 내지 약 150 g/ℓ, 약 10 내지 약 100 g/ℓ, 20 내지 약 100 g/ℓ 또는 약 50 내지 약 100 g/ℓ의 기질 화합물인 화합물(2)를 포함한다. 일부 실시양태에서, 적합한 반응 조건은 적어도 약 0.5 g/ℓ, 적어도 약 1 g/ℓ, 적어도 약 5 g/ℓ, 적어도 약 10 g/ℓ, 적어도 약 15 g/, 적어도 약 20 g/ℓ, 적어도 약 30 g/ℓ, 적어도 약 50 g/ℓ, 적어도 약 75 g/ℓ, 적어도 약 100 g/ℓ, 적어도 약 150 g/ℓ 또는 적어도 약 200 g/ℓ 또는 그 이상의 기질 화합물 부하량을 포함한다. 본원에 제공된 기질 부하량에 대한 값은 화합물(2)의 분자량을 기준으로 하지만; 등몰량의 다양한 2'-데옥시리보뉴클레오시드 유사체도 공정에 사용될 수 있다는 점도 고려된다.
일부 실시양태에서, 적합한 반응 조건은 적어도 약 0.5 내지 약 200 g/ℓ, 1 내지 약 200 g/ℓ, 5 내지 약 150 g/ℓ, 약 10 내지 약 100 g/ℓ, 20 내지 약 100 g/ℓ 또는 약 50 내지 약 100 g/ℓ의 기질 화합물, 화합물(3) 부하량을 포함한다. 일부 실시양태에서, 적합한 반응 조건은 적어도 약 0.5 g/ℓ, 적어도 약 1 g/ℓ, 적어도 약 5 g/ℓ, 적어도 약 10 g/ℓ, 적어도 약 15 g/ℓ, 적어도 약 20 g/ℓ, 적어도 약 30 g/ℓ, 적어도 약 50 g/ℓ, 적어도 약 75 g/ℓ, 적어도 약 100 g/ℓ, 적어도 약 150 g/ℓ 또는 적어도 약 200 g/ℓ, 또는 그 이상의 기질 화합물 부하량을 포함한다. 본원에 제공된 기질 부하량에 대한 값은 화합물(3)의 분자량을 기준으로 하지만; 등몰량의 다양한 퓨린 염기 유사체가 공정에 사용될 수 있다는 점도 고려된다.
본원에 기술된 NDT 매개 공정을 수행함에 있어서, 조작된 폴리펩티드는 세포 추출물 및/또는 그러한 세포의 용해물로서, 정제된 효소, 부분적으로 정제된 효소, 효소를 코딩하는 유전자(들)로 형질전환된 전체 세포의 형태, 및/또는 고체 지지체 상에 고정된 효소로서 반응 혼합물에 첨가될 수 있다. 조작된 NDT 효소 또는 세포 추출물, 이의 용해물 및 분리된 효소를 코딩하는 유전자(들)로 형질전환된 전체 세포는 고체(예: 동결건조, 분무 건조 등) 또는 반고체(예: 조질 페이스트)를 비롯한 다양한 형태로 사용될 수 있다. 세포 추출물 또는 세포 용해물은 침전(황산암모늄, 폴리에틸렌이민, 열 처리 등)에 이어 동결건조 전 탈염 과정(예: 한외여과, 투석 등)을 통해 부분적으로 정제될 수 있다. 임의의 효소 제제(전체 세포 제제 포함)는 예를 들어 글루타르알데히드와 같은 공지된 가교제를 사용한 가교결합 또는 고체상(예를 들어 Eupergit C 등)에 고정화에 의해 안정화될 수 있다.
조작된 NDT 폴리펩티드를 코딩하는 유전자(들)는 동일한 숙주 세포 내로 별도로 또는 함께 숙주 세포로 형질전환될 수 있다. 예를 들어, 일부 실시양태에서 숙주 세포의 한 세트는 하나의 조작된 NDT 폴리펩티드를 코딩하는 유전자(들)로 형질전환될 수 있고 다른 세트는 또 다른 조작된 NDT 폴리펩티드를 코딩하는 유전자(들)로 형질전환될 수 있다. 형질전환된 세포의 두 세트 모두 전체 세포 형태, 또는 그로부터 유래된 용해물 또는 추출물의 형태로 반응 혼합물에서 함께 활용될 수 있다. 다른 실시양태에서, 숙주 세포는 다수의 조작된 NDT 폴리펩티드를 코딩하는 유전자(들)로 형질전환될 수 있다. 일부 실시양태에서, 조작된 폴리펩티드는 분비된 폴리펩티드의 형태로 발현될 수 있고, 분비된 폴리펩티드를 함유하는 배양 배지는 NDT 반응을 위해 사용될 수 있다.
일부 실시양태에서, 본원에 개시된 조작된 NDT 폴리펩티드의 개선된 활성 및/또는 기질 선택성은 더 낮은 농도의 조작된 폴리펩티드로 더 높은 전환율을 달성할 수 있는 방법을 제공한다. 공정의 일부 실시양태에서, 적합한 반응 조건은 기질 화합물 부하량의 약 0.03%(w/w), 0.05%(w/w), 0.1%(w/w), 0.15%(w/w), 0.2%(w/w), 0.3%(w/w), 0.4%(w/w), 0.5%(w/w), 1%(w/w), 2%(w/w), 5%(w/w), 10%(w/w), 20%(w/w) 이상의 조작된 폴리펩티드 양을 포함한다.
일부 실시양태에서, 조작된 폴리펩티드는 약 0.01 g/ℓ 내지 약 15 g/ℓ; 약 0.05 g/ℓ 내지 약 15 g/ℓ; 약 0.1 g/ℓ 내지 약 10 g/ℓ; 약 1 g/ℓ 내지 약 8 g/ℓ; 약 0.5 g/ℓ 내지 약 10 g/ℓ; 약 1 g/ℓ 내지 약 10 g/ℓ; 약 0.1 g/ℓ 내지 약 5 g/ℓ; 약 0.5 g/ℓ 내지 약 5 g/ℓ; 또는 약 0.1 g/ℓ 내지 약 2 g/ℓ로 존재한다. 일부 실시양태에서, NDT 폴리펩티드는 약 0.01 g/ℓ, 0.05 g/ℓ, 0.1 g/ℓ, 0.2 g/ℓ, 0.5 g/ℓ, 1 g/ℓ, 2 g/ℓ, 5 g/ℓ, 10 g/ℓ 또는 15 g/ℓ로 존재한다.
반응 과정 동안, 반응 혼합물의 pH가 변할 수 있다. 반응 혼합물의 pH는 원하는 pH 또는 원하는 pH 범위 내에서 유지될 수 있다. 이는 반응 전 및/또는 도중에 산이나 염기를 첨가하여 수행할 수 있다. 대안적으로, 완충액을 사용하여 pH를 조절할 수도 있다. 따라서, 일부 실시양태에서, 반응 조건은 완충제를 포함한다. 원하는 pH 범위를 유지하는 데 적합한 완충액은 관련 기술분야에 공지되어 있으며, 예를 들어 붕산염, 시트레이트 인산염, 인산염, 2-(N-모르폴리노)에탄술폰산(MES), 3-(N-모르폴리노)프로판술폰산(MOPS), 아세테이트, 트리에탄올아민(TEoA), 2-아미노-2-히드록시메틸-프로판-1,3-디올(Tris) 등을 포함하지만 이에 제한되지 않는다. 일부 실시양태에서, 완충제는 시트레이트 포스페이트 완충제이다. 공정의 일부 실시양태에서, 적합한 반응 조건은 약 0.01 내지 약 0.4 M, 0.05 내지 약 0.4 M, 0.1 내지 약 0.3 M, 또는 약 0.1 내지 약 0.2 M의 완충제(예를 들어, 시트레이트 포스페이트) 농도를 포함한다. 일부 실시양태에서, 반응 조건은 약 0.01, 0.02, 0.03, 0.04, 0.05, 0.07, 0.1, 0.12, 0.14, 0.16, 0.18, 0.2, 0.3 또는 0.4M의 완충제(예를 들어, 시트레이트 포스페이트) 농도를 포함한다.
일부 실시양태에서, 반응 조건은 습식 유기 용매를 포함한다. 적합한 습식 유기 용매는 관련 기술분야에 공지되어 있으며, 예를 들어 습식 이소프로필 알코올, 습식 톨루엔 및 습식 메틸 3급 부틸 에테르를 포함하지만 이에 제한되지 않는다.
공정의 실시양태에서, 반응 조건은 적합한 pH를 포함할 수 있다. 원하는 pH 또는 원하는 pH 범위는 산이나 염기, 적절한 완충제, 또는 완충제와 산이나 염기 첨가의 조합을 사용하여 유지될 수 있다. 반응 혼합물의 pH는 반응 전 및/또는 반응 과정 중에 제어될 수 있다. 일부 실시양태에서, 적합한 반응 조건은 pH 약 4 내지 약 10, pH 약 5 내지 약 10, pH 약 5 내지 약 9, pH 약 6 내지 약 9, 또는 pH 약 6 내지 약 8의 용액을 포함한다. 일부 실시양태에서, 반응 조건은 약 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5 또는 10의 용액 pH를 포함한다.
본원의 공정의 실시양태에서, 예를 들어 더 높은 온도에서의 반응 속도의 증가 및 반응 시간 동안 효소의 활성을 고려하여 반응 조건에 적합한 온도가 사용될 수 있다. 따라서, 일부 실시양태에서, 적합한 반응 조건은 약 10℃ 내지 약 60℃, 약 10℃ 내지 약 55℃, 약 15℃ 내지 약 60℃, 약 20℃ 내지 60℃, 약 20℃ 내지 약 55℃, 약 25℃ 내지 약 55℃ 또는 약 30℃ 내지 약 50℃의 온도를 포함한다. 일부 실시양태에서, 적합한 반응 조건은 약 10℃, 15℃, 20℃, 25℃, 30℃, 35℃, 40℃, 45℃, 50℃, 55℃ 또는 60℃의 온도를 포함한다. 일부 실시양태에서, 효소 반응 동안의 온도는 반응 과정 전반에 걸쳐 특정 온도로 유지될 수 있다. 일부 실시양태에서, 효소 반응 동안의 온도는 반응 과정 동안의 온도 프로파일에 따라 조정될 수 있다.
일부 실시양태에서, 적합한 반응 조건은 약 20 g/ℓ의 기질 알키닐 데옥시우리딘(화합물(2)), 약 15 g/ℓ의 기질 2-F-아데닌(화합물(3)), 약 0.05 g /ℓ의 NDT 폴리펩티드, 100mM 시트레이트 포스페이트, 약 pH 6, 및 약 45℃이다.
일부 실시양태에서, 반응 조건은 반응을 안정화하거나 향상시키기 위한 계면활성제를 포함할 수 있다. 계면활성제는 비이온성, 양이온성, 음이온성 및/또는 양친매성 계면활성제를 포함할 수 있다. 예시적인 계면활성제에는 예를 들어 노닐 페녹시폴리에톡실에탄올(NP40), 트리톤 X-100, 폴리옥시에틸렌-스테아릴아민, 세틸트리메틸암모늄 브로마이드, 나트륨 올레일아미도황산염, 폴리옥시에틸렌-소르비탄모노스테아레이트, 헥사데실디메틸아민 등이 포함되지만 이에 제한되지 않는다. 반응을 안정화하거나 향상시킬 수 있는 임의의 계면활성제가 이용될 수 있다. 반응에 사용되는 계면활성제의 농도는 일반적으로 0.1 내지 50 ㎎/㎖, 특히 1 내지 20 ㎎/㎖일 수 있다.
일부 실시양태에서, 반응 조건은 반응 용액이 혼합되거나 살포되는 경우와 같이 반응 용액에서 거품의 형성을 감소시키거나 방지하는 데 도움이 되는 소포제를 포함할 수 있다. 소포제에는 비극성 오일(예: 미네랄, 실리콘 등), 극성 오일(예: 지방산, 알킬 아민, 알킬 아미드, 알킬 황산염 등) 및 소수성(예: 처리된 실리카, 폴리프로필렌 등)이 포함되며, 이들 중 일부는 계면활성제로도 기능한다. 예시적인 소포제에는 Y-30®(Dow Corning), 폴리글리콜 공중합체, 옥시/에톡실화 알코올, 및 폴리디메틸실록산이 포함된다. 일부 실시양태에서, 약 0.001%(v/v) 내지 약 5%(v/v), 약 0.01%(v/v) 내지 약 5%(v/v), 약 0.1%(v/v) 내지 약 5%(v/v), 또는 약 0.1%(v/v) 내지 약 2%(v/v)로 존재할 수 있다. 일부 실시양태에서, 소포제는 반응을 촉진하기 위한 목적에 따라 약 0.001%(v/v), 약 0.01%(v/v), 약 0.1%(v/v), 약 0.5%(v/v), 약 0.001%(v/v), 1%(v/v), 약 2%(v/v), 약 3%(v/v), 약 4%(v/v), 또는 약 5%(v/v) 또는 그 이상으로 존재할 수 있다.
뉴클레오시드 교환 반응에 사용되는 반응물의 양은 일반적으로 원하는 생성물의 양 및 그에 따라 사용되는 기질의 양에 따라 달라질 것이다. 관련 기술분야의 기술자는 원하는 수준의 생산성 및 생산 규모에 맞춰 이들 양을 변화시키는 방법을 쉽게 이해할 것이다.
일부 실시양태에서, 반응물의 첨가 순서는 중요하지 않다. 반응물은 용매(예를 들어, 단상 용매, 2상 수성 공용매 시스템 등)에 동시에 첨가될 수 있거나, 대안적으로 반응물의 일부는 별도로 첨가될 수 있고 일부는 다른 시점에 함께 첨가될 수 있다.
고체 반응물(예를 들어, 효소, 염 등)은 분말(예를 들어, 동결건조, 분무 건조 등), 용액, 에멀젼, 현탁액 등을 포함한, 다양한 서로 다른 형태로 반응에 제공될 수 있다. 반응물은 관련 기술분야의 기술자에게 공지된 방법 및 장비를 사용하여 용이하게 동결건조되거나 분무 건조될 수 있다. 예를 들어, 단백질 용액을 작은 분취량으로 -80℃에서 냉동한 다음 미리 냉각된 동결 건조 챔버에 첨가한 다음, 진공을 적용할 수 있다.
수성 공용매 시스템을 사용할 때 혼합 효율을 향상시키기 위해, NDT 효소 및 보조인자를 먼저 첨가하고 수성 상에 혼합할 수 있다. 이어서, 유기상을 첨가하고 혼합한 후, PPM 효소 기질, 기타 효소(예를 들어 SP, DERA 및 PNP), 및 공동 기질을 첨가할 수 있다. 대안적으로, PPM 효소 기질은 수성 상에 첨가되기 전에 유기 상에 미리 혼합될 수 있다.
뉴클레오시드 교환 공정은 일반적으로 기질의 생성물로의 추가 전환이 반응 시간에 따라 크게 변하지 않을 때까지(예를 들어, 기질의 10% 미만이 전환되거나, 기질의 5% 미만이 전환됨) 진행되도록 허용된다. 일부 실시양태에서, 기질이 생성물로 완전하게 또는 거의 완전하게 전환될 때까지 반응이 진행되도록 허용된다. 기질에서 생성물로의 전환은 유도체화 여부에 관계없이 기질 및/또는 생성물을 검출함으로써 공지된 방법을 사용하여 모니터링할 수 있다. 적합한 분석 방법에는 가스 크로마토그래피, HPLC, MS 등이 포함된다.
공정의 일부 실시양태에서, 적합한 반응 조건은 적어도 약 5 g/ℓ, 10 g/ℓ, 20 g/ℓ, 30 g/ℓ, 40 g/ℓ, 50 g/ℓ, 60 g/ℓ, 70 g/ℓ, 100 g/ℓ, 또는 그 이상의 기질 부하량을 포함하며, 이 방법은 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 그 이상의 기질을 생성물 화합물로 약 48시간 이하, 약 36시간 이하, 약 24시간 이하, 또는 약 3시간 이하 내에 전환시킨다.
조작된 NDT 폴리펩티드를 사용하여 기질 화합물을 생성물 화합물로 전환시키는 방법의 추가 실시양태에서, 적합한 반응 조건은 반응 용액에 초기 기질 부하량을 포함시킬 수 있으며, 이어서 반응 용액을 폴리펩티드와 접촉시킨다. 이어서, 이 반응 용액에 추가 기질 화합물을 시간 경과에 따른 연속 또는 회분식 첨가로서 적어도 약 1 g/ℓ/h, 적어도 약 2 g/ℓ/h, 적어도 약 4 g/ℓ/h, 적어도 약 6g/ℓ/h의 속도로 추가로 보충한다. 따라서, 이들 적합한 반응 조건에 따라, 폴리펩티드는 적어도 약 20g/ℓ, 30g/ℓ, 또는 40g/ℓ의 초기 기질 부하량을 갖는 용액에 첨가된다. 상기 폴리펩티드를 첨가한 후, 적어도 약 30g/ℓ, 40g/ℓ, 50g/ℓ, 60g/ℓ, 70g/ℓ, 100g/ℓ, 150g/ℓ, 200g/ℓ 또는 그 이상의 훨씬 더 높은 최종 기질 부하량에 도달할 때까지 약 2g/ℓ/h, 4g/ℓ/h, 또는 6g/ℓ/h의 속도로 추가 기질을 용액에 계속해서 첨가한다. 따라서, 본 공정의 일부 실시양태에서, 적합한 반응 조건은 초기 기질 부하량이 적어도 약 20g/ℓ, 30g/ℓ 또는 40g/ℓ인 용액에 폴리펩티드를 첨가한 후, 적어도 약 30 g/ℓ, 40 g/ℓ, 50g/ℓ, 60g/ℓ, 70g/ℓ, 100g/ℓ 또는 그 이상의 훨씬 더 높은 최종 기질 부하량에 도달할 때까지 약 2g/ℓ/h, 4g/ℓ/h, 또는 6g/ℓ/h의 속도로 추가 기질을 용액에 추가로 첨가하는 것을 포함한다. 이러한 기질 보충 반응 조건은 기질의 적어도 약 50%, 60%, 70%, 80%, 90% 또는 그 이상의 생성물로의 기질의 전환율을 높게 유지하면서 더 높은 기질 부하량을 달성할 수 있게 한다.
일부 실시양태에서, 반응 조건을 보충하기 위해 추가 반응 성분 또는 추가 기술이 수행된다. 여기에는 효소의 불활성화를 안정화 또는 방지하고, 생성물 억제를 감소시키고/시키거나 반응 평형을 생성물 형성으로 전환시키기 위한 조치를 취하는 것이 포함될 수 있다.
추가 실시양태에서, 기질 화합물을 생성물 화합물로 전환시키기 위한 임의의 상기 기재된 방법은 추출; 단리; 정제; 및/또는 생성물 화합물의 결정화로부터 선택되는 하나 이상의 단계를 추가로 포함할 수 있다. 상기 개시된 공정에 의해 생성된 생체촉매 반응 혼합물로부터 생성물을 추출, 단리, 정제 및/또는 결정화하기 위한 방법, 기법 및 프로토콜은 관련 기술분야의 기술자에게 공지되어 있고/있거나 일상적인 실험을 통해 접근할 수 있다. 또한, 예시적인 방법이 아래 실시예에 제공된다.
본 발명의 다양한 특징 및 구체예는 다음의 대표적인 실시예에 예시되어 있으며, 이는 예시를 위한 것이지 제한하려는 것이 아니다.
조작된 폴리펩티드를 코딩하는 조작된 NDT 폴리뉴클레오티드, 발현 벡터 및 숙주 세포
본 발명은 본원에 기술된 조작된 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드를 제공한다. 일부 실시양태에서, 폴리뉴클레오타이드는 유전자 발현을 제어하는 하나 이상의 이종 조절 서열에 작동가능하게 연결되어 상기 폴리펩티드를 발현할 수 있는 재조합 폴리뉴클레오타이드를 생성한다. 일부 실시양태에서, 조작된 효소 폴리펩티드(들)를 코딩하는 적어도 하나의 이종 폴리뉴클레오티드를 함유하는 발현 작제물은 상응하는 효소 폴리펩티드(들)를 발현하기 위해 적절한 숙주 세포 내로 도입된다.
관련 기술분야의 기술자에게 명백한 바와 같이, 단백질 서열의 이용가능성 및 다양한 아미노산에 상응하는 코돈에 대한 지식은 대상 폴리펩티드를 코딩할 수 있는 모든 폴리뉴클레오티드에 대한 설명을 제공한다. 동일한 아미노산이 대체 또는 동의어 코돈에 의해 코딩되는 유전자 코드의 축퇴성으로 인해 극도로 많은 수의 핵산이 만들어질 수 있으며, 이들 모두는 조작된 효소(예: NDT) 폴리펩티드를 코딩한다. 따라서, 본 발명은 가능한 코돈 선택에 기초하여 조합을 선택함으로써 본원에 기술된 효소 폴리펩티드를 코딩하는 제조될 수 있는 효소 폴리뉴클레오티드의 각각 및 모든 가능한 변이를 생산하기 위한 방법 및 조성물을 제공하며, 이러한 모든 변이는 실시예(예를 들어, 다양한 표)에 제시된 아미노산 서열을 포함하여 본원에 기술된 임의의 폴리펩티드에 대해 구체적으로 개시되어 있는 것으로 고려되어야 한다.
일부 실시양태에서, 코돈은 바람직하게는 단백질 생산을 위해 선택된 숙주 세포에 의한 활용을 위해 최적화된다. 예를 들어, 박테리아에서 사용되는 선호 코돈은 일반적으로 박테리아에서의 발현에 사용된다. 결과적으로, 조작된 효소 폴리펩티드를 코딩하는 코돈 최적화된 폴리뉴클레오티드는 전체 길이 코딩 영역 내 코돈 위치의 약 40%, 50%, 60%, 70%, 80%, 90% 또는 90% 초과에서 바람직한 코돈을 함유한다.
일부 실시양태에서, 효소 폴리뉴클레오티드는 본원에 개시된 특성을 갖는 효소 활성을 갖는 조작된 폴리펩티드를 코딩하며, 여기서 상기 폴리펩티드는 본원에 제공된 서열 번호로부터 선택된 기준 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일성을 갖는 아미노산 서열, 또는 임의의 변이체(예를 들어, 실시예에 제공된 것)의 아미노산 서열, 및 기준 폴리뉴클레오티드(들)과 비교하여 하나 이상의 잔기 차이, 또는 실시예에 개시된 바와 같은 임의의 변이체의 아미노산 서열(예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 아미노산 잔기 위치)을 포함한다. 일부 실시양태에서, 기준 폴리펩티드 서열은 서열번호: 4, 14 및/또는 126으로부터 선택된다.
일부 실시양태에서, 폴리뉴클레오티드는 매우 엄격한 조건 하에서 본원에 제공된 임의의 폴리뉴클레오티드 서열, 이의 상보체, 또는 본원에 제공된 임의의 변이체 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열로부터 선택된 기준 폴리뉴클레오티드 서열에 하이브리드화할 수 있다. 일부 실시양태에서, 매우 엄격한 조건 하에서 하이브리드화할 수 있는 폴리뉴클레오타이드는 기준 서열과 비교하여 하나 이상의 잔기 차이가 있는 아미노산 서열을 포함하는 효소 폴리펩티드를 코딩한다.
일부 실시양태에서, 본원의 임의의 조작된 효소 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드는 효소 폴리펩티드의 발현을 촉진하기 위해 다양한 방식으로 조작된다. 일부 실시양태에서, 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드는 효소 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 조절하기 위해 하나 이상의 제어 서열이 존재하는 발현 벡터를 포함한다. 벡터에 삽입하기 전에 단리된 폴리뉴클레오티드를 조작하는 것은 활용되는 발현 벡터에 따라 바람직하거나 필요할 수 있다. 재조합 DNA 방법을 활용하여 폴리뉴클레오타이드 및 핵산 서열을 변형하는 기술은 관련 분야에 잘 알려져 있다. 일부 실시양태에서, 제어 서열에는 특히 프로모터, 리더 서열, 폴리아데닐화 서열, 프로펩티드 서열, 신호 펩티드 서열, 및 전사 종결자가 포함된다. 일부 실시양태에서, 적합한 프로모터는 숙주 세포 선택에 기초하여 선택된다. 박테리아 숙주 세포의 경우, 본 개시내용의 핵산 작제물의 전사를 지시하기 위한 적합한 프로모터는 이. 콜리lac 오페론, 스트렙토마이세스 코엘리콜로(Streptomyces coelicolor) 아가라제 유전자 (dagA), 바실러스 서브틸리스(Bacillus subtilis) 레벤수크라제 유전자 (sacB), 바실러스 리체니포르미스(Bacillus licheniformis) 알파-아밀라제 유전자 (amyL), 바실러스 스테아로써모필루스(Bacillus stearothermophilus) 말토겐 아밀라제 유전자 (amyM), 바실러스 아밀로쿠에파시엔스(Bacillus amyloliquefaciens) 알파-아밀라제 유전자 (amyQ), 바실러스 리체니포르미스(Bacillus licheniformis) 페니실리나제 유전자 (penP), 바실러스 서브틸리스(Bacillus subtilis) xylA 및 xylB 유전자, 및 원핵 베타-락타마제 유전자 (예를 들어, 문헌: Villa-Kamaroff et al., Proc. Natl Acad. Sci. USA 75: 3727-3731 [1978] 참조)로부터 얻은 프로모터, 뿐만 아니라 tac 프로모터 (예를 들어, 문헌: DeBoer et al., Proc. Natl Acad. Sci. USA 80: 21-25 [1983] 참조)가 포함되나, 이들로 제한되는 것은 아니다. 사상균 숙주 세포에 대한 예시적인 프로모터에는 아스퍼길러스 오리자에(Aspergillus oryzae)TAKA 아밀라제, 리조무코르 미헤이(Rhizomucor miehei) 아스파르트산 프로테이나제, 아스퍼길러스 니거(Aspergillus niger) 중성 알파-아밀라제, 아스퍼길러스 니거 산 안정한 알파-아밀라제, 아스퍼길러스 니거 또는 아스퍼길러스 아와모리(Aspergillus awamori) 글루코아밀라제 (glaA), 리조무코르 미헤이 리파제, 아스퍼길러스 오리자에 알칼리성 프로테아제, 아스퍼길러스 오리자에 트리오스 포스페이트 이소머라제, 아스퍼길러스 니둘란스(Aspergillus nidulans) 아세트아미다제, 및 푸사리움 옥시포룸(Fusarium oxysporum) 트립신-유사 프로테아제(예를 들어, WO 96/00787 참조)에 대한 유전자로부터 얻은 프로모터, 뿐만 아니라 NA2-tpi 프로모터 (아스퍼길러스 니거 중성 알파-아밀라제와 아스퍼길러스 오리자에 트리오스 포스페이트 이소머라제에 대한 유전자로부터의 프로모터의 하이브리드), 및 이들의 돌연변이체, 절단형 및 하이브리드 프로모터가 포함되지만, 이들로 제한되는 것은 아니다. 예시적인 효모 세포 프로모터는 사카로마이세스 세레비시아에 에놀라제 (ENO-1), 사카로마이세스 세레비시아에 갈락토키나제 (GAL1), 사카로마이세스 세레비시아에 알코올 데하이드로게나제/글리세르알데히드-3-포스페이트 데하이드로게나제 (ADH2/GAP), 및 사카로마이세스 세레비시아제 3-포스포글리세레이트 키나제에 대한 유전자로부터 유래될 수 있다. 효모 숙주 세포에 대한 다른 유용한 프로모터는 관련 기술분야에 공지되어 있다(예를 들어, Romanos et al., Yeast 8:423-488 [1992] 참조).
일부 실시양태에서, 제어 서열은 또한 적합한 전사 종결자 서열(즉, 전사를 종결시키기 위해 숙주 세포에 의해 인식되는 서열)이다. 일부 실시양태에서, 종결자 서열은 효소 폴리펩티드를 코딩하는 핵산 서열의 3' 말단에 작동가능하게 연결된다. 선택된 숙주 세포에서 기능적인 임의의 적합한 종결자가 본 발명에 사용된다. 사상균 숙주 세포에 대한 예시적인 전사 종결자는 아스퍼길러스 오리자에 TAKA 아밀라제, 아스퍼길러스 니거 글루코아밀라제, 아스퍼길러스 니둘란스 안트라닐레이트 신타제, 아스퍼길러스 니거 알파-글루코시다제, 및 푸사리움 옥시포룸 트립신 유사 프로테아제에 대한 유전자로부터 얻을 수 있다. 효모 숙주 세포에 대한 예시적인 종결자는 사카로마이세스 세레비시아에 에놀라제, 사카로마이세스 세레비시아에 시토크롬 C(CYC1), 및 사카로마이세스 세레비시아에 글리세르알데히드-3-포스페이트 데하이드로게나제에 대한 유전자로부터 얻을 수 있다. 효모 숙주 세포에 대한 다른 유용한 종결자는 관련 기술분야에 공지되어 있다(예를 들어, Romanos et al., 상기 문헌 참조).
일부 실시양태에서, 제어 서열은 또한 적합한 리더 서열(즉, 숙주 세포에 의한 번역에 중요한 mRNA의 비번역된 영역)이다. 일부 실시양태에서, 리더 서열은 효소 폴리펩티드를 코딩하는 핵산 서열의 5' 말단에 작동가능하게 연결된다. 선택된 숙주 세포에서 기능적인 임의의 적합한 리더 서열이 본 발명에 사용된다. 사상균 숙주 세포의 예시적인 리더는 아스퍼길러스 오리자에 TAKA 아밀라제 및 아스퍼길러스 니둘란스 트리오스 포스페이트 이소머라제에 대한 유전자로부터 얻어진다. 효모 숙주 세포에 적합한 리더는 사카로마이세스 세레비시아에 에놀라제(ENO-1), 사카로마이세스 세레비시아에 3-포스포글리세레이트 키나제, 사카로마이세스 세레비시아에 알파 인자, 및 사카로마이세스 세레비시아에 알코올 데하이드로게나제/글리세르알데히드-3-인산 데하이드로게나제(ADH2/GAP)에 대한 유전자로부터 얻어진다.
일부 실시양태에서, 제어 서열은 또한 폴리아데닐화 서열(즉, 핵산 서열의 3' 말단에 작동가능하게 연결되고, 전사될 때 숙주 세포에 의해 폴리아데노신 잔기를 전사된 mRNA에 첨가하는 신호로서 인식되는 서열)이다. 선택된 숙주 세포에서 기능적인 임의의 적합한 폴리아데닐화 서열이 본 발명에 사용된다. 사상균 숙주 세포에 대한 예시적인 폴리아데닐화 서열에는 아스퍼길러스 오리자에 TAKA 아밀라제, 아스퍼길러스 니거 글루코아밀라제, 아스퍼길러스 니둘란스 안트라닐레이트 신타제, 푸사리움 옥시포룸 트립신 유사 프로테아제, 및 아스퍼길러스 니거 알파-글루코시다제에 대한 유전자가 포함되지만 이에 제한되지 않는다. 효모 숙주 세포에 유용한 폴리아데닐화 서열은 알려져 있다(예를 들어, Guo and Sherman, Mol. Cell. Bio., 15:5983-5990 [1995] 참조).
일부 실시양태에서, 제어 서열은 또한 신호 펩티드(즉, 폴리펩티드의 아미노 말단에 연결된 아미노산 서열을 코딩하고 코딩된 폴리펩티드를 세포의 분비 경로로 지시하는 코딩 영역)이다. 일부 실시양태에서, 핵산 서열의 코딩 서열의 5' 말단은 분비된 폴리펩티드를 코딩하는 코딩 영역의 절편과 번역 판독 프레임에서 자연적으로 연결된 신호 펩티드 코딩 영역을 본질적으로 함유한다. 대안적으로, 일부 실시양태에서, 코딩 서열의 5' 말단은 코딩 서열에 대해 외래인 신호 펩티드 코딩 영역을 함유한다. 발현된 폴리펩티드를 선택된 숙주 세포의 분비 경로로 지시하는 임의의 적합한 신호 펩티드 코딩 영역은 조작된 폴리펩티드(들)의 발현에 사용된다. 박테리아 숙주 세포에 대한 효과적인 신호 펩티드 코딩 영역은 신호 펩티드 코딩 영역으로 바실러스 NClB 11837 말토겐 아밀라제, 바실러스 스테아로써모필러스 알파-아밀라제, 바실러스 리체니포르미스 서브틸리신, 바실러스 리체니포르미스 베타-락타마제, 바실러스 스테아로써모필러스 중성 프로테아제(nprT, nprS, nprM), 및 바실러스 서브틸리스 prsA에 대한 유전자로부터 얻은 것들을 포함하지만, 이들로 제한되지 않는다. 추가의 신호 펩티드는 관련 기술분야에 공지되어 있다(예를 들어, Simonen and Palva, Microbiol. Rev., 57:109-137 [1993] 참조). 일부 실시양태에서, 사상균 숙주 세포에 대한 효과적인 신호 펩티드 코딩 영역에는 아스퍼길러스 오리자에 TAKA 아밀라제, 아스퍼길러스 니거 중성 아밀라제, 아스퍼길러스 니거 글루코아밀라제, 리조무코르 미헤이 아스파르트 프로테이나제, 휴미콜라 인솔렌스(Humicola insolens) 셀룰라제, 및 휴미콜라 라누기노사(Humicola lanuginosa ) 리파제에 대한 유전자로부터 얻은 신호 펩티드 코딩 영역이 포함되지만, 이들로 제한되지 않는다. 효모 숙주 세포에 유용한 신호 펩티드에는 사카로마이세스 세레비시아제 알파-인자 및 사카로마이세스 세레비시아에 인버타제에 대한 유전자의 신호 펩티드가 포함되지만 이에 제한되지는 않는다.
일부 실시양태에서, 제어 서열은 또한 폴리펩티드의 아미노 말단에 위치하는 아미노산 서열을 코딩하는 프로펩티드 코딩 영역이기도 하다. 생성된 폴리펩티드는 "전효소", "프로폴리펩티드" 또는 "자이모겐"으로 지칭된다. 프로폴리펩티드는 프로폴리펩티드로부터 프로펩티드의 촉매적 또는 자가촉매적 절단에 의해 성숙한 활성 폴리펩티드로 전환될 수 있다. 프로펩티드 코딩 영역은 바실러스 서브틸리스 알칼리성 프로테아제(aprE), 바실러스 서브틸리스 중성 프로테아제(nprT), 사카로마이세스 세레비시아 알파-인자, 리조무코르 미헤이 아스파르틱 프로테이나제, 및 미셀리오프토라 써모필라(Myceliophthora thermophila) 락타제에 대한 유전자를 포함하지만 이에 제한되지 않는 임의의 적합한 공급원으로부터 얻을 수 있다(예를 들어, WO 95/33836 참조). 신호 펩티드 및 프로펩티드 영역 둘 모두가 폴리펩티드의 아미노 말단에 존재하는 경우, 프로펩티드 영역은 폴리펩티드의 아미노 말단 옆에 위치하고, 신호 펩티드 영역은 프로펩티드 영역의 아미노 말단 옆에 위치한다.
일부 실시양태에서, 조절 서열도 활용된다. 이들 서열은 숙주 세포의 성장과 관련된 폴리펩티드 발현의 조절을 촉진한다. 조절 시스템의 예로는 조절 화합물의 존재를 포함하여 화학적 또는 물리적 자극에 반응하여 유전자 발현이 켜지거나 꺼지는 시스템이 있다. 원핵 숙주 세포에서, 적합한 조절 서열에는 lac, tac 및 trp 작동인자 시스템이 포함되지만 이에 제한되지 않는다. 효모 숙주 세포에서 적합한 조절 시스템에는 ADH2 시스템 또는 GAL1 시스템이 포함되지만 이에 제한되지 않는다. 사상균에서 적합한 조절 서열에는 TAKA 알파-아밀라제 프로모터, 아스퍼길러스 니거 글루코아밀라제 프로모터, 및 아스퍼길러스 오리자에 글루코아밀라제 프로모터가 포함되지만 이에 제한되지 않는다.
또 다른 양태에서, 본 발명은 조작된 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 프로모터 및 종결자와 같은 하나 이상의 발현 조절 영역, 복제 기원 등과 이들이 도입될 숙주의 유형에 따라 포함하는 재조합 발현 벡터에 관한 것이다. 일부 실시양태에서, 본원에 기술된 다양한 핵산 및 제어 서열은 함께 연결되어 이러한 부위에서 효소 폴리펩티드를 코딩하는 핵산 서열의 삽입 또는 치환을 가능하게 하는 하나 이상의 편리한 제한 부위를 포함하는 재조합 발현 벡터를 생성한다. 대안적으로, 일부 실시양태에서, 본 발명의 핵산 서열은 핵산 서열 또는 상기 서열을 포함하는 핵산 작제물을 발현을 위한 적절한 벡터에 삽입함으로써 발현된다. 발현 벡터의 생성과 관련된 일부 실시양태에서, 코딩 서열은 코딩 서열이 발현을 위한 적절한 제어 서열과 작동가능하게 연결되도록 벡터에 위치한다.
재조합 발현 벡터는 재조합 DNA 절차에 편리하게 적용되어 효소 폴리뉴클레오티드 서열의 발현을 가져올 수 있는 임의의 적합한 벡터(예를 들어, 플라스미드 또는 바이러스)일 수 있다. 벡터의 선택은 일반적으로 벡터가 도입될 숙주 세포와 벡터의 호환성에 따라 달라진다. 벡터는 선형 또는 폐쇄형 원형 플라스미드일 수 있다.
일부 실시양태에서, 발현 벡터는 자율 복제 벡터이다(즉, 염색체외 실체로서 존재하는 벡터, 그의 복제는 염색체 복제와 무관함, 예를 들어 플라스미드, 염색체외 요소, 미니염색체 또는 인공 염색체). 벡터에는 자가 복제를 보장하는 수단이 포함될 수 있다. 일부 대안적인 실시양태에서, 벡터는 숙주 세포에 도입될 때 게놈에 통합되고, 통합된 염색체(들)와 함께 복제되는 벡터이다. 더욱이, 일부 실시양태에서, 숙주 세포의 게놈 내로 도입될 전체 DNA 및/또는 트랜스포존을 함께 함유하는 단일 벡터 또는 플라스미드, 또는 2개 이상의 벡터 또는 플라스미드가 활용된다.
일부 실시양태에서, 발현 벡터는 형질전환된 세포의 용이한 선택을 허용하는 하나 이상의 선택 가능한 마커를 함유한다. "선택 가능한 마커"는 살생물제 또는 바이러스 내성, 중금속에 대한 내성, 영양요구주에 대한 원영양성 등을 제공하는 생성물을 갖는 유전자이다. 박테리아 선택 가능한 마커의 예에는 바실러스 서브틸리스 또는 바실러스 리케니포르미스로부터의 dal 유전자, 또는 암피실린, 카나마이신, 클로르암페니콜 또는 테트라사이클린 내성과 같은 항생제 내성을 부여하는 마커가 포함되지만 이에 제한되지 않는다. 효모 숙주 세포에 적합한 마커에는 ADE2, HIS3, LEU2, LYS2, MET3, TRP1, 및 URA3이 포함되지만 이에 제한되지 않는다. 사상균 숙주 세포에 사용하기 위한 선택 가능한 마커에는 amdS(아세트아미다제, 예를 들어 에이. 니둘란스 또는 에이. 오리자에 유래), argB(오르니틴 카르바모일트랜스퍼라제), bar(포스피노트리신 아세틸트랜스퍼라제; 예를 들어 에스. 하이그로스코피쿠스(S. hygroscopicus)유래), hph(하이그로마이신 포스포트랜스퍼라제), niaD(질산염 환원효소), pyrG(오로티딘-5'-포스페이트 데카르복실라제, 예를 들어 에이. 니둘란스 또는 에이. 오리자에 유래), sC(황산염 아데닐트랜스퍼라제), 및 trpC(안트라닐레이트 신타제)뿐만 아니라 이의 등가물이 포함되지만 이에 제한되지 않는다.
또 다른 양태에서, 본 발명은 본 발명의 적어도 하나의 조작된 효소 폴리펩티드를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하며, 폴리뉴클레오티드(들)는 상기 숙주 세포에서 조작된 효소(들)의 발현을 위한 하나 이상의 제어 서열에 작동가능하게 연결된다. 본 발명의 발현 벡터에 의해 코딩된 폴리펩티드를 발현하는데 사용하기에 적합한 숙주 세포는 관련 기술분야에 잘 알려져 있고, 박테리아 세포, 예컨대 이. 콜리(E. coli), 비브리오 플루비알리스(Vibrio fluvialis), 스트렙토마이세스(Streptomyces) 및 살모넬라 타이피무리움(Salmonella typhimurium) 세포; 진균 세포, 예컨대 효모 세포 (예, 사카로마이세스 세레비지아에 또는 피키아 파스토리스 (ATCC Accession No. 201178)); 곤충 세포, 예컨대 드로스필라(Drosophila) S2 및 스포도프테라(Spodoptera) Sf9 세포; 동물 세포, 예컨대 CHO, COS, BHK, 293, 및 Bowes 흑색종 세포; 및 식물 세포가 포함되지만, 이들로 제한되지 않는다. 예시적인 숙주 세포에는 또한 다양한 대장균 균주(예를 들어, W3110(ΔfhuA) 및 BL21)가 포함된다. 박테리아 선택 가능한 마커의 예에는 바실러스 서브틸리스 또는 바실러스 리케니포르미스로부터의 dal 유전자, 또는 암피실린, 카나마이신, 클로르암페니콜 및/또는 테트라사이클린 내성과 같은 항생제 내성을 부여하는 마커가 포함되지만 이에 국한되지 않는다.
일부 실시양태에서, 본 발명의 발현 벡터는 벡터의 숙주 세포 게놈 내로의 통합 또는 게놈과 무관한 세포 내 벡터의 자율 복제를 허용하는 요소(들)를 함유한다. 숙주 세포 게놈으로의 통합을 포함하는 일부 실시양태에서, 벡터는 상동성 또는 비상동성 재조합에 의해 벡터를 게놈으로 통합하기 위해 폴리펩티드를 코딩하는 핵산 서열 또는 벡터의 임의의 다른 요소에 의존한다.
일부 대안적인 실시양태에서, 발현 벡터는 상동성 재조합에 의한 숙주 세포의 게놈으로의 통합을 지시하기 위한 추가적인 핵산 서열을 함유한다. 추가 핵산 서열은 벡터가 염색체(들)의 정확한 위치(들)에서 숙주 세포 게놈에 통합될 수 있도록 한다. 정확한 위치에서 통합 가능성을 증가시키기 위해, 통합 요소는 바람직하게는 충분한 수의 뉴클레오티드, 예를 들어 100 내지 10,000개의 염기쌍, 바람직하게는 400 내지 10,000개의 염기쌍, 가장 바람직하게는 800 내지 10,000개의 염기쌍을 함유하며, 이는 상응하는 표적 서열과 고도로 상동성이어서 상동성 재조합 가능성을 향상시킨다. 통합 요소는 숙주 세포 게놈의 표적 서열과 상동성인 임의의 서열일 수 있다. 더욱이, 통합 요소는 비-코딩 또는 코딩 핵산 서열일 수 있다. 한편, 벡터는 비상동성 재조합에 의해 숙주 세포의 게놈에 통합될 수 있다.
자율 복제를 위해, 벡터는 벡터가 해당 숙주 세포에서 자율적으로 복제할 수 있게 하는 복제 기원을 추가로 포함할 수 있다. 박테리아 복제 기원의 예는 P15A ori 또는 플라스미드 pBR322, pUC19, pACYCl77(플라스미드에 P15A ori가 있음)의 복제 기원 또는 이. 콜리에서 복제를 허용하는 pACYC184 및 바실러스에서 복제를 허용하는 pUB110, pE194, 또는 pTA1060이다. 효모 숙주 세포에 사용하기 위한 복제 기원의 예는 2 마이크론 복제 기원, ARS1, ARS4, ARS1과 CEN3의 조합, 및 ARS4와 CEN6의 조합이다. 복제 기원은 숙주 세포에서 온도에 민감하게 기능하도록 하는 돌연변이를 갖는 것일 수 있다(예를 들어, Ehrlich, Proc. Natl. Acad. Sci. USA 75:1433 [1978] 참조).
일부 실시양태에서, 본 발명의 핵산 서열의 1개 이상의 카피가 숙주 세포에 삽입되어 유전자 생성물의 생산을 증가시킨다. 핵산 서열의 카피 수의 증가는 상기 서열 중 적어도 하나의 추가 카피를 숙주 세포 게놈에 통합하거나 증폭 가능한 선택 마커 유전자를 핵산 서열과 함께 포함시킴으로써 얻을 수 있으며, 여기서 세포는 선택 가능한 마커의 증폭된 카피를 포함하며, 이에 따라 핵산 서열의 추가적인 카피는 적절한 선별제의 존재 하에서 세포를 배양함으로써 선별될 수 있다.
본 발명에 사용하기 위한 다수의 발현 벡터는 시판된다. 적합한 상업적 발현 벡터에는 포유동물 숙주 세포에서의 발현을 위한 CMV 프로모터 및 hGH 폴리아데닐화 부위 및 pBR322 복제 기원 및 이. 콜리에서의 증폭을 위한 암피실린 내성 마커를 포함하는 p3xFLAGTM™ 발현 벡터(Sigma-Aldrich Chemicals)가 포함되지만 이에 제한되지 않는다. 다른 적합한 발현 벡터에는 pBluescriptII SK(-) 및 pBK-CMV(Stratagene), 및 pBR322(Gibco BRL), pUC(Gibco BRL), pREP4, pCEP4(Invitrogen) 또는 pPoly로부터 유래된 플라스미드가 포함되지만, 이들로 제한되지 않는다(참조: 예를 들어, Lathe et al., Gene 57:193-201 [1987]).
따라서, 일부 실시양태에서, 적어도 하나의 변이체 NDT를 코딩하는 서열을 포함하는 벡터는 벡터의 증식 및 변이체 NDT(들)의 발현을 허용하기 위해 숙주 세포로 형질전환된다. 일부 실시양태에서, 변이체 NDT는 번역 후 변형되어 신호 펩티드를 제거하고 일부 경우에는 분비 후에 절단될 수 있다. 일부 실시양태에서, 상기 기재된 형질전환 숙주 세포는 변이체 NDT(들)의 발현을 허용하는 조건 하에 적합한 영양 배지에서 배양된다. 적절한 보충제를 함유하는 최소 또는 복합 배지를 포함하지만 이에 제한되지 않는 숙주 세포 배양에 유용한 임의의 적합한 배지가 본 발명에 사용된다. 일부 실시양태에서, 숙주 세포는 HTP 배지에서 성장된다. 적합한 배지는 다양한 상업용 공급업체로부터 구입하거나 공개된 제조법(예: American Type Culture Collection 카탈로그)에 따라 제조할 수 있다.
또 다른 양태에서, 본 발명은 본원에 제공된 개선된 NDT 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하며, 폴리뉴클레오티드는 숙주 세포에서 NDT 효소의 발현을 위한 하나 이상의 제어 서열에 작동가능하게 연결되어 있다. 본 발명의 발현 벡터에 의해 코딩된 NDT 폴리펩티드를 발현하는데 사용하기 위한 숙주 세포는 관련 기술분야에 잘 알려져 있고, 이에 제한되지 않지만 박테리아 세포, 예컨대 대장균, 바실러스 메가테리움(Bacillus megaterium), 락토바실러스 케피르(Lactobacillus kefir), 스트렙토마이세스(Streptomyces) 및 살모넬라 티피무리움(Salmonella typhimurium) 세포; 진균 세포, 예컨대 효모 세포(예, 사카로마이세스 세레비지아에 또는 피키아 파스토리스(ATCC 수탁번호 제201178호); 곤충 세포, 예컨대 드로소필라 S2 및 스포도프테라 Sf9 세포; 동물 세포, 예컨대 CHO, COS, BHK, 293, 및 Bowes 흑색종 세포; 및 식물세포를 포함한다. 상기 숙주 세포에 대한 적절한 배양 배지 및 성장 조건은 관련 기술분야에 잘 알려져 있다.
NDT의 발현을 위한 폴리뉴클레오티드는 관련 기술분야에 공지된 다양한 방법에 의해 세포 내로 도입될 수 있다. 기술에는 무엇보다도 전기천공, 생물학적 입자 충격, 리포솜 매개 형질감염, 염화칼슘 형질감염 및 원형질체 융합이 포함된다. 폴리뉴클레오티드를 세포 내로 도입하는 다양한 방법은 관련 기술분야의 기술자에게 공지되어 있다.
일부 실시양태에서, 숙주 세포는 진핵 세포이다. 적합한 진핵 숙주 세포에는 진균 세포, 조류 세포, 곤충 세포, 및 식물 세포가 포함되나 이에 제한되지는 않는다. 적합한 진균 숙주 세포에는 자낭균류(Ascomycota), 담자균류(Basidiomycota), 중수균류(Deuteromycota), 접합균류(Zygomycota), 불완전균류( Fungi imperfecti)가 포함되나 이에 제한되지 않는다. 일부 실시양태에서, 진균 숙주 세포는 효모 세포 및 사상균 세포이다. 본 발명의 사상균 숙주 세포는 세분류인 진균류(Eumycotina) 및 난균류(Oomycota)의 모든 사상 형태를 포함한다. 사상균은 키틴, 셀룰로오스 및 기타 복합 다당류로 구성된 세포벽을 가진 영양 균사체가 특징이다. 본 발명의 사상균 숙주 세포는 형태학적으로 효모와 구별된다.
본 발명의 일부 실시양태에서, 사상균 숙주 세포는 아클리야(Achlya), 아크레모니움(Acremonium), 아스퍼길러스, 아우레오바시디움(Aureobasidium), 베르칸데라(Bjerkandera), 세리포리오프시스(Ceriporiopsis), 세팔로스포리움(Cephalosporium), 크라이소스포리움(Chrysosporium), 코클리오볼루스(Cochliobolus), 코리나스쿠스(Corynascus), 크리포넥트리아(Cryphonectria), 크립토코커스(Cryptococcus), 코프리누스(Coprinus), 코리올루스(Coriolus), 디플로디아(Diplodia), 엔도티스(Endothis), 푸사리움(Fusarium), 지베렐라(Gibberella), 글리오클라디움(Gliocladium), 휴미콜라(Humicola), 하이포크레아(Hypocrea), 마이셀리오프토라(Myceliophthora), 뮤코르(Mucor), 뉴로스포라(Neurospora), 페니실리움(Penicillium), 포도스포라(Podospora), 플레비아(Phlebia), 피로마이세스(Piromyces), 피리쿨라리아(Pyricularia), 리조뮤코르(Rhizomucor), 리조푸스(Rhizopus), 쉬조필룸(Schizophyllum), 스키탈리디움(Scytalidium), 스포로트리쿰(Sporotrichum), 탈라로마이세스(Talaromyces), 테르모아스쿠스(Thermoascus), 티엘라비아(Thielavia), 트라메테스(Trametes), 톨리포클라디움(Tolypocladium), 트리코데르마(Trichoderma), 베르티실리움(Verticillium), 및/또는 볼바리엘라(Volvariella), 및/또는 유성생식형, 또는 무성생식형, 이들의 통속명, 기본명, 또는 분류학상 등가물을 포함하지만, 이들로 제한되지 않는, 임의의 적합한 유전자 및 종 중 하나이다.
본 발명의 일부 실시양태에서, 숙주 세포는 칸디다(Candida), 한세눌라(Hansenula), 사카로마이세스, 쉬조사카로마이세스(Schizosaccharomyces), 피키아, 클루이베로마이세스(Kluyveromyces) 또는 야로위아(Yarrowia) 종의 세포를 포함하지만 이에 제한되지 않는 효모 세포이다. 본 발명의 일부 실시양태에서, 효모 세포는 한세눌라 폴리모르파(Hansenula polymorpha), 사카로마이세스 세레비지아에, 사카로마이세스 칼스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 쉬조사카로마이세스 폼베(Schizosaccharomyces pombe), 피키아 파스토리스, 피키아 핀란디카(Pichia finlandica), 피키아 트레할로필라(Pichia trehalophila), 피키아 코다마에(Pichia kodamae), 피키아 멤브라나에파시엔스(Pichia membranaefaciens), 피키아 오푼티아에(Pichia opuntiae), 피키아 써모톨레란스(Pichia thermotolerans), 피키아 살리크타리아(Pichia salictaria), 피키아 퀘르쿠움(Pichia quercuum), 피키아 피페리(Pichia pijperi), 피키아 스티피티스(Pichia stipitis), 피키아 메탄올리카(Pichia methnolica), 피키아 안구스타(Pichia angusta), 클루이베로마이세스 락티스(Kluyveromyces lactis), 칸디다 알비칸스(Candida albicans), 또는 야로위아 리폴리티카(Yarrowia liplytica)이다.
본 발명의 일부 실시양태에서, 숙주 세포는 클라미도모나스(예를 들어, C. reinhardtii) 및 포르미디움(P. sp. ATCC29409)과 같은 조류 세포이다.
일부 다른 실시양태에서, 숙주 세포는 원핵 세포이다. 적합한 원핵 세포에는 그람 양성, 그람 음성 및 그람 가변 박테리아 세포가 포함되지만 이에 제한되지 않는다. 임의의 적합한 박테리아 유기체가 본 발명에서 사용되며, 여기에는 아그로박테리움(Agrobacterium), 알리사이클로바실러스(Alicyclobacillus), 아나바에나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써무스(Acidothermus), 아르트로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움(Brevibacterium), 부티리비브리오(Butyrivibrio), 부크네라(Buchnera), 캄페스트리스(Campestris), 캄필로박터(Camplyobacter), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로코쿠스(Coprococcus), 에쉐리키아(Escherichia), 엔테로코커스(Enterococcus), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움(Flavobacterium), 게오바실러스(Geobacillus), 해모필러스(Haemophilus), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 일리오박터(Ilyobacter), 마이크로코커스(Micrococcus), 마이크로박테리움(Microbacterium), 메소리조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 메틸로박테리움(Methylobacterium), 마이코박테리움(Mycobacterium), 네이세리아(Neisseria), 판토에아(Pantoea), 슈도모나스(Pseudomonas), 프로클로로코커스(Prochlorococcus), 로도박터(Rhodobacter), 로도슈도모나스(Rhodopseudomonas), 로도슈도모나스(Rhodopseudomonas), 로세부리아(Roseburia), 로도스피릴리움(Rhodospirillum), 로도코커스(Rhodococcus), 세네데스무스(Scenedesmus), 스트렙토마이세스, 스트렙토코커스(Streptococcus), 시네코커스(Synecoccus), 사카로모노스포라(Saccharomonospora), 스태필로코커스(Staphylococcus), 세라티아(Serratia), 살모넬라, 쉬겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테메쿨라(Temecula), 써모시네초코커스(Thermosynechococcus), 써모코커스(Thermococcus), 우레아플라스마(Ureaplasma), 크산토모나스(Xanthomonas), 크실렐라(Xylella), 예르시니아(Yersinia) 및 자이모모나스(Zymomonas)가 포함되지만, 이들로 제한되지 않는다. 일부 실시양태에서, 박테리아 숙주 균주는 인간에게 비-병원성이다. 일부 실시양태에서, 박테리아 숙주 균주는 산업용 균주이다. 수많은 산업용 박테리아 균주가 알려져 있고 본 발명에 적합하다. 본 발명의 일부 실시양태에서, 박테리아 숙주 세포는 아그로박테리움 종(예를 들어, 에이. 라디오박터(A. radiobacter), 에이. 리조게네스(A. rhizogenes) 및 에이. 루비(A. rubi))이다. 본 발명의 일부 실시양태에서, 박테리아 숙주 세포는 아르트로박터(Arthrobacter) 종 (예를 들어, 에이. 아우레센스(A. aurescens), 에이. 시트레우스(A. citreus), 에이. 글로비포르미스(A. globiformis), 에이. 하이드로카르보글루타미쿠스(A. hydrocarboglutamicus), 에이. 마이소렌스(A. mysorens), 에이. 니코티아나에(A. nicotianae), 에이. 파라피네우스(A. paraffineus), 에이. 프로토폰니아에(A. protophonniae), 에이. 로세오파라피누스(A. roseoparqffinus), 에이. 술푸레오스(A. sulfureus), 및 에이. 우레아파시엔스(A. ureafaciens))이다. 본 발명의 일부 실시양태에서, 박테리아 숙주 세포는 바실러스 종(예를 들어, 비. 투링겐시스(B. thuringensis), 비. 안트라시스(B. anthracis), 비. 메가테리움, 비. 서브틸리스, 비. 렌투스(B. lentus), 비. 시르쿨란스(B. circulans), 비. 푸밀루스, 비. 라우투스(B. lautus), 비. 코아굴란스(B.coagulans), 비. 브레비스(B. brevis), 비. 피르무스(B. firmus), 비. 알카오피우스(B. alkaophius), 비. 리체니포르미스, 비. 클라우시이(B. clausii), 비. 스테아로써모필루스, 비. 할로두란스(B. halodurans), 및 비. 아밀로리퀘파시엔스(B. amyloliquefaciens))이다. 일부 실시양태에서, 숙주 세포는 다음: 비. 서브틸리스, 비. 푸밀루스, 비. 리체니포르미스. 비. 메가테리움, 비. 클라우시이, 비. 스테아로써모필루스, 또는 비. 아밀로리퀘파시엔스를 포함하지만 이에 제한되지 않는 산업용 바실러스 균주이다. 일부 실시양태에서, 바실러스 숙주 세포는 다음: 비. 서브틸리스, 비. 리체니포르미스, 비.메가테리움, 비. 스테아로써모필루스, 및/또는 비. 아밀로리퀘파시엔스이다. 일부 실시양태에서, 박테리아 숙주 세포는 클로스트리디움 종(예를 들어, 씨. 아세토부틸리쿰(C. acetobutylicum), 씨. 테타니(C. tetani) E88, 씨. 리투세부렌세(C. lituseburense), 씨. 사카로부틸리쿰(C. saccharobutylicum), 씨. 페르프링겐스(C. perfringens), 및 씨. 베이예링키이(C. beijerinckii))이다. 일부 실시양태에서, 박테리아 숙주 세포는 코리네박테리움 종(예를 들어, 씨. 글루타미쿰(C. glutamicum) 및 씨. 아세토아시도필룸(C. acetoacidophilum))이다. 일부 실시양태에서 박테리아 숙주 세포는 에스케리키아 종(예를 들어, 이. 콜리)이다. 일부 실시양태에서, 숙주 세포는 에스케리키아 콜리 W3110이다. 일부 실시양태에서, 박테리아 숙주 세포는 에르위니아 종(예를 들어, 이. 우레도보라(E. uredovora), 이. 카로토보라(E. carotovora), 이. 아나나스(E. ananas), 이. 허비콜라(E. herbicola), 이. 푼크타타(E. punctata), 및 이. 테레우스(E. terreus))이다. 일부 실시양태에서, 박테리아 숙주 세포는 판토에아(Pantoea) 종(예를 들어, 피. 시트레아(P. citrea), 및 피. 아글로메란스(P. agglomerans))이다. 일부 실시양태에서 박테리아 숙주 세포는 슈도모나스 종(예를 들어, 피. 푸티다(P. putida), 피. 아레우기노사(P. aeruginosa), 피. 메발로니이(P. mevalonii), 및 P. sp. D-0l 10)이다. 일부 실시양태에서, 박테리아 숙주 세포는 스트렙토코커스 종(예를 들어, 에스. 에퀴시밀레스(S. equisimiles), 에스. 피오게네스(S. pyogenes), 및 에스. 우베리스(S. uberis))이다. 일부 실시양태에서, 박테리아 숙주 세포는 스트렙토마이세스 종(예를 들어, 에스. 암보파시엔스(S. ambofaciens), 에스. 아크로모게네스(S. achromogenes), 에스. 아베르미틸리스(S. avermitilis), 에스. 코엘리콜라(S. coelicolor), 에스. 아우레파시엔스(S. aureofaciens), 에스. 아우레우스(S. aureus), 에스. 풍기시디쿠스(S. fungicidicus), 에스. 그리세우스(S. griseus), 및 에스. 리비단스(S. lividans))이다. 일부 실시양태에서, 박테리아 숙주 세포는 자이모모나스 종(예를 들어, 제트. 모빌리스(Z. mobilis), 및 제트. 리폴리티카(Z. lipolytica))이다.
본 발명에 사용되는 많은 원핵 및 진핵 균주는 American Type Culture Collection(ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM), Centraalbureau Voor Schimmelcultures(CBS), 및 농업 연구청 특허 배양 컬렉션, 북부 지역 연구 센터(NRRL)와 같은 다수의 배양 컬렉션으로부터 대중에게 쉽게 입수할 수 있다.
일부 실시양태에서, 숙주 세포는 단백질 분비, 단백질 안정성 및/또는 단백질의 발현 및/또는 분비에 바람직한 기타 특성을 개선하는 특징을 갖도록 유전적으로 변형된다. 유전적 변형은 유전공학 기술 및/또는 고전적인 미생물학적 기술(예: 화학적 또는 UV 돌연변이 유발 및 후속 선택)을 통해 달성될 수 있다. 실제로, 일부 실시양태에서, 재조합 변형과 고전적 선택 기술의 조합이 숙주 세포를 생산하는 데 사용된다. 재조합 기술을 사용하여, 핵산 분자는 숙주 세포 및/또는 배양 배지 내에서 NDT 변이체의 수율을 증가시키는 방식으로 도입, 결실, 억제 또는 변형될 수 있다. 예를 들어, Alp1 기능의 녹아웃은 프로테아제가 결핍된 세포를 초래하고, pyr5 기능의 녹아웃은 피리미딘 결핍 표현형을 갖는 세포를 초래한다. 한 유전 공학적 접근 방식에서는 상동 재조합을 사용하여 생체 내에서 유전자를 특이적으로 표적화하여 코딩된 단백질의 발현을 억제함으로써 표적 유전자 변형을 유도한다. 대안적 접근법에서는 siRNA, 안티센스 및/또는 리보자임 기술이 유전자 발현을 억제하는 데서의 용도가 발견되었다. 단백질을 코딩하는 유전자의 전부 또는 일부의 결실 및 유전자 생성물의 발현 또는 활성을 방해하는 부위 특이적 돌연변이 유발을 포함하지만 이에 제한되지 않는, 세포에서 단백질의 발현을 감소시키기 위한 다양한 방법이 공지되어 있다(예를 들어, Chaveroche et al., Nucl. Acids Res., 28:22 e97 [2000]; Cho et al., Molec. Plant Microbe Interact., 19:7-15 [2006]; Maruyama and Kitamoto, Biotechnol Lett., 30:1811-1817 [2008]; Takahashi et al., Mol. Gen. Genom., 272: 344-352 [2004]; 및 You et al., Arch. Microbiol., 191:615-622 [2009]를 참조하며, 이들 모두는 본원에 참고로 포함된다). 무작위 돌연변이 유발 후 원하는 돌연변이에 대한 스크리닝 또한 용도가 발견되었다(예를 들어, Combier et al., FEMS Microbiol. Lett., 220:141-8 [2003]; 및 Firon et al., Eukary. Cell 2:247-55 [2003] 참조, 이 둘 모두 참조로 포함됨).
숙주 세포 내로 벡터 또는 DNA 작제물 도입은 인산칼슘 형질감염, DEAE-덱스트란 매개 형질감염, PEG 매개 형질전환, 전기천공 또는 관련 기술분야에 공지된 다른 기술을 포함하나 이에 제한되지 않는 관련 기술분야에 공지된 임의의 적합한 방법을 사용하여 달성될 수 있다. 일부 실시양태에서, 에스케리키아 콜리 발현 벡터 pCK100900i(본원에 참고로 포함된 미국 특허 제9,714,437호 참조)가 사용된다.
일부 실시양태에서, 본 발명의 조작된 숙주 세포(즉, "재조합 숙주 세포")는 프로모터 활성화, 형질전환체 선택, 또는 NDT 폴리뉴클레오티드 증폭을 위해 적절하게 변형된 통상적인 영양 배지에서 배양된다. 온도, pH 등과 같은 배양 조건은 발현을 위해 선택된 숙주 세포에 대해 이전에 사용된 조건이며, 관련 기술분야의 기술자에게 잘 알려져 있다. 언급한 바와 같이, 박테리아, 식물, 동물(특히 포유류) 및 고세균 기원의 세포를 포함하여 많은 세포의 배양 및 생산에 대해 많은 표준 참고자료와 텍스트를 이용할 수 있다.
일부 실시양태에서, 본 발명의 변이체 NDT 폴리펩티드를 발현하는 세포는 회분식 또는 연속 발효 조건 하에서 성장된다. 고전적인 "회분식 발효"는 폐쇄형 시스템으로, 배지의 조성이 발효 초기에 설정되고 발효 중에 인위적으로 변경되지 않는다. 회분식 시스템의 변형은 본 발명에서도 사용되는 "유가식 발효(fed-batch fermentation)"이다. 이 변형에서는 발효가 진행됨에 따라 기질이 점차적으로 추가된다. 유가식 시스템은 이화물질 억제가 세포의 대사를 억제할 가능성이 있고 배지에 기질의 양을 제한하는 것이 바람직한 경우에 유용하다. 회분식 및 유가식 발효는 일반적이며 관련 기술분야에 잘 알려져 있다. "연속 발효"는 정의된 발효 배지가 생물반응기에 연속적으로 추가되고 동일한 양의 조절된 배지가 처리를 위해 동시에 제거되는 개방형 시스템이다. 연속 발효는 일반적으로 세포가 주로 대수기 성장에 있는 일정한 고밀도로 배양을 유지한다. 연속 발효 시스템은 안정적인 성장 조건을 유지하기 위해 노력한다. 연속 발효 공정을 위한 영양분 및 성장 인자를 조절하는 방법뿐만 아니라 생성물 형성 속도를 최대화하는 기술은 산업 미생물학 분야에 잘 알려져 있다.
본 발명의 일부 실시양태에서, 무세포 전사/번역 시스템은 변이체 NDT(들)을 생성하는데 사용된다. 몇몇 시스템이 상업적으로 이용 가능하며 이 방법은 관련 분야의 기술자에게 잘 알려져 있다.
본 발명은 변이체 NDT 폴리펩티드 또는 이의 생물학적 활성 단편을 제조하는 방법을 제공한다. 일부 실시양태에서, 상기 방법은 서열번호: 4, 14, 및/또는 126과 적어도 약 70%(또는 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%)의 서열 동일성을 포함하는 아미노산 서열을 코딩하며, 본원에 제공된 바와 같은 적어도 하나의 돌연변이를 포함하는 폴리뉴클레오티드로 형질전환된 숙주 세포를 제공하는 단계; 숙주 세포가 코딩된 변이체 NDT 폴리펩티드를 발현하는 조건 하에 배양 배지에서 상기 형질전환된 숙주 세포를 배양하는 단계; 및 선택적으로 발현된 변이체 NDT 폴리펩티드를 회수 또는 단리하고/하거나 발현된 변이체 NDT 폴리펩티드를 함유하는 배양 배지를 회수 또는 단리하는 단계를 포함한다. 일부 실시양태에서, 상기 방법은 코딩된 NDT 폴리펩티드를 발현한 후 형질전환된 숙주 세포를 선택적으로 용해시키고, 선택적으로 세포 용해물로부터 발현된 변이체 NDT 폴리펩티드를 회수 및/또는 단리하는 단계를 추가로 제공한다. 본 발명은 또한 변이체 NDT 폴리펩티드의 생산에 적합한 조건 하에서 변이체 NDT 폴리펩티드로 형질전환된 숙주 세포를 배양하는 단계 및 변이체 NDT 폴리펩티드를 회수하는 단계를 포함하는 변이 NDT 폴리펩티드를 제조하는 방법을 제공한다. 일반적으로 NDT 폴리펩티드의 회수 또는 단리는 본원에 기술된 것을 포함하여 관련 분야에 잘 알려진 단백질 회수 기술을 사용하여 숙주 세포 배양 배지, 숙주 세포 또는 둘 모두로부터 이루어진다. 일부 실시양태에서, 숙주 세포는 원심분리에 의해 수확되고, 물리적 또는 화학적 수단에 의해 파괴되며, 생성된 조 추출물은 추가 정제를 위해 유지된다. 단백질 발현에 사용되는 미생물 세포는 동결-해동 순환, 초음파 처리, 기계적 파괴, 및/또는 세포 용해제의 사용을 포함하지만 이에 제한되지 않는 임의의 편리한 방법뿐만 아니라 관련 분야의 기술자에게 잘 알려진 많은 다른 적합한 방법에 의해 파괴될 수 있다.
숙주 세포에서 발현된 조작된 NDT 효소는 리소자임 처리, 초음파 처리, 여과, 염석, 초원심분리, 및 크로마토그래피를 비롯한 단백질 정제를 위해 관련 분야에 공지된 기술 중 하나 이상을 사용하여 세포 및/또는 배양 배지로부터 회수될 수 있다. E. coli와 같은 박테리아로부터 단백질을 용해하고 고효율로 추출하는 데 적합한 솔루션은 CelLytic BTM(Sigma-Aldrich)이라는 상표명으로 시판되고 있다. 따라서, 일부 실시양태에서, 생성된 폴리펩티드는 회수/분리되고 선택적으로 관련 분야에 공지된 다수의 방법에 의해 정제된다. 예를 들어, 일부 실시양태에서, 폴리펩티드는 원심분리, 여과, 추출, 분무 건조, 증발, 크로마토그래피(예를 들어, 이온 교환, 친화성, 소수성 상호작용, 크로마토포커싱, 및 크기 배제), 또는 침전을 포함하지만 이에 제한되지 않는 통상의 절차에 의해 영양 배지로부터 단리된다. 일부 실시양태에서, 성숙한 단백질의 배열을 완성하는데 있어서 원하는 대로 단백질 재폴딩 단계가 사용된다. 또한, 일부 실시양태에서, 고성능 액체 크로마토그래피(HPLC)가 최종 정제 단계에 사용된다. 예를 들어, 일부 실시양태에서, 관련 분야에 공지된 방법이 본 발명에 사용된다(예를 들어, Parry et al., Biochem. J., 353:117 [2001]; 및 Hong et al., Appl. Microbiol. Biotechnol., 73:1331 [2007] 참조; 둘 다 본원에서 참고로 포함됨). 실제로, 관련 분야에 공지된 임의의 적합한 정제 방법이 본 발명에 사용된다.
NDT 폴리펩티드를 단리하기 위한 크로마토그래피 기술에는 역상 크로마토그래피, 고성능 액체 크로마토그래피, 이온 교환 크로마토그래피, 겔 전기영동, 및 친화성 크로마토그래피가 포함되지만 이에 제한되지 않는다. 특정 효소를 정제하기 위한 조건은 부분적으로 관련 분야의 기술자에게 공지된 바와 같이 순 전하, 소수성, 친수성, 분자량, 분자 모양 등과 같은 요인에 따라 달라질 것이다.
일부 실시양태에서, 친화성 기술은 개선된 NDT 효소를 단리하는 데 사용된다. 친화성 크로마토그래피 정제를 위해 NDT 폴리펩티드에 특이적으로 결합하는 임의의 항체가 사용될 수 있다. 항체 생산을 위해 토끼, 마우스, 래트 등을 포함하지만 이에 제한되지 않는 다양한 숙주 동물에 NDT를 주사하여 면역화할 수 있다. NDT 폴리펩티드는 측쇄 작용기 또는 측쇄 작용기에 부착된 링커에 의해 BSA와 같은 적합한 담체에 부착될 수 있다. 면역학적 반응을 증가시키기 위해 숙주 종에 따라 프로인트(완전 및 불완전), 수산화알루미늄과 같은 미네랄 겔, 리소레시틴과 같은 표면 활성 물질, 플루로닉 폴리올, 폴리음이온, 펩티드, 오일 에멀젼, 키홀 림펫 헤모시아닌, 디니트로페놀 및 BCG(Bacillus Calmette Guerin) 및 코리네박테리움 파르붐(Corynebacterium parvum)을 포함하지만 이들로 제한되지 않는, 다양한 애주번트가 숙주 종에 따라 면역학적 반응을 증가시키기 위하여 사용될 수 있다.
일부 실시양태에서, NDT 변이체는 효소를 발현하는 세포의 형태로, 조추출물로서, 또는 단리되거나 정제된 제제로서 제조되고 사용된다. 일부 실시양태에서 NDT 변이체는 동결건조물, 분말 형태(예: 아세톤 분말)로 제조되거나 효소 용액으로 제조된다. 일부 실시양태에서, NDT 변이체는 실질적으로 순수한 제제의 형태이다.
일부 실시양태에서, NDT 폴리펩티드는 임의의 적합한 고체 기판에 부착된다. 고체 기판에는 고체상, 표면, 및/또는 막이 포함되지만 이에 제한되지 않는다. 고체 지지체에는 폴리스티렌, 폴리에틸렌, 폴리프로필렌, 폴리플루오로에틸렌, 폴리에틸렌옥시, 및 폴리아크릴아미드와 같은 유기 중합체뿐만 아니라 이들의 공중합체 및 그래프트가 포함되지만 이에 제한되지 않는다. 고체 지지체는 유리, 실리카, 제어된 공극 유리(CPG), 역상 실리카 또는 금이나 백금과 같은 금속과 같은 무기물일 수도 있다. 기질의 구조는 비드, 구형, 입자, 과립, 겔, 막 또는 표면의 형태일 수 있다. 표면은 평면형, 실질적으로 평면형 또는 비평면형일 수 있다. 고체 지지체는 다공성 또는 비다공성일 수 있으며 팽윤 또는 비팽창 특성을 가질 수 있다. 고체 지지체는 웰, 함몰 또는 기타 용기, 베슬, 피쳐 또는 위치의 형태로 구성될 수 있다. 복수의 지지체는 시약의 로봇식 운반을 위해 또는 검출 방법 및/또는 기구에 의해 주소 지정이 가능한 다양한 위치의 어레이에 구성될 수 있다.
일부 실시양태에서, NDT 변이체를 정제하기 위해 면역학적 방법이 사용된다. 한 가지 접근법에서, 야생형 또는 변이체 NDT 폴리펩티드(예를 들어, 서열번호: 4, 14, 및/또는 126 중 어느 하나를 포함하는 폴리펩티드, 및/또는 이의 변이체, 및/또는 면역원성 단편에 대해)에 대해 발생된 항체를 통상적인 방법을 사용하여 비드에 고정시키고, 변이체 NDT가 결합된 조건 하에서 세포 배양 배지와 혼합하여 침전시킨다. 관련된 접근법으로, 면역크로마토그래피가 사용된다.
일부 실시양태에서, 변이체 NDT는 비효소 부분을 포함하는 융합 단백질로서 발현된다. 일부 실시양태에서, 변이체 NDT 서열은 정제 촉진 도메인에 융합된다. 본원에 사용된 바와 같이, 용어 "정제 촉진 도메인"은 융합된 폴리펩티드의 정제를 매개하는 도메인을 지칭한다. 적합한 정제 도메인에는 금속 킬레이팅 펩티드, 고정화된 금속에서 정제를 허용하는 히스티딘-트립토판 모듈, 글루타티온(예: GST)과 결합하는 서열, 헤마글루티닌(HA) 태그(인플루엔자 헤마글루티닌 단백질로부터 유래되는 에피토프에 해당함; 예를 들어, Wilson et al., Cell 37:767 [1984] 참조), 말토스 결합 단백질 서열, FLAGS 연장/친화성 정제 시스템(예를 들어, Immunex Corp에서 입수 가능한 시스템)에 활용되는 FLAG 에피토프 등이 포함되지만 이에 제한되지 않는다. 본원에 기술된 조성물 및 방법에 사용하기 위해 고려되는 하나의 발현 벡터는 엔테로키나제 절단 부위에 의해 분리된 폴리히스티딘 영역에 융합된 본 발명의 폴리펩티드를 포함하는 융합 단백질의 발현을 제공한다, 히스티딘 잔기는 IMIAC(고정된 금속 이온 친화성 크로마토그래피; 예를 들어, 문헌: Porath et al., Prot. Exp. Purif., 3:263-281 [1992] 참조)에서 정제를 촉진하는 반면, 엔테로키나제 절단 부위는 융합 단백질로부터 NDT 폴리펩티드 변이체를 분리하기 위한 수단을 제공한다. pGEX 벡터(Promega)는 또한 글루타티온 S-트랜스퍼라제(GST)와의 융합 단백질로서 외래 폴리펩티드를 발현하는데 사용될 수 있다. 일반적으로, 이러한 융합 단백질은 가용성이며 리간드-아가로스 비드(예: GST 융합의 경우 글루타티온-아가로스)에 흡착한 후 유리 리간드가 있는 경우 용출하여 용해된 세포로부터 쉽게 정제될 수 있다.
따라서, 또 다른 양태에서, 본 발명은 조작된 효소 폴리펩티드를 생산하는 방법을 제공하며, 여기서 이 방법은 조작된 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드를 발현할 수 있는 숙주 세포를 폴리펩티드의 발현에 적합한 조건 하에서 배양하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 본원에 기재된 바와 같이 효소 폴리펩티드를 단리 및/또는 정제하는 단계를 추가로 포함한다.
숙주 세포에 대한 적절한 배양 배지 및 성장 조건은 관련 분야에 잘 알려져 있다. 효소 폴리펩티드의 발현을 위한 폴리뉴클레오티드를 세포 내로 도입하기 위한 임의의 적합한 방법이 본 발명에 사용될 것으로 고려된다. 적합한 기술에는 전기천공법, 생물학적 입자 충격, 리포솜 매개 형질감염, 염화칼슘 형질감염, 및 원형질체 융합이 포함되지만 이에 제한되지 않는다.
본 발명의 다양한 특징 및 실시양태는 하기 대표적인 실시예에 예시되어 있으며, 이는 예시를 위한 것이지 제한하려는 것이 아니다.
실험
실험 및 달성된 결과를 포함하여, 다음 실시예는 단지 설명의 목적으로 제공되며 본 발명을 제한하는 것으로 해석되어서는 안 된다. 실제로 아래에 설명된 많은 시약 및 장비에 적합한 다양한 공급원이 있다. 본 발명이 임의의 시약 또는 장비 품목에 대한 임의의 특정 공급원으로 제한되도록 의도되지는 않는다.
하기 실험 개시내용에서, 다음 약어가 적용된다: M(몰); mM(밀리몰), uM 및 μM(마이크로몰); nM(나노몰); mol(몰); gm 및 g(그램); ㎎(밀리그램); ug 및 ㎍(마이크로그램); L 및 ℓ(리터); ㎖ 및 mL(밀리리터); ㎝(센티미터); ㎜(밀리미터); um 및 ㎛(마이크로미터); sec. (초); min(s) (분); h(s) 및 hr(s) (시간); U(단위); MW(분자량); rpm(분당 회전수); psi 및 PSI(평방 인치당 파운드); ℃(섭씨 온도); RT 및 rt(실온); CV(변동계수); CAM 및 캠(클로르암페니콜); PMBS(폴리믹신 B 황산염); IPTG(이소프로필 β-D-1-티오갈락토피라노시드); LB(용원성 브로쓰); TB(참 좋은 브로쓰); SFP(진탕 플라스크 분말); CDS(코딩 서열); DNA(데옥시리보핵산); RNA(리보핵산); nt(뉴클레오티드; 폴리뉴클레오티드); aa(아미노산, 폴리펩티드); 이. 콜리 W3110(일반적으로 사용되는 실험실용 이. 콜리 균주, Coli Genetic Stock Center[CGSC], New Haven, CT에서 구입 가능); HTP(고처리량); HPLC(고압 액체 크로마토그래피); HPLC-UV(HPLC-자외선 검출기); 1H NMR(양성자 핵자기공명 분광법); FIOPC(양성 대조군에 비해 배수 개선); Sigma 및 Sigma-Aldrich(Sigma-Aldrich, St. Louis, MO); Difco(Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Microfluidics(Microfluidics, Westwood, MA); Life Technologies(Life Technologies, Fisher Scientific의 일부, Waltham, MA); Amresco(Amresco, LLC, Solon, OH); Carbosynth(영국 버크셔 소재 Carbosynth, Ltd.), Varian(Varian Medical Systems, 캘리포니아주 팔로 알토); Agilent(Agilent Technologies, Inc., Santa Clara, CA), Infors(Infors USA Inc., Annapolis Junction, MD); 및 Thermotron(Thermotron, Inc., Holland, MI).
실시예 1
재조합 NDT 유전자를 함유하는 이. 콜리 발현 숙주
본 발명의 변이체를 생성하는 데 사용된 진화된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT)의 부모 유전자는 락토바실러스 루테리 NDT(서열번호: 1)였다. NDT-코딩 유전자를 발현 벡터 pCK110900(미국 특허 공개공보 제2006/0195947호의 도 3 참조)에 클로닝하고, lacl 억제인자의 제어 하에 lac 프로모터에 작동가능하게 연결시켰다. 발현 벡터에는 P15a 복제 기원과 클로르암페니콜 저항성 유전자도 포함되어 있다. 생성된 플라스미드는 관련 분야에 공지된 표준 방법을 사용하여 E. coli W3110으로 형질전환되었다. 관련 분야에 공지된 바와 같이(예를 들어, 미국 특허 제8,383,346호 및 WO2010/144103 참조), 세포를 클로르암페니콜 선택에 적용하여 형질전환체를 단리하였다.
실시예 2
HTP NDT-함유 습식 세포 펠릿의 제조
단일클론 콜로니로부터 재조합 NDT 코딩 유전자를 함유한 이. 콜리 세포를 96개-웰 얕은 웰 미세적정 플레이트의 웰에 있는 1% 포도당과 30 ㎍/㎖ 클로르암페니콜(CAM)을 함유한 190㎕ LB에 접종하였다. 플레이트를 O2 투과성 씰로 밀봉하고, 배양물을 20℃, 200rpm 및 85% 습도에서 밤새 성장시켰다. 그런 다음, 각 세포 배양액 20㎕를 380㎕ TB 및 30 ㎍/㎖ CAM이 포함된 96개-웰 깊은 웰 플레이트의 웰로 옮겼다. 깊은 웰 플레이트를 O2 투과성 씰로 밀봉하고 OD600 0.6-0.8에 도달할 때까지 30℃, 250rpm 및 85% 습도에서 배양하였다. 이어서, 세포 배양물을 IPTG에 의해 최종 농도 1mM로 유도하고 원래 사용된 것과 동일한 조건 하에서 밤새 배양하였다. 그런 다음 4℃, 4,000rpm에서 10분 동안 원심분리를 사용하여 세포를 펠렛화하였다. 상청액을 버리고 펠릿을 -80℃에서 냉동시킨 후 용해시켰다.
실시예 3
HTP NDT-함유 세포 용해물의 제조
먼저, 실시예 2에 기술된 바와 같이 생성된 세포 펠릿을 50mM 시트레이트, pH 6, 1g/ℓ 리소자임 및 0.5g/ℓ PMBS를 함유하는 200㎕ 용해 완충액을 첨가하여 용해시켰다. 그 다음, 세포 펠릿을 벤치탑 진탕기에서 실온에서 2시간 동안 진탕시켰다. 플레이트를 4℃에서 15분 동안 4,000rpm으로 원심분리하여 세포 잔해물을 제거하였다. 그런 다음 상청액을 생체촉매 반응에 사용하여 활성 수준을 결정하였다.
실시예 4
진탕 플라스크(SF) 배양물로부터 동결건조된 용해물의 제조
진탕 플라스크 절차는 조작된 NDT 폴리펩티드 진탕 플라스크 분말(SFP)을 생성하는 데 사용될 수 있으며, 이는 2차 스크리닝 분석 및/또는 본원에 기술된 생체촉매 공정에서의 사용에 유용하다. 효소의 진탕 플라스크 분말(SFP) 제제는 HTP 분석에 사용되는 세포 용해물과 비교하여 조작된 효소의 더욱 정제된 제제(예: 총 단백질의 최대 30%)를 제공하며 또한 보다 농축된 효소 용액의 사용을 허용한다. 이를 시작하기 위해 위에서 설명한 대로 성장한 선택된 HTP 배양물을 1% 글루코오스와 30㎍/㎖ CAM이 포함된 LB 한천 플레이트에 플레이팅하고 37℃에서 밤새 성장시켰다. 각 배양물로부터의 단일 콜로니를 1% 글루코오스 및 30㎍/㎖ CAM이 포함된 6㎖의 LB로 옮겼다. 배양물을 30℃및 250rpm에서 18시간 동안 성장시켰다. 배양물을 30㎍/㎖ CAM을 함유하는 250㎖의 TB에 대략 1:50으로 계대배양하여 최종 OD600이 0.05가 되도록 하였다. 배양물을 30℃ 및 250rpm에서 약 3.25시간 동안 0.6-0.8 사이의 OD600으로 성장시킨 후 IPTG를 사용하여 최종 농도 1mM로 유도하였다. 그런 다음 배양물을 30℃ 및 250rpm에서 20시간 동안 성장시켰다. 배양물을 원심분리 병에 옮기고 7,000 rpm에서 7-10분 동안 원심분리하였다. 상청액을 버리고 펠릿을 -80℃에서 최소 2시간 동안 또는 사용할 준비가 될 때까지 동결시켰다. 냉동 펠릿을 30㎖의 20mM TRIS-HCl pH 7.5에 재현탁시키고 Microfluidizer®프로세서 시스템(Microfluidics)을 사용하여 18,000psi에서 용해시켰다. 용해물을 펠렛화하고(60분 동안 10,000rpm), 상청액을 냉동 및 동결건조시켜 진탕 플레이크(SF) 효소를 생성하였다.
실시예 5
화합물(1)의 향상된 생산을 위한 서열번호: 4로부터 유래된 조작된 폴리펩티드의 진화 및 스크리닝
화합물(1)의 향상된 생산을 위한 변이체 스크리닝 결과를 기초로 서열번호: 4를 부모 효소로 선택하였다. 조작된 유전자의 라이브러리는 잘 확립된 기술(예: 포화 돌연변이 유발, 및 이전에 확인된 유익한 돌연변이의 재조합)을 사용하여 생성되었다. 각 유전자에 의해 코딩된 폴리펩티드는 실시예 2에 설명된 대로 HTP에서 생성되었으며, 실시예 3에 설명된 대로 가용성 용해물이 생성되었다.
서열번호: 4의 화합물(1)을 생산하기 위하여 폴리펩티드를 코딩하는 조작된 폴리뉴클레오티드(즉, 서열번호: 3)를 사용하여 표 5-1의 추가 조작된 폴리펩티드를 생성하였다. 이들 폴리펩티드는 출발 폴리펩티드와 비교하여 개선된 생성물 형성을 나타냈다. 조작된 폴리펩티드는 아래 표 5-2에 설명된 HTP 분석 및 분석 방법과 함께 상기 설명된 지시된 진화 방법을 사용하여 서열번호: 4의 "백본" 아미노산 서열로부터 생성되었다.
지시된 진화는 서열번호: 3에 제시된 폴리뉴클레오티드로 시작되었다. 이어서 조작된 폴리펩티드를 출발 "백본" 유전자 서열로서 선택하였다. 조작된 폴리펩티드의 라이브러리는 잘 알려진 다양한 기술(예: 포화 돌연변이 유발, 이전에 확인된 유익한 아미노산 차이의 재조합)을 사용하여 생성되었으며 위의 반응식 1에 나타낸 바와 같이, HTP 분석 및 화합물(2)를 화합물(1)로 전환시키는 폴리펩티드의 능력을 측정하는 분석 방법을 사용하여 스크리닝하였다.
효소 분석은 5% v/v HTP 용해물, 20 g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 50 mM 시트레이트 완충액, pH 6을 포함하는 100㎕ 총 부피/웰의 96개-웰 형식으로 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.
18-22시간 후, 1:1 1M KOH:DMSO 혼합물 150㎕를 첨가하였다. 플레이트를 밀봉하고 잠깐 원심분리하여 모든 액체를 가라앉히고, 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시켰다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다. HPLC 실행 매개변수는 아래 표 5-2에 설명되어 있다. 서열번호: 4보다 개선된 변이체가 표 5-1에 수록되어 있다.
실시예 6
화합물(1)의 향상된 생산을 위한 서열번호: 14로부터 유래된 조작된 폴리펩티드의 진화 및 스크리닝
화합물(1)의 향상된 생산을 위한 변이체 스크리닝 결과를 기초로 서열번호: 14를 부모 효소로 선택하였다. 조작된 유전자의 라이브러리는 잘 확립된 기술(예: 포화 돌연변이 유발, 및 이전에 확인된 유익한 돌연변이의 재조합)을 사용하여 생성되었다. 각 유전자에 의해 코딩된 폴리펩티드는 실시예 2에 설명된 대로 HTP에서 생성되었으며, 실시예 3에 설명된 대로 가용성 용해물이 생성되었다.
서열번호: 14의 화합물(1)을 생산하기 위하여 폴리펩티드를 코딩하는 조작된 폴리뉴클레오티드(즉, 서열번호: 13)를 사용하여 표 6-1의 추가 조작된 폴리펩티드를 생성하였다. 이들 폴리펩티드는 출발 폴리펩티드와 비교하여 개선된 생성물 형성을 나타냈다. 조작된 폴리펩티드는 아래 표 6-2에 설명된 HTP 분석 및 분석 방법과 함께 상기 설명된 지시된 진화 방법을 사용하여 서열번호: 14의 "백본" 아미노산 서열로부터 생성되었다.
지시된 진화는 서열번호: 13에 제시된 폴리뉴클레오티드로 시작되었다. 이어서 조작된 폴리펩티드를 출발 "백본" 유전자 서열로서 선택하였다. 조작된 폴리펩티드의 라이브러리는 잘 알려진 다양한 기술(예: 포화 돌연변이 유발, 이전에 확인된 유익한 아미노산 차이의 재조합)을 사용하여 생성되었으며 위의 반응식 1에 나타낸 바와 같이, HTP 분석 및 화합물(2)를 화합물(1)로 전환시키는 폴리펩티드의 능력을 측정하는 분석 방법을 사용하여 스크리닝하였다.
효소 분석은 0.1% v/v HTP 용해물, 20 g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 100 mM 시트레이트 완충액, pH 6을 포함하는 100 ㎕ 총 부피/웰의 96개-웰 형식으로 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.
18-22시간 후, 1:1 1M KOH:DMSO 혼합물 150㎕를 첨가하였다. 플레이트를 밀봉하고 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시킨 다음, 잠깐 원심분리시켜 모든 액체를 가라 앉혔다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다. HPLC 실행 매개변수는 아래 표 6-2에 설명되어 있다. 서열번호: 14보다 개선된 변이체가 표 6-1에 수록되어 있다.
50 g/ℓ의 화합물(2)를 사용하여 여러 변이체도 테스트하였다. 효소 분석은 96개-웰 형식으로 총 용적 100㎕/웰로 수행되었다. 분석은 0.1% v/v HTP 용해물, 50g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 100 mM 시트레이트 완충액, pH 6을 사용하여 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.
18-22시간 후, 1:1 1M KOH:DMSO 혼합물 150㎕를 첨가하였다. 플레이트를 밀봉하고 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시킨 다음, 잠깐 원심분리하여 모든 액체를 가라앉힌다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다.
실시예 7
화합물(1)의 향상된 생산을 위한 서열번호: 126으로부터 유래된 조작된 폴리펩티드의 진화 및 스크리닝
화합물(1)의 향상된 생산을 위한 변이체 스크리닝 결과를 기초로 서열번호: 126을 부모 효소로 선택하였다. 조작된 유전자의 라이브러리는 잘 확립된 기술(예: 포화 돌연변이 유발, 및 이전에 확인된 유익한 돌연변이의 재조합)을 사용하여 생성되었다. 각 유전자에 의해 코딩된 폴리펩티드는 실시예 2에 설명된 대로 HTP에서 생성되었으며, 실시예 3에 설명된 대로 가용성 용해물이 생성되었다.
서열번호: 126의 화합물(1)을 생산하기 위하여 폴리펩티드를 코딩하는 조작된 폴리뉴클레오티드(즉, 서열번호: 125)를 사용하여 표 7-1의 추가 조작된 폴리펩티드를 생성하였다. 이들 폴리펩티드는 출발 폴리펩티드와 비교하여 개선된 생성물 형성을 나타냈다. 조작된 폴리펩티드는 아래 표 7-2에 설명된 HTP 분석 및 분석 방법과 함께 상기 설명된 지시된 진화 방법을 사용하여 서열번호: 126의 "백본" 아미노산 서열로부터 생성되었다.
지시된 진화는 서열번호: 125에 제시된 폴리뉴클레오티드로 시작되었다. 이어서 조작된 폴리펩티드를 출발 "백본" 유전자 서열로서 선택하였다. 조작된 폴리펩티드의 라이브러리는 잘 알려진 다양한 기술(예: 포화 돌연변이 유발, 이전에 확인된 유익한 아미노산 차이의 재조합)을 사용하여 생성되었으며 위의 반응식 1에 나타낸 바와 같이, HTP 분석 및 화합물(2)를 화합물(1)로 전환시키는 폴리펩티드의 능력을 측정하는 분석 방법을 사용하여 스크리닝하였다.
효소 분석은 0.025% v/v HTP 용해물, 20 g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 100 mM 시트레이트/포스페이트 완충액, pH 6을 포함하는 100 ㎕ 총 부피/웰의 96개-웰 형식으로 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.
18-22시간 후, 1:1 1M KOH:DMSO 혼합물 200㎕를 첨가하였다. 플레이트를 밀봉하고 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시킨 다음, 잠깐 원심분리시켜 모든 액체를 가라 앉혔다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다. 서열번호: 126보다 개선된 변이체가 표 7-1에 수록되어 있다.
50 g/ℓ의 화합물(2)를 사용하여 여러 변이체도 테스트하였다. 효소 분석은 96개-웰 형식으로 총 용적 100㎕/웰로 수행되었다. 분석은 0.025% v/v HTP 용해물, 50g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 100 mM 시트레이트/포스페이트 완충액, pH 6을 사용하여 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.
18-22시간 후, 1:1 1M KOH:DMSO 혼합물 200㎕를 첨가하였다. 플레이트를 밀봉하고 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시킨 다음, 잠깐 원심분리하여 모든 액체를 가라앉힌다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다. 서열번호: 126보다 개선된 변이체가 표 7-2에 수록되어 있다.
본원에 인용된 모든 간행물, 특허, 특허 출원 및 기타 문서는 각각의 개별 간행물, 특허, 특허 출원 또는 기타 문서가 개별적으로 다음과 같이 표시된 것과 동일한 정도로 모든 목적을 위해 전체 내용이 모든 목적을 위해 참조로 포함되었다.
다양한 특정 실시예가 예시되고 설명되었지만, 본 발명(들)의 사상 및 범위를 벗어나지 않고 다양한 변경이 이루어질 수 있음이 이해될 것이다.
Claims (30)
- 서열번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열 또는 이의 기능적 단편을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제로서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 적어도 하나의 치환 또는 치환 세트를 포함하며 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4, 14, 및/또는 126을 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 폴리펩티드 서열은 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 20/101/104, 15, 17, 18, 18/19/22/91/104, 18/19/22/104, 18/22/62/91/104, 19/91/104, 19/104, 20, 20/63/101/104, 20/101, 20/104, 22, 22/62, 22/62/91/104, 22/91, 22/91/104, 22/91/108, 22/104, 22/108, 30, 50, 53, 55/133, 56, 61, 62/104, 72, 75, 76, 91/104, 93, 101/104, 104, 104/139, 108, 109, 114, 134, 136, 및 138로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4를 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 상기 폴리펩티드 서열은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 상기 폴리펩티드 서열은 22/75/108, 22/108, 22/108/109, 50/61, 50/75, 53/108/109, 61, 61/108/109, 75/108, 75/108/114, 108, 108/109, 및 108/138로부터 선택된 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 22/108/109, 31/76, 50/75, 61/108/109, 75, 108, 108/109, 및 108/138로부터 선택된 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 12/35/61/69, 12/35/61/157, 20, 20/50/149, 20/149/157, 28/39/61, 28/61, 35, 35/39/61/149/157, 35/50/149/157, 35/69, 35/157, 39/50, 39/61, 39/61/149, 39/69/149/157, 39/149, 39/157, 50/61/149, 61/69, 61/69/149, 61/69/157, 61/157, 69/149/157, 149, 및 149/157로부터 선택된 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 20/50/149 및 39/157 중에서 선택된 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 표 5-1, 6-1, 6-2, 7-1, 및/또는 7-2에 제시된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체의 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 폴리펩티드 서열을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 서열번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 폴리펩티드 서열을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 서열번호: 14 또는 126에 제시된 변이체 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 서열번호: 6-214의 짝수 번호 서열에 제시된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체의 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 폴리펩티드 서열을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 서열번호: 6-214의 짝수 번호 서열 중 적어도 하나에 제시된 폴리펩티드 서열을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 야생형 락토바실러스 루테리(Lactobacillus reuteri) 뉴클레오시드 데옥시리보실트랜스퍼라제에 비해 적어도 하나의 개선된 특성을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제12항에 있어서, 상기 개선된 특성이 기질에 대한 개선된 활성을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제13항에 있어서, 상기 기질이 화합물(2)를 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제12항에 있어서, 상기 개선된 특성이 화합물(1)의 개선된 생성을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제12항에 있어서, 상기 개선된 특성이 화합물(2)에 대한 개선된 기질 특이성을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 정제된 것인 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
- 제1항의 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함하는 조성물.
- 제1항의 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열.
- 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열로서, 상기 폴리뉴클레오티드 서열은 서열번호: 3, 13, 및/또는 125와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 포함하며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리뉴클레오티드 서열은 하나 이상의 위치에 적어도 하나의 치환을 포함하는 폴리뉴클레오티드 서열.
- 서열번호: 3, 13, 및/또는 125와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 포함하는 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 또는 이의 기능적 단편을 코딩하는 폴리뉴클레오티드 서열.
- 제19항에 있어서, 상기 폴리뉴클레오티드 서열이 제어 서열에 작동가능하게 연결된 폴리뉴클레오티드 서열.
- 제19항에 있어서, 상기 폴리뉴클레오티드 서열이 코돈 최적화된 폴리뉴클레오티드 서열.
- 제19항에 있어서, 상기 폴리뉴클레오티드 서열이 서열번호: 5-213의 홀수 번호 서열에 제시된 폴리뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 서열.
- 제19항의 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 발현 벡터.
- 제25항의 적어도 하나의 발현 벡터를 포함하는 숙주 세포.
- 제19항의 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 숙주 세포.
- 제1항의 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 생산되도록 적합한 조건 하에서 숙주 세포를 배양하는 단계를 포함하는, 숙주 세포에서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 생산하는 방법.
- 제28항에 있어서, 배양물 및/또는 숙주 세포로부터 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 회수하는 단계를 추가로 포함하는 방법.
- 제28항에 있어서, 상기 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 정제하는 단계를 추가로 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163232725P | 2021-08-13 | 2021-08-13 | |
US63/232,725 | 2021-08-13 | ||
PCT/US2022/074775 WO2023019178A1 (en) | 2021-08-13 | 2022-08-10 | Engineered nucleoside deoxyribosyltransferase variant enzymes |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240045297A true KR20240045297A (ko) | 2024-04-05 |
Family
ID=85200965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247008368A KR20240045297A (ko) | 2021-08-13 | 2022-08-10 | 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체 효소 |
Country Status (6)
Country | Link |
---|---|
KR (1) | KR20240045297A (ko) |
CN (1) | CN117813376A (ko) |
AU (1) | AU2022327169A1 (ko) |
CA (1) | CA3229280A1 (ko) |
IL (1) | IL310621A (ko) |
WO (1) | WO2023019178A1 (ko) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002051781A (ja) * | 2000-08-08 | 2002-02-19 | Yamasa Shoyu Co Ltd | デオキシヌクレオシドの酵素的製造法 |
US7381555B2 (en) * | 2001-09-14 | 2008-06-03 | Institut Pasteur | Lactobacillus N-deoxyribosyl transferases, corresponding nucleotide sequences and their uses |
ES2425997B8 (es) * | 2012-04-13 | 2014-08-11 | Universidad Complutense De Madrid | Biocatalizador con actividad nucléosido desoxirribosiltransferasa inmovilizado sobre partículas magnéticas de quitosano |
-
2022
- 2022-08-10 CA CA3229280A patent/CA3229280A1/en active Pending
- 2022-08-10 CN CN202280056376.7A patent/CN117813376A/zh active Pending
- 2022-08-10 IL IL310621A patent/IL310621A/en unknown
- 2022-08-10 WO PCT/US2022/074775 patent/WO2023019178A1/en active Application Filing
- 2022-08-10 AU AU2022327169A patent/AU2022327169A1/en active Pending
- 2022-08-10 KR KR1020247008368A patent/KR20240045297A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
AU2022327169A1 (en) | 2024-02-15 |
WO2023019178A1 (en) | 2023-02-16 |
IL310621A (en) | 2024-04-01 |
CA3229280A1 (en) | 2023-02-16 |
CN117813376A (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7462969B2 (ja) | 操作されたデオキシリボースリン酸アルドラーゼ | |
JP2022062113A (ja) | 産業上の生体触媒作用のための操作されたトランスアミナーゼポリペプチド | |
US20240002816A1 (en) | Engineered transaminase polypeptides | |
US11913037B2 (en) | Engineered adenylate kinase variant enzymes | |
US11913036B2 (en) | Engineered acetate kinase variant enzymes | |
KR20240045297A (ko) | 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체 효소 | |
WO2022212828A1 (en) | Engineered guanylate kinase variant enzymes | |
US20220325285A1 (en) | ENGINEERED CYCLIC GMP-AMP SYNTHASE (cGAS) VARIANT ENZYMES | |
US20230242946A1 (en) | Engineered enone reductase and ketoreductase variant enzymes |