KR20220158770A - 칸나비노이드 및 칸나비노이드 전구체의 생합성 - Google Patents
칸나비노이드 및 칸나비노이드 전구체의 생합성 Download PDFInfo
- Publication number
- KR20220158770A KR20220158770A KR1020227036684A KR20227036684A KR20220158770A KR 20220158770 A KR20220158770 A KR 20220158770A KR 1020227036684 A KR1020227036684 A KR 1020227036684A KR 20227036684 A KR20227036684 A KR 20227036684A KR 20220158770 A KR20220158770 A KR 20220158770A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- amino acid
- residue corresponding
- host cell
- sequence
- Prior art date
Links
- 239000003557 cannabinoid Substances 0.000 title claims abstract description 240
- 229930003827 cannabinoid Natural products 0.000 title claims abstract description 240
- 229940065144 cannabinoids Drugs 0.000 title claims abstract description 110
- 230000015572 biosynthetic process Effects 0.000 title abstract description 33
- 239000002243 precursor Substances 0.000 title abstract description 29
- 238000000338 in vitro Methods 0.000 claims abstract description 6
- 210000004027 cell Anatomy 0.000 claims description 300
- 150000001413 amino acids Chemical class 0.000 claims description 289
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 131
- 238000000034 method Methods 0.000 claims description 104
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 77
- 102000005454 Dimethylallyltranstransferase Human genes 0.000 claims description 67
- 108010006731 Dimethylallyltranstransferase Proteins 0.000 claims description 67
- 150000007523 nucleic acids Chemical class 0.000 claims description 67
- 108010030975 Polyketide Synthases Proteins 0.000 claims description 66
- 238000006467 substitution reaction Methods 0.000 claims description 64
- 238000004519 manufacturing process Methods 0.000 claims description 58
- 102000039446 nucleic acids Human genes 0.000 claims description 55
- 108020004707 nucleic acids Proteins 0.000 claims description 55
- 239000002253 acid Substances 0.000 claims description 54
- 102000040430 polynucleotide Human genes 0.000 claims description 49
- 108091033319 polynucleotide Proteins 0.000 claims description 49
- 239000002157 polynucleotide Substances 0.000 claims description 49
- UCONUSSAWGCZMV-HZPDHXFCSA-N Delta(9)-tetrahydrocannabinolic acid Chemical compound C([C@H]1C(C)(C)O2)CC(C)=C[C@H]1C1=C2C=C(CCCCC)C(C(O)=O)=C1O UCONUSSAWGCZMV-HZPDHXFCSA-N 0.000 claims description 37
- 230000014509 gene expression Effects 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 34
- 238000012217 deletion Methods 0.000 claims description 33
- 230000037430 deletion Effects 0.000 claims description 33
- 238000003780 insertion Methods 0.000 claims description 33
- 230000037431 insertion Effects 0.000 claims description 33
- SEEZIOZEUUMJME-FOWTUZBSSA-N cannabigerolic acid Chemical compound CCCCCC1=CC(O)=C(C\C=C(/C)CCC=C(C)C)C(O)=C1C(O)=O SEEZIOZEUUMJME-FOWTUZBSSA-N 0.000 claims description 28
- 238000007792 addition Methods 0.000 claims description 27
- WVOLTBSCXRRQFR-DLBZAZTESA-N cannabidiolic acid Chemical compound OC1=C(C(O)=O)C(CCCCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 WVOLTBSCXRRQFR-DLBZAZTESA-N 0.000 claims description 25
- SEEZIOZEUUMJME-VBKFSLOCSA-N Cannabigerolic acid Natural products CCCCCC1=CC(O)=C(C\C=C(\C)CCC=C(C)C)C(O)=C1C(O)=O SEEZIOZEUUMJME-VBKFSLOCSA-N 0.000 claims description 22
- 101001120927 Cannabis sativa 3,5,7-trioxododecanoyl-CoA synthase Proteins 0.000 claims description 22
- SEEZIOZEUUMJME-UHFFFAOYSA-N cannabinerolic acid Natural products CCCCCC1=CC(O)=C(CC=C(C)CCC=C(C)C)C(O)=C1C(O)=O SEEZIOZEUUMJME-UHFFFAOYSA-N 0.000 claims description 22
- 238000007243 oxidative cyclization reaction Methods 0.000 claims description 21
- HRHJHXJQMNWQTF-UHFFFAOYSA-N cannabichromenic acid Chemical compound O1C(C)(CCC=C(C)C)C=CC2=C1C=C(CCCCC)C(C(O)=O)=C2O HRHJHXJQMNWQTF-UHFFFAOYSA-N 0.000 claims description 20
- 125000001844 prenyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 19
- 101710095468 Cyclase Proteins 0.000 claims description 17
- 238000001727 in vivo Methods 0.000 claims description 17
- WVOLTBSCXRRQFR-SJORKVTESA-N Cannabidiolic acid Natural products OC1=C(C(O)=O)C(CCCCC)=CC(O)=C1[C@@H]1[C@@H](C(C)=C)CCC(C)=C1 WVOLTBSCXRRQFR-SJORKVTESA-N 0.000 claims description 15
- 230000001580 bacterial effect Effects 0.000 claims description 15
- 230000002538 fungal effect Effects 0.000 claims description 15
- 229930001119 polyketide Natural products 0.000 claims description 15
- 150000003881 polyketide derivatives Chemical class 0.000 claims description 14
- 238000007363 ring formation reaction Methods 0.000 claims description 13
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 claims description 11
- 210000005253 yeast cell Anatomy 0.000 claims description 11
- 102220541030 Putative uncharacterized protein PRO0255_Y39F_mutation Human genes 0.000 claims description 10
- 239000003795 chemical substances by application Substances 0.000 claims description 10
- 102200153332 rs116840818 Human genes 0.000 claims description 10
- 102200110348 rs151344481 Human genes 0.000 claims description 10
- 102220615165 Calcyphosin_T33D_mutation Human genes 0.000 claims description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 9
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 9
- 102200031793 rs800292 Human genes 0.000 claims description 9
- 241000228212 Aspergillus Species 0.000 claims description 8
- 241000588724 Escherichia coli Species 0.000 claims description 8
- 102220249077 rs776423551 Human genes 0.000 claims description 8
- 241000235070 Saccharomyces Species 0.000 claims description 7
- 239000003054 catalyst Substances 0.000 claims description 6
- 229930182817 methionine Natural products 0.000 claims description 6
- 101710084186 Acetyl-coenzyme A synthetase Proteins 0.000 claims description 5
- 101710194784 Acetyl-coenzyme A synthetase, cytoplasmic Proteins 0.000 claims description 5
- 102100035709 Acetyl-coenzyme A synthetase, cytoplasmic Human genes 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 5
- 241000235648 Pichia Species 0.000 claims description 4
- 241000235013 Yarrowia Species 0.000 claims description 4
- 210000004102 animal cell Anatomy 0.000 claims description 4
- FRNQLQRBNSSJBK-UHFFFAOYSA-N divarinol Chemical compound CCCC1=CC(O)=CC(O)=C1 FRNQLQRBNSSJBK-UHFFFAOYSA-N 0.000 claims description 4
- 241001099157 Komagataella Species 0.000 claims description 2
- 230000001590 oxidative effect Effects 0.000 claims description 2
- 102220075865 rs79046967 Human genes 0.000 claims 4
- OIVPAQDCMDYIIL-UHFFFAOYSA-N 5-hydroxy-2-methyl-2-(4-methylpent-3-enyl)-7-propylchromene-6-carboxylic acid Chemical compound O1C(C)(CCC=C(C)C)C=CC2=C1C=C(CCC)C(C(O)=O)=C2O OIVPAQDCMDYIIL-UHFFFAOYSA-N 0.000 claims 3
- 150000001875 compounds Chemical class 0.000 description 338
- 125000000217 alkyl group Chemical group 0.000 description 255
- 235000001014 amino acid Nutrition 0.000 description 234
- 230000000875 corresponding effect Effects 0.000 description 201
- 229940024606 amino acid Drugs 0.000 description 195
- 239000000047 product Substances 0.000 description 158
- 102000004190 Enzymes Human genes 0.000 description 120
- 108090000790 Enzymes Proteins 0.000 description 120
- 108090000623 proteins and genes Proteins 0.000 description 88
- 239000000758 substrate Substances 0.000 description 88
- 125000004429 atom Chemical group 0.000 description 77
- -1 cycloaliphatic Chemical group 0.000 description 75
- 125000000304 alkynyl group Chemical group 0.000 description 68
- 125000004452 carbocyclyl group Chemical group 0.000 description 67
- 125000003118 aryl group Chemical group 0.000 description 66
- 230000000694 effects Effects 0.000 description 61
- 240000004308 marijuana Species 0.000 description 61
- 102000004169 proteins and genes Human genes 0.000 description 60
- 235000018102 proteins Nutrition 0.000 description 59
- 108010002861 cannabichromenic acid synthase Proteins 0.000 description 56
- 108030003705 Tetrahydrocannabinolic acid synthases Proteins 0.000 description 55
- 125000003342 alkenyl group Chemical group 0.000 description 55
- 229910052799 carbon Inorganic materials 0.000 description 55
- 125000004432 carbon atom Chemical group C* 0.000 description 55
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 52
- 108090000765 processed proteins & peptides Proteins 0.000 description 49
- 102000004196 processed proteins & peptides Human genes 0.000 description 46
- 229920001184 polypeptide Polymers 0.000 description 45
- 239000001257 hydrogen Substances 0.000 description 38
- 229910052739 hydrogen Inorganic materials 0.000 description 38
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 37
- 230000001105 regulatory effect Effects 0.000 description 37
- 125000000623 heterocyclic group Chemical group 0.000 description 35
- 108010075293 Cannabidiolic acid synthase Proteins 0.000 description 31
- 125000002252 acyl group Chemical group 0.000 description 30
- 125000000547 substituted alkyl group Chemical group 0.000 description 29
- 241000196324 Embryophyta Species 0.000 description 27
- 102100039371 ER lumen protein-retaining receptor 1 Human genes 0.000 description 26
- 101000812437 Homo sapiens ER lumen protein-retaining receptor 1 Proteins 0.000 description 26
- 238000006243 chemical reaction Methods 0.000 description 26
- 150000003839 salts Chemical class 0.000 description 26
- 125000005017 substituted alkenyl group Chemical group 0.000 description 26
- 230000000670 limiting effect Effects 0.000 description 25
- 125000003107 substituted aryl group Chemical group 0.000 description 25
- 125000004426 substituted alkynyl group Chemical group 0.000 description 24
- QXACEHWTBCFNSA-SFQUDFHCSA-N cannabigerol Chemical compound CCCCCC1=CC(O)=C(C\C=C(/C)CCC=C(C)C)C(O)=C1 QXACEHWTBCFNSA-SFQUDFHCSA-N 0.000 description 23
- QXACEHWTBCFNSA-UHFFFAOYSA-N cannabigerol Natural products CCCCCC1=CC(O)=C(CC=C(C)CCC=C(C)C)C(O)=C1 QXACEHWTBCFNSA-UHFFFAOYSA-N 0.000 description 23
- 125000001072 heteroaryl group Chemical group 0.000 description 22
- 239000013641 positive control Substances 0.000 description 22
- 125000001424 substituent group Chemical group 0.000 description 22
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 21
- 239000013078 crystal Substances 0.000 description 20
- CYQFCXCEBYINGO-IAGOWNOFSA-N delta1-THC Chemical compound C1=C(C)CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 CYQFCXCEBYINGO-IAGOWNOFSA-N 0.000 description 20
- 230000035772 mutation Effects 0.000 description 19
- SXFKFRRXJUJGSS-UHFFFAOYSA-N olivetolic acid Chemical compound CCCCCC1=CC(O)=CC(O)=C1C(O)=O SXFKFRRXJUJGSS-UHFFFAOYSA-N 0.000 description 19
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 19
- 125000000882 C2-C6 alkenyl group Chemical group 0.000 description 17
- 125000004122 cyclic group Chemical group 0.000 description 17
- 229960004242 dronabinol Drugs 0.000 description 17
- 238000000855 fermentation Methods 0.000 description 17
- 230000004151 fermentation Effects 0.000 description 17
- 239000012453 solvate Substances 0.000 description 17
- CYQFCXCEBYINGO-UHFFFAOYSA-N THC Natural products C1=C(C)CCC2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3C21 CYQFCXCEBYINGO-UHFFFAOYSA-N 0.000 description 16
- 239000000203 mixture Substances 0.000 description 16
- 239000000651 prodrug Substances 0.000 description 16
- 229940002612 prodrug Drugs 0.000 description 16
- ZTGXAWYVTLUPDT-UHFFFAOYSA-N cannabidiol Natural products OC1=CC(CCCCC)=CC(O)=C1C1C(C(C)=C)CC=C(C)C1 ZTGXAWYVTLUPDT-UHFFFAOYSA-N 0.000 description 15
- OKTJSMMVPCPJKN-YPZZEJLDSA-N carbon-10 atom Chemical compound [10C] OKTJSMMVPCPJKN-YPZZEJLDSA-N 0.000 description 15
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 15
- 241000894007 species Species 0.000 description 15
- UVOLYTDXHDXWJU-UHFFFAOYSA-N Cannabichromene Chemical compound C1=CC(C)(CCC=C(C)C)OC2=CC(CCCCC)=CC(O)=C21 UVOLYTDXHDXWJU-UHFFFAOYSA-N 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 14
- 125000004404 heteroalkyl group Chemical group 0.000 description 14
- 125000003601 C2-C6 alkynyl group Chemical group 0.000 description 13
- 241000186226 Corynebacterium glutamicum Species 0.000 description 13
- 108030006655 Olivetolic acid cyclases Proteins 0.000 description 13
- QHMBSVQNZZTUGM-UHFFFAOYSA-N Trans-Cannabidiol Natural products OC1=CC(CCCCC)=CC(O)=C1C1C(C(C)=C)CCC(C)=C1 QHMBSVQNZZTUGM-UHFFFAOYSA-N 0.000 description 13
- 125000006708 (C5-C14) heteroaryl group Chemical group 0.000 description 12
- UVOLYTDXHDXWJU-NRFANRHFSA-N Cannabichromene Natural products C1=C[C@](C)(CCC=C(C)C)OC2=CC(CCCCC)=CC(O)=C21 UVOLYTDXHDXWJU-NRFANRHFSA-N 0.000 description 12
- ORKZJYDOERTGKY-UHFFFAOYSA-N Dihydrocannabichromen Natural products C1CC(C)(CCC=C(C)C)OC2=CC(CCCCC)=CC(O)=C21 ORKZJYDOERTGKY-UHFFFAOYSA-N 0.000 description 12
- 125000001931 aliphatic group Chemical group 0.000 description 12
- 125000003710 aryl alkyl group Chemical group 0.000 description 12
- 210000004899 c-terminal region Anatomy 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 12
- QHMBSVQNZZTUGM-ZWKOTPCHSA-N cannabidiol Chemical compound OC1=CC(CCCCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 QHMBSVQNZZTUGM-ZWKOTPCHSA-N 0.000 description 12
- 229950011318 cannabidiol Drugs 0.000 description 12
- PCXRACLQFPRCBB-ZWKOTPCHSA-N dihydrocannabidiol Natural products OC1=CC(CCCCC)=CC(O)=C1[C@H]1[C@H](C(C)C)CCC(C)=C1 PCXRACLQFPRCBB-ZWKOTPCHSA-N 0.000 description 12
- 230000001939 inductive effect Effects 0.000 description 12
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 12
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 12
- VHFNTMSJVWRHBO-GMHMEAMDSA-N 3,5,7-trioxododecanoyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(=O)CC(=O)CC(=O)CCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 VHFNTMSJVWRHBO-GMHMEAMDSA-N 0.000 description 11
- WWZKQHOCKIZLMA-UHFFFAOYSA-N Caprylic acid Natural products CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 description 11
- 230000027455 binding Effects 0.000 description 11
- 239000006227 byproduct Substances 0.000 description 11
- 230000037361 pathway Effects 0.000 description 11
- 150000003505 terpenes Chemical class 0.000 description 11
- 235000007586 terpenes Nutrition 0.000 description 11
- 125000006714 (C3-C10) heterocyclyl group Chemical group 0.000 description 10
- 241000894006 Bacteria Species 0.000 description 10
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 10
- 125000006374 C2-C10 alkenyl group Chemical group 0.000 description 10
- 244000025254 Cannabis sativa Species 0.000 description 10
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 9
- 241000186216 Corynebacterium Species 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 230000001588 bifunctional effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 229910052736 halogen Inorganic materials 0.000 description 9
- 150000002367 halogens Chemical class 0.000 description 9
- OEXFMSFODMQEPE-HDRQGHTBSA-J hexanoyl-CoA(4-) Chemical compound O[C@@H]1[C@H](OP([O-])([O-])=O)[C@@H](COP([O-])(=O)OP([O-])(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 OEXFMSFODMQEPE-HDRQGHTBSA-J 0.000 description 9
- 125000001313 C5-C10 heteroaryl group Chemical group 0.000 description 8
- 150000007513 acids Chemical class 0.000 description 8
- 125000000753 cycloalkyl group Chemical group 0.000 description 8
- 125000005842 heteroatom Chemical group 0.000 description 8
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 7
- 239000002028 Biomass Substances 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 125000002837 carbocyclic group Chemical group 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 7
- 210000003463 organelle Anatomy 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 7
- 102220039977 rs587778113 Human genes 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- CZXWOKHVLNYAHI-LSDHHAIUSA-N 2,4-dihydroxy-3-[(1r,6r)-3-methyl-6-prop-1-en-2-ylcyclohex-2-en-1-yl]-6-propylbenzoic acid Chemical compound OC1=C(C(O)=O)C(CCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 CZXWOKHVLNYAHI-LSDHHAIUSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 239000004098 Tetracycline Substances 0.000 description 6
- 230000001086 cytosolic effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 6
- 150000002148 esters Chemical class 0.000 description 6
- VWWQXMAJTJZDQX-UYBVJOGSSA-N flavin adenine dinucleotide Chemical compound C1=NC2=C(N)N=CN=C2N1[C@@H]([C@H](O)[C@@H]1O)O[C@@H]1CO[P@](O)(=O)O[P@@](O)(=O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C2=NC(=O)NC(=O)C2=NC2=C1C=C(C)C(C)=C2 VWWQXMAJTJZDQX-UYBVJOGSSA-N 0.000 description 6
- 235000019162 flavin adenine dinucleotide Nutrition 0.000 description 6
- 239000011714 flavin adenine dinucleotide Substances 0.000 description 6
- 229940093632 flavin-adenine dinucleotide Drugs 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 230000004807 localization Effects 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 125000003136 n-heptyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 6
- FUZZWVXGSFPDMH-UHFFFAOYSA-N n-hexanoic acid Natural products CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 150000003254 radicals Chemical class 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 239000002904 solvent Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 235000019364 tetracycline Nutrition 0.000 description 6
- 229930101283 tetracycline Natural products 0.000 description 6
- 150000003522 tetracyclines Chemical class 0.000 description 6
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 6
- 241000193830 Bacillus <bacterium> Species 0.000 description 5
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- 102000018697 Membrane Proteins Human genes 0.000 description 5
- 108010052285 Membrane Proteins Proteins 0.000 description 5
- 108091005461 Nucleic proteins Chemical group 0.000 description 5
- GONOPSZTUGRENK-UHFFFAOYSA-N benzyl(trichloro)silane Chemical compound Cl[Si](Cl)(Cl)CC1=CC=CC=C1 GONOPSZTUGRENK-UHFFFAOYSA-N 0.000 description 5
- NHZMSIOYBVIOAF-UHFFFAOYSA-N cannabichromanone A Natural products O=C1C(CCC(C)=O)C(C)(C)OC2=CC(CCCCC)=CC(O)=C21 NHZMSIOYBVIOAF-UHFFFAOYSA-N 0.000 description 5
- 210000000170 cell membrane Anatomy 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 5
- 239000005516 coenzyme A Substances 0.000 description 5
- 229940093530 coenzyme a Drugs 0.000 description 5
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 5
- 235000019441 ethanol Nutrition 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 230000003248 secreting effect Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 229960002180 tetracycline Drugs 0.000 description 5
- 125000006706 (C3-C6) carbocyclyl group Chemical group 0.000 description 4
- ZLYNXDIDWUWASO-UHFFFAOYSA-N 6,6,9-trimethyl-3-pentyl-8,10-dihydro-7h-benzo[c]chromene-1,9,10-triol Chemical compound CC1(C)OC2=CC(CCCCC)=CC(O)=C2C2=C1CCC(C)(O)C2O ZLYNXDIDWUWASO-UHFFFAOYSA-N 0.000 description 4
- 241000203069 Archaea Species 0.000 description 4
- 241001328122 Bacillus clausii Species 0.000 description 4
- 241000194107 Bacillus megaterium Species 0.000 description 4
- 241000194103 Bacillus pumilus Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 102000018208 Cannabinoid Receptor Human genes 0.000 description 4
- 108050007331 Cannabinoid receptor Proteins 0.000 description 4
- 235000008697 Cannabis sativa Nutrition 0.000 description 4
- 241000206602 Eukaryota Species 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 4
- 241000589323 Methylobacterium Species 0.000 description 4
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- 241000190932 Rhodopseudomonas Species 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 125000002015 acyclic group Chemical group 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 239000002585 base Substances 0.000 description 4
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 4
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 4
- CRFNGMNYKDXRTN-CITAKDKDSA-N butyryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 CRFNGMNYKDXRTN-CITAKDKDSA-N 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 150000001721 carbon Chemical group 0.000 description 4
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 239000000835 fiber Substances 0.000 description 4
- 238000003306 harvesting Methods 0.000 description 4
- 150000002430 hydrocarbons Chemical group 0.000 description 4
- 239000000411 inducer Substances 0.000 description 4
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 4
- 125000001280 n-hexyl group Chemical group C(CCCCC)* 0.000 description 4
- IRMPFYJSHJGOPE-UHFFFAOYSA-N olivetol Chemical compound CCCCCC1=CC(O)=CC(O)=C1 IRMPFYJSHJGOPE-UHFFFAOYSA-N 0.000 description 4
- 235000021317 phosphate Nutrition 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- 125000006376 (C3-C10) cycloalkyl group Chemical group 0.000 description 3
- 125000005913 (C3-C6) cycloalkyl group Chemical group 0.000 description 3
- 125000006704 (C5-C6) cycloalkyl group Chemical group 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- GYSCBCSGKXNZRH-UHFFFAOYSA-N 1-benzothiophene-2-carboxamide Chemical compound C1=CC=C2SC(C(=O)N)=CC2=C1 GYSCBCSGKXNZRH-UHFFFAOYSA-N 0.000 description 3
- XYHKNCXZYYTLRG-UHFFFAOYSA-N 1h-imidazole-2-carbaldehyde Chemical compound O=CC1=NC=CN1 XYHKNCXZYYTLRG-UHFFFAOYSA-N 0.000 description 3
- GWYFCOCPABKNJV-UHFFFAOYSA-M 3-Methylbutanoic acid Natural products CC(C)CC([O-])=O GWYFCOCPABKNJV-UHFFFAOYSA-M 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 3
- 241000228245 Aspergillus niger Species 0.000 description 3
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- 241000193403 Clostridium Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 3
- GHVNFZFCNZKVNT-UHFFFAOYSA-N Decanoic acid Natural products CCCCCCCCCC(O)=O GHVNFZFCNZKVNT-UHFFFAOYSA-N 0.000 description 3
- YOVRGSHRZRJTLZ-UHFFFAOYSA-N Delta9-THCA Natural products C1=C(C(O)=O)CCC2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3C21 YOVRGSHRZRJTLZ-UHFFFAOYSA-N 0.000 description 3
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 241000588722 Escherichia Species 0.000 description 3
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 241000520272 Pantoea Species 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 3
- XBDQKXXYIPTUBI-UHFFFAOYSA-N Propionic acid Chemical compound CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 3
- 241000589516 Pseudomonas Species 0.000 description 3
- 241000187561 Rhodococcus erythropolis Species 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 241000319304 [Brevibacterium] flavum Species 0.000 description 3
- 235000011054 acetic acid Nutrition 0.000 description 3
- 229960000583 acetic acid Drugs 0.000 description 3
- 229910052784 alkaline earth metal Inorganic materials 0.000 description 3
- 125000003545 alkoxy group Chemical group 0.000 description 3
- OBETXYAYXDNJHR-UHFFFAOYSA-N alpha-ethylcaproic acid Natural products CCCCC(CC)C(O)=O OBETXYAYXDNJHR-UHFFFAOYSA-N 0.000 description 3
- 150000001408 amides Chemical class 0.000 description 3
- 125000003277 amino group Chemical group 0.000 description 3
- 125000000129 anionic group Chemical group 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 3
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 3
- GWYFCOCPABKNJV-UHFFFAOYSA-N beta-methyl-butyric acid Natural products CC(C)CC(O)=O GWYFCOCPABKNJV-UHFFFAOYSA-N 0.000 description 3
- 230000001851 biosynthetic effect Effects 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 3
- 235000005607 chanvre indien Nutrition 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 235000014113 dietary fatty acids Nutrition 0.000 description 3
- 239000002621 endocannabinoid Substances 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 229930195729 fatty acid Natural products 0.000 description 3
- 239000000194 fatty acid Substances 0.000 description 3
- 150000004665 fatty acids Chemical class 0.000 description 3
- 125000000524 functional group Chemical group 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 229940050410 gluconate Drugs 0.000 description 3
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 3
- 150000004677 hydrates Chemical class 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 3
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 3
- 150000002576 ketones Chemical class 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000037353 metabolic pathway Effects 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 125000002950 monocyclic group Chemical group 0.000 description 3
- 125000001624 naphthyl group Chemical group 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 229960002429 proline Drugs 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- JBYXPOFIGCOSSB-UQGDGPGGSA-N rumenic acid Chemical compound CCCCCC\C=C/C=C/CCCCCCCC(O)=O JBYXPOFIGCOSSB-UQGDGPGGSA-N 0.000 description 3
- 229920006395 saturated elastomer Polymers 0.000 description 3
- 150000003431 steroids Chemical class 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 3
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 150000003573 thiols Chemical class 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000032258 transport Effects 0.000 description 3
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical compound CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 description 3
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 2
- 125000006650 (C2-C4) alkynyl group Chemical group 0.000 description 2
- 125000006552 (C3-C8) cycloalkyl group Chemical group 0.000 description 2
- FNQJDLTXOVEEFB-UHFFFAOYSA-N 1,2,3-benzothiadiazole Chemical compound C1=CC=C2SN=NC2=C1 FNQJDLTXOVEEFB-UHFFFAOYSA-N 0.000 description 2
- 125000004973 1-butenyl group Chemical group C(=CCC)* 0.000 description 2
- 125000004972 1-butynyl group Chemical group [H]C([H])([H])C([H])([H])C#C* 0.000 description 2
- 125000004974 2-butenyl group Chemical group C(C=CC)* 0.000 description 2
- 125000000069 2-butynyl group Chemical group [H]C([H])([H])C#CC([H])([H])* 0.000 description 2
- AAXZFUQLLRMVOG-UHFFFAOYSA-N 2-methyl-2-(4-methylpent-3-enyl)-7-propylchromen-5-ol Chemical compound C1=CC(C)(CCC=C(C)C)OC2=CC(CCC)=CC(O)=C21 AAXZFUQLLRMVOG-UHFFFAOYSA-N 0.000 description 2
- 125000000094 2-phenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])* 0.000 description 2
- GGVVJZIANMUEJO-UHFFFAOYSA-N 3-butyl-6,6,9-trimethylbenzo[c]chromen-1-ol Chemical compound C1=C(C)C=C2C3=C(O)C=C(CCCC)C=C3OC(C)(C)C2=C1 GGVVJZIANMUEJO-UHFFFAOYSA-N 0.000 description 2
- QUYCDNSZSMEFBQ-UHFFFAOYSA-N 3-ethyl-6,6,9-trimethylbenzo[c]chromen-1-ol Chemical compound C1=C(C)C=C2C3=C(O)C=C(CC)C=C3OC(C)(C)C2=C1 QUYCDNSZSMEFBQ-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- WBRXESQKGXYDOL-DLBZAZTESA-N 5-butyl-2-[(1r,6r)-3-methyl-6-prop-1-en-2-ylcyclohex-2-en-1-yl]benzene-1,3-diol Chemical compound OC1=CC(CCCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 WBRXESQKGXYDOL-DLBZAZTESA-N 0.000 description 2
- GGHRHCGOMWNLCE-VQTJNVASSA-N 5-heptyl-2-[(1r,6r)-3-methyl-6-prop-1-en-2-ylcyclohex-2-en-1-yl]benzene-1,3-diol Chemical compound OC1=CC(CCCCCCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 GGHRHCGOMWNLCE-VQTJNVASSA-N 0.000 description 2
- 239000005964 Acibenzolar-S-methyl Substances 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 241000186361 Actinobacteria <class> Species 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 2
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 2
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 241000186063 Arthrobacter Species 0.000 description 2
- 241000185996 Arthrobacter citreus Species 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 241000193747 Bacillus firmus Species 0.000 description 2
- 241000193422 Bacillus lentus Species 0.000 description 2
- 241001465180 Botrytis Species 0.000 description 2
- 101150085381 CDC19 gene Proteins 0.000 description 2
- 101100480861 Caldanaerobacter subterraneus subsp. tengcongensis (strain DSM 15242 / JCM 11007 / NBRC 100824 / MB4) tdh gene Proteins 0.000 description 2
- 241000589876 Campylobacter Species 0.000 description 2
- 101100351264 Candida albicans (strain SC5314 / ATCC MYA-2876) PDC11 gene Proteins 0.000 description 2
- 101100447466 Candida albicans (strain WO-1) TDH1 gene Proteins 0.000 description 2
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 2
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 2
- 241000190831 Chromatium Species 0.000 description 2
- 241001464948 Coprococcus Species 0.000 description 2
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 2
- 241001644925 Corynebacterium efficiens Species 0.000 description 2
- 241000133018 Corynebacterium melassecola Species 0.000 description 2
- 241000337023 Corynebacterium thermoaminogenes Species 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 101100510329 Drosophila melanogaster Pkc53E gene Proteins 0.000 description 2
- 101710140859 E3 ubiquitin ligase TRAF3IP2 Proteins 0.000 description 2
- 102100026620 E3 ubiquitin ligase TRAF3IP2 Human genes 0.000 description 2
- 102100023431 E3 ubiquitin-protein ligase TRIM21 Human genes 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 241000194033 Enterococcus Species 0.000 description 2
- 241000230562 Flavobacteriia Species 0.000 description 2
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 101150094690 GAL1 gene Proteins 0.000 description 2
- 102100028501 Galanin peptides Human genes 0.000 description 2
- 102100028652 Gamma-enolase Human genes 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 2
- 101000685877 Homo sapiens E3 ubiquitin-protein ligase TRIM21 Proteins 0.000 description 2
- 101000871151 Homo sapiens G-protein coupled receptor 55 Proteins 0.000 description 2
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 2
- 101001058231 Homo sapiens Gamma-enolase Proteins 0.000 description 2
- 101000829761 Homo sapiens N-arachidonyl glycine receptor Proteins 0.000 description 2
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 2
- 101000642268 Homo sapiens Speckle-type POZ protein Proteins 0.000 description 2
- 101000801742 Homo sapiens Triosephosphate isomerase Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 241000411968 Ilyobacter Species 0.000 description 2
- 241000186984 Kitasatospora aureofaciens Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000235087 Lachancea kluyveri Species 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 2
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 2
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 2
- 241000192041 Micrococcus Species 0.000 description 2
- 241000186359 Mycobacterium Species 0.000 description 2
- 102100023414 N-arachidonyl glycine receptor Human genes 0.000 description 2
- 241000588653 Neisseria Species 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 101100234604 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) ace-8 gene Proteins 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 101150050255 PDC1 gene Proteins 0.000 description 2
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 2
- 102100026466 POU domain, class 2, transcription factor 3 Human genes 0.000 description 2
- 101710084413 POU domain, class 2, transcription factor 3 Proteins 0.000 description 2
- 101150093629 PYK1 gene Proteins 0.000 description 2
- 241000157908 Paenarthrobacter aurescens Species 0.000 description 2
- 241000194109 Paenibacillus lautus Species 0.000 description 2
- 241000157907 Paeniglutamicibacter sulfureus Species 0.000 description 2
- 241000588912 Pantoea agglomerans Species 0.000 description 2
- 241000588696 Pantoea ananatis Species 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 102000003728 Peroxisome Proliferator-Activated Receptors Human genes 0.000 description 2
- 108090000029 Peroxisome Proliferator-Activated Receptors Proteins 0.000 description 2
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 102000019337 Prenyltransferases Human genes 0.000 description 2
- 108050006837 Prenyltransferases Proteins 0.000 description 2
- 241000192138 Prochlorococcus Species 0.000 description 2
- 101150012328 RPL18-B gene Proteins 0.000 description 2
- 241000191025 Rhodobacter Species 0.000 description 2
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 2
- 241000190967 Rhodospirillum Species 0.000 description 2
- 241000605947 Roseburia Species 0.000 description 2
- OVMIMTBRDWDMOG-HSJNEKGZSA-N S-[2-[3-[[(2R)-4-[[[(2R,3S,4R,5R)-5-(6-aminopurin-9-yl)-4-hydroxy-3-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl]oxy-2-hydroxy-3,3-dimethylbutanoyl]amino]propanoylamino]ethyl] 3,5,7-trioxodecanethioate Chemical compound O=C(CC(=O)SCCNC(CCNC([C@@H](C(COP(OP(OC[C@@H]1[C@H]([C@H]([C@@H](O1)N1C=NC=2C(N)=NC=NC1=2)O)OP(=O)(O)O)(=O)O)(=O)O)(C)C)O)=O)=O)CC(CC(CCC)=O)=O OVMIMTBRDWDMOG-HSJNEKGZSA-N 0.000 description 2
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 2
- 101100507950 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HXT3 gene Proteins 0.000 description 2
- 101100507956 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HXT7 gene Proteins 0.000 description 2
- 101100196145 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPL20B gene Proteins 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 241001407717 Saccharomyces norbensis Species 0.000 description 2
- 101100296591 Schizosaccharomyces pombe (strain 972 / ATCC 24843) pck2 gene Proteins 0.000 description 2
- 101100303045 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rpl1802 gene Proteins 0.000 description 2
- 241000015473 Schizothorax griseus Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 102100036422 Speckle-type POZ protein Human genes 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000194054 Streptococcus uberis Species 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 241000187758 Streptomyces ambofaciens Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241000971005 Streptomyces fungicidicus Species 0.000 description 2
- 241000187398 Streptomyces lividans Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 108010021188 Superoxide Dismutase-1 Proteins 0.000 description 2
- 102100038836 Superoxide dismutase [Cu-Zn] Human genes 0.000 description 2
- 101150001810 TEAD1 gene Proteins 0.000 description 2
- 101150074253 TEF1 gene Proteins 0.000 description 2
- UCONUSSAWGCZMV-UHFFFAOYSA-N Tetrahydro-cannabinol-carbonsaeure Natural products O1C(C)(C)C2CCC(C)=CC2C2=C1C=C(CCCCC)C(C(O)=O)=C2O UCONUSSAWGCZMV-UHFFFAOYSA-N 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 2
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000588901 Zymomonas Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 125000004423 acyloxy group Chemical group 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 238000005882 aldol condensation reaction Methods 0.000 description 2
- 125000005377 alkyl thioxy group Chemical group 0.000 description 2
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 2
- 150000008064 anhydrides Chemical class 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000005165 aryl thioxy group Chemical group 0.000 description 2
- 125000004104 aryloxy group Chemical group 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 125000002619 bicyclic group Chemical group 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 244000213578 camo Species 0.000 description 2
- 235000009120 camo Nutrition 0.000 description 2
- MIOPJNTWMNEORI-UHFFFAOYSA-N camphorsulfonic acid Chemical compound C1CC2(CS(O)(=O)=O)C(=O)CC1C2(C)C MIOPJNTWMNEORI-UHFFFAOYSA-N 0.000 description 2
- 229930192457 cannabichromanone Natural products 0.000 description 2
- IGHTZQUIFGUJTG-UHFFFAOYSA-N cannabicyclol Chemical compound O1C2=CC(CCCCC)=CC(O)=C2C2C(C)(C)C3C2C1(C)CC3 IGHTZQUIFGUJTG-UHFFFAOYSA-N 0.000 description 2
- 235000013877 carbamide Nutrition 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 150000001735 carboxylic acids Chemical class 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010924 continuous production Methods 0.000 description 2
- 238000002425 crystallisation Methods 0.000 description 2
- 230000008025 crystallization Effects 0.000 description 2
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 125000000582 cycloheptyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000000640 cyclooctyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- MOTZDAYCYVMXPC-UHFFFAOYSA-N dodecyl hydrogen sulfate Chemical compound CCCCCCCCCCCCOS(O)(=O)=O MOTZDAYCYVMXPC-UHFFFAOYSA-N 0.000 description 2
- 229940043264 dodecyl sulfate Drugs 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 125000002350 geranyl group Chemical group [H]C([*])([H])/C([H])=C(C([H])([H])[H])/C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 230000000762 glandular Effects 0.000 description 2
- 238000002873 global sequence alignment Methods 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 229930182470 glycoside Natural products 0.000 description 2
- 150000002338 glycosides Chemical class 0.000 description 2
- 210000002288 golgi apparatus Anatomy 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 229940093915 gynecological organic acid Drugs 0.000 description 2
- 125000003187 heptyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 125000005553 heteroaryloxy group Chemical group 0.000 description 2
- 125000005378 heteroarylthioxy group Chemical group 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 239000012510 hollow fiber Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003402 intramolecular cyclocondensation reaction Methods 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- 230000002262 irrigation Effects 0.000 description 2
- 238000003973 irrigation Methods 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229940001447 lactate Drugs 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- IWYDHOAUDWTVEP-UHFFFAOYSA-N mandelic acid Chemical compound OC(=O)C(O)C1=CC=CC=C1 IWYDHOAUDWTVEP-UHFFFAOYSA-N 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 150000007522 mineralic acids Chemical class 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- 235000005985 organic acids Nutrition 0.000 description 2
- 150000002894 organic compounds Chemical class 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- VLTRZXGMWDSKGL-UHFFFAOYSA-N perchloric acid Chemical compound OCl(=O)(=O)=O VLTRZXGMWDSKGL-UHFFFAOYSA-N 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 230000000243 photosynthetic effect Effects 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 101150037186 pkc-1 gene Proteins 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 108010061942 reticuline oxidase Proteins 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 229930195734 saturated hydrocarbon Natural products 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 229940083542 sodium Drugs 0.000 description 2
- 235000015424 sodium Nutrition 0.000 description 2
- 229910052708 sodium Inorganic materials 0.000 description 2
- 238000003797 solvolysis reaction Methods 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 229940095064 tartrate Drugs 0.000 description 2
- 101150003389 tdh2 gene Proteins 0.000 description 2
- 101150088047 tdh3 gene Proteins 0.000 description 2
- JOXIMZWYDAKGHI-UHFFFAOYSA-N toluene-4-sulfonic acid Chemical compound CC1=CC=C(S(O)(=O)=O)C=C1 JOXIMZWYDAKGHI-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 238000003809 water extraction Methods 0.000 description 2
- LSPHULWDVZXLIL-UHFFFAOYSA-N (+/-)-Camphoric acid Chemical class CC1(C)C(C(O)=O)CCC1(C)C(O)=O LSPHULWDVZXLIL-UHFFFAOYSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- OKDRUMBNXIYUEO-VHJVCUAWSA-N (2s,3s)-3-hydroxy-2-[(e)-prop-1-enyl]-2,3-dihydropyran-6-one Chemical compound C\C=C\[C@@H]1OC(=O)C=C[C@@H]1O OKDRUMBNXIYUEO-VHJVCUAWSA-N 0.000 description 1
- LOUSQMWLMDHRIK-IAGOWNOFSA-N (6ar,10ar)-9-(hydroxymethyl)-6,6-dimethyl-3-pentyl-6a,7,10,10a-tetrahydrobenzo[c]chromen-1-ol Chemical compound C1C(CO)=CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 LOUSQMWLMDHRIK-IAGOWNOFSA-N 0.000 description 1
- INKUWBOHCFHXTJ-BRWVUGGUSA-N (6ar,8r,10ar)-6,6,9-trimethyl-3-pentyl-6a,7,8,10a-tetrahydrobenzo[c]chromene-1,8-diol Chemical compound C1=C(C)[C@H](O)C[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 INKUWBOHCFHXTJ-BRWVUGGUSA-N 0.000 description 1
- INKUWBOHCFHXTJ-ZACQAIPSSA-N (6ar,8s,10ar)-6,6,9-trimethyl-3-pentyl-6a,7,8,10a-tetrahydrobenzo[c]chromene-1,8-diol Chemical compound C1=C(C)[C@@H](O)C[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 INKUWBOHCFHXTJ-ZACQAIPSSA-N 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- 125000006545 (C1-C9) alkyl group Chemical group 0.000 description 1
- 125000006649 (C2-C20) alkynyl group Chemical group 0.000 description 1
- 125000006713 (C5-C10) cycloalkyl group Chemical group 0.000 description 1
- 125000006569 (C5-C6) heterocyclic group Chemical group 0.000 description 1
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- VUDQSRFCCHQIIU-UHFFFAOYSA-N 1-(3,5-dichloro-2,6-dihydroxy-4-methoxyphenyl)hexan-1-one Chemical compound CCCCCC(=O)C1=C(O)C(Cl)=C(OC)C(Cl)=C1O VUDQSRFCCHQIIU-UHFFFAOYSA-N 0.000 description 1
- UEFGHYCIOXYTOG-UHFFFAOYSA-N 1-hydroxy-6,6,9-trimethyl-3-pentyl-8,9-dihydro-7h-benzo[c]chromen-10-one Chemical compound CC1(C)OC2=CC(CCCCC)=CC(O)=C2C2=C1CCC(C)C2=O UEFGHYCIOXYTOG-UHFFFAOYSA-N 0.000 description 1
- YEDIZIGYIMTZKP-UHFFFAOYSA-N 1-methoxy-6,6,9-trimethyl-3-pentylbenzo[c]chromene Chemical compound C1=C(C)C=C2C3=C(OC)C=C(CCCCC)C=C3OC(C)(C)C2=C1 YEDIZIGYIMTZKP-UHFFFAOYSA-N 0.000 description 1
- 125000001637 1-naphthyl group Chemical group [H]C1=C([H])C([H])=C2C(*)=C([H])C([H])=C([H])C2=C1[H] 0.000 description 1
- 125000006017 1-propenyl group Chemical group 0.000 description 1
- 125000000530 1-propynyl group Chemical group [H]C([H])([H])C#C* 0.000 description 1
- YCBKSSAWEUDACY-IAGOWNOFSA-N 11-hydroxy-Delta(9)-tetrahydrocannabinol Chemical compound C1=C(CO)CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 YCBKSSAWEUDACY-IAGOWNOFSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- KNLOTZNPRIFUAR-UHFFFAOYSA-N 2-bromodecanoic acid Chemical compound CCCCCCCCC(Br)C(O)=O KNLOTZNPRIFUAR-UHFFFAOYSA-N 0.000 description 1
- MURRZAQARFXHRD-UHFFFAOYSA-N 2-methyl-2-(4-methylpent-2-enyl)-7-propylchromen-5-ol Chemical compound C1=CC(C)(CC=CC(C)C)OC2=CC(CCC)=CC(O)=C21 MURRZAQARFXHRD-UHFFFAOYSA-N 0.000 description 1
- VLYMUOXNXHHASP-UHFFFAOYSA-N 2-methyl-2-(4-methylpent-3-enyl)chromen-5-ol Chemical compound C1=CC(O)=C2C=CC(CCC=C(C)C)(C)OC2=C1 VLYMUOXNXHHASP-UHFFFAOYSA-N 0.000 description 1
- 229940080296 2-naphthalenesulfonate Drugs 0.000 description 1
- 125000001622 2-naphthyl group Chemical group [H]C1=C([H])C([H])=C2C([H])=C(*)C([H])=C([H])C2=C1[H] 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 125000001494 2-propynyl group Chemical group [H]C#CC([H])([H])* 0.000 description 1
- LLIALYZUJZMUKA-UHFFFAOYSA-N 3,5,7-trioxododecanoic acid Chemical compound CCCCCC(=O)CC(=O)CC(=O)CC(O)=O LLIALYZUJZMUKA-UHFFFAOYSA-N 0.000 description 1
- BMYNFMYTOJXKLE-UHFFFAOYSA-N 3-azaniumyl-2-hydroxypropanoate Chemical compound NCC(O)C(O)=O BMYNFMYTOJXKLE-UHFFFAOYSA-N 0.000 description 1
- IPGGELGANIXRSX-RBUKOAKNSA-N 3-methoxy-2-[(1r,6r)-3-methyl-6-prop-1-en-2-ylcyclohex-2-en-1-yl]-5-pentylphenol Chemical compound COC1=CC(CCCCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 IPGGELGANIXRSX-RBUKOAKNSA-N 0.000 description 1
- XMIIGOLPHOKFCH-UHFFFAOYSA-N 3-phenylpropionic acid Chemical class OC(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-N 0.000 description 1
- HLLSOEKIMZEGFV-UHFFFAOYSA-N 4-(dibutylsulfamoyl)benzoic acid Chemical compound CCCCN(CCCC)S(=O)(=O)C1=CC=C(C(O)=O)C=C1 HLLSOEKIMZEGFV-UHFFFAOYSA-N 0.000 description 1
- AWQSAIIDOMEEOD-UHFFFAOYSA-N 5,5-Dimethyl-4-(3-oxobutyl)dihydro-2(3H)-furanone Chemical compound CC(=O)CCC1CC(=O)OC1(C)C AWQSAIIDOMEEOD-UHFFFAOYSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical group NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- NAGBBYZBIQVPIQ-UHFFFAOYSA-N 6-methyl-3-pentyl-9-prop-1-en-2-yldibenzofuran-1-ol Chemical compound C1=CC(C(C)=C)=C2C3=C(O)C=C(CCCCC)C=C3OC2=C1C NAGBBYZBIQVPIQ-UHFFFAOYSA-N 0.000 description 1
- BEUDCHGZCTUAOG-UHFFFAOYSA-N 6h-benzo[c]chromene Chemical group C1=CC=C2COC3=CC=CC=C3C2=C1 BEUDCHGZCTUAOG-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 235000007754 Achillea millefolium Nutrition 0.000 description 1
- 240000000073 Achillea millefolium Species 0.000 description 1
- 241001134629 Acidothermus Species 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 241001135511 Agrobacterium rubi Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- 241001136561 Allomyces Species 0.000 description 1
- 241000134914 Amanita muscaria Species 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 229910017008 AsF 6 Inorganic materials 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 241001331782 Aspergillus lacticoffeatus Species 0.000 description 1
- 241001229258 Aspergillus neoniger Species 0.000 description 1
- 241000668755 Aspergillus novofumigatus Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 241000228232 Aspergillus tubingensis Species 0.000 description 1
- 241000772824 Aspergillus turcosus Species 0.000 description 1
- 241000306560 Aspergillus udagawae Species 0.000 description 1
- 241000853023 Aspergillus vadensis Species 0.000 description 1
- 241000445051 Aspergillus welwitschiae Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000006382 Bacillus halodurans Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 241000151861 Barnettozyma salicaria Species 0.000 description 1
- 241000186000 Bifidobacterium Species 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 241001274890 Boeremia exigua Species 0.000 description 1
- 241000255783 Bombycidae Species 0.000 description 1
- 241000149420 Bothrometopus brevis Species 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- 241001453698 Buchnera <proteobacteria> Species 0.000 description 1
- 241000605902 Butyrivibrio Species 0.000 description 1
- 125000003358 C2-C20 alkenyl group Chemical group 0.000 description 1
- 125000004648 C2-C8 alkenyl group Chemical group 0.000 description 1
- 125000004649 C2-C8 alkynyl group Chemical group 0.000 description 1
- 101150009300 CBDAS gene Proteins 0.000 description 1
- JGLMVXWAHNTPRF-CMDGGOBGSA-N CCN1N=C(C)C=C1C(=O)NC1=NC2=CC(=CC(OC)=C2N1C\C=C\CN1C(NC(=O)C2=CC(C)=NN2CC)=NC2=CC(=CC(OCCCN3CCOCC3)=C12)C(N)=O)C(N)=O Chemical compound CCN1N=C(C)C=C1C(=O)NC1=NC2=CC(=CC(OC)=C2N1C\C=C\CN1C(NC(=O)C2=CC(C)=NN2CC)=NC2=CC(=CC(OCCCN3CCOCC3)=C12)C(N)=O)C(N)=O JGLMVXWAHNTPRF-CMDGGOBGSA-N 0.000 description 1
- 101100180402 Caenorhabditis elegans jun-1 gene Proteins 0.000 description 1
- 101100421200 Caenorhabditis elegans sep-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- IPGGELGANIXRSX-UHFFFAOYSA-N Cannabidiol monomethyl ether Natural products COC1=CC(CCCCC)=CC(O)=C1C1C(C(C)=C)CCC(C)=C1 IPGGELGANIXRSX-UHFFFAOYSA-N 0.000 description 1
- REOZWEGFPHTFEI-JKSUJKDBSA-N Cannabidivarin Chemical compound OC1=CC(CCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 REOZWEGFPHTFEI-JKSUJKDBSA-N 0.000 description 1
- VBGLYOIFKLUMQG-UHFFFAOYSA-N Cannabinol Chemical compound C1=C(C)C=C2C3=C(O)C=C(CCCCC)C=C3OC(C)(C)C2=C1 VBGLYOIFKLUMQG-UHFFFAOYSA-N 0.000 description 1
- 101000712615 Cannabis sativa Tetrahydrocannabinolic acid synthase Proteins 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000606161 Chlamydia Species 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000191368 Chlorobi Species 0.000 description 1
- 241001142109 Chloroflexi Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 229910020366 ClO 4 Inorganic materials 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241000193401 Clostridium acetobutylicum Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000429427 Clostridium saccharobutylicum Species 0.000 description 1
- 241000193449 Clostridium tetani Species 0.000 description 1
- 241001471082 Colocasia bobone disease-associated cytorhabdovirus Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000223184 Cucumber Bulgarian virus Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- RBNPOMFGQQGHHO-UWTATZPHSA-N D-glyceric acid Chemical compound OC[C@@H](O)C(O)=O RBNPOMFGQQGHHO-UWTATZPHSA-N 0.000 description 1
- 241000246067 Deinococcales Species 0.000 description 1
- XXGMIHXASFDFSM-UHFFFAOYSA-N Delta9-tetrahydrocannabinol Natural products CCCCCc1cc2OC(C)(C)C3CCC(=CC3c2c(O)c1O)C XXGMIHXASFDFSM-UHFFFAOYSA-N 0.000 description 1
- 241000224495 Dictyostelium Species 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- CYQFCXCEBYINGO-DLBZAZTESA-N Dronabinol Natural products C1=C(C)CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@H]21 CYQFCXCEBYINGO-DLBZAZTESA-N 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 240000000664 Eriochloa polystachya Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 241001608234 Faecalibacterium Species 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 102100033061 G-protein coupled receptor 55 Human genes 0.000 description 1
- 101150038242 GAL10 gene Proteins 0.000 description 1
- 101150037782 GAL2 gene Proteins 0.000 description 1
- 101150103804 GAL3 gene Proteins 0.000 description 1
- 102100024637 Galectin-10 Human genes 0.000 description 1
- 102100021735 Galectin-2 Human genes 0.000 description 1
- 102100039558 Galectin-3 Human genes 0.000 description 1
- 102100039555 Galectin-7 Human genes 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- GVVPGTZRZFNKDS-YFHOEESVSA-N Geranyl diphosphate Natural products CC(C)=CCC\C(C)=C/COP(O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-YFHOEESVSA-N 0.000 description 1
- 241001401556 Glutamicibacter mysorens Species 0.000 description 1
- AEMRFAOFKBGASW-UHFFFAOYSA-M Glycolate Chemical compound OCC([O-])=O AEMRFAOFKBGASW-UHFFFAOYSA-M 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101000608772 Homo sapiens Galectin-7 Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241001099156 Komagataella phaffii Species 0.000 description 1
- 238000012218 Kunkel's method Methods 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- 150000000994 L-ascorbates Chemical class 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 229910009891 LiAc Inorganic materials 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 101710140450 Mating factor alpha-2 Proteins 0.000 description 1
- 241000970829 Mesorhizobium Species 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 241001430197 Mollicutes Species 0.000 description 1
- 108010047290 Multifunctional Enzymes Proteins 0.000 description 1
- 102000006833 Multifunctional Enzymes Human genes 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 150000001200 N-acyl ethanolamides Chemical class 0.000 description 1
- 102220476547 NF-kappa-B inhibitor alpha_D35A_mutation Human genes 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 1
- 241000208134 Nicotiana rustica Species 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- IGHTZQUIFGUJTG-QSMXQIJUSA-N O1C2=CC(CCCCC)=CC(O)=C2[C@H]2C(C)(C)[C@@H]3[C@H]2[C@@]1(C)CC3 Chemical compound O1C2=CC(CCCCC)=CC(O)=C2[C@H]2C(C)(C)[C@@H]3[C@H]2[C@@]1(C)CC3 IGHTZQUIFGUJTG-QSMXQIJUSA-N 0.000 description 1
- 101150050051 OAC gene Proteins 0.000 description 1
- 241000489469 Ogataea kodamae Species 0.000 description 1
- 241001452677 Ogataea methanolica Species 0.000 description 1
- 241000489470 Ogataea trehalophila Species 0.000 description 1
- 241000826199 Ogataea wickerhamii Species 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241001524178 Paenarthrobacter ureafaciens Species 0.000 description 1
- 241000588701 Pectobacterium carotovorum Species 0.000 description 1
- 241001280501 Penicillium rubens Species 0.000 description 1
- 241000530350 Phaffomyces opuntiae Species 0.000 description 1
- 241000529953 Phaffomyces thermotolerans Species 0.000 description 1
- 241000192608 Phormidium Species 0.000 description 1
- 241000235062 Pichia membranifaciens Species 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 241000157935 Promicromonospora citrea Species 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- 241001453299 Pseudomonas mevalonii Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 241000411574 Ptinus fur Species 0.000 description 1
- 101001023863 Rattus norvegicus Glucocorticoid receptor Proteins 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 241000186567 Romboutsia lituseburensis Species 0.000 description 1
- 241000187792 Saccharomonospora Species 0.000 description 1
- 101100402850 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CUP1-1 gene Proteins 0.000 description 1
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 1
- 241000187560 Saccharopolyspora Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 229910018286 SbF 6 Inorganic materials 0.000 description 1
- 241000195663 Scenedesmus Species 0.000 description 1
- 241000235060 Scheffersomyces stipitis Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 1
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- 241000221948 Sordaria Species 0.000 description 1
- 241000589970 Spirochaetales Species 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000521540 Starmera quercuum Species 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 208000003217 Tetany Diseases 0.000 description 1
- 241001137870 Thermoanaerobacterium Species 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- 241000204315 Thermosipho <sea snail> Species 0.000 description 1
- 241001313706 Thermosynechococcus Species 0.000 description 1
- 241000204652 Thermotoga Species 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- 241000203807 Tropheryma Species 0.000 description 1
- 241000202898 Ureaplasma Species 0.000 description 1
- 241000221566 Ustilago Species 0.000 description 1
- HQVHOQAKMCMIIM-HXUWFJFHSA-N WIN 55212-2 Chemical compound C([C@@H]1COC=2C=CC=C3C(C(=O)C=4C5=CC=CC=C5C=CC=4)=C(N1C3=2)C)N1CCOCC1 HQVHOQAKMCMIIM-HXUWFJFHSA-N 0.000 description 1
- 241000370136 Wickerhamomyces pijperi Species 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 241000204366 Xylella Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 241000588902 Zymomonas mobilis Species 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 150000008065 acid anhydrides Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000037328 acute stress Effects 0.000 description 1
- 150000001266 acyl halides Chemical class 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- WNLRTRBMVRJNCN-UHFFFAOYSA-L adipate(2-) Chemical compound [O-]C(=O)CCCCC([O-])=O WNLRTRBMVRJNCN-UHFFFAOYSA-L 0.000 description 1
- WNLRTRBMVRJNCN-UHFFFAOYSA-N adipic acid Chemical class OC(=O)CCCCC(O)=O WNLRTRBMVRJNCN-UHFFFAOYSA-N 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 230000008484 agonism Effects 0.000 description 1
- 150000001294 alanine derivatives Chemical class 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 150000007933 aliphatic carboxylic acids Chemical class 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 150000001340 alkali metals Chemical class 0.000 description 1
- 150000001342 alkaline earth metals Chemical class 0.000 description 1
- 125000004453 alkoxycarbonyl group Chemical group 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- 125000002877 alkyl aryl group Chemical group 0.000 description 1
- 150000008055 alkyl aryl sulfonates Chemical class 0.000 description 1
- 125000005907 alkyl ester group Chemical group 0.000 description 1
- 229940045714 alkyl sulfonate alkylating agent Drugs 0.000 description 1
- 150000008052 alkyl sulfonates Chemical class 0.000 description 1
- 208000030961 allergic reaction Diseases 0.000 description 1
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 1
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 238000003277 amino acid sequence analysis Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 230000008503 anti depressant like effect Effects 0.000 description 1
- 230000000949 anxiolytic effect Effects 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000001769 aryl amino group Chemical group 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical class N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 229940067597 azelate Drugs 0.000 description 1
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 229940077388 benzenesulfonate Drugs 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-M benzenesulfonate Chemical compound [O-]S(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-M 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-N benzenesulfonic acid Chemical class OS(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-N 0.000 description 1
- 229940050390 benzoate Drugs 0.000 description 1
- 150000001558 benzoic acid derivatives Chemical class 0.000 description 1
- 150000001576 beta-amino acids Chemical class 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- BVCRERJDOOBZOH-UHFFFAOYSA-N bicyclo[2.2.1]heptanyl Chemical group C1C[C+]2CC[C-]1C2 BVCRERJDOOBZOH-UHFFFAOYSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-M bisulphate group Chemical group S([O-])(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-M 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 150000004648 butanoic acid derivatives Chemical class 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229960005069 calcium Drugs 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- FATUQANACHZLRT-KMRXSBRUSA-L calcium glucoheptonate Chemical compound [Ca+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)C([O-])=O FATUQANACHZLRT-KMRXSBRUSA-L 0.000 description 1
- CJZGTCYPCWQAJB-UHFFFAOYSA-L calcium stearate Chemical class [Ca+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O CJZGTCYPCWQAJB-UHFFFAOYSA-L 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- REOZWEGFPHTFEI-UHFFFAOYSA-N cannabidivarine Natural products OC1=CC(CCC)=CC(O)=C1C1C(C(C)=C)CCC(C)=C1 REOZWEGFPHTFEI-UHFFFAOYSA-N 0.000 description 1
- YJYIDZLGVYOPGU-UHFFFAOYSA-N cannabigeroldivarin Natural products CCCC1=CC(O)=C(CC=C(C)CCC=C(C)C)C(O)=C1 YJYIDZLGVYOPGU-UHFFFAOYSA-N 0.000 description 1
- 230000003375 cannabimimetic effect Effects 0.000 description 1
- 229960003453 cannabinol Drugs 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000015861 cell surface binding Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- QZHPTGXQGDFGEN-UHFFFAOYSA-N chromene Chemical group C1=CC=C2C=C[CH]OC2=C1 QZHPTGXQGDFGEN-UHFFFAOYSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 229960004106 citric acid Drugs 0.000 description 1
- 235000015165 citric acid Nutrition 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001723 curing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000001047 cyclobutenyl group Chemical group C1(=CCC1)* 0.000 description 1
- 125000002188 cycloheptatrienyl group Chemical group C1(=CC=CC=CC1)* 0.000 description 1
- 125000001162 cycloheptenyl group Chemical group C1(=CCCCCC1)* 0.000 description 1
- 125000003678 cyclohexadienyl group Chemical group C1(=CC=CCC1)* 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 125000004090 cyclononenyl group Chemical group C1(=CCCCCCCC1)* 0.000 description 1
- 125000006547 cyclononyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 125000000522 cyclooctenyl group Chemical group C1(=CCCCCCC1)* 0.000 description 1
- 125000002433 cyclopentenyl group Chemical group C1(=CCCC1)* 0.000 description 1
- 125000000298 cyclopropenyl group Chemical group [H]C1=C([H])C1([H])* 0.000 description 1
- 230000007711 cytoplasmic localization Effects 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 125000005508 decahydronaphthalenyl group Chemical group 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 150000004683 dihydrates Chemical class 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 229910001882 dioxygen Inorganic materials 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- POULHZVOKOAJMA-UHFFFAOYSA-M dodecanoate Chemical compound CCCCCCCCCCCC([O-])=O POULHZVOKOAJMA-UHFFFAOYSA-M 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 108010057988 ecdysone receptor Proteins 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 150000002085 enols Chemical class 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- 229960004756 ethanol Drugs 0.000 description 1
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000004129 fatty acid metabolism Effects 0.000 description 1
- 108010060641 flavanone synthetase Proteins 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 235000019867 fractionated palm kernal oil Nutrition 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- JFCQEDHGNNZCLN-UHFFFAOYSA-N glutaric acid Chemical compound OC(=O)CCCC(O)=O JFCQEDHGNNZCLN-UHFFFAOYSA-N 0.000 description 1
- 150000002332 glycine derivatives Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- MNWFXJYAOYHMED-UHFFFAOYSA-N heptanoic acid Chemical compound CCCCCCC(O)=O MNWFXJYAOYHMED-UHFFFAOYSA-N 0.000 description 1
- 125000005241 heteroarylamino group Chemical group 0.000 description 1
- 150000004687 hexahydrates Chemical class 0.000 description 1
- 125000006038 hexenyl group Chemical group 0.000 description 1
- 125000005980 hexynyl group Chemical group 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 150000004679 hydroxides Chemical class 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 230000002673 intoxicating effect Effects 0.000 description 1
- 210000003093 intracellular space Anatomy 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- UYVZIWWBJMYRCD-ZMHDXICWSA-N isovaleryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(C)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 UYVZIWWBJMYRCD-ZMHDXICWSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 229940099584 lactobionate Drugs 0.000 description 1
- JYTUSYBCFIZPBE-AMTLMPIISA-N lactobionic acid Chemical compound OC(=O)[C@H](O)[C@@H](O)[C@@H]([C@H](O)CO)O[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O JYTUSYBCFIZPBE-AMTLMPIISA-N 0.000 description 1
- 229940070765 laurate Drugs 0.000 description 1
- FFVXQGMUHIJQAO-BFKQJKLPSA-N levonantradol Chemical compound C([C@@H](C)OC=1C=C(OC(C)=O)C=2[C@@H]3C[C@H](O)CC[C@H]3[C@H](C)NC=2C=1)CCC1=CC=CC=C1 FFVXQGMUHIJQAO-BFKQJKLPSA-N 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 229960001078 lithium Drugs 0.000 description 1
- 238000002714 localization assay Methods 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 229940091250 magnesium supplement Drugs 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 229940049920 malate Drugs 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-N malic acid Chemical compound OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 1
- 125000005637 malonyl-CoA group Chemical group 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 210000005060 membrane bound organelle Anatomy 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 108020004084 membrane receptors Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 239000011325 microbead Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 150000004682 monohydrates Chemical class 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- DUWWHGPELOTTOE-UHFFFAOYSA-N n-(5-chloro-2,4-dimethoxyphenyl)-3-oxobutanamide Chemical compound COC1=CC(OC)=C(NC(=O)CC(C)=O)C=C1Cl DUWWHGPELOTTOE-UHFFFAOYSA-N 0.000 description 1
- GECBBEABIDMGGL-UHFFFAOYSA-N nabilone Chemical compound C1C(=O)CCC2C(C)(C)OC3=CC(C(C)(C)CCCCCC)=CC(O)=C3C21 GECBBEABIDMGGL-UHFFFAOYSA-N 0.000 description 1
- KVBGVZZKJNLNJU-UHFFFAOYSA-M naphthalene-2-sulfonate Chemical compound C1=CC=CC2=CC(S(=O)(=O)[O-])=CC=C21 KVBGVZZKJNLNJU-UHFFFAOYSA-M 0.000 description 1
- KVBGVZZKJNLNJU-UHFFFAOYSA-N naphthalene-2-sulfonic acid Chemical compound C1=CC=CC2=CC(S(=O)(=O)O)=CC=C21 KVBGVZZKJNLNJU-UHFFFAOYSA-N 0.000 description 1
- 125000001971 neopentyl group Chemical group [H]C([*])([H])C(C([H])([H])[H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- VLZLOWPYUQHHCG-UHFFFAOYSA-N nitromethylbenzene Chemical compound [O-][N+](=O)CC1=CC=CC=C1 VLZLOWPYUQHHCG-UHFFFAOYSA-N 0.000 description 1
- 125000006574 non-aromatic ring group Chemical group 0.000 description 1
- BDJRBEYXGGNYIS-UHFFFAOYSA-N nonanedioic acid Chemical compound OC(=O)CCCCCCCC(O)=O BDJRBEYXGGNYIS-UHFFFAOYSA-N 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- KQMZYOXOBSXMII-CECATXLMSA-N octanoyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 KQMZYOXOBSXMII-CECATXLMSA-N 0.000 description 1
- 125000004365 octenyl group Chemical group C(=CCCCCCC)* 0.000 description 1
- UZGLIIJVICEWHF-UHFFFAOYSA-N octogen Chemical compound [O-][N+](=O)N1CN([N+]([O-])=O)CN([N+]([O-])=O)CN([N+]([O-])=O)C1 UZGLIIJVICEWHF-UHFFFAOYSA-N 0.000 description 1
- 125000005069 octynyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C#C* 0.000 description 1
- 229940049964 oleate Drugs 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 125000004043 oxo group Chemical group O=* 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 150000002942 palmitic acid derivatives Chemical class 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 125000002255 pentenyl group Chemical group C(=CCCC)* 0.000 description 1
- 125000005981 pentynyl group Chemical group 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- JRKICGRDRMAZLK-UHFFFAOYSA-L persulfate group Chemical group S(=O)(=O)([O-])OOS(=O)(=O)[O-] JRKICGRDRMAZLK-UHFFFAOYSA-L 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 150000002993 phenylalanine derivatives Chemical class 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- XNGIFLGASWRNHJ-UHFFFAOYSA-L phthalate(2-) Chemical compound [O-]C(=O)C1=CC=CC=C1C([O-])=O XNGIFLGASWRNHJ-UHFFFAOYSA-L 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- OXNIZHLAWKMVMX-UHFFFAOYSA-N picric acid Chemical class OC1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-N 0.000 description 1
- WLJVNTCWHIRURA-UHFFFAOYSA-M pimelate(1-) Chemical compound OC(=O)CCCCCC([O-])=O WLJVNTCWHIRURA-UHFFFAOYSA-M 0.000 description 1
- 150000003053 piperidines Chemical class 0.000 description 1
- 125000005547 pivalate group Chemical group 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 125000000830 polyketide group Chemical group 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229960003975 potassium Drugs 0.000 description 1
- 230000036515 potency Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- KOODSCBKXPPKHE-UHFFFAOYSA-N propanethioic s-acid Chemical compound CCC(S)=O KOODSCBKXPPKHE-UHFFFAOYSA-N 0.000 description 1
- 235000019260 propionic acid Nutrition 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 230000005588 protonation Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 125000004309 pyranyl group Chemical group O1C(C=CC=C1)* 0.000 description 1
- 150000004728 pyruvic acid derivatives Chemical class 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000001953 recrystallisation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinyl group Chemical group C1(O)=CC(O)=CC=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 102000027483 retinoid hormone receptors Human genes 0.000 description 1
- 108091008679 retinoid hormone receptors Proteins 0.000 description 1
- 102220037054 rs587780188 Human genes 0.000 description 1
- 102220241914 rs771007866 Human genes 0.000 description 1
- YGSDEFSMJLZEOE-UHFFFAOYSA-M salicylate Chemical compound OC1=CC=CC=C1C([O-])=O YGSDEFSMJLZEOE-UHFFFAOYSA-M 0.000 description 1
- 229960001860 salicylate Drugs 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 229940116351 sebacate Drugs 0.000 description 1
- CXMXRPHRNRROMY-UHFFFAOYSA-L sebacate(2-) Chemical compound [O-]C(=O)CCCCCCCCC([O-])=O CXMXRPHRNRROMY-UHFFFAOYSA-L 0.000 description 1
- 230000018448 secretion by cell Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- TYFQFVWCELRYAO-UHFFFAOYSA-L suberate(2-) Chemical compound [O-]C(=O)CCCCCCC([O-])=O TYFQFVWCELRYAO-UHFFFAOYSA-L 0.000 description 1
- 125000005346 substituted cycloalkyl group Chemical group 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 239000001384 succinic acid Substances 0.000 description 1
- 235000011044 succinic acid Nutrition 0.000 description 1
- 150000003900 succinic acid esters Chemical class 0.000 description 1
- 239000002352 surface water Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 150000003892 tartrate salts Chemical class 0.000 description 1
- 238000003419 tautomerization reaction Methods 0.000 description 1
- 101150024821 tetO gene Proteins 0.000 description 1
- 101150061166 tetR gene Proteins 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229940040944 tetracyclines Drugs 0.000 description 1
- 150000003567 thiocyanates Chemical class 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 102000004217 thyroid hormone receptors Human genes 0.000 description 1
- 108090000721 thyroid hormone receptors Proteins 0.000 description 1
- 238000010937 topological data analysis Methods 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- ITMCEJHCFYSIIV-UHFFFAOYSA-M triflate Chemical compound [O-]S(=O)(=O)C(F)(F)F ITMCEJHCFYSIIV-UHFFFAOYSA-M 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 150000003667 tyrosine derivatives Chemical class 0.000 description 1
- ZDPHROOEEOARMN-UHFFFAOYSA-N undecanoic acid Chemical compound CCCCCCCCCCC(O)=O ZDPHROOEEOARMN-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 150000003672 ureas Chemical class 0.000 description 1
- 229940070710 valerate Drugs 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C65/00—Compounds having carboxyl groups bound to carbon atoms of six—membered aromatic rings and containing any of the groups OH, O—metal, —CHO, keto, ether, groups, groups, or groups
- C07C65/01—Compounds having carboxyl groups bound to carbon atoms of six—membered aromatic rings and containing any of the groups OH, O—metal, —CHO, keto, ether, groups, groups, or groups containing hydroxy or O-metal groups
- C07C65/19—Compounds having carboxyl groups bound to carbon atoms of six—membered aromatic rings and containing any of the groups OH, O—metal, —CHO, keto, ether, groups, groups, or groups containing hydroxy or O-metal groups having unsaturation outside the aromatic ring
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
- C12N1/18—Baker's yeast; Brewer's yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/06—Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/99—Oxidoreductases acting on the CH-OH group of donors (1.1) with other acceptors (1.1.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y121/00—Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21)
- C12Y121/03—Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21) with oxygen as acceptor (1.21.3)
- C12Y121/03003—Reticuline oxidase (1.21.3.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y121/00—Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21)
- C12Y121/03—Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21) with oxygen as acceptor (1.21.3)
- C12Y121/03007—Tetrahydrocannabinolic acid synthase (1.21.3.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y121/00—Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21)
- C12Y121/03—Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21) with oxygen as acceptor (1.21.3)
- C12Y121/03008—Cannabidiolic acid synthase (1.21.3.8)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C39/00—Compounds having at least one hydroxy or O-metal group bound to a carbon atom of a six-membered aromatic ring
- C07C39/18—Compounds having at least one hydroxy or O-metal group bound to a carbon atom of a six-membered aromatic ring monocyclic with unsaturation outside the aromatic ring
- C07C39/19—Compounds having at least one hydroxy or O-metal group bound to a carbon atom of a six-membered aromatic ring monocyclic with unsaturation outside the aromatic ring containing carbon-to-carbon double bonds but no carbon-to-carbon triple bonds
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D311/00—Heterocyclic compounds containing six-membered rings having one oxygen atom as the only hetero atom, condensed with other rings
- C07D311/02—Heterocyclic compounds containing six-membered rings having one oxygen atom as the only hetero atom, condensed with other rings ortho- or peri-condensed with carbocyclic rings or ring systems
- C07D311/04—Benzo[b]pyrans, not hydrogenated in the carbocyclic ring
- C07D311/58—Benzo[b]pyrans, not hydrogenated in the carbocyclic ring other than with oxygen or sulphur atoms in position 2 or 4
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D311/00—Heterocyclic compounds containing six-membered rings having one oxygen atom as the only hetero atom, condensed with other rings
- C07D311/02—Heterocyclic compounds containing six-membered rings having one oxygen atom as the only hetero atom, condensed with other rings ortho- or peri-condensed with carbocyclic rings or ring systems
- C07D311/78—Ring systems having three or more relevant rings
- C07D311/80—Dibenzopyrans; Hydrogenated dibenzopyrans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Botany (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Plant Substances (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 개시내용의 양태는 재조합 세포에서 시험관내 칸나비노이드 및 칸나비노이드 전구체의 생합성에 관한 것이다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 3월 26일에 출원된 "칸나비노이드 및 칸나비노이드 전구체의 생합성"이라는 명칭의 미국 가출원 번호 63/000,419의 35 U.S.C. § 119(e)에 따른 이익을 주장하며, 그 전체 개시내용은 그 전체가 본원에 참조로 포함된다.
EFS-웹을 통한 텍스트 파일로서 제출된 서열 목록에 관한 참조
본 출원은 EFS-웹을 통해 ASCII 형식으로 제출된 서열 목록을 포함하며, 그 전체가 본원에 참조로 포함된다. 2021년 3월 24일에 생성된 상기 ASCII 파일의 이름은 G091970059WO00-SEQ-OMJ.txt이며, 크기는 526 킬로바이트이다.
발명의 분야
본 개시내용은 재조합 세포에서와 같이 칸나비노이드 및 칸나비노이드 전구체의 생합성에 관한 것이다.
칸나비노이드는 엔도칸나비노이드 수용체에 대한 리간드 역할을 할 수 있는 화합물이며 다양한 의학적 용도를 가지고 있다. 전통적으로, 칸나비노이드는 대마초(Cannabis) 속의 식물로부터 단리되었다. 칸나비노이드를 생성하기 위한 식물의 사용은 비효율적이지만, 다른 칸나비노이드는 전형적으로 대마초 식물에서 매우 낮은 농도로 생성되기 때문에 단리된 생성물은 종종 가장 만연한 2개의 내인성 칸나비노이드인 THC 및 CBD로 제한된다. 또한, 대마초 식물의 재배는 많은 관할 구역(jurisdiction)에서 제한된다. 또한, 일관된 결과를 얻기 위해, 대마초 식물은 종종 창문이 없는 실내 재배실(indoor grow room)과 같은 통제된 환경에서 재배되어 조명, 온도, 습도, 기류 등과 같은 재배 조건을 유연하게 조절한다. 이러한 통제된 환경에서 대마초 식물을 재배하면 특히 식물이 소량만 생성하는 희귀한 칸나비노이드의 경우 생성되는 칸나비노이드 그램당 높은 에너지 사용량을 초래할 수 있다. 예를 들어, 이러한 재배실의 조명은 고출력 나트륨 조명과 같은 인공 광원에 의해 제공된다. 많은 종류의 대마초가 하루에 18시간 이상의 조명을 필요로 하는 식물 주기를 가지고 있기 때문에 이러한 조명에 전력을 공급하면 상당한 에너지 소비를 초래할 수 있다. 건조된 대마초 꽃 형태(예를 들어, 임의의 추출 또는 정제 전)로 1 그램의 THC를 생성하기 위해 0.88 kWh와 1.34 kWh 사이의 에너지가 필요한 것으로 추정된다. 또한, 성장 시즌이 건기와 일치하여 물 사용량이 하천의 연결된 지표수에 영향을 미칠 수 있는 캘리포니아와 같은 특정 관할 구역의 농업 관행에 대한 우려가 제기되었다(Dillis, Christopher, Connor McIntee, Van Butsic, Lance Le, Kason Grady, and Theodore Grantham. "Water storage and Irrigation practices for cannabis drive seasonal patterns of water extraction and use in Northern California." Journal of Environmental Management 272 (2020): 110955).
칸나비노이드는 화학적 합성을 통해 생성될 수 있다(예를 들어, Souza 등의 미국 특허 번호 7,323,576 참조). 그러나 이러한 방법은 낮은 생산량과 높은 비용으로 인해 어려움을 겪고 있다. 조작된 유기체를 사용한 칸나비노이드, 칸나비노이드 유사체 및 칸나비노이드 전구체의 생성은 이러한 화합물에 대한 증가하는 수요를 충족시키기 위한 유리한 접근법을 제공할 수 있다.
요약
본 개시내용의 양태는 유전적으로 변형된 숙주 세포를 사용하여 지방산 기질로부터 칸나비노이드 및 칸나비노이드 전구체의 생성 방법을 제공한다.
본 개시내용의 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 27 또는 25와 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하거나 100% 동일한 서열을 포함하고, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.
본 개시내용의 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 27 또는 25와 적어도 90% 동일한 서열을 포함하고, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.
일부 구현예에서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함한다.
일부 구현예에서, TS는 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D; 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F; 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E; 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T; 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E; 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D; 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W; 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G; 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M; 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F; 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R; 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H; 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L; 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N; 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y; 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A를 포함한다.
일부 구현예에서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함한다.
일부 구현예에서, 칸나비노이드는 CBC 유형 칸나비노이드이다. 일부 구현예에서, 칸나비노이드는 칸나비크로멘산(CBCA) 및/또는 칸나비크로메바린산(CBCVA)이다. 일부 구현예에서, 숙주 세포는 테트라하이드로칸나비놀산(THCA), 칸나비디올산(CBDA) 및/또는 테트라하이드로칸나비바린산(THCVA) 중 하나 이상을 추가로 생성한다.
일부 구현예에서, TS는 대조군 TS보다 더 높은 비율의 CBCA:CBDA, CBCA:THCA, 및/또는 CBCVA:THCVA를 생성한다. 일부 구현예에서, 대조군 TS는 서열번호 20, 23, 25 또는 27의 서열을 포함하는 TS이다. 일부 구현예에서, TS는 서열번호 27에 비해 하기 아미노산 치환: A57Q 및 G61A; Y71I; 및/또는 V260F 중 하나 이상을 포함한다. 일부 구현예에서, TS는 대조군 TS보다 CBC 유형 칸나비노이드에 대해 더 높은 생성물 특이성을 갖는다. 일부 구현예에서, 대조군 TS는 서열번호 20, 23, 25 또는 27의 서열을 포함하는 TS이다. 일부 구현예에서, TS는 서열번호 27의 서열에 비해 Y39F 및/또는 V63I를 포함한다.
일부 구현예에서, TS는 서열번호 25, 27, 105, 126, 134, 155, 162, 164, 또는 165 중 어느 하나의 서열을 포함하고, 임의로 여기서 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함한다. 일부 구현예에서, TS의 서열은 하기 모티프 중 하나 이상을 포함한다: KVQARSGGH(서열번호 174); RASNTQNQD[VI][FL]FA[VI]K(서열번호 176); CPTI[KR]TGGH(서열번호 181); WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184); P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186); MKHF[TNS]QFSM(서열번호 189); P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193); RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200); RT[EQ][PQ]APGLAVQYSY(서열번호 207); 및/또는 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211).
본 개시내용의 추가 양태는 칸나비노이드를 생성하기 위한 숙주 세포에 관한 것으로, 여기서 숙주 세포는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하고, 여기서 TS의 서열은 하기 모티프 중 하나 이상을 포함하고: KVQARSGGH(서열번호 174); RASNTQNQD[VI][FL]FA[VI]K(서열번호 176); CPTI[KR]TGGH(서열번호 181); WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184); P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCP DP[RK]M(서열번호 186); MKHF[TNS]QFSM(서열번호 189); P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193); RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200); RT[EQ][PQ]APGLAVQYSY(서열번호 207); 및/또는 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211), 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.
일부 구현예에서, 모티프 KVQARSGGH(서열번호 174)는 서열번호 27의 잔기 72-80에 상응하는 TS의 잔기에 위치하고; 모티프 RASNTQNQD[VI][FL]FA[VI]K(서열번호 176)는 서열번호 27의 잔기 183-197에 상응하는 TS의 잔기에 위치하고; 모티프 CPTI[KR]TGGH(서열번호 181)는 서열번호 27의 잔기 141-149에 상응하는 TS의 잔기에 위치하고; 모티프 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)는 서열번호 27의 잔기 360-383에 상응하는 TS의 잔기에 위치하고; 모티프 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 서열번호 27의 잔기 400-436에 상응하는 TS의 잔기에 위치하고; 모티프 MKHF[TNS]QFSM(서열번호 189)은 서열번호 27의 잔기 98-106에 상응하는 TS의 잔기에 위치하고; 모티프 P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193)는 서열번호 27의 잔기 53-65에 상응하는 TS의 잔기에 위치하고; 모티프 RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200)는 서열번호 27의 잔기 10-32에 상응하는 TS의 잔기에 위치하고; 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)는 서열번호 27의 잔기 212-225에 상응하는 TS의 잔기에 위치하고/하거나; 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 서열번호 27의 잔기 242-259에 상응하는 TS의 잔기에 위치한다.
일부 구현예에서, TS는 진균 TS 또는 이의 보존적으로 치환된 버전이다. 일부 구현예에서, TS는 아스페르길루스 TS 또는 이의 보존적으로 치환된 버전이다. 일부 구현예에서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함한다. 일부 구현예에서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함한다. 일부 구현예에서, TS는 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D; 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F; 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E; 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T; 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E; 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D; 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W; 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G; 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M; 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F; 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R; 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H; 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L; 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N; 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y; 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A를 포함한다.
일부 구현예에서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함한다. 일부 구현예에서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 143, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 서열 또는 이의 보존적으로 치환된 버전을 포함한다.
본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하거나 100% 동일한 서열을 포함하고, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.
본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하고, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.
일부 구현예에서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 하나 이상의 신호 펩티드에 연결된다. 일부 구현예에서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가 또는 결실을 갖는 서열을 포함하는 신호 펩티드에 연결된다. 일부 구현예에서, 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열의 N-말단에 연결된다. 일부 구현예에서, N-말단 메티오닌은 서열번호 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172로부터 제거되고, 여기서 메티오닌 잔기는 신호 펩티드의 N-말단에 부가된다. 일부 구현예에서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드에 연결된다. 일부 구현예에서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열의 C-말단에 연결된다.
일부 구현예에서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함한다. 일부 구현예에서, TS는 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D; 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F; 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E; 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T; 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E; 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D; 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W; 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G; 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M; 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F; 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R; 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H; 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L; 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N; 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y; 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A를 포함한다. 일부 구현예에서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함한다.
일부 구현예에서, 이종 폴리뉴클레오티드는 서열번호 26, 28, 35, 42, 56, 60, 64, 74, 85, 89, 92, 93, 94, 95, 96, 97, 및 102 중 어느 하나와 적어도 90% 동일한 서열을 포함한다. 일부 구현예에서, TS 서열은 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167 및 172 중 어느 하나를 포함한다.
본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하거나, 여기서 숙주 세포는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 보존적으로 치환된 버전을 포함한다.
본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있고, 여기서 TS는 진균 TS 또는 이의 보존적으로 치환된 버전이다. 일부 구현예에서, 진균 TS는 아스페르길루스 TS 또는 이의 보존적으로 치환된 버전이다. 일부 구현예에서, 칸나비노이드는 CBC 유형 칸나비노이드이다. 일부 구현예에서, 칸나비노이드는 칸나비크로멘산(CBCA) 및/또는 칸나비크로메바린산(CBCVA)이다. 일부 구현예에서, 숙주 세포는 테트라하이드로칸나비놀산(THCA), 칸나비디올산(CBDA) 및/또는 테트라하이드로칸나비바린산(THCVA) 중 하나 이상을 추가로 생성한다.
일부 구현예에서, 숙주 세포는 식물 세포, 조류 세포, 효모 세포, 박테리아 세포, 또는 동물 세포이다. 일부 구현예에서, 숙주 세포는 효모 세포이다. 일부 구현예에서, 효모 세포는 사카로마이세스(Saccharomyces) 세포, 야로위아(Yarrowia) 세포, 코마가타엘라(Komagataella) 세포, 또는 피키아(Pichia) 세포이다. 일부 구현예에서, 사카로마이세스 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 세포이다. 일부 구현예에서, 숙주 세포는 박테리아 세포이다. 일부 구현예에서, 박테리아 세포는 이. 콜라이(E. coli) 세포이다. 일부 구현예에서, 숙주 세포는 아실 활성화 효소(AAE), 폴리케타이드 신타제(PKS), 폴리케타이드 사이클라제(PKC), 프레닐트랜스퍼라제(PT), 및/또는 추가 말단 신타제(TS) 중 하나 이상을 코딩하는 하나 이상의 이종 폴리뉴클레오티드를 추가로 포함한다. 일부 구현예에서, PKS는 올리베톨 신타제(OLS) 또는 디바리놀 신타제이다. 본 개시내용의 추가 양태는 본 개시내용과 관련된 임의의 숙주 세포를 배양하는 단계를 포함하는 방법에 관한 것이다.
본 개시내용의 추가 양태는 CBG 유형 칸나비노이드를 말단 신타제(TS)와 접촉시키는 단계를 포함하는, 칸나비노이드를 생성하는 방법에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함한다. 일부 구현예에서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 시험관내에서 발생한다. 일부 구현예에서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 생체내에서 발생한다. 일부 구현예에서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 숙주 세포에서 발생한다. 본 개시내용의 추가 양태는 칸나비노이드 생성 방법에 관한 것으로, CBG 유형 칸나비노이드를 CBD 유형 칸나비노이드, THC 유형 칸나비노이드 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환하도록 적응된 산화적 고리화 촉매와 생체내에서 접촉시키는 단계를 포함한다.
일부 구현예에서, 칸나비노이드는 CBG 유형 칸나비노이드의 고리화 생성물이다. 일부 구현예에서, 칸나비노이드는 고리화된 프레닐 모이어티를 갖는 칸나비노이드이다. 일부 구현예에서, 칸나비노이드는 CBC 유형 칸나비노이드, CBD 유형 칸나비노이드, 또는 THC 유형 칸나비노이드이다. 일부 구현예에서, 칸나비노이드는 CBC 유형 칸나비노이드이다. 일부 구현예에서, CBG 유형 칸나비노이드는 칸나비게롤산이다. 일부 구현예에서, CBC 유형 칸나비노이드는 CBCA이다. 일부 구현예에서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 서열 또는 이의 보존적으로 치환된 버전을 포함한다.
본 개시내용의 추가 양태는 CBG 유형 칸나비노이드, 및 CBG 유형 칸나비노이드, THC 유형 칸나비노이드, 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환하도록 CBG 유형 칸나비노이드의 산화적 고리화를 촉매하는 수단을 포함하는 숙주 세포에 관한 것이다. 본 개시내용의 추가 양태는 CBG 유형 칸나비노이드, 및 CBG 유형 칸나비노이드, THC 유형 칸나비노이드, 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환되도록 적응된 산화적 고리화 촉매를 포함하는 숙주 세포에 관한 것이다. 일부 구현예에서, CBC 유형 칸나비노이드를 생성하기 위해 CBG 유형 칸나비노이드의 산화적 고리화를 촉매하는 수단은 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드이고, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열 또는 이의 보존적으로 치환된 버전을 포함한다. 일부 구현예에서, TS는 또한 THCA, THCVA 또는 CBDA를 생성할 수 있다.
본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 비-자연 발생 핵산에 관한 것으로, 여기서 비-자연 발생 핵산은 서열번호 26, 28, 35, 42, 56, 60, 64, 74, 85, 89, 92, 93, 94, 95, 96, 97, 및 102 중 어느 하나와 적어도 90% 동일성을 갖는 서열을 포함한다. 본 개시내용의 추가 양태는 본 개시내용과 관련된 비-자연 발생 핵산을 포함하는 벡터에 관한 것이다. 본 개시내용의 추가 양태는 본 개시내용과 관련된 비-자연 발생 핵산을 포함하는 발현 카세트에 관한 것이다. 본 개시내용의 추가 양태는 본 개시내용과 관련된 비-자연 발생 핵산, 벡터, 또는 발현 카세트로 형질전환된 숙주 세포에 관한 것이다.
본 개시내용의 추가 양태는 칸나비노이드를 생성하기 위한 생물반응기에 관한 것으로, 여기서 생물반응기는 CBG 유형 칸나비노이드 및 말단 신타제(TS)를 포함하고, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하거나, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 보존적으로 치환된 버전을 포함한다.
본 개시내용의 추가 양태는 비-자연 발생 말단 신타제(TS)에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함한다.
본 개시내용의 추가 양태는 THC 유형 화합물 또는 CBD 유형 화합물과 비교하여 생체내에서 CBG 유형 칸나비노이드를 CBC 유형 화합물로 우선적으로 전환하도록 적응된 산화적 고리화 촉매에 관한 것이다.
본 발명의 각각의 제한은 본 발명의 다양한 구현예를 포함할 수 있다. 따라서, 어느 하나의 요소 또는 요소들의 조합을 포함하는 본 발명의 각각의 제한이 본 발명의 각각의 양태에 포함될 수 있음이 예상된다. 본 개시내용은 하기의 설명에 기재되거나 도면에 도시된 구성의 세부사항 및 구성요소의 배열에 대한 이의 적용에 제한되지 않는다. 본 발명은 다른 구현예가 가능하고 다양한 방식으로 실시되거나 수행될 수 있다. 또한, 본 출원에서 사용되는 어구 및 용어는 설명을 위한 것이며 제한적으로 간주되어서는 안된다. "포함하는(including)", "포함하는(comprising)" 또는 "갖는(having)", "함유하는(containing)", "수반하는(involving)" 및 이들의 변형의 사용은 이후에 나열된 항목 및 이의 등가물뿐만 아니라 추가 항목을 포함하는 것을 의미한다.
첨부된 도면은 축척에 맞추어 그리려고 한 게 아니다. 도면에서, 다양한 도면에 도시된 동일하거나 거의 동일한 구성요소는 유사한 번호로 나타낸다. 명확성을 위해, 모든 구성요소가 모든 도면에서 표시될 수 있는 것은 아니다. 도면에서:
도 1은 (R1a) 아실 활성화 효소(AAE); (R2a) 올리베톨 신타제 효소(OLS); (R3a) 올리베톨산 사이클라제 효소(OAC); (R4a) 프레닐트랜스퍼라제 효소(PT); 및 (R5a) 말단 신타제 효소(TS)에 의해 매개되는 5개의 효소 단계를 포함하는 칸나비노이드 화합물의 생성을 위한 천연 대마초 생합성 경로를 도시하는 개략도이다. 화학식 1a-11a는 헥산산(1a), 헥사노일-CoA(2a), 말로닐-CoA(3a), 3,5,7-트리옥소도데카노일-CoA(4a), 올리베톨(5a), 올리베톨산(6a), 게라닐 피로포스페이트(7a), 칸나비게롤산(8a), 칸나비디올산(9a), 테트라하이드로칸나비놀산(10a), 및 칸나비크로멘산(11a)에 상응한다. 헥산산은 예시적인 카복실산 기질이고; 다른 카복실산도 사용될 수 있다(예를 들어, 부티르산, 이소발레르산, 옥탄산, 데칸산 등; 예를 들어, 하기 도 3 참조). 3,5,7-트리옥소도데카노일-CoA 및 올리베톨산의 합성을 촉매하는 효소는 각각 R2a 및 R3a에 나타내고, 3,5,7-트리옥소도데카노일-CoA 및 올리베톨산의 합성을 촉매하는 다기능 효소를 포함할 수 있다. 칸나비디올산, 테트라하이드로칸나비놀산, 및 칸나비크로멘산의 합성을 각각 촉매하는 효소 칸나비디올산 신타제(CBDAS), 테트라하이드로칸나비놀산 신타제(THCAS), 및 칸나비크로멘산 신타제(CBCAS)를 단계 R5a에 나타낸다. 도 1은 문헌(Carvalho et al. "Designing Microorganisms for Heterologous Biosynthesis of Cannabinoids" (2017) FEMS Yeast Research Jun 1;17(4))으로부터 적응되며 상기 문헌은 그 전체가 참조로 포함된다.
도 2는 (R1) 아실 활성화 효소(AAE); (R2) 폴리케타이드 신타제 효소(PKS) 또는 이기능성 폴리케타이드 신타제-폴리케타이드 사이클라제 효소(PKS-PKC); (R3) 폴리케타이드 사이클라제 효소(PKC) 또는 이기능성 PKS-PKC 효소; (R4) 프레닐트랜스퍼라제 효소(PT); 및 (R5) 말단 신타제 효소(TS)에 의해 매개되는 5개의 효소 단계를 포함하는 칸나비노이드 화합물의 생성을 위한 이종 생합성 경로를 도시하는 개략도이다. 다양한 사슬 길이, 구조(예를 들어, 지방족, 지환족, 또는 방향족) 및 기능화(예를 들어, 하이드록실-, 케토-, 아미노-, 티올-, 아릴-, 또는 알로게노-)의 임의의 카복실산이 또한 전구체 기질(예를 들어, 티오프로피온산, 하이드록시 페닐 아세트산, 노르류신, 브로모데칸산, 부티르산, 이소발레르산, 옥탄산, 데칸산 등)로서 사용될 수 있다.
도 3은 도 2의 칸나비노이드 경로에 대한 선택된 추정 전구체의 비배타적 표현이다.
도 4는 칸나비게롤산(화학식 (8a))의 게라닐 모이어티가 고리화되어 칸나비디올산, 테트라하이드로칸나비놀산, 또는 칸나비크로멘산을 생성하는 TS 효소에 의해 촉매되는 반응을 나타내는 개략도이다.
도 5는 TS를 코딩하는 전사 단위를 보유하는 플라스미드를 나타내는 개략도이다. TS 효소에 대한 코딩 서열("라이브러리 유전자"로 표시됨)은 GAL1 프로모터에 의해 구동되었다. 각각의 TS 효소는 N-말단 융합된 에스. 세레비지아에 교배 인자 알파 2 신호 펩티드("MFα2"로 표시됨) 및 C-말단 융합된 HDEL 신호 펩티드("LDEL"로 표시됨)를 보유했다.
도 6은 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA 생성에 대한 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 아스페르길루스 니제르(Aspergillus niger)(에이. 니제르) CBCAS를 발현하는 하나의 라이브러리 균주인 균주 t619896은 CBCA를 생성하는 것으로 관찰되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 씨. 사티바(C. sativa) THCAS를 발현하는 균주 t616315는 THCAS 활성뿐만 아니라 CBCAS 활성을 나타내는 것으로 관찰되었기 때문에 양성 대조군으로서 사용되었다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 이러한 그래프로부터의 균주 ID 및 이들의 상응하는 활성을 표 5에 나타낸다.
도 7은 라이브러리 균주 t619896에 의한 에스. 세레비지아에에서의 생체내 활성 검정에 기초한 CBCVA의 생성을 나타내는 그래프를 도시한다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 이러한 그래프로부터 균주 ID 및 이들의 상응하는 활성을 표 6에 나타낸다.
도 8a-8c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA, THCA, 및 CBDA 생성에 대한 TS 변이체의 라이브러리의 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 THCAS를 발현하는 균주 t865843은 THCAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t865768은 CBCAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 CBDAS를 발현하는 균주 t876607은 CBDAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t865842는 음성 대조군으로 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 도 8a는 CBCA 생성을 나타내는 그래프를 도시한다. 도 8b는 THCA 생성을 나타내는 그래프를 도시한다. 도 8c는 CBDA 생성을 나타내는 그래프를 도시한다. 도 8a-8c에 도시된 균주 및 이들의 상응하는 활성을 표 8에 나타낸다.
도 9a-9c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 칸나비크로메바린산(CBCVA), 테트라하이드로칸나비바린산(THCVA), 및 칸나비디바린산(CBDVA) 생성에 대한 TS 변이체의 라이브러리의 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 THCAS를 발현하는 균주 t865843은 THCVAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t865768은 CBCVAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 CBDAS를 발현하는 균주 t876607은 CBDVAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t865842는 음성 대조군으로 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 도 9a는 CBCVA 생성을 나타내는 그래프를 도시한다. 도 9b는 THCVA 생성을 나타내는 그래프를 도시한다. 도 9c는 CBDVA 생성을 나타내는 그래프를 도시한다. 도 9a-9c에 도시된 균주 및 이들의 상응하는 활성을 표 9에 나타낸다.
도 10a-10c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA, THCA, 및 CBDA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 CBCAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. 대마초 CBDAS를 발현하는 균주 t616314는 CBDAS 활성에 대한 양성 대조군으로 사용되었다. 대마초 THCAS를 발현하는 균주 t701870은 THCAS 활성에 대한 양성 대조군으로 사용되었다. 모든 라이브러리 균주 및 양성 대조군 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함한다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 10a는 CBCA 생성을 나타내는 그래프를 도시한다. 도 10b는 THCA 생성을 나타내는 그래프를 도시한다. 도 10c는 CBDA 생성을 나타내는 그래프를 도시한다. 도 10a-10c에 도시된 균주 및 이들의 상응하는 활성을 표 10에 나타낸다.
도 11a-11c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCVA, THCVA, 및 CBDVA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. 대마초 CBDAS를 발현하는 균주 t616314는 양성 대조군으로 사용되었다. 대마초 THCAS를 발현하는 균주 t701870은 양성 대조군으로 사용되었다. 모든 라이브러리 균주 및 양성 대조군 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 11a는 CBCVA 생성을 나타내는 그래프를 도시한다. 도 11b는 THCVA 생성을 나타내는 그래프를 도시한다. 도 11c는 CBDVA 생성을 나타내는 그래프를 도시한다. 도 11a-11c에 도시된 균주 및 이들의 상응하는 활성을 표 11에 나타낸다.
도 12a-12b는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 실시예 3에서 확인된 후보 CBCAS 효소에 의한 CBGA 및 CBGVA의 기질 이용을 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로서 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 12a는 CBGA 기질 이용을 나타내는 그래프를 도시한다. 도 12b는 CBGVA 기질 이용을 나타내는 그래프를 도시한다. 도 12a-12b에 도시된 균주 및 이들의 상응하는 활성을 표 12에 나타낸다.
도 13은 실시예 3 및 4에서 확인된 후보 CBCAS 효소의 동일성 매트릭스 백분율을 도시한다. 맨 왼쪽 열과 맨 위 행은 특정 효소에 상응하는 서열 번호를 나열한다. 서열번호 27은 에이. 니제르로부터 UniProt 수탁 번호 A0A254UC34와 관련된 단백질 서열에 상응한다. 서열번호 144는 아마니타 무스카리아(Amanita muscaria)로부터의 UniProt 수탁 번호 A0A0C2SDS1과 관련된 단백질 서열에 상응하고; 서열번호 172는 페니실리움 루벤스(Penicillium rubens)로부터의 UniProt 수탁 번호 B6HV04와 관련된 단백질 서열에 상응하고; 서열번호 166은 아스페르길루스 테레우스(spergillus terreus)로부터의 UniProt 수탁 번호 Q0CYD9와 관련된 단백질 서열에 상응하고; 서열번호 159는 아스페르길루스 투르코수스(Aspergillus turcosus)로부터의 UniProt 수탁 번호 A0A397IKU4와 관련된 단백질 서열에 상응하고; 서열번호 167은 아스페르길루스 우다가와에(Aspergillus udagawae)로부터의 UniProt 수탁 번호 A0A0K8LLN9와 관련된 단백질 서열에 상응하고; 서열번호 163은 아스페르길루스 노보푸미가투스(Aspergillus novofumigatus)로부터의 UniProt 수탁 번호 A0A2I1CBC7과 관련된 단백질 서열에 상응하고; 서열번호 165는 아스페르길루스 니제르로부터의 UniProt 수탁 번호 G3Y7J1과 관련된 단백질 서열에 상응하고; 서열번호 162는 아스페르길루스 락티코페아투스(Aspergillus lacticoffeatus)로부터의 UniProt 수탁 번호 A0A319AGI5와 관련된 단백질 서열에 상응하고; 서열번호 164는 아스페르길루스 웰위치아에(Aspergillus welwitschiae)로부터의 UniProt 수탁 번호 A0A3F3PQ52와 관련된 단백질 서열에 상응하고; 서열번호 134는 아스페르길루스 아와모리(Aspergillus awamori)로부터의 UniProt 수탁 번호 A0A401KY63과 관련된 단백질 서열에 상응하고; 서열번호 105는 아스페르길루스 튜빙겐시스(Aspergillus tubingensis)로부터의 UniProt 수탁 번호 A0A1L9NII2와 관련된 단백질 서열에 상응하고; 서열번호 126은 아스페르길루스 네오니제르(Aspergillus neoniger)로부터의 UniProt 수탁 번호 A0A318Y6S9와 관련된 단백질 서열에 상응하고; 서열번호 155는 아스페르길루스 바덴시스(Aspergillus vadensis)로부터의 UniProt 수탁 번호 A0A319B6X5와 관련된 단백질 서열에 상응하고; 서열번호 112는 아스페르길루스 노미아에(Aspergillus nomiae)로부터의 UniProt 수탁 번호 A0A0L1J4J1과 관련된 단백질 서열에 상응하고; 서열번호 130은 아스페르길루스 오리자에(Aspergillus oryzae)로부터의 UniProt 수탁 번호 Q2UF91과 관련된 단백질 서열에 상응한다. 매트릭스의 각 셀에 있는 값은 상응하는 X 및 Y 축의 효소의 아미노산 서열 간의 동일성 백분율이다. 동일성이 100%인 셀은 흰색 텍스트와 함께 검은색으로 음영처리되고 동일성이 95-99.99%인 셀은 회색으로 음영처리된다.
도 14는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS("AnCBCAS"로 지칭됨)를 발현하는 균주 861555는 양성 대조군으로 사용되었다. 균주 861565는 실시예 1에서 확인된 에이. 니제르 CBCAS("AnCBCAS"로 지칭됨)를 발현하지만 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드는 제외된다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 하나의 균주 및 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 제외한 다른 균주와 쌍으로 검정되었다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 14에 도시된 균주 및 이들의 상응하는 활성을 표 13에 나타낸다.
도 15는 CBCA를 생성하는 데 효과적인 것으로 밝혀진 후보 비-대마초 CBCAS가 풍부한 것으로 확인된 서열 모티프의 대마초 TS의 3차원 구조 내의 예측된 위치를 도시하는 리본 다이어그램이다. 화살표로 나타낸 서열 모티프 KVQARSGGH(서열번호 174), CPTI[KR]TGGH(서열번호 181), 및 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 보조인자 결합 부위와 접촉할 것으로 예측된다.
도 16은 CBCA를 생성하는 데 효과적인 것으로 밝혀진 후보 비-대마초 CBCAS가 풍부한 것으로 확인된 서열 모티프의 대마초 TS의 3차원 구조 내의 예측된 위치를 도시하는 리본 다이어그램이다. TS의 활성 부위는 짙은 회색으로 나타낸다. FAD 보조인자는 다이어그램의 오른쪽에 막대로 나타낸다. 도면의 중앙에 나타낸 삼각형 보이드가 기질 결합 부위이다. 화살표로 나타낸 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207) 및 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 기질 결합 포켓 근처에 있을 것으로 예측된다.
도 1은 (R1a) 아실 활성화 효소(AAE); (R2a) 올리베톨 신타제 효소(OLS); (R3a) 올리베톨산 사이클라제 효소(OAC); (R4a) 프레닐트랜스퍼라제 효소(PT); 및 (R5a) 말단 신타제 효소(TS)에 의해 매개되는 5개의 효소 단계를 포함하는 칸나비노이드 화합물의 생성을 위한 천연 대마초 생합성 경로를 도시하는 개략도이다. 화학식 1a-11a는 헥산산(1a), 헥사노일-CoA(2a), 말로닐-CoA(3a), 3,5,7-트리옥소도데카노일-CoA(4a), 올리베톨(5a), 올리베톨산(6a), 게라닐 피로포스페이트(7a), 칸나비게롤산(8a), 칸나비디올산(9a), 테트라하이드로칸나비놀산(10a), 및 칸나비크로멘산(11a)에 상응한다. 헥산산은 예시적인 카복실산 기질이고; 다른 카복실산도 사용될 수 있다(예를 들어, 부티르산, 이소발레르산, 옥탄산, 데칸산 등; 예를 들어, 하기 도 3 참조). 3,5,7-트리옥소도데카노일-CoA 및 올리베톨산의 합성을 촉매하는 효소는 각각 R2a 및 R3a에 나타내고, 3,5,7-트리옥소도데카노일-CoA 및 올리베톨산의 합성을 촉매하는 다기능 효소를 포함할 수 있다. 칸나비디올산, 테트라하이드로칸나비놀산, 및 칸나비크로멘산의 합성을 각각 촉매하는 효소 칸나비디올산 신타제(CBDAS), 테트라하이드로칸나비놀산 신타제(THCAS), 및 칸나비크로멘산 신타제(CBCAS)를 단계 R5a에 나타낸다. 도 1은 문헌(Carvalho et al. "Designing Microorganisms for Heterologous Biosynthesis of Cannabinoids" (2017) FEMS Yeast Research Jun 1;17(4))으로부터 적응되며 상기 문헌은 그 전체가 참조로 포함된다.
도 2는 (R1) 아실 활성화 효소(AAE); (R2) 폴리케타이드 신타제 효소(PKS) 또는 이기능성 폴리케타이드 신타제-폴리케타이드 사이클라제 효소(PKS-PKC); (R3) 폴리케타이드 사이클라제 효소(PKC) 또는 이기능성 PKS-PKC 효소; (R4) 프레닐트랜스퍼라제 효소(PT); 및 (R5) 말단 신타제 효소(TS)에 의해 매개되는 5개의 효소 단계를 포함하는 칸나비노이드 화합물의 생성을 위한 이종 생합성 경로를 도시하는 개략도이다. 다양한 사슬 길이, 구조(예를 들어, 지방족, 지환족, 또는 방향족) 및 기능화(예를 들어, 하이드록실-, 케토-, 아미노-, 티올-, 아릴-, 또는 알로게노-)의 임의의 카복실산이 또한 전구체 기질(예를 들어, 티오프로피온산, 하이드록시 페닐 아세트산, 노르류신, 브로모데칸산, 부티르산, 이소발레르산, 옥탄산, 데칸산 등)로서 사용될 수 있다.
도 3은 도 2의 칸나비노이드 경로에 대한 선택된 추정 전구체의 비배타적 표현이다.
도 4는 칸나비게롤산(화학식 (8a))의 게라닐 모이어티가 고리화되어 칸나비디올산, 테트라하이드로칸나비놀산, 또는 칸나비크로멘산을 생성하는 TS 효소에 의해 촉매되는 반응을 나타내는 개략도이다.
도 5는 TS를 코딩하는 전사 단위를 보유하는 플라스미드를 나타내는 개략도이다. TS 효소에 대한 코딩 서열("라이브러리 유전자"로 표시됨)은 GAL1 프로모터에 의해 구동되었다. 각각의 TS 효소는 N-말단 융합된 에스. 세레비지아에 교배 인자 알파 2 신호 펩티드("MFα2"로 표시됨) 및 C-말단 융합된 HDEL 신호 펩티드("LDEL"로 표시됨)를 보유했다.
도 6은 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA 생성에 대한 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 아스페르길루스 니제르(Aspergillus niger)(에이. 니제르) CBCAS를 발현하는 하나의 라이브러리 균주인 균주 t619896은 CBCA를 생성하는 것으로 관찰되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 씨. 사티바(C. sativa) THCAS를 발현하는 균주 t616315는 THCAS 활성뿐만 아니라 CBCAS 활성을 나타내는 것으로 관찰되었기 때문에 양성 대조군으로서 사용되었다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 이러한 그래프로부터의 균주 ID 및 이들의 상응하는 활성을 표 5에 나타낸다.
도 7은 라이브러리 균주 t619896에 의한 에스. 세레비지아에에서의 생체내 활성 검정에 기초한 CBCVA의 생성을 나타내는 그래프를 도시한다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 이러한 그래프로부터 균주 ID 및 이들의 상응하는 활성을 표 6에 나타낸다.
도 8a-8c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA, THCA, 및 CBDA 생성에 대한 TS 변이체의 라이브러리의 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 THCAS를 발현하는 균주 t865843은 THCAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t865768은 CBCAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 CBDAS를 발현하는 균주 t876607은 CBDAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t865842는 음성 대조군으로 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 도 8a는 CBCA 생성을 나타내는 그래프를 도시한다. 도 8b는 THCA 생성을 나타내는 그래프를 도시한다. 도 8c는 CBDA 생성을 나타내는 그래프를 도시한다. 도 8a-8c에 도시된 균주 및 이들의 상응하는 활성을 표 8에 나타낸다.
도 9a-9c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 칸나비크로메바린산(CBCVA), 테트라하이드로칸나비바린산(THCVA), 및 칸나비디바린산(CBDVA) 생성에 대한 TS 변이체의 라이브러리의 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 THCAS를 발현하는 균주 t865843은 THCVAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t865768은 CBCVAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 CBDAS를 발현하는 균주 t876607은 CBDVAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t865842는 음성 대조군으로 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 도 9a는 CBCVA 생성을 나타내는 그래프를 도시한다. 도 9b는 THCVA 생성을 나타내는 그래프를 도시한다. 도 9c는 CBDVA 생성을 나타내는 그래프를 도시한다. 도 9a-9c에 도시된 균주 및 이들의 상응하는 활성을 표 9에 나타낸다.
도 10a-10c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA, THCA, 및 CBDA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 CBCAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. 대마초 CBDAS를 발현하는 균주 t616314는 CBDAS 활성에 대한 양성 대조군으로 사용되었다. 대마초 THCAS를 발현하는 균주 t701870은 THCAS 활성에 대한 양성 대조군으로 사용되었다. 모든 라이브러리 균주 및 양성 대조군 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함한다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 10a는 CBCA 생성을 나타내는 그래프를 도시한다. 도 10b는 THCA 생성을 나타내는 그래프를 도시한다. 도 10c는 CBDA 생성을 나타내는 그래프를 도시한다. 도 10a-10c에 도시된 균주 및 이들의 상응하는 활성을 표 10에 나타낸다.
도 11a-11c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCVA, THCVA, 및 CBDVA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. 대마초 CBDAS를 발현하는 균주 t616314는 양성 대조군으로 사용되었다. 대마초 THCAS를 발현하는 균주 t701870은 양성 대조군으로 사용되었다. 모든 라이브러리 균주 및 양성 대조군 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 11a는 CBCVA 생성을 나타내는 그래프를 도시한다. 도 11b는 THCVA 생성을 나타내는 그래프를 도시한다. 도 11c는 CBDVA 생성을 나타내는 그래프를 도시한다. 도 11a-11c에 도시된 균주 및 이들의 상응하는 활성을 표 11에 나타낸다.
도 12a-12b는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 실시예 3에서 확인된 후보 CBCAS 효소에 의한 CBGA 및 CBGVA의 기질 이용을 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로서 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 12a는 CBGA 기질 이용을 나타내는 그래프를 도시한다. 도 12b는 CBGVA 기질 이용을 나타내는 그래프를 도시한다. 도 12a-12b에 도시된 균주 및 이들의 상응하는 활성을 표 12에 나타낸다.
도 13은 실시예 3 및 4에서 확인된 후보 CBCAS 효소의 동일성 매트릭스 백분율을 도시한다. 맨 왼쪽 열과 맨 위 행은 특정 효소에 상응하는 서열 번호를 나열한다. 서열번호 27은 에이. 니제르로부터 UniProt 수탁 번호 A0A254UC34와 관련된 단백질 서열에 상응한다. 서열번호 144는 아마니타 무스카리아(Amanita muscaria)로부터의 UniProt 수탁 번호 A0A0C2SDS1과 관련된 단백질 서열에 상응하고; 서열번호 172는 페니실리움 루벤스(Penicillium rubens)로부터의 UniProt 수탁 번호 B6HV04와 관련된 단백질 서열에 상응하고; 서열번호 166은 아스페르길루스 테레우스(spergillus terreus)로부터의 UniProt 수탁 번호 Q0CYD9와 관련된 단백질 서열에 상응하고; 서열번호 159는 아스페르길루스 투르코수스(Aspergillus turcosus)로부터의 UniProt 수탁 번호 A0A397IKU4와 관련된 단백질 서열에 상응하고; 서열번호 167은 아스페르길루스 우다가와에(Aspergillus udagawae)로부터의 UniProt 수탁 번호 A0A0K8LLN9와 관련된 단백질 서열에 상응하고; 서열번호 163은 아스페르길루스 노보푸미가투스(Aspergillus novofumigatus)로부터의 UniProt 수탁 번호 A0A2I1CBC7과 관련된 단백질 서열에 상응하고; 서열번호 165는 아스페르길루스 니제르로부터의 UniProt 수탁 번호 G3Y7J1과 관련된 단백질 서열에 상응하고; 서열번호 162는 아스페르길루스 락티코페아투스(Aspergillus lacticoffeatus)로부터의 UniProt 수탁 번호 A0A319AGI5와 관련된 단백질 서열에 상응하고; 서열번호 164는 아스페르길루스 웰위치아에(Aspergillus welwitschiae)로부터의 UniProt 수탁 번호 A0A3F3PQ52와 관련된 단백질 서열에 상응하고; 서열번호 134는 아스페르길루스 아와모리(Aspergillus awamori)로부터의 UniProt 수탁 번호 A0A401KY63과 관련된 단백질 서열에 상응하고; 서열번호 105는 아스페르길루스 튜빙겐시스(Aspergillus tubingensis)로부터의 UniProt 수탁 번호 A0A1L9NII2와 관련된 단백질 서열에 상응하고; 서열번호 126은 아스페르길루스 네오니제르(Aspergillus neoniger)로부터의 UniProt 수탁 번호 A0A318Y6S9와 관련된 단백질 서열에 상응하고; 서열번호 155는 아스페르길루스 바덴시스(Aspergillus vadensis)로부터의 UniProt 수탁 번호 A0A319B6X5와 관련된 단백질 서열에 상응하고; 서열번호 112는 아스페르길루스 노미아에(Aspergillus nomiae)로부터의 UniProt 수탁 번호 A0A0L1J4J1과 관련된 단백질 서열에 상응하고; 서열번호 130은 아스페르길루스 오리자에(Aspergillus oryzae)로부터의 UniProt 수탁 번호 Q2UF91과 관련된 단백질 서열에 상응한다. 매트릭스의 각 셀에 있는 값은 상응하는 X 및 Y 축의 효소의 아미노산 서열 간의 동일성 백분율이다. 동일성이 100%인 셀은 흰색 텍스트와 함께 검은색으로 음영처리되고 동일성이 95-99.99%인 셀은 회색으로 음영처리된다.
도 14는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS("AnCBCAS"로 지칭됨)를 발현하는 균주 861555는 양성 대조군으로 사용되었다. 균주 861565는 실시예 1에서 확인된 에이. 니제르 CBCAS("AnCBCAS"로 지칭됨)를 발현하지만 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드는 제외된다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 하나의 균주 및 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 제외한 다른 균주와 쌍으로 검정되었다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 14에 도시된 균주 및 이들의 상응하는 활성을 표 13에 나타낸다.
도 15는 CBCA를 생성하는 데 효과적인 것으로 밝혀진 후보 비-대마초 CBCAS가 풍부한 것으로 확인된 서열 모티프의 대마초 TS의 3차원 구조 내의 예측된 위치를 도시하는 리본 다이어그램이다. 화살표로 나타낸 서열 모티프 KVQARSGGH(서열번호 174), CPTI[KR]TGGH(서열번호 181), 및 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 보조인자 결합 부위와 접촉할 것으로 예측된다.
도 16은 CBCA를 생성하는 데 효과적인 것으로 밝혀진 후보 비-대마초 CBCAS가 풍부한 것으로 확인된 서열 모티프의 대마초 TS의 3차원 구조 내의 예측된 위치를 도시하는 리본 다이어그램이다. TS의 활성 부위는 짙은 회색으로 나타낸다. FAD 보조인자는 다이어그램의 오른쪽에 막대로 나타낸다. 도면의 중앙에 나타낸 삼각형 보이드가 기질 결합 부위이다. 화살표로 나타낸 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207) 및 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 기질 결합 포켓 근처에 있을 것으로 예측된다.
상세한 설명
본 개시내용은 유전적으로 변형된 숙주 세포를 사용하여 지방산 기질로부터 칸나비노이드 및 칸나비노이드 전구체를 생성하는 방법을 제공한다. 상기 방법은 칸나비크로멘산 신타제(CBCAS)와 같은 말단 신타제(TS)의 이종 발현을 포함한다. 본 출원에는 에스. 세레비지아에와 같은 숙주 세포에서 기능적으로 발현될 수 있는 TS가 기재되어 있다. 실시예에 입증된 바와 같이, THCA, THCVA 및 CBDA와 같은 다른 TS 생성물뿐만 아니라 숙주 세포에서 칸나비크로멘산(CBCA) 및 칸나비크로메바린산(CBCVA)을 생성할 수 있는 다수의 비-대마초 CBCAS가 확인되었다. 본 개시내용에 기재된 TS는, 예를 들어, 이러한 효소의 활성 및/또는 풍부도를 변경함으로써 칸나비노이드 생성의 효율 및 순도를 증가시키는 데 유용할 수 있다.
정의
하기 용어들은 당업자에 의해 잘 이해되는 것으로 여겨지지만, 하기 정의는 개시된 주제에 대한 설명을 용이하게 하기 위해 기재되어 있다.
용어 "a" 또는 "an"은 하나 이상의 개체를 지칭하는데, 즉, 지시 대상을 복수로 식별할 수 있다. 따라서, 용어 "a" 또는 "an", "하나 이상" 및 "적어도 하나"는 본 출원에서 상호교환적으로 사용된다. 또한, 부정 관사 "a" 또는 "an"에 의한 "요소"에 대한 언급은 문맥상 요소가 하나이거나 하나만이 존재하도록 명확하게 요구하지 않는 한, 하나 초과의 요소가 존재할 가능성을 배제하지 않는다.
용어 "미생물(microorganism)" 또는 "미생물(microbe)"은 널리 받아들여져야 한다. 이러한 용어는 상호교환적으로 사용되며 2개의 원핵생물 도메인인 박테리아 및 고세균뿐만 아니라 특정 진핵생물 진균 및 원생생물을 포함하지만 이에 제한되지 않는다. 일부 구현예에서, 본 개시내용은 본 개시내용에 존재하는 목록/표 및 도면의 "미생물(microorganism)" 또는 "미생물(microbe)"을 지칭할 수 있다. 이러한 특성확인은 표와 도면의 확인된 분류학적 속뿐만 아니라 확인된 분류학적 종뿐만 아니라 표 또는 도면에 있는 임의의 유기체의 신규한 그리고 새로 확인되거나 설계된 다양한 균주를 참조할 수 있다. 동일한 특성확인은 실시예에서와 같이 명세서의 다른 부분에서 이러한 용어를 인용하는 경우에도 마찬가지이다.
용어 "원핵생물"은 당업계에서 인식되고 핵 또는 다른 세포 소기관을 포함하지 않는 세포를 지칭한다. 원핵생물은 일반적으로 박테리아 및 고세균이라는 두 도메인 중 하나로 분류된다.
"박테리아" 또는 "진정박테리아"는 원핵생물 유기체의 도메인을 지칭한다. 박테리아는 다음과 같이 적어도 11개의 별개의 군을 포함한다: (1) 그람-양성 (그람+) 박테리아로, 그 중 2개의 주요 하위분류가 있다: (a) 높은 G+C 군(액티노마이세티스(Actinomycetes), 마이코박테리아(Mycobacteria), 마이크로코커스(Micrococcus) 등) 및 (b) 낮은 G+C 군(바실러스(Bacillus), 클로스트리디아(Clostridia), 락토바실러스(Lactobacillus), 스타필로코시(Staphylococci), 스트렙토코시(Streptococci), 마이코플라스마(Mycoplasmas)); (2) 프로테오박테리아, 예를 들어, 보라색 광합성+비-광합성 그람-음성 박테리아(대부분의 "일반적인" 그람-음성 박테리아 포함); (3) 시아노박테리아, 예를 들어, 산소 광영양체(oxygenic phototroph); (4) 스피로케테스(Spirochetes) 및 관련 종; (5) 플랑토마이세스; (6) 박테로이데스(Bacteroides), 플라보박테리아(Flavobacteria); (7) 클라미디아(Chlamydia); (8) 녹색 황 박테리아; (9) 녹색 비-황 박테리아(또한 혐기성 광영양체); (10) 방사선저항성 미세구균 및 동족류; 및 (11) 써모토가(Thermotoga) 및 써모시포 써모필레스(Thermosipho thermophiles).
용어 "고세균"은 생리학 및 계통발생학에서 박테리아와 구별되게 만드는 특정 특성을 갖는 원핵생물 유기체의 분류학적 분류를 지칭한다.
용어 "대마초"는 대마초과의 속을 지칭한다. 대마초는 이가(dioecious) 식물이다. 트리콤(trichomes)으로 불리는 대마초의 암꽃에 위치한 선 구조물(glandular structure)은 파이토칸나비노이드(아래에서 더 자세히 기재되어 있음)로 공지된 테르페노-페놀 화합물 부류의 비교적 많은 양을 축적한다. 대마초는 통상적으로 섬유질 및 종자 생산(일반적으로 "대마(hemp) 유형"으로 지칭됨) 또는 취화제(intoxicant) 생산(일반적으로 "약물 유형"으로 지칭됨)을 위해 재배되었다. 약물 유형의 대마초에서, 트리콤은 상대적으로 많은 양의 테트라하이드로칸나비놀산(THCA)을 포함하고 있으며, 이는, 예를 들어, 말린 대마초 꽃의 연소 시 탈카복실화 반응을 통해 테트라하이드로칸나비놀(THC)로 전환되어 중독 효과(intoxicating effect)를 제공할 수 있다. 약물 유형 대마초는 종종 다른 칸나비노이드를 더 적은 양으로 함유한다. 대조적으로, 대마 유형(heme-type) 대마초는 건조 중량 기준으로 THC가 종종 0.3% 미만인 비교적 낮은 농도의 THCA를 함유한다. 대마 유형 대마초는 칸나비디올산(CBDA), 칸나비디올(CBD) 및 기타 칸나비노이드와 같은 비-THC 및 비-THCA 칸나비노이드를 함유할 수 있다. 현재, 속 내의 종의 분류학적 조직에 대한 합의가 부족하다. 문맥에 달리 지시하지 않는 한, 용어 "대마초"는 대마초가 대마 유형 또는 약물 유형인지 여부와 관계없이, 제한 없이 대마초 사티바(Cannabis sativa), 대마초 인디카(Cannabis indica) 및 대마초 루데랄리스(Cannabis ruderalis)와 같은 속 내의 모든 추정 종을 포함하도록 의도된다.
폴리케타이드 신타제(PKS) 효소(예를 들어, 올리베톨 신타제(OLS) 효소) 또는 폴리케타이드 사이클라제(PKC) 효소(예를 들어, 올리베톨산 사이클라제(OAC) 효소)와 관련하여 용어 "사이클라제 활성"은 상응하는 분자내 고리화 생성물(예를 들어, 올리베톨산, 디바린산)에 대한 옥소 지방 아실-CoA(예를 들어, 3,5,7-트리옥소도데카노일-COA, 3,5,7-트리옥소데카노일-COA)의 고리화를 촉매하는 활성을 지칭한다. 일부 구현예에서, PKS 또는 PKC는 3개의 추가 케타이드 모이어티가 이에 부가된 아실-COA의 C2-C7 알돌 축합을 촉매한다.
"세포질" 또는 "가용성" 효소는 숙주 세포의 세포질에 우세하게 국소화된 (또는 국소화될 것으로 예상됨) 효소를 지칭한다.
"진핵생물"은 세포가 막 내에 둘러싸인 핵 및 기타 세포소기관을 포함하는 임의의 유기체이다. 진핵생물(Eukaryotes)은 분류군 진핵생물류(Eukarya) 또는 진핵생물(Eukaryota)에 속한다. 진핵생물 세포를 원핵생물 세포(즉, 박테리아 및 고세균)와 구별하는 정의적인 특징은 그들이 막에 결합된 세포소기관, 특히 유전 물질을 포함하고 핵 외피로 둘러싸여 있는 핵을 갖는다는 것이다.
용어 "숙주 세포"는 칸나비노이드 또는 칸나비노이드 전구체의 생합성에 사용되는 효소를 코딩하는 폴리뉴클레오티드와 같은 폴리뉴클레오티드를 발현하는 데 사용될 수 있는 세포를 지칭한다. 용어 "유전적으로 변형된 숙주 세포", "재조합 숙주 세포" 및 "재조합 균주"는 상호교환적으로 사용되며, 예를 들어, 클로닝 및 형질전환 방법, 또는 당업계에 공지된 다른 방법(예를 들어, CRISPR과 같은 선택적 편집 방법)에 의해 유전적으로 변형된 숙주 세포를 지칭한다. 따라서, 상기 용어는 유전적으로 변경, 변형 또는 조작된 숙주 세포(예를 들어, 박테리아 세포, 효모 세포, 진균 세포, 곤충 세포, 식물 세포, 포유동물 세포, 인간 세포 등)를 포함하여 그것이 유래된 자연 발생 세포와 비교하여 변경, 변형 또는 상이한 유전자형 및/또는 표현형을 나타낸다. 일부 구현예에서, 상기 용어는 해당 특정 재조합 숙주 세포뿐만 아니라 이러한 숙주 세포의 자손 또는 잠재적 자손을 지칭하는 것으로 이해된다.
용어 "대조군 숙주 세포" 또는 숙주 세포와 관련하여 사용될 때 용어 "대조군"은 유전자 변형 또는 실험적 치료의 효과를 결정하기 위한 적절한 대조 숙주 세포를 지칭한다. 일부 구현예에서, 대조군 숙주 세포는 야생형 세포이다. 다른 구현예에서, 대조군 숙주 세포는 유전적으로 변형된 또는 실험적 처리 숙주 세포를 구별하는 유전자 변형(들)을 제외하고는 유전적으로 변형된 숙주 세포와 유전적으로 동일하다. 일부 구현예에서, 대조군 숙주 세포는 다른 시험 숙주 세포에서 활성에 대해 시험되는 효소의 야생형 또는 달리 공지된 변이체를 발현하도록 유전적으로 변형되었다.
유전자를 포함하는 폴리뉴클레오티드와 같은 폴리뉴클레오티드와 관련하여 용어 "이종"은 용어 "외인성" 및 용어 "재조합"과 상호교환적으로 사용되며, 생물학적 시스템에 인위적으로 공급된 폴리뉴클레오티드; 생물학적 시스템 내에서 변형된 폴리뉴클레오티드; 또는 발현 또는 조절이 생물학적 시스템 내에서 조작된 폴리뉴클레오티드를 지칭한다. 숙주 세포에 도입되거나 이에서 발현되는 이종 폴리뉴클레오티드는 숙주 세포와 상이한 유기체 또는 종으로부터 유래된 폴리뉴클레오티드일 수 있거나, 합성 폴리뉴클레오티드일 수 있거나, 또한 숙주 세포와 동일한 유기체 또는 종에서 내인성으로 발현되는 폴리뉴클레오티드 일 수 있다. 예를 들어, 숙주 세포에서 내인성으로 발현되는 폴리뉴클레오티드는 숙주 세포에 비자연적으로 위치되거나; 안정적이거나 일시적으로 숙주 세포에서 재조합적으로 발현되거나; 숙주 세포 내에서 변형되거나; 숙주 세포 내에서 선택적으로 편집되거나; 숙주 세포 내에서 자연적으로 발생하는 카피 수와 상이한 카피 수로 표현되거나; 예컨대 폴리뉴클레오티드의 발현을 제어하는 조절 영역을 조작함으로써 숙주 세포 내에서 비천연 방식으로 발현되는 경우 이종성인 것으로 간주될 수 있다. 일부 구현예에서, 이종 폴리뉴클레오티드는 숙주 세포에서 내인성으로 발현되지만 이의 발현이 폴리뉴클레오티드의 발현을 자연적으로 조절하지 않는 프로모터에 의해 구동되는 폴리뉴클레오티드이다. 다른 구현예에서, 이종 폴리뉴클레오티드는 숙주 세포에서 내인성으로 발현되고 이의 발현이 폴리뉴클레오티드의 발현을 자연적으로 조절하는 프로모터에 의해 구동되지만 프로모터 또는 또 다른 조절 영역이 변형된 폴리뉴클레오티드이다. 일부 구현예에서, 프로모터는 재조합적으로 활성화되거나 억제된다. 예를 들어, 유전자 편집 기반 기술은 내인성 프로모터를 포함하는 프로모터로부터 내인성 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드의 발현을 조절하는 데 사용될 수 있다. 예를 들어, 문헌(Chavez et al., Nat Methods. 2016 Jul; 13(7): 563-567)을 참조한다. 이종 폴리뉴클레오티드는 참조 폴리뉴클레오티드 서열과 비교하여 야생형 서열 또는 돌연변이 서열을 포함할 수 있다.
핵산 또는 폴리펩티드의 "적어도 부분" 또는 "적어도 단편"이라는 용어는 이러한 서열의 최소 크기 특징을 갖는 부분, 또는 전장 분자 이하의 전장 분자의 임의의 더 큰 단편을 의미한다. 본 개시내용의 폴리뉴클레오티드의 단편은 촉매 도메인과 같은 효소의 생물학적 활성 부분을 코딩할 수 있다. 유전자 조절 요소의 생물학적 활성 부분은 전장 유전자 조절 요소의 일부 또는 단편을 포함할 수 있고, 전장 유전자 조절 요소와 동일한 유형의 활성을 갖지만, 유전자 조절 요소의 생물학적 활성 부분의 활성 수준은 전장 유전자 조절 요소의 활성 수준에 비해 다양할 수 있다.
코딩 서열 및 조절 서열은 코딩 서열 및 조절 서열이 공유적으로 연결되어 코딩 서열의 발현 또는 전사가 조절 서열의 영향 또는 제어 하에 있을 때 "작동적으로 연결(joined)" 또는 "작동적으로 연결(linked)"되어 있다고 한다. 코딩 서열이 기능성 단백질로 번역되어야 하는 경우, 코딩 서열 및 조절 서열은 5' 조절 서열에서 프로모터의 유도가 코딩 서열의 전사를 촉진한다면, 그리고 코딩 서열과 조절 서열 간의 연결 성질이 (1) 프레임-시프트 돌연변이의 도입을 초래하지 않거나, (2) 코딩 서열의 전사를 지시하는 프로모터 영역의 능력을 방해하지 않거나, (3) 단백질로 번역되려는 상응하는 RNA 전사체의 능력을 방해하지 않는다면, 코딩 서열과 조절 서열이 작동 가능하게 연결되어 있다고 한다
용어 "연결(link)", "연결된(linked)" 또는 "연결(linkage)"은 2개의 개체(예를 들어, 2개의 폴리뉴클레오티드 또는 2개의 단백질)가 임의의 물리화학적 수단에 의해 서로 결합됨을 의미한다. 공유 또는 비공유의 당업자에게 공지된 임의의 연결이 포함된다. 일부 구현예에서, 본 개시내용의 효소를 코딩하는 핵산 서열은 신호 펩티드를 코딩하는 핵산에 연결된다. 일부 구현예에서, 본 개시내용의 효소는 신호 펩티드에 연결된다. 연결은 직접적이거나 간접적일 수 있다.
숙주 세포와 관련하여 용어 "형질전환된" 또는 "형질전환"은 하나 이상의 핵산이, 예를 들어, 플라스미드 또는 벡터 상에서 또는 게놈으로의 통합에 의해 도입된 숙주 세포를 지칭한다. 하나 이상의 핵산이 플라스미드 또는 벡터 상의 숙주 세포 내로 도입되는 일부 경우에, 하나 이상의 핵산 또는 이의 단편은, 예컨대 세포의 게놈으로의 통합에 의해 세포에 보유될 수 있는 반면, 플라스미드 또는 벡터 자체는 세포로부터 제거될 수 있다. 이러한 경우에, 숙주 세포는 플라스미드 또는 벡터가 세포에 유지되는지 여부에 관계없이 세포에 도입된 핵산으로 형질전환된 것으로 간주된다.
용어 "부피 생산성" 또는 "생산율"은 단위 시간당 매질의 부피당 형성되는 생성물의 양을 지칭한다. 부피 생산성은 시간당 리터당 그램(g/L/h)으로 보고될 수 있다.
생성물의 "비생산성(specific productivity)"이라는 용어는 단위 부피 또는 매쓰 또는 바이오매쓰로 정규화된 생성물의 형성률을 지칭하며, 단위 매쓰 또는 부피당 단위 시간당 물질의 양의 물리적 치수를 갖는다[MㆍT-1ㆍM-1 또는 MㆍT-1ㆍL-3, 여기서 M은 매쓰 또는 몰이고, T는 시간이고, L은 길이임].
용어 "바이오매쓰 비생산성"은 시간당 세포 건조 중량(CDW) 그램당 생성물 그램(g/g CDW/h) 또는 시간당 세포 건조 중량(CDW) 그램당 생성물 mmol(mmol/g CDW/h)의 비생산성을 지칭한다. 주어진 미생물에 대한 OD600에 대한 CDW의 관계를 사용하여, 비생산성은 시간당 600 nm에서 배양 브로쓰의 광학 밀도(OD)당 배양 배지 리터당 생성물 그램(g/L/h/OD)으로 표시될 수도 있다. 또한, 바이오매쓰의 원소 조성이 공지된 경우, 바이오매쓰 비생산성은 시간당 바이오매쓰의 C-몰(탄소 몰)당 생성물 mmol(mmol/C-mol/h)로 표시될 수 있다.
용어 "수율"은 특정 기질의 단위 중량당 수득되는 생성물의 양을 지칭하며, 기질 g당 생성물 g(g/g) 또는 기질 몰당 생성물 몰(mol/mol)로 표시될 수 있다. 수율은 이론적 수율의 백분율로 표시될 수도 있다. "이론적 수율"은 생성물을 만드는 데 사용되는 대사 경로의 화학량론에 의해 지시되는 바와 같이 기질의 주어진 양당 생성될 수 있는 생성물의 최대량으로 정의되며, 기질 g당 생성물 g(g/g) 또는 기질 몰당 생성물 몰(mol/mol)로 표시될 수 있다.
용어 "역가"는 용액의 강도 또는 용액 중의 물질의 농도를 지칭한다. 예를 들어, 발효 브로쓰 중의 관심 생성물(예를 들어, 소분자, 펩티드, 합성 화합물, 연료, 알코올 등)의 역가는 발효 브로쓰 또는 무세포 브로쓰의 리터당 용액 중의 관심 생성물의 g(g/L)으로 또는 발효 브로쓰 또는 무세포 브로쓰의 kg당 용액 중의 관심 생성물의 g(g/Kg)으로 기재된다.
용어 "총 역가"는, 공정에서의 초기 부피 또는 공정에서의 작동 부피에 비해 용액 중의 관심 생성물, 해당되는 경우 가스상의 관심 생성물, 및 공정으로부터 제거되고 회수되는 임의의 관심 생성물을 포함하지만 이에 제한되지 않는, 공정에서 생성되는 모든 관심 생성물의 합을 지칭한다. 예를 들어, 발효 브로쓰 중의 관심 생성물(예를 들어, 소분자, 펩티드, 합성 화합물, 연료, 알코올 등)의 총 역가는 발효 브로쓰 또는 무세포 브로쓰의 리터당 용액 중의 관심 생성물의 g(g/L)으로 또는 발효 브로쓰 또는 무세포 브로쓰의 kg당 용액 중의 관심 생성물의 g(g/Kg)으로 기재된다.
용어 "아미노산"은 아미노 기인 -NH2 및 카복실 기인 -COOH를 포함하는 유기 화합물을 지칭한다. 용어 "아미노산"은 자연 발생 아미노산과 비천연 아미노산 둘 모두를 포함한다. 20개의 일반적인 아미노산에 대한 명명법은 다음과 같다: 알라닌(ala 또는 A); 아르기닌(arg 또는 R); 아스파라긴(asn 또는 N); 아스파르트산(asp 또는 D); 시스테인(cys 또는 C); 글루타민(gln 또는 Q); 글루탐산(glu 또는 E); 글리신(gly 또는 G); 히스티딘(his 또는 H); 이소류신(ile 또는 I); 류신(leu 또는 L); 라이신(lys 또는 K); 메티오닌(met 또는 M); 페닐알라닌(phe 또는 F); 프롤린(pro 또는 P); 세린(ser 또는 S); 트레오닌(thr 또는 T); 트립토판(trp 또는 W); 티로신(tyr 또는 Y); 및 발린(val 또는 V). 비천연 아미노산의 비제한적인 예는 호모-아미노산, 프롤린 및 피루브산 유도체, 3-치환된 알라닌 유도체, 글리신 유도체, 고리-치환된 페닐알라닌 유도체, 고리-치환된 티로신 유도체, 선형 코어 아미노산, Fmoc, Boc, 및 CBz를 포함하는 보호기를 갖는 아미노산, β-아미노산(β3 및 β2), 및 N-메틸 아미노산을 포함한다.
용어 "지방족"은 알킬, 알케닐, 알키닐 및 카보사이클릭 기를 지칭한다. 마찬가지로, 용어 "헤테로지방족"은 헤테로알킬, 헤테로알케닐, 헤테로알키닐 및 헤테로사이클릭 기를 지칭한다.
용어 "알킬"은 1 내지 20개의 탄소 원자를 갖는 직쇄 또는 분지형 포화 탄화수소 기의 라디칼 또는 치환기를 지칭한다("C1-20 알킬"). 특정 구현예에서, 용어 "알킬"은 1 내지 10개의 탄소 원자를 갖는 직쇄 또는 분지형 포화 탄화수소 기의 라디칼 또는 치환기를 지칭한다("C1-10 알킬"). 일부 구현예에서, 알킬 기는 1 내지 9개의 탄소 원자를 갖는다("C1-9 알킬"). 일부 구현예에서, 알킬 기는 1 내지 8개의 탄소 원자를 갖는다("C1-8 알킬"). 일부 구현예에서, 알킬 기는 1 내지 7개의 탄소 원자를 갖는다("C1-7 알킬"). 일부 구현예에서, 알킬 기는 2 내지 7개의 탄소 원자를 갖는다("C2-7 알킬"). 일부 구현예에서, 알킬 기는 3 내지 7개의 탄소 원자를 갖는다("C3-7 알킬"). 일부 구현예에서, 알킬 기는 1 내지 6개의 탄소 원자를 갖는다("C1-6 알킬"). 일부 구현예에서, 알킬 기는 2 내지 6개의 탄소 원자를 갖는다("C2-6 알킬"). 일부 구현예에서, 알킬 기는 3 내지 5개의 탄소 원자를 갖는다("C3-5 알킬"). 일부 구현예에서, 알킬 기는 5개의 탄소 원자를 갖는다("C5 알킬"). 일부 구현예에서, 알킬 기는 3개의 탄소 원자를 갖는다("C3 알킬"). 일부 구현예에서, 알킬 기는 7개의 탄소 원자를 갖는다("C7 알킬"). 일부 구현예에서, 알킬 기는 1 내지 5개의 탄소 원자를 갖는다("C1-5 알킬"). 일부 구현예에서, 알킬 기는 1 내지 4개의 탄소 원자를 갖는다("C1-4 알킬"). 일부 구현예에서, 알킬 기는 1 내지 3개의 탄소 원자를 갖는다("C1-3 알킬"). 일부 구현예에서, 알킬 기는 1 내지 2개의 탄소 원자를 갖는다("C1-2 알킬"). 일부 구현예에서, 알킬 기는 1개의 탄소 원자를 갖는다("C1 알킬").
C1-6 알킬 기의 예는 메틸(C1), 에틸(C2), 프로필(C3) (예를 들어, n-프로필, 이소프로필), 부틸(C4) (예를 들어, n-부틸, tert-부틸, sec-부틸, 이소-부틸), 펜틸(C5) (예를 들어, n-펜틸, 3-펜타닐, 아밀, 네오펜틸, 3-메틸-2-부타닐, 3차 아밀), 및 헥실(C6) (예를 들어, n-헥실)을 포함한다. 알킬 기의 추가 예는 n-헵틸(C7), n-옥틸(C8) 등을 포함한다. 달리 명시되지 않는 한, 알킬 기의 각 경우는 독립적으로 비치환되거나("비치환된 알킬") 하나 이상의 치환기(예를 들어, 할로겐, 예컨대 F)로 치환된다("치환된 알킬"). 특정 구현예에서, 알킬 기는 비치환된 C1-10 알킬(예컨대, 비치환된 C1-6 알킬, 예를 들어, -CH3(Me), 비치환된 에틸(Et), 비치환된 프로필(Pr, 예를 들어, 비치환된 n-프로필(n-Pr), 비치환된 이소프로필(i-Pr)), 비치환된 부틸(Bu, 예를 들어, 비치환된 n-부틸(n-Bu), 비치환된 tert-부틸(tert-Bu 또는 t-Bu), 비치환된 sec-부틸(sec-Bu), 비치환된 이소부틸(i-Bu))이다. 특정 구현예에서, 알킬 기는 치환된 C1-10 알킬(예컨대, 치환된 C1-6 알킬, 예를 들어, -CF3, 벤질)이다.
용어 "아실"은 일반식 -C(=O)RX1, -C(=O)ORX1, -C(=O)-O-C(=O)RX1, -C(=O)SRX1, -C(=O)N(RX1)2, -C(=S)RX1, -C(=S)N(RX1)2, 및 -C(=S)S(RX1), -C(=NRX1)RX1, -C(=NRX1)ORX1, -C(=NRX1)SRX1, 및 -C(=NRX1)N(RX1)2를 갖는 기를 지칭하며, 여기서 RX1은 수소; 할로겐; 치환된 또는 비치환된 하이드록실; 치환된 또는 비치환된 티올; 치환된 또는 비치환된 아미노; 치환된 또는 비치환된 아실, 환형 또는 비환형, 치환된 또는 비치환된, 분지형 또는 비분지형 지방족; 환형 또는 비환형, 치환된 또는 비치환된, 분지형 또는 비분지형 헤테로지방족; 환형 또는 비환형, 치환된 또는 비치환된, 분지형 또는 비분지형 알킬; 환형 또는 비환형, 치환된 또는 비치환된, 분지형 또는 비분지형 알케닐; 치환된 또는 비치환된 알키닐; 치환된 또는 비치환된 아릴, 치환된 또는 비치환된 헤테로아릴, 지방족옥시, 헤테로지방족옥시, 알킬옥시, 헤테로알킬옥시, 아릴옥시, 헤테로아릴옥시, 지방족티옥시, 헤테로지방족티옥시, 알킬티옥시, 헤테로알킬티옥시, 아릴티옥시, 헤테로아릴티옥시, 모노- 또는 디- 지방족아미노, 모노- 또는 디-헤테로지방족아미노, 모노- 또는 디-알킬아미노, 모노- 또는 디-헤테로알킬아미노, 모노- 또는 디-아릴아미노, 또는 모노- 또는 디-헤테로아릴아미노이거나; 2개의 RX1 기는 함께 취하여 5- 내지 6원 헤테로사이클릭 고리를 형성한다. 예시적인 아실 기는 알데하이드(-CHO), 카복실산(-CO2H), 케톤, 아실 할라이드, 에스테르, 아미드, 이민, 카보네이트, 카바메이트, 및 우레아를 포함한다. 아실 치환기는 안정한 모이어티(예를 들어, 지방족, 알킬, 알케닐, 알키닐, 헤테로지방족, 헤테로사이클릭, 아릴, 헤테로아릴, 아실, 옥소, 이미노, 티오옥소, 시아노, 이소시아노, 아미노, 아지도, 니트로, 하이드록실, 티올, 할로, 지방족아미노, 헤테로지방족아미노, 알킬아미노, 헤테로알킬아미노, 아릴아미노, 헤테로아릴아미노, 알킬아릴, 아릴알킬, 지방족옥시, 헤테로지방족옥시, 알킬옥시, 헤테로알킬옥시, 아릴옥시, 헤테로아릴옥시, 지방족티옥시, 헤테로지방족티옥시, 알킬티옥시, 헤테로알킬티옥시, 아릴티옥시, 헤테로아릴티옥시, 아실옥시 등으로, 이들 각각은 추가로 치환될 수 있거나 치환되지 않을 수 있음)의 형성을 초래하는 본 출원에 기재된 임의의 치환기를 포함하지만 이에 제한되지 않는다.
"알케닐"은 2 내지 20개의 탄소 원자, 하나 이상의 탄소-탄소 이중 결합을 갖고 삼중 결합이 없는 직쇄 또는 분지형 탄화수소 기의 라디칼 또는 치환기를 지칭한다("C2-20 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 10개의 탄소 원자를 갖는다("C2-10 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 9개의 탄소 원자를 갖는다("C2-9 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 8개의 탄소 원자를 갖는다("C2-8 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 7개의 탄소 원자를 갖는다("C2-7 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 6개의 탄소 원자를 갖는다("C2-6 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 5개의 탄소 원자를 갖는다("C2-5 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 4개의 탄소 원자를 갖는다("C2-4 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 3개의 탄소 원자를 갖는다("C2-3 알케닐"). 일부 구현예에서, 알케닐 기는 2개의 탄소 원자를 갖는다("C2 알케닐"). 하나 이상의 탄소-탄소 이중 결합은 내부(예컨대, 2-부테닐에서) 또는 말단(예컨대, 1-부테닐에서)일 수 있다. C2-4 알케닐 기의 예는 에테닐(C2), 1-프로페닐(C3), 2-프로페닐(C3), 1-부테닐(C4), 2-부테닐(C4), 부타디에닐(C4) 등을 포함한다. C2-6 알케닐 기의 예는 상기 언급된 C2-4 알케닐 기뿐만 아니라 펜테닐(C5), 펜타디에닐(C5), 헥세닐(C6) 등을 포함한다. 알케닐의 추가 예는 헵테닐(C7), 옥테닐(C8), 옥타트리에닐(C8) 등을 포함한다. 달리 명시되지 않는 한, 알케닐 기의 각 경우는 독립적으로 임의로 치환되는데, 즉, 비치환되거나("비치환된 알케닐") 하나 이상의 치환기로 치환된다("치환된 알케닐"). 특정 구현예에서, 알케닐 기는 비치환된 C2-10 알케닐이다. 특정 구현예에서, 알케닐 기는 치환된 C2-10 알케닐이다.
"알키닐"은 2 내지 20개의 탄소 원자, 하나 이상의 탄소-탄소 삼중 결합, 및 임의로 하나 이상의 이중 결합을 갖는 직쇄 또는 분지형 탄화수소 기의 라디칼 또는 치환기를 지칭한다("C2-20 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 10개의 탄소 원자를 갖는다("C2-10 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 9개의 탄소 원자를 갖는다("C2-9 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 8개의 탄소 원자를 갖는다("C2-8 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 7개의 탄소 원자를 갖는다("C2-7 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 6개의 탄소 원자를 갖는다("C2-6 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 5개의 탄소 원자를 갖는다("C2-5 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 4개의 탄소 원자를 갖는다("C2-4 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 3개의 탄소 원자를 갖는다("C2-3 알키닐"). 일부 구현예에서, 알키닐 기는 2개의 탄소 원자를 갖는다("C2 알키닐"). 하나 이상의 탄소-탄소 삼중 결합은 내부(예컨대, 2-부티닐에서) 또는 말단(예컨대, 1-부티닐에서)일 수 있다. C2-4 알키닐 기의 예는, 제한 없이, 에티닐(C2), 1-프로피닐(C3), 2-프로피닐(C3), 1-부티닐(C4), 2-부티닐(C4) 등을 포함한다. C2-6 알케닐 기의 예는 상기 언급된 C2-4 알키닐 기뿐만 아니라 펜티닐(C5), 헥시닐(C6) 등을 포함한다. 알키닐의 추가 예는 헵티닐(C7), 옥티닐(C8) 등을 포함한다. 달리 명시되지 않는 한, 알키닐 기의 각 경우는 독립적으로 임의로 치환되는데, 즉, 비치환되거나("비치환된 알키닐") 하나 이상의 치환기로 치환된다("치환된 알키닐"). 특정 구현예에서, 알키닐 기는 비치환된 C2-10 알키닐이다. 특정 구현예에서, 알키닐 기는 치환된 C2-10 알키닐이다.
"카보사이클릴" 또는 "카보사이클릭"은 비방향족 고리 시스템에서 3 내지 10개의 고리 탄소 원자("C3-10 카보사이클릴") 및 0개의 헤테로원자를 갖는 비방향족 사이클릭 탄화수소 기의 라디칼을 지칭한다. 일부 구현예에서, 카보사이클릴 기는 3 내지 8개의 고리 탄소 원자를 갖는다("C3-8 카보사이클릴"). 일부 구현예에서, 카보사이클릴 기는 3 내지 6개의 고리 탄소 원자를 갖는다("C3-6 카보사이클릴"). 일부 구현예에서, 카보사이클릴 기는 3 내지 6개의 고리 탄소 원자를 갖는다("C3-6 카보사이클릴"). 일부 구현예에서, 카보사이클릴 기는 5 내지 10개의 고리 탄소 원자를 갖는다("C5-10 카보사이클릴"). 예시적인 C3-6 카보사이클릴 기는, 제한 없이, 사이클로프로필(C3), 사이클로프로페닐(C3), 사이클로부틸(C4), 사이클로부테닐(C4), 사이클로펜틸(C5), 사이클로펜테닐(C5), 사이클로헥실(C6), 사이클로헥세닐(C6), 사이클로헥사디에닐(C6) 등을 포함한다. 예시적인 C3-8 카보사이클릴 기는, 제한 없이, 상기 언급된 C3-6 카보사이클릴 기뿐만 아니라 사이클로헵틸(C7), 사이클로헵테닐(C7), 사이클로헵타디에닐(C7), 사이클로헵타트리에닐(C7), 사이클로옥틸(C8), 사이클로옥테닐(C8), 바이사이클로[2.2.1]헵타닐(C7), 바이사이클로[2.2.2]옥타닐(C8) 등을 포함한다. 예시적인 C3-10 카보사이클릴 기는, 제한 없이, 상기 언급된 C3-8 카보사이클릴 기뿐만 아니라 사이클로노닐(C9), 사이클로노네닐(C9), 사이클로데실(C10), 사이클로데세닐(C10), 옥타하이드로-1H-인데닐(C9), 데카하이드로나프탈레닐(C10), 스피로[4.5]데카닐(C10) 등을 포함한다. 상기 실시예가 예시하는 바와 같이, 특정 구현예에서, 카보사이클릴 기는 모노사이클릭("모노사이클릭 카보사이클릴")이거나, 바이사이클릭 시스템("바이사이클릭 카보사이클릴")과 같은 융합, 가교 또는 스피로 고리 시스템을 포함하고, 포화될 수 있거나 부분적으로 불포화될 수 있다. "카보사이클릴"은 또한 상기 정의된 바와 같은 카보사이클릭 고리가 하나 이상의 아릴 또는 헤테로아릴 기와 융합된 고리 시스템을 포함하며, 여기서, 부착점은 카보사이클릭 고리에 있고, 이러한 경우에, 탄소 수는 카보사이클릭 고리 시스템의 탄소 수를 계속 지정한다. 달리 명시되지 않는 한, 카보사이클릴 기의 각 경우는 독립적으로 임의로 치환되는데, 즉, 비치환되거나("비치환된 카보사이클릴") 하나 이상의 치환기로 치환된다("치환된 카보사이클릴"). 특정 구현예에서, 카보사이클릴 기는 비치환된 C3-10 카보사이클릴이다. 특정 구현예에서, 카보사이클릴 기는 치환된 C3-10 카보사이클릴이다.
일부 구현예에서, "카보사이클릴"은 3 내지 10개의 고리 탄소 원자를 갖는 모노사이클릭, 포화 카보사이클릴 기이다("C3-10 사이클로알킬"). 일부 구현예에서, 사이클로알킬 기는 3 내지 8개의 고리 탄소 원자를 갖는다("C3-8 사이클로알킬"). 일부 구현예에서, 사이클로알킬 기는 3 내지 6개의 고리 탄소 원자를 갖는다("C3-6 사이클로알킬"). 일부 구현예에서, 사이클로알킬 기는 5 내지 6개의 고리 탄소 원자를 갖는다("C5-6 사이클로알킬"). 일부 구현예에서, 사이클로알킬 기는 5 내지 10개의 고리 탄소 원자를 갖는다("C5-10 사이클로알킬"). C5-6 사이클로알킬 기의 예는 사이클로펜틸(C5) 및 사이클로헥실(C5)을 포함한다. C3-6 사이클로알킬 기의 예는 상기 언급된 C5-6 사이클로알킬 기뿐만 아니라 사이클로프로필(C3) 및 사이클로부틸(C4)을 포함한다. C3-8 사이클로알킬 기의 예는 상기 언급된 C3-6 사이클로알킬 기뿐만 아니라 사이클로헵틸(C7) 및 사이클로옥틸(C8)을 포함한다. 달리 명시되지 않는 한, 사이클로알킬 기의 각 경우는 독립적으로 비치환되거나("비치환된 사이클로알킬") 하나 이상의 치환기로 치환된다("치환된 사이클로알킬"). 특정 구현예에서, 사이클로알킬 기는 비치환된 C3-10 사이클로알킬이다. 특정 구현예에서, 사이클로알킬 기는 치환된 C3-10 사이클로알킬이다.
"아릴"은 방향족 고리 시스템에 제공된 6-14개의 고리 탄소 원자 및 0개의 헤테로원자를 갖는 모노사이클릭 또는 폴리사이클릭(예를 들어, 바이사이클릭 또는 트리사이클릭) 4n+2개의 방향족 고리 시스템(예를 들어, 사이클릭 배열에서 공유되는 6, 10, 또는 14개의 파이 전자를 가짐)의 라디칼을 지칭한다("C6-14 아릴"). 일부 구현예에서, 아릴 기는 6개의 고리 탄소 원자를 갖는다("C6 아릴"; 예를 들어, 페닐). 일부 구현예에서, 아릴 기는 10개의 고리 탄소 원자를 갖는다("C10 아릴"; 예를 들어, 나프틸, 예컨대 1-나프틸 및 2-나프틸). 일부 구현예에서, 아릴 기는 14개의 고리 탄소 원자를 갖는다("C10 아릴"; 예를 들어, 안트라실). "아릴"은 또한 상기 정의된 바와 같은 아릴 고리가 하나 이상의 카보사이클릴 또는 헤테로사이클릴 기와 융합된 고리 시스템을 포함하며, 여기서, 라디칼 또는 부착점은 아릴 고리 상에 있고, 이러한 경우에, 탄소 원자의 수는 아릴 고리 시스템에서 탄소 원자의 수를 계속 지정한다. 달리 명시되지 않는 한, 아릴 기의 각 경우는 독립적으로 임의로 치환되는데, 즉 비치환되거나("비치환된 아릴") 하나 이상의 치환기로 치환된다("치환된 아릴"). 특정 구현예에서, 아릴 기는 비치환된 C6-14 아릴이다. 특정 구현예에서, 아릴 기는 치환된 C6-14 아릴이다.
"아르알킬"은 알킬 및 아릴의 서브세트이고 임의로 치환된 아릴 기에 의해 치환된 임의로 치환된 알킬 기를 지칭한다. 특정 구현예에서, 아르알킬은 임의로 치환된 벤질이다. 특정 구현예에서, 아르알킬은 벤질이다. 특정 구현예에서, 아르알킬은 임의로 치환된 페네틸이다. 특정 구현예에서, 아르알킬은 페네틸이다. 특정 구현예에서, 아르알킬은 7-페닐헵타닐이다. 특정 구현예에서, 아르알킬은 임의로 치환된 아릴 기(예를 들어, 페닐)에 의해 치환된 C7 알킬이다. 특정 구현예에서, 아르알킬은 임의로 치환된 아릴 기(예를 들어, 페닐)에 의해 치환된 C7-C10 알킬 기이다.
"부분적으로 불포화된"은 적어도 하나의 이중 또는 삼중 결합을 포함하는 기를 지칭한다. "부분적으로 불포화된" 고리 시스템은 또한 다중 불포화 부위를 갖는 고리를 포함하도록 의도되지만, 본 출원에 정의된 바와 같은 방향족 기(예를 들어, 아릴 또는 헤테로아릴 기)를 포함하는 것으로 의도되지 않는다. 마찬가지로, "포화된"은 이중 또는 삼중 결합을 포함하지 않는, 즉 단일 결합을 모두 포함하는 기를 지칭한다.
용어 "임의로 치환된"은 치환 또는 비치환을 의미한다.
알킬, 알케닐, 알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴 기는 임의로 치환된다(예를 들어, "치환된" 또는 "비치환된" 알킬, "치환된" 또는 "비치환된" 알케닐, "치환된" 또는 "비치환된" 알키닐, "치환된" 또는 "비치환된" 카보사이클릴, "치환된" 또는 "비치환된" 헤테로사이클릴, "치환된" 또는 "비치환된" 아릴 또는 "치환된" 또는 "비치환된" 헤테로아릴 기). 일반적으로, 용어 "임의로"가 앞에 있든 없든, 용어 "치환된"은 기(예를 들어, 탄소 또는 질소 원자)에 존재하는 적어도 하나의 수소가 허용되는 치환기, 예를 들어, 치환 시 안정한 화합물, 예를 들어, 재배열, 고리화, 제거 또는 기타 반응에 의한 것과 같은 자발적으로 변형되지 않는 화합물을 생성하는 치환기로 대체됨을 의미한다. 달리 나타내지 않는 한, "치환된" 기는 기의 하나 이상의 치환 가능한 위치에 치환기를 갖고, 임의의 주어진 구조에서 하나 초과의 위치가 치환되는 경우, 치환기는 각 위치에서 동일하거나 상이하다. 용어 "치환된"은 안정한 화합물의 형성을 초래하는 본 출원에 기재된 임의의 치환기인 유기 화합물의 모든 허용 가능한 치환기로의 치환을 포함하는 것으로 고려된다. 본 발명은 안정한 화합물에 도달하기 위해 이러한 임의의 모든 조합을 고려한다. 본 발명의 목적을 위해, 질소와 같은 헤테로원자는 수소 치환기 및/또는 헤테로원자의 원자가를 만족시키고 안정한 모이어티의 형성을 초래하는 본 출원에 기재된 바와 같은 임의의 적합한 치환기를 가질 수 있다.
예시적인 탄소 원자 치환기는 할로겐, -CN, -NO2, -N3, -SO2H, -SO3H, -OH, -ORaa, -ON(Rbb)2, -N(Rbb)2, -N(Rbb)3 +X-, -N(ORcc)Rbb, -SH, -SRaa, -SSRcc, -C(=O)Raa, -CO2H, -CHO, -C(ORcc)2, -CO2Raa, -OC(=O)Raa, -OCO2Raa, -C(=O)N(Rbb)2, -OC(=O)N(Rbb)2, -NRbbC(=O)Raa, -NRbbCO2Raa, -NRbbC(=O)N(Rbb)2, -C(=NRbb)Raa, -C(=NRbb)ORaa, -OC(=NRbb)Raa, -OC(=NRbb)ORaa, -C(=NRbb)N(Rbb)2, -OC(=NRbb)N(Rbb)2, -NRbbC(=NRbb)N(Rbb)2, -C(=O)NRbbSO2Raa, -NRbbSO2Raa, -SO2N(Rbb)2, -SO2Raa, -SO2ORaa, -OSO2Raa, -S(=O)Raa, -OS(=O)Raa, -Si(Raa)3, -OSi(Raa)3 -C(=S)N(Rbb)2, -C(=O)SRaa, -C(=S)SRaa, -SC(=S)SRaa, -SC(=O)SRaa, -OC(=O)SRaa, -SC(=O)ORaa, -SC(=O)Raa, -P(=O)(Raa)2, -P(=O)(ORcc)2, -OP(=O)(Raa)2, -OP(=O)(ORcc)2, -P(=O)(N(Rbb)2)2, -OP(=O)(N(Rbb)2)2, -NRbbP(=O)(Raa)2, -NRbbP(=O)(ORcc)2, -NRbbP(=O)(N(Rbb)2)2, -P(Rcc)2, -P(ORcc)2, -P(Rcc)3 +X-, -P(ORcc)3 +X-, -P(Rcc)4, -P(ORcc)4, -OP(Rcc)2, -OP(Rcc)3 +X-, -OP(ORcc)2, -OP(ORcc)3 +X-, -OP(Rcc)4, -OP(ORcc)4, -B(Raa)2, -B(ORcc)2, -BRaa(ORcc), C1-10 알킬, C1-10 퍼할로알킬, C2-10 알케닐, C2-10 알키닐, 헤테로C1-10 알킬, 헤테로C2-10 알케닐, 헤테로C2-10 알키닐, C3-10 카보사이클릴, 3-14원 헤테로사이클릴, C6-14 아릴, 및 5-14원 헤테로아릴을 포함하지만 이에 제한되지 않으며;
여기서:
Raa의 각 경우는, 독립적으로 C1-10 알킬, C1-10 퍼할로알킬, C2-10 알케닐, C2-10 알키닐, 헤테로C1-10 알킬, 헤테로C2-10알케닐, 헤테로C2-10알키닐, C3-10 카보사이클릴, 3-14원 헤테로사이클릴, C6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 Raa 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rdd 기로 독립적으로 치환되고;
Rbb의 각 경우는, 독립적으로 수소, -OH, -ORaa, -N(Rcc)2, -CN, -C(=O)Raa, -C(=O)N(Rcc)2, -CO2Raa, -SO2Raa, -C(=NRcc)ORaa, -C(=NRcc)N(Rcc)2, -SO2N(Rcc)2, -SO2Rcc, -SO2ORcc, -SORaa, -C(=S)N(Rcc)2, -C(=O)SRcc, -C(=S)SRcc, -P(=O)(Raa)2, -P(=O)(ORcc)2, -P(=O)(N(Rcc)2)2, C1-10 알킬, C1-10 퍼할로알킬, C2-10 알케닐, C2-10 알키닐, 헤테로C1-10 알킬, 헤테로C2-10 알케닐, 헤테로C2-10알키닐, C3-10 카보사이클릴, 3-14원 헤테로사이클릴, C6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 Rbb 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rdd 기로 독립적으로 치환되고; 여기서 X-는 반대이온이고;
Rcc의 각 경우는, 독립적으로 수소, C1-10 알킬, C1-10 퍼할로알킬, C2-10 알케닐, C2-10 알키닐, 헤테로C1-10 알킬, 헤테로C2-10 알케닐, 헤테로C2-10 알키닐, C3-10 카보사이클릴, 3-14원 헤테로사이클릴, C6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 Rcc 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rdd 기로 독립적으로 치환되고;
Rdd의 각 경우는, 독립적으로 할로겐, -CN, -NO2, -N3, -SO2H, -SO3H, -OH, -ORee, -ON(Rff)2, -N(Rff)2, -N(Rff)3 +X-, -N(ORee)Rff, -SH, -SRee, -SSRee, -C(=O)Ree, -CO2H, -CO2Ree, -OC(=O)Ree, -OCO2Ree, -C(=O)N(Rff)2, -OC(=O)N(Rff)2, -NRffC(=O)Ree, -NRffCO2Ree, -NRffC(=O)N(Rff)2, -C(=NRff)ORee, -OC(=NRff)Ree, -OC(=NRff)ORee, -C(=NRff)N(Rff)2, -OC(=NRff)N(Rff)2, -NRffC(=NRff)N(Rff)2, -NRffSO2Ree, -SO2N(Rff)2, -SO2Ree, -SO2ORee, -OSO2Ree, -S(=O)Ree, -Si(Ree)3, -OSi(Ree)3, -C(=S)N(Rff)2, -C(=O)SRee, -C(=S)SRee, -SC(=S)SRee, -P(=O)(ORee)2, -P(=O)(Ree)2, -OP(=O)(Ree)2, -OP(=O)(ORee)2, C1-6 알킬, C1-6 퍼할로알킬, C2-6 알케닐, C2-6 알키닐, 헤테로C1-6 알킬, 헤테로C2-6 알케닐, 헤테로C2-6 알키닐, C3-10 카보사이클릴, 3-10원 헤테로사이클릴, C6-10 아릴, 5-10원 헤테로아릴로부터 선택되고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rgg 기로 독립적으로 치환되거나, 2개의 같은 자리(geminal) Rdd 치환기가 연결되어 =O 또는 =S를 형성할 수 있고; 여기서 X-는 반대이온이고;
Ree의 각 경우는, 독립적으로 C1-6 알킬, C1-6 퍼할로알킬, C2-6 알케닐, C2-6 알키닐, 헤테로C1-6 알킬, 헤테로C2-6 알케닐, 헤테로C2-6 알키닐, C3-10 카보사이클릴, C6-10 아릴, 3-10원 헤테로사이클릴, 및 3-10원 헤테로아릴로부터 선택되고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rgg 기로 독립적으로 치환되고;
Rff의 각 경우는, 독립적으로 수소, C1-6 알킬, C1-6 퍼할로알킬, C2-6 알케닐, C2-6 알키닐, 헤테로C1-6 알킬, 헤테로C2-6 알케닐, 헤테로C2-6 알키닐, C3-10 카보사이클릴, 3-10원 헤테로사이클릴, C6-10 아릴 및 5-10원 헤테로아릴로부터 선택되거나, 2개의 Rff 기가 연결되어 3-10원 헤테로사이클릴 또는 5-10원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rgg 기로 독립적으로 치환되고;
Rgg의 각 경우는, 독립적으로 할로겐, -CN, -NO2, -N3, -SO2H, -SO3H, -OH, -OC1-6 알킬, -ON(C1-6 알킬)2, -N(C1-6 알킬)2, -N(C1-6 알킬)3 +X-, -NH(C1-6 알킬)2 +X-, -NH2(C1-6 알킬)+X-, -NH3 +X-, -N(OC1-6 알킬)(C1-6 알킬), -N(OH)(C1-6 알킬), -NH(OH), -SH, -SC1-6 알킬, -SS(C1-6 알킬), -C(=O)(C1-6 알킬), -CO2H, -CO2(C1-6 알킬), -OC(=O)(C1-6 알킬), -OCO2(C1-6 알킬), -C(=O)NH2, -C(=O)N(C1-6 알킬)2, -OC(=O)NH(C1-6 알킬), -NHC(=O)(C1-6 알킬), -N(C1-6 알킬)C(=O)(C1-6 알킬), -NHCO2(C1-6 알킬), -NHC(=O)N(C1-6 알킬)2, -NHC(=O)NH(C1-6 알킬), -NHC(=O)NH2, -C(=NH)O(C1-6 알킬), -OC(=NH)(C1-6 알킬), -OC(=NH)OC1-6 알킬, -C(=NH)N(C1-6 알킬)2, -C(=NH)NH(C1-6 알킬), -C(=NH)NH2, -OC(=NH)N(C1-6 알킬)2, -OC(NH)NH(C1-6 알킬), -OC(NH)NH2, -NHC(NH)N(C1-6 알킬)2, -NHC(=NH)NH2, -NHSO2(C1-6 알킬), -SO2N(C1-6 알킬)2, -SO2NH(C1-6 알킬), -SO2NH2, -SO2C1-6 알킬, -SO2OC1-6 알킬, -OSO2C1-6 알킬, -SOC1-6 알킬, -Si(C1-6 알킬)3, -OSi(C1-6 알킬)3, -C(=S)N(C1-6 알킬)2, C(=S)NH(C1-6 알킬), C(=S)NH2, -C(=O)S(C1-6 알킬), -C(=S)SC1-6 알킬, -SC(=S)SC1-6 알킬, -P(=O)(OC1-6 알킬)2, -P(=O)(C1-6 알킬)2, -OP(=O)(C1-6 알킬)2, -OP(=O)(OC1-6 알킬)2, C1-6 알킬, C1-6 퍼할로알킬, C2-6 알케닐, C2-6 알키닐, 헤테로C1-6 알킬, 헤테로C2-6 알케닐, 헤테로C2-6 알키닐, C3-10 카보사이클릴, C6-10 아릴, 3-10원 헤테로사이클릴, 5-10원 헤테로아릴이거나; 2개의 같은 자리 Rgg 치환기가 연결되어 =O 또는 =S를 형성할 수 있고; 여기서 X-는 반대이온이다. 대안적으로, 탄소 원자 상의 2개의 같은 자리 수소는 기 =O, =S, =NN(Rbb)2, =NNRbbC(=O)Raa, =NNRbbC(=O)ORaa, =NNRbbS(=O)2Raa, =NRbb, 또는 =NORcc로 대체되고; 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rdd 기로 독립적으로 치환되고; 여기서 X-는 반대이온이고;
여기서:
Raa의 각 경우는, 독립적으로 C1-10 알킬, C1-10 퍼할로알킬, C2-10 알케닐, C2-10 알키닐, 헤테로C1-10 알킬, 헤테로C2-10 알케닐, 헤테로C2-10 알키닐, C3-10 카보사이클릴, 3-14원 헤테로사이클릴, C6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 Raa 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rdd 기로 독립적으로 치환되고;
Rbb의 각 경우는, 독립적으로 수소, -OH, -ORaa, -N(Rcc)2, -CN, -C(=O)Raa, -C(=O)N(Rcc)2, -CO2Raa, -SO2Raa, -C(=NRcc)ORaa, -C(=NRcc)N(Rcc)2, -SO2N(Rcc)2, -SO2Rcc, -SO2ORcc, -SORaa, -C(=S)N(Rcc)2, -C(=O)SRcc, -C(=S)SRcc, -P(=O)(Raa)2, -P(=O)(ORcc)2, -P(=O)(N(Rcc)2)2, C1-10 알킬, C1-10 퍼할로알킬, C2-10 알케닐, C2-10 알키닐, 헤테로C1-10 알킬, 헤테로C2-10 알케닐, 헤테로C2-10 알키닐, C3-10 카보사이클릴, 3-14원 헤테로사이클릴, C6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 Rbb 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rdd 기로 독립적으로 치환되고; 여기서 X-는 반대이온이고;
Rcc의 각 경우는, 독립적으로 수소, C1-10 알킬, C1-10 퍼할로알킬, C2-10 알케닐, C2-10 알키닐, 헤테로C1-10 알킬, 헤테로C2-10 알케닐, 헤테로C2-10 알키닐, C3-10 카보사이클릴, 3-14원 헤테로사이클릴, C6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 Rcc 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rdd 기로 독립적으로 치환되고;
Rdd의 각 경우는, 독립적으로 할로겐, -CN, -NO2, -N3, -SO2H, -SO3H, -OH, -ORee, -ON(Rff)2, -N(Rff)2, -N(Rff)3 +X-, -N(ORee)Rff, -SH, -SRee, -SSRee, -C(=O)Ree, -CO2H, -CO2Ree, -OC(=O)Ree, -OCO2Ree, -C(=O)N(Rff)2, -OC(=O)N(Rff)2, -NRffC(=O)Ree, -NRffCO2Ree, -NRffC(=O)N(Rff)2, -C(=NRff)ORee, -OC(=NRff)Ree, -OC(=NRff)ORee, -C(=NRff)N(Rff)2, -OC(=NRff)N(Rff)2, -NRffC(=NRff)N(Rff)2, -NRffSO2Ree, -SO2N(Rff)2, -SO2Ree, -SO2ORee, -OSO2Ree, -S(=O)Ree, -Si(Ree)3, -OSi(Ree)3, -C(=S)N(Rff)2, -C(=O)SRee, -C(=S)SRee, -SC(=S)SRee, -P(=O)(ORee)2, -P(=O)(Ree)2, -OP(=O)(Ree)2, -OP(=O)(ORee)2, C1-6 알킬, C1-6 퍼할로알킬, C2-6 알케닐, C2-6 알키닐, 헤테로C1-6 알킬, 헤테로C2-6 알케닐, 헤테로C2-6 알키닐, C3-10 카보사이클릴, 3-10원 헤테로사이클릴, C6-10 아릴, 5-10원 헤테로아릴로부터 선택되고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rgg 기로 독립적으로 치환되거나, 2개의 같은 자리 Rdd 치환기가 연결되어 =O 또는 =S를 형성할 수 있고; 여기서 X-는 반대이온이고;
Ree의 각 경우는, 독립적으로 C1-6 알킬, C1-6 퍼할로알킬, C2-6 알케닐, C2-6 알키닐, 헤테로C1-6 알킬, 헤테로C2-6 알케닐, 헤테로C2-6 알키닐, C3-10 카보사이클릴, C6-10 아릴, 3-10원 헤테로사이클릴, 및 3-10원 헤테로아릴로부터 선택되고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rgg 기로 독립적으로 치환되고;
Rff의 각 경우는, 독립적으로 수소, C1-6 알킬, C1-6 퍼할로알킬, C2-6 알케닐, C2-6 알키닐, 헤테로C1-6 알킬, 헤테로C2-6 알케닐, 헤테로C2-6알키닐, C3-10 카보사이클릴, 3-10원 헤테로사이클릴, C6-10 아릴 및 5-10원 헤테로아릴로부터 선택되거나, 2개의 Rff 기가 연결되어 3-10원 헤테로사이클릴 또는 5-10원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 Rgg 기로 독립적으로 치환되고;
Rgg의 각 경우는, 독립적으로 할로겐, -CN, -NO2, -N3, -SO2H, -SO3H, -OH, -OC1-6 알킬, -ON(C1-6 알킬)2, -N(C1-6 알킬)2, -N(C1-6 알킬)3 +X-, -NH(C1-6 알킬)2 +X-, -NH2(C1-6 알킬)+X-, -NH3 +X-, -N(OC1-6 알킬)(C1-6 알킬), -N(OH)(C1-6 알킬), -NH(OH), -SH, -SC1-6 알킬, -SS(C1-6 알킬), -C(=O)(C1-6 알킬), -CO2H, -CO2(C1-6 알킬), -OC(=O)(C1-6 알킬), -OCO2(C1-6 알킬), -C(=O)NH2, -C(=O)N(C1-6 알킬)2, -OC(=O)NH(C1-6 알킬), -NHC(=O)(C1-6 알킬), -N(C1-6 알킬)C(=O)(C1-6 알킬), -NHCO2(C1-6 알킬), -NHC(=O)N(C1-6 알킬)2, -NHC(=O)NH(C1-6 알킬), -NHC(=O)NH2, -C(=NH)O(C1-6 알킬), -OC(=NH)(C1-6 알킬), -OC(=NH)OC1-6 알킬, -C(=NH)N(C1-6 알킬)2, -C(=NH)NH(C1-6 알킬), -C(=NH)NH2, -OC(=NH)N(C1-6 알킬)2, -OC(NH)NH(C1-6 알킬), -OC(NH)NH2, -NHC(NH)N(C1-6 알킬)2, -NHC(=NH)NH2, -NHSO2(C1-6 알킬), -SO2N(C1-6 알킬)2, -SO2NH(C1-6 알킬), -SO2NH2, -SO2C1-6 알킬, -SO2OC1-6 알킬, -OSO2C1-6 알킬, -SOC1-6 알킬, -Si(C1-6 알킬)3, -OSi(C1-6 알킬)3, -C(=S)N(C1-6 알킬)2, C(=S)NH(C1-6 알킬), C(=S)NH2, -C(=O)S(C1-6 알킬), -C(=S)SC1-6 알킬, -SC(=S)SC1-6 알킬, -P(=O)(OC1-6 알킬)2, -P(=O)(C1-6 알킬)2, -OP(=O)(C1-6 알킬)2, -OP(=O)(OC1-6 알킬)2, C1-6 알킬, C1-6 퍼할로알킬, C2-6 알케닐, C2-6 알키닐, 헤테로C1-6 알킬, 헤테로C2-6 알케닐, 헤테로C2-6 알키닐, C3-10 카보사이클릴, C6-10 아릴, 3-10원 헤테로사이클릴, 5-10원 헤테로아릴이거나; 2개의 같은 자리 Rgg 치환기는 연결되어 =O 또는 =S를 형성할 수 있고; 여기서 X-는 반대이온이다.
"반대이온" 또는 "음이온성 반대이온"은 전자 중성을 유지하기 위해 양으로 하전된 기와 관련된 음으로 하전된 기이다. 음이온성 반대이온은 1가(즉, 하나의 형식 음전하 포함)일 수 있다. 음이온성 반대이온은 또한 2가 또는 3가와 같은 다가(즉, 하나 초과의 형식 음전하 포함)일 수 있다. 예시적인 반대이온은 할로겐화 이온(예를 들어, F-, Cl-, Br-, I-), NO3 -, ClO4 -, OH-, H2PO4 -, HCO3 -, HSO4 -, 설포네이트 이온(예를 들어, 메탄설포네이트, 트리플루오로메탄설포네이트, p-톨루엔설포네이트, 벤젠설포네이트, 10-캄포르 설포네이트, 나프탈렌-2-설포네이트, 나프탈렌-1-설폰산-5-설포네이트, 에탄-1-설폰산-2-설포네이트 등), 카복실레이트 이온(예를 들어, 아세테이트, 프로파노에이트, 벤조에이트, 글리세레이트, 락테이트, 타르트레이트, 글리콜레이트, 글루코네이트 등), BF4 -, PF4 -, PF6 -, AsF6 -, SbF6 -, B[3,5-(CF3)2C6H3]4]-, B(C6F5)4 -, BPh4 -, Al(OC(CF3)3)4 -, 및 카보란 음이온(예를 들어, CB11H12 - 또는 (HCB11Me5Br6)-)을 포함한다. 다가일 수 있는 예시적인 반대이온은 CO3 2-, HPO4 2-, PO4 3- , B4O7 2-, SO4 2-, S2O3 2-, 카복실레이트 음이온(예를 들어, 타르트레이트, 시트레이트, 푸마레이트, 말레에이트, 말레이트, 말로네이트, 글루코네이트, 석시네이트, 글루타레이트, 아디페이트, 피멜레이트, 수베레이트, 아젤레이트, 세바케이트, 살리실레이트, 프탈레이트, 아스파르테이트, 글루타메이트 등), 및 카보란을 포함한다.
용어 "약학적으로 허용되는 염"은 건전한 의학적 판단 범위 내에서 과도한 독성, 자극, 알레르기 반응 등이 없이 인간 및 하등 동물의 조직과 접촉하여 사용하기에 적합하고 합리적인 이득/위험 비율에 부합되는 이러한 염을 지칭한다. 약학적으로 허용되는 염은 당업계에 익히 공지되어 있다. 예를 들어, Berge 등은 문헌(J. Pharmaceutical Sciences, 1977, 66, 1-19)에서 약학적으로 허용되는 염을 상세하게 기재하며, 이 문헌은 참조로 포함된다. 본 출원에 개시된 화합물의 약학적으로 허용되는 염은 적합한 무기 및 유기 산 및 염기로부터 유도된 것들을 포함한다. 약학적으로 허용되는 무독성 산 부가염의 예는 염산, 브롬화수소산, 인산, 황산 및 과염소산과 같은 무기산으로, 또는 아세트산, 옥살산, 말레산, 타르타르산, 시트르산, 석신산 또는 말론산과 같은 유기산으로, 또는 이온 교환과 같은 당업계에 공지된 다른 방법을 사용하여 형성된 아미노 기의 염이다. 다른 약학적으로 허용되는 염은 아디페이트, 알지네이트, 아스코르베이트, 아스파르테이트, 벤젠설포네이트, 벤조에이트, 바이설페이트, 보레이트, 부티레이트, 캄포레이트, 캄포르설포네이트, 시트레이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 포르메이트, 푸마레이트, 글루코헵토네이트, 글리세로포스페이트, 글루코네이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로요오다이드, 2-하이드록시-에탄설포네이트, 락토비오네이트, 락테이트, 라우레이트, 라우릴 설페이트, 말레이트, 말레에이트, 말로네이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 올레에이트, 옥살레이트, 팔미테이트, 파모에이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 스테아레이트, 석시네이트, 설페이트, 타르트레이트, 티오시아네이트, p-톨루엔설포네이트, 운데카노에이트, 발레레이트 등을 포함한다. 적절한 염기로부터 유래된 염은 알칼리 금속, 알칼리 토금속, 암모늄 및 N+(C1-4 알킬)4 - 염을 포함한다. 대표적인 알칼리 또는 알칼리 토금속 염은 나트륨, 리튬, 칼륨, 칼슘, 마그네슘 등을 포함한다. 추가의 약학적으로 허용되는 염은, 적절한 경우, 할라이드, 하이드록사이드, 카복실레이트, 설페이트, 포스페이트, 니트레이트, 저급 알킬 설포네이트 및 아릴 설포네이트와 같은 반대이온을 사용하여 형성된 무독성 암모늄, 4차 암모늄, 및 아민 양이온을 포함한다.
용어 "용매화물"은 일반적으로 가용매분해 반응에 의해 용매와 회합된 화합물의 형태를 지칭한다. 이러한 물리적 회합은 수소 결합을 포함할 수 있다. 통상적인 용매는 물, 메탄올, 에탄올, 아세트산, DMSO, THF, 디에틸 에테르 등을 포함한다. 화학식 (1), (9), (10), 및 (11)의 화합물은, 예를 들어, 결정질 형태로 제조될 수 있고 용매화될 수 있다. 적합한 용매화물은 약학적으로 허용되는 용매화물을 포함하고, 화학량론적 용매화물과 비화학량론적 용매화물 둘 모두를 추가로 포함한다. 특정 경우에, 용매화물은, 예를 들어, 하나 이상의 용매 분자가 결정질 고체의 결정 격자에 혼입될 때 단리될 수 있을 것이다. "용매화물"은 용액 상(solution-phase) 및 단리 가능한 용매화물 둘 모두를 포함한다. 대표적인 용매화물은 수화물, 에탄올레이트, 및 메탄올레이트를 포함한다.
용어 "수화물"은 물과 회합된 화합물을 지칭한다. 전형적으로, 화합물의 수화물에 함유된 물 분자의 수는 수화물 중 화합물 분자의 수에 대한 일정한 비율이다. 따라서, 화합물의 수화물은, 예를 들어, 일반식 RㆍxH2O로 표시될 수 있으며, 여기서 R은 화합물이고 x는 0 초과의 수이다. 주어진 화합물은, 예를 들어, 일수화물(x는 1임), 저급 수화물(x는 0 초과 1 미만의 수로, 예를 들어, 반수화물(Rㆍ0.5 H2O)임) 및 다가수화물(polyhydrate) (x는 1 초과의 수로, 예를 들어, 이수화물(Rㆍ2 H2O) 및 육수화물(Rㆍ6 H2O)임)을 포함하는 하나 초과의 유형의 수화물을 형성할 수 있다.
용어 "호변이성질체"는 특정 화합물 구조의 상호교환 가능한 형태이고 수소 원자 및 전자의 변위가 다양한 화합물을 지칭한다. 따라서, 두 구조는 π 전자와 원자(일반적으로 H)의 이동을 통해 평형 상태에 있을 수 있다. 예를 들어, 에놀과 케톤은 산 또는 염기로 처리하여 신속하게 상호 전환되기 때문에 호변이성질체이다. 호변이성질 현상의 또 다른 예는 산 또는 염기로 처리하여 마찬가지로 형성되는 페닐니트로메탄의 산 및 니트로 형태이다. 호변이성질체 형태는 관심 화합물의 최적의 화학 반응성 및 생물학적 활성의 달성과 관련될 수 있다.
또한, 동일한 분자식을 갖지만 원자의 결합 성질 또는 순서 또는 공간에서 원자의 배열이 상이한 화합물은 "이성질체"로 지칭되는 것으로 이해되어야 한다. 공간에서 원자의 배열이 상이한 이성질체는 "입체이성질체"로 지칭된다.
서로의 거울상이 아닌 입체이성질체는 "부분입체이성질체"로 지칭되고, 서로의 거울상이 중첩될 수 없는 것들은 "거울상이성질체"로 지칭된다. 화합물이 비대칭 중심을 갖는 경우, 예를 들어, 4개의 다른 기에 결합되는 경우, 한 쌍의 거울상이성질체가 가능하다. 거울상이성질체는 비대칭 중심의 절대적 구성을 특징으로 할 수 있으며 칸 및 프렐로그(Cahn and Prelog)의 R- 및 S- 순서결정 규칙에 의해 설명된다. 거울상이성질체는 또한 분자가 편광면을 회전시키는 방식을 특징으로 할 수 있으며 우선성 또는 좌선성으로서(즉, 각각 (+) 또는 (-)-이성질체로서) 지정된다. 키랄 화합물은 개별 거울상이성질체 또는 거울상이성질체의 혼합물로서 존재할 수 있다. 동일한 비율의 거울상이성질체를 함유하는 혼합물은 "라세미 혼합물"로 불린다.
용어 "공결정"은 적어도 2개의 상이한 성분(예를 들어, 본 출원에 기재된 화합물 및 산)을 포함하는 결정질 구조를 지칭하며, 여기서 각각의 성분은 독립적으로 원자, 이온 또는 분자이다. 특정 구현예에서, 어떠한 성분도 용매가 아니다. 특정 구현예에서, 성분 중 적어도 하나는 용매이다. 화합물과 산의 공결정은 화합물과 산으로부터 형성된 염과는 상이하다. 염에서, 본 출원에 기재된 화합물은 산으로부터 본 출원에 기재된 화합물로의 양성자 이동(예를 들어, 완전한 양성자 이동)이 실온에서 쉽게 발생하는 방식으로 산과 착물을 형성한다. 그러나, 공결정에서, 본 출원에 기재된 화합물은 산으로부터 본 출원에 기재된 화합물로의 양성자 이동이 실온에서 쉽게 발생하지 않는 방식으로 산과 착물을 형성한다. 특정 구현예에서, 공결정에서, 산으로부터 본 출원에 기재된 화합물로의 양성자 이동이 없다. 특정 구현예에서, 공결정에서, 산으로부터 본 출원에 기재된 화합물로의 부분적인 양성자 이동이 있다. 공결정은 본 출원에 기재된 화합물의 특성(예를 들어, 용해도, 안정성, 및 제형화의 용이성)을 개선하는 데 유용할 수 있다.
용어 "다형체"는 특정 결정 패킹 배열에서 화합물 (또는 이의 염, 수화물 또는 용매화물)의 결정질 형태를 지칭한다. 동일한 화합물의 모든 다형체는 동일한 원소 조성을 갖는다. 상이한 결정질 형태는 일반적으로 X선 회절 패턴, 적외선 스펙트럼, 융점, 밀도, 경도, 결정 형상, 광학 및 전기적 특성, 안정성 및 용해도가 상이하다. 재결정화 용매, 결정화 속도, 보관 온도 및 기타 요인으로 인해 하나의 결정 형태가 지배적일 수 있다. 화합물의 다양한 다형체는 상이한 조건 하에 결정화하여 제조될 수 있다.
용어 "프로드럭"은 절단 가능한 기를 갖고 가용매분해에 의해 또는 생리학적 조건 하에 화학식 (X), (8), (9), (10), 또는 (11)의 화합물이 되고 생체내에서 약학적으로 활성인 화학식 (X), (8), (9), (10), 또는 (11)의 화합물의 유도체를 포함한 화합물을 지칭한다. 프로드럭은, 제한 없이, 용해도, 생체이용률, 조직 적합성, 또는 포유동물 유기체에서의 지연된 방출과 같은 속성을 가질 수 있다. 예는 본 출원에 기재된 화합물의 글리코실화로부터 형성된 유도체(예를 들어, 글리코시드 유도체), 담체-연결된 프로드럭(예를 들어, 에스테르 유도체), 생물전구체 프로드럭(분자 변형에 의해 활성 화합물로 대사되는 프로드럭) 등을 포함하는 본 출원에 기재된 화합물의 유도체를 포함하지만 이에 제한되지 않는다. 글리코시드 유도체의 비제한적인 예는 PCT 공개 번호 WO2018208875 및 미국 특허 공개 번호 2019/0078168에 개시되어 있으며 이로부터 참조로 포함된다. 에스테르 유도체의 비제한적인 예는 미국 특허 공개 번호 US2017/0362195에 개시되어 있으며 이로부터 참조로 포함된다.
본 발명의 화합물의 다른 유도체는 이들의 산 및 산 유도체 형태 둘 모두에서 활성을 갖지만, 산 민감성 형태는 종종 포유동물 유기체에서 용해도, 생체이용률, 조직 적합성 또는 지연된 방출의 이점을 제공한다(문헌(Bundgard, H., Design of Prodrugs, pp. 7-9, 21-24, Elsevier, Amsterdam 1985) 참조). 프로드럭은, 예를 들어, 모산(parent acid)과 적합한 알코올의 반응에 의해 제조된 에스테르, 또는 모산 화합물과 치환 또는 비치환된 아민, 또는 산 무수물, 또는 혼합 무수물의 반응에 의해 제조된 아미드와 같은 당업자에게 익히 공지된 산 유도체를 포함한다. 본 발명의 화합물에 펜던트된 산성 기로부터 유도된 단순 지방족 또는 방향족 에스테르, 아미드 및 무수물이 특정 프로드럭이다. 일부 경우에, (아실옥시)알킬 에스테르 또는 ((알콕시카보닐)옥시)알킬에스테르와 같은 이중 에스테르 유형 프로드럭을 제조하는 것이 바람직하다. 화학식 (X), (8), (9), (10), 또는 (11)의 화합물의 C1-C8 알킬, C2-C8 알케닐, C2-C8 알키닐, 아릴, C7-C12 치환된 아릴, 및 C7-C12 아릴알킬 에스테르가 바람직할 수 있다.
칸나비노이드
본 출원에서 사용된 바와 같이, 용어 "칸나비노이드"는 하기 화학식 (X)의 화합물 또는 이의 약학적으로 허용되는 염, 공결정, 호변이성질체, 입체이성질체, 용매화물, 수화물, 다형체, 동위원소적으로 농축된 유도체, 또는 프로드럭을 포함한다:
상기 식에서, R1은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고; R2 및 R6은 독립적으로 수소 또는 카복실이고; R3 및 R5는 독립적으로 하이드록실, 할로겐, 또는 알콕시이고; R4는 수소 또는 임의로 치환된 프레닐 모이어티이거나; 임의로 R4 및 R3은 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성하거나, 임의로 R4 및 R5는 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성하거나, 임의로 1) R4 및 R3은 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성할 뿐만 아니라, 2) R4 및 R5는 이들의 개재 원자와 함께 취하여 사이클릭 모이어티도 형성한다. 특정 구현예에서, R4 및 R3은 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성한다. 특정 구현예에서, R4 및 R5는 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성한다. 특정 구현예에서, "칸나비노이드"는 화학식 (X)의 화합물 또는 이의 약학적으로 허용되는 염을 지칭한다. 특정 구현예에서, 1) R4 및 R3은 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성할 뿐만 아니라, 2) R4 및 R5는 이들의 개재 원자와 함께 취하여 사이클릭 모이어티도 형성한다.
일부 구현예에서, 칸나비노이드는 다음 단계를 통해 합성될 수 있다: a) 3개의 추가 케톤 모이어티를 아실-CoA 스캐폴드에 혼입시키기 위한 하나 이상의 반응으로, 여기서 아실-CoA 스캐폴드의 아실 모이어티는 4개와 14개 사이의 탄소를 포함하는 것인, 하나 이상의 반응; b) 단계 (a)의 생성물을 고리화하는 반응; 및 c) 프레닐 모이어티를 단계 (b)의 생성물 또는 단계 (b)의 생성물의 유도체에 혼입시키기 위한 반응. 일부 구현예에서, 단계 (a)에 기재된 아실-CoA 스캐폴드의 비제한적인 예는 헥사노일-CoA 및 부티릴-CoA를 포함한다. 일부 구현예에서, 단계 (b)의 생성물 또는 단계 (b)의 생성물의 유도체의 비제한적인 예는 올리베톨산 디바린산, 및 스패로포롤산을 포함한다.
일부 구현예에서, 화학식 (X)의 칸나비노이드 화합물은 하기 화학식 (X-A), (X-B), 또는 (X-C) 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭이다:
R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;
RZ1은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;
RZ2는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;
또는 임의로, RZ1 및 RZ2는 이들의 개재 원자와 함께 취하여 임의로 치환된 카보사이클릭 고리를 형성하고;
R3A는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고;
R3B는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고;
RY는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고;
RZ는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이다.
특정 구현예에서, 칸나비노이드 화합물은 하기 화학식 (X-A)의 화합물이다:
상기 식에서, 는 이중 결합이고, 각각의 RZ1 및 RZ2는 수소이고, R3A 및 R3B 중 하나는 임의로 치환된 C2-6 알케닐이고, R3A 및 R3B 중 다른 하나는 임의로 치환된 C2-6 알킬이다. 일부 구현예에서, 화학식 (X)의 칸나비노이드 화합물은 화학식 (X-A)의 화합물이고, 여기서 각각의 RZ1 및 RZ2는 수소이고, R3A 및 R3B 중 하나는 프레닐 기이고, R3A 및 R3B 중 다른 하나는 임의로 치환된 메틸이다.
특정 구현예에서, 화학식 (X-A)의 화학식 (X)의 칸나비노이드 화합물은 하기 화학식 (11-z)의 화합물이다:
상기 식에서, 는 원자가가 허용하는 대로 이중 결합 또는 단일 결합이고; R3A 및 R3B 중 하나는 알케닐로 임의로 치환된 C1-6 알킬이고, R3A 및 R3B 중 다른 하나는 임의로 치환된 C1-6 알킬이다. 특정 구현예에서, 화학식 (11-z)의 화합물에서, 는 단일 결합이고; R3A 및 R3B 중 하나는 프레닐로 임의로 치환된 C1-6 알킬이고; R3A 및 R3B 중 다른 하나는 비치환된 메틸이고; R은 본 출원에 기재된 바와 같다. 특정 구현예에서, 화학식 (11-z)의 화합물에서, 는 단일 결합이고; R3A 및 R3B 중 하나는 이고; R3A 및 R3B 중 다른 하나는 비치환된 메틸이고; R은 본 출원에 기재된 바와 같다. 특정 구현예에서, 화학식 (11-z)의 칸나비노이드 화합물은 하기 화학식 (11a)의 화합물이다:
특정 구현예에서, 화학식 (X-A)의 화학식 (X)의 칸나비노이드 화합물은 하기 화학식 (11a)의 화합물이다:
특정 구현예에서, 화학식 (X-A)의 칸나비노이드 화합물은 하기 화학식 (10-z)의 화합물이다:
상기 식에서, 는 원자가가 허용하는 대로 이중 결합 또는 단일 결합이고; RY는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고; 각각의 R3A 및 R3B는 독립적으로 임의로 치환된 C1-6 알킬이다. 특정 구현예에서, 화학식 (10-z)의 화합물에서, 는 단일 결합이고; 각각의 R3A 및 R3B는 비치환된 메틸이고, R은 본 출원에 기재된 바와 같다. 특정 구현예에서, 화학식 (10-z)의 칸나비노이드 화합물은 하기 화학식 (10a)의 화합물이다: . 특정 구현예에서, 화학식 (10a)의 화합물()은 탄소 10에서 *로 표지된 키랄 원자 및 탄소 6에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (10a)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물()은 하기 화학식의 화합물이다: 특정 구현예에서, 화학식 (10a)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고 탄소 6에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물( )은 하기 화학식의 화합물이다:
특정 구현예에서, 칸나비노이드 화합물은 하기 화학식 (X-B)의 화합물이다: 상기 식에서, 는 이중 결합이고; RY는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고; 각각의 R3A 및 R3B는 독립적으로 임의로 치환된 C1-6 알킬이다. 특정 구현예에서, 화학식 (X-B)의 화합물에서, RY는 임의로 치환된 C1-6 알킬이고; R3A 및 R3B 중 하나는 이고; R3A 및 R3B 중 다른 하나는 비치환된 메틸이고, R은 본 출원에 기재된 바와 같다. 특정 구현예에서, 화학식 (X-B)의 화합물은 하기 화학식 (9a)의 화합물이다: 특정 구현예에서, 화학식 (9a)의 화합물()은 탄소 3에서 *로 표지된 키랄 원자 및 탄소 4에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (9a)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물( )은 하기 화학식의 화합물이다: 특정 구현예에서, 화학식 (9a)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물()은 하기 화학식의 화합물이다:
특정 구현예에서, 칸나비노이드 화합물은 하기 화학식 (X-C)의 화합물이다: 상기 식에서, RZ는 임의로 치환된 알킬 또는 임의로 치환된 알케닐이다. 특정 구현예에서, 화학식 (X-C)의 화합물은 하기 화학식의 화합물이다: 상기 식에서, a는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이다. 특정 구현예에서, a는 1이다. 특정 구현예에서, a는 2이다. 특정 구현예에서, a는 3이다. 특정 구현예에서, a는 화학식 (X-C)의 화합물의 경우, 1, 2, 또는 3이다. 특정 구현예에서, 칸나비노이드 화합물은 화학식 (X-C)의 화합물이고, a는 1, 2, 3, 4, 또는 5이다. 특정 구현예에서, 화학식 (X-C)의 화합물은 하기 화학식 (8a)의 화합물이다:
일부 구현예에서, 본 개시내용의 칸나비노이드는 칸나비노이드 수용체 리간드를 포함한다. 칸나비노이드 수용체는 G 단백질-결합된 수용체 슈퍼패밀리에 있는 세포막 수용체 부류이다. 칸나비노이드 수용체는 CB1 수용체 및 CB2 수용체를 포함한다. 일부 구현예에서, 칸나비노이드 수용체는 GPR18, GPR55, 및 PPAR을 포함한다(문헌(Bram et al. "Activation of GPR18 by cannabinoid compounds: a tale of biased agonism" Br J Pharmcol v171 (16) (2014); Shi et al. "The novel cannabinoid receptor GPR55 mediates anxiolytic-like effects in the medial orbital cortex of mice with acute stress" Molecular Brain 10, No. 38 (2017); and O'Sullvan, Elizabeth. "An update on PPAR activation by cannabinoids" Br J Pharmcol v. 173(12) (2016)) 참조).
일부 구현예에서, 칸나비노이드는 체내에서 생성되는 물질인 엔도칸나비노이드와 대마초 속의 식물에 의해 자연적으로 생성되는 칸나비노이드인 파이토칸나비노이드로 구성된다. 일부 구현예에서, 파이토칸나비노이드는 자연 발생 식물 유래 칸나비노이드의 산성 및 탈카복실화된 산 형태 및 이들의 합성 및 생합성 등가물로 구성된다.
현재까지 94개 초과의 파이토칸나비노이드가 확인되었다(Berman, Paula, et al. "A new ESI-LC/MS approach for comprehensive metabolic profiling of phytocannabinoids in Cannabis." Scientific reports 8.1 (2018): 14280; El-Alfy et al., 2010, "Antidepressant-like effect of delta-9-tetrahydrocannabinol and other cannabinoids isolated from Cannabis sativa L", Pharmacology Biochemistry and Behavior 95 (4): 434-42; Rudolf Brenneisen, 2007, Chemistry and Analysis of Phytocannabinoids, Citti, Cinzia, et al. "A novel phytocannabinoid isolated from Cannabis sativa L. with an in vivo cannabimimetic activity higher than △9-tetrahydrocannabinol: △9-Tetrahydrocannabiphorol." Sci Rep 9 (2019): 20335, 이들 각각은 그 전체가 본 출원에 참조로 포함됨). 일부 구현예에서, 칸나비노이드는 △9-테트라하이드로칸나비놀(THC) 유형(예를 들어, (-)-트랜스-델타-9-테트라하이드로칸나비놀 또는 드로나비놀, (+)-트랜스-델타-9-테트라하이드로칸나비놀, (-)-시스-델타-9-테트라하이드로칸나비놀, 또는 (+)-시스-델타-9-테트라하이드로칸나비놀), 칸나비디올(CBD) 유형, 칸나비게롤(CBG) 유형, 칸나비크로멘(CBC) 유형, 칸나바이사이클롤(CBL) 유형, 칸나비노디올(CBND) 유형, 또는 칸나비트리올(CBT) 유형 칸나비노이드, 또는 이들의 임의의 조합을 포함한다(예를 들어, 문헌(R Pertwee, ed, Handbook of Cannabis (Oxford, UK: Oxford University Press, 2014) 참조, 이는 그 전체가 본 출원에 참조로 포함됨). 칸나비노이드의 비제한적인 목록은 다음을 포함한다: 칸나비오르콜-C1(CBNO), CBND-C1(CBNDO), △9-트랜스-테트라하이드로칸나비오르콜산-C1(△9-THCO), 카나비디오르콜-C1(CBDO), 카나비오르크로멘-C1(CBCO), (-)-△8-트랜스-(6aR,10aR)-테트라하이드로칸나비오르콜-C1(△8-THCO), 칸나비오르사이클롤 C1(CBLO), CBG-C1(CBGO), 칸나비놀-C2(CBN-C2), CBND-C2, △9-THC-C2, CBD-C2, CBC-C2, △8-THC-C2, CBL-C2, 비스노르-칸나비엘소인-C1(CBEO), CBG-C2, 칸나비바린-C3(CBNV), 칸나비노디바린-C3(CBNDV), (-)-△9-트랜스-테트라하이드로칸나비바린-C3(△9-THCV), (-)-칸나비디바린-C3(CBDV), (±)-칸나비크로메바린-C3(CBCV), (-)-△8-트랜스-THC-C3(△8-THCV), (±)-(1aS,3aR,8bR,8cR)-칸나비사이클로바린-C3(CBLV), 2-메틸-2-(4-메틸-2-펜테닐)-7-프로필-2H-1-벤조피란-5-올, △7-테트라하이드로칸나비바린-C3(△7-THCV), CBE-C2, 칸나비게로바린-C3(CBGV), 칸나비트리올-C1(CBTO), 칸나비놀-C4(CBN-C4), CBND-C4, (-)-△9-트랜스-테트라하이드로칸나비놀-C4(△9-THC-C4), 칸나비디올-C4(CBD-C4), CBC-C4, (-)-트랜스-△8-THC-C4, CBL-C4, 칸나비엘소인-C3(CBEV), CBG-C4, CBT-C2, 칸나비크로마논-C3, 칸나비글렌돌-C3(OH-이소-HHCV-C3), 칸나비옥세판-C5(CBX), 데하이드로칸나비푸란-C5(DCBF), 칸나비놀-C5(CBN), 칸나비노디올-C5(CBND), (-)-△9-트랜스-테트라하이드로칸나비놀-C5(△9-THC), (-)-△8-트랜스-(6aR,10aR)-테트라하이드로칸나비놀-C5(△8-THC), (±)-칸나비크로멘-C5(CBC), (-)-칸나비디올-C5(CBD), (±)-(1aS,3aR,8bR,8cR)-칸나비사이클롤C5(CBL), 칸나비시트란-C5(CBR), (-)-△9-(6aS,10aR-시스)-테트라하이드로칸나비놀-C5((-)-시스-△9-THC), (-)-△7-트랜스-(1R,3R,6R)-이소테트라하이드로칸나비놀-C5(트랜스-이소△7-THC), CBE-C4, 칸나비게롤-C5(CBG), 칸나비트리올-C3(CBTV), 칸나비놀 메틸 에테르-C5(CBNM), CBNDM-C5, 8-OH-CBN-C5(OH-CBN), OH-CBND-C5(OH-CBND), 10-옥소-△6a(10a)-테트라하이드로칸나비놀-C5(OTHC), 칸나비크로마논 D-C5, 칸나비쿠마로논-C5(CBCON-C5), 칸나비디올 모노메틸 에테르-C5(CBDM), △9-THCM-C5, (±)-3"-하이드록시-△4"-칸나비크로멘-C5, (5aS,6S,9R,9aR)-칸나비엘소인-C5(CBE), 2-게라닐-5-하이드록시-3-n-펜틸-1,4-벤조퀴논-C5, 5-게라닐 올리베톨산, 5-게라닐 올리베톨레이트, 8α-하이드록시-△9-테트라하이드로칸나비놀-C5(8α-OH-△9-THC), 8β-하이드록시-△9-테트라하이드로칸나비놀-C5(8β-OH-△9-THC), 10α-하이드록시-△8-테트라하이드로칸나비놀-C5(10α-OH-△8-THC), 10β-하이드록시-△8-테트라하이드로칸나비놀-C5(10β-OH-△8-THC), 10α-하이드록시-△9,11-헥사하이드로칸나비놀-C5, 9β,10β-에폭시헥사하이드로칸나비놀-C5, OH-CBD-C5(OH-CBD), 칸나비게롤 모노메틸 에테르-C5(CBGM), 칸나비크로마논-C5, CBT-C4, (±)-6,7-시스-에폭시칸나비게롤-C5, (±)-6,7-트랜스-에폭시칸나비게롤-C5, (-)-7-하이드록시칸나비크로만-C5, 칸나비모본-C5, (-)-트랜스-칸나비트리올-C5((-)-트랜스-CBT), (+)-트랜스-칸나비트리올-C5((+)-트랜스-CBT), (±)-시스-칸나비트리올-C5((±)-시스-CBT), (-)-트랜스-10-에톡시-9-하이드록시-△6a(10a)-테트라하이드로칸나비바린-C3 [(-)-트랜스-CBT-OEt], (-)-(6aR,9S,10S,10aR)-9,10-디하이드록시헥사하이드로칸나비놀-C5 [(-)-칸나비립솔] (CBR), 칸나비크로마논 C-C5, (-)-6a,7,10a-트리하이드록시-△9-테트라하이드로칸나비놀-C5[(-)-칸나비테트롤] (CBTT), 칸나비크로마논 B-C5, 8,9-디하이드록시-△6a(10a)-테트라하이드로칸나비놀-C5(8,9-디-OHCBT), (±)-4-아세톡시칸나비크로멘-C5, 2-아세톡시-6-게라닐-3-n-펜틸-1,4-벤조퀴논-C5, 11-아세톡시-△9-테트라하이드로칸나비놀C5(11-OAc-△9-THC), 5-아세틸-4-하이드록시칸나비게롤-C5, 4-아세톡시-2-게라닐-5-하이드록시-3-펜틸페놀-C5, (-)-트랜스-10-에톡시-9-하이드록시-△6a(10a)-테트라하이드로칸나비놀-C5((-)-트랜스-CBTOEt), 세스퀴칸나비게롤-C5(SesquiCBG), 카마게롤-C5, 4-테르페닐 칸나비놀레이트-C5, β-펜칠-△9-테트라하이드로칸나비놀레이트-C5, α-펜칠-△9-테트라하이드로칸나비놀레이트-C5, 에피-보르닐-△9-테트라하이드로칸나비놀레이트-C5, 보르닐-△9-테트라하이드로칸나비놀레이트-C5, α-테르페닐-△9-테트라하이드로칸나비놀레이트-C5, 4-테르페닐-△9-테트라하이드로칸나비놀레이트-C5, 6,6,9-트리메틸-3-펜틸-6H-디벤조[b,d]피란-1-올, 3-(1,1-디메틸헵틸)-6,6a,7,8,10,10a-헥사하이드로-1-하이드록시-6,6-디메틸-9H-디벤조[b,d]피란-9-온, (-)-(3S,4S)-7-하이드록시-△6-테트라하이드로칸나비놀-1,1-디메틸헵틸, (+)-(3S,4S)-7-하이드록시-△6-테트라하이드로칸나비놀-1,1-디메틸헵틸, 11-하이드록시-△9-테트라하이드로칸나비놀, 및 △8-테트라하이드로칸나비놀-11-오익산)); 특정 피페리딘 유사체(예를 들어, (-)-(6S,6aR,9R,10aR)-5,6,6a,7,8,9,10,10a-옥타하이드로-6-메틸-3-[(R)-1-메틸-4-페닐부톡시]-1,9-페난트리딘디올 1-아세테이트)), 특정 아미노알킬인돌 유사체(예를 들어, (R)-(+)-[2,3-디하이드로-5-메틸-3-(4-모르폴리닐메틸)-피롤로[1,2,3-데]-1,4-벤족사진-6-일]-1-나프탈레닐-메타논), 특정 개방 피란 고리 유사체(예를 들어, 2-[3-메틸-6-(1-메틸에테닐)-2-사이클로헥센-1-일]-5-펜틸-1,3-벤젠디올 및 4-(1,1-디메틸헵틸)-2,3'-디하이드록시-6'알파-(3-하이드록시프로필)-1',2',3',4',5',6'-헥사하이드로비페닐, 테트라하이드로칸나비포롤(THCP), 칸나비디포롤(CBDP), CBGP, CBCP, 이들의 산성 형태, 산성 형태의 염, 상기의 임의의 조합의 이량체, 상기의 임의의 조합의 삼량체, 상기의 임의의 조합의 중합체, 또는 이들의 임의의 조합.
본 출원에 기재된 칸나비노이드는 희귀 칸나비노이드일 수 있다. 예를 들어, 일부 구현예에서, 본 출원에 기재된 칸나비노이드는 암꽃의 건조 중량 기준으로 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.9%, 0.8%, 0.7%, 0.6%, 0.5%, 0.25%, 또는 0.1% 미만의 농도로 통상적인 대마초 품종에서 자연적으로 생성되는 칸나비노이드에 상응한다. 일부 구현예에서, 휘귀 칸나비노이드는 CBGA, CBGVA, THCVA, CBDVA, CBCVA, 및 CBCA를 포함한다. 일부 구현예에서, 휘귀 칸나비노이드는 THCA, THC, CBDA 또는 CBD가 아닌 칸나비노이드이다.
본 출원에 기재된 칸나비노이드는 또한 희귀하지 않은 칸나비노이드일 수 있다.
일부 구현예에서, 칸나비노이드는 표 1에 열거된 칸나비노이드로부터 선택된다.
표 1. 본 개시내용에 따른 칸나비노이드의 비제한적인 예.
칸나비노이드는 종종 "유형", 즉 프레닐 모이어티의 위상학적 배열에 의해 분류된다(예를 들어, 문헌(M. A. Elsohly and D. Slade, Life Sci., 2005, 78, 539-548; 및 L.O. Hanus et al. Nat. Prod. Rep., 2016, 33, 1357) 참조). 일반적으로, 칸나비노이드의 각각의 "유형"은 메타 위치에서 2개의 하이드록실 모이어티에 대한 레조르시놀 모이어티의 고리 치환에 대해 가능한 변형을 포함한다. 본원에 사용된 바와 같이, "CBG 유형" 칸나비노이드는 벤조산 모이어티의 6 위치에서 임의로 치환된 3-[(2E)-3,7-디메틸옥타-2,6-디에닐]-2,4-디하이드록시벤조산이다. 본원에 사용된 바와 같이, "CBG 유형" 칸나비노이드는 크로멘 모이어티의 7 위치에서 임의로 치환된 5-하이드록시-2-메틸-2-(4-메틸펜트-3-에닐)-크로멘-6-카복실산을 지칭한다. 본원에 사용된 바와 같이, "THC 유형" 칸나비노이드는 벤조[c]크로멘 모이어티의 3 위치에서 임의로 치환된 (6aR,10aR)-1-하이드록시-6,6,9-트리메틸-6a,7,8,10a-테트라하이드로벤조[c]크로멘-2-카복실산이다. 본원에 사용된 바와 같이, "CBD 유형" 칸나비노이드는 벤조산 모이어티의 6 위치에서 임의로 치환된 2,4-디하이드록시-3-[(1R,6R)-3-메틸-6-프로프-1-엔-2-일사이클로헥스-2-엔-1-일]-벤조산이다. 일부 구현예에서, 각 "유형"에 대한 임의의 고리 치환은 임의로 치환된 C1-C11 알킬, 임의로 치환된 C1-C11 알케닐, 임의로 치환된 C1-C11 알키닐, 또는 임의로 치환된 C1-C11 아르알킬이다.
칸나비노이드 및 칸나비노이드 전구체의 생합성
본 개시내용의 양태는 숙주 세포에서 칸나비노이드의 생합성 생성을 위한 도구, 서열 및 방법을 제공한다. 일부 구현예에서, 본 개시내용은 생합성에 의해 칸나비노이드를 생성할 수 있는 효소의 발현을 교시한다.
비제한적인 예로서, 도 2에 도시된 효소 중 하나 이상을 사용하여 관심 칸나비노이드 또는 칸나비노이드 전구체를 생성할 수 있다. 도 1은 대마초에서 발견되는 가장 풍부한 파이토칸나비노이드에 대한 칸나비노이드 생합성 경로를 나타낸다. 또한 문헌(de Meijer et al. I, II, III, and IV (I: 2003, Genetics, 163:335-346; II: 2005, Euphytica, 145:189-198; III: 2009, Euphytica, 165:293-311; and IV: 2009, Euphytica, 168:95-112), 및 Carvalho et al. "Designing Microorganisms for Heterologous Biosynthesis of Cannabinoids" (2017) FEMS Yeast Research Jun 1;17(4))을 참조하며, 이들 각각은 그 전체가 본 출원에 참조로 포함된다.
칸나비노이드 생합성에 사용하기 위한 전구체 기질은 일반적으로 관심 칸나비노이드에 기초하여 선택된다는 것을 인식해야 한다. 칸나비노이드 전구체의 비제한적인 예는 도 2의 화학식 (1)-(8)의 화합물을 포함한다. 일부 구현예에서, 화학식 (5)의 화합물을 포함하는 폴리케타이드는 프레닐화될 수 있다. 특정 구현예에서, 전구체는 도 1, 2, 또는 3에 나타낸 전구체 화합물이다. R이 1-40개의 탄소 원자를 포함하는 기질이 바람직하다. 일부 구현예에서, R이 3-8개의 탄소 원자를 포함하는 기질이 가장 바람직하다.
본 출원에 사용된 바와 같이, 칸나비노이드 또는 칸나비노이드 전구체는 R 기를 포함할 수 있다. 예를 들어, 도 2를 참조한다. 일부 구현예에서, R은 수소일 수 있다. 특정 구현예에서, R은 임의로 치환된 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-40 알킬이다. 특정 구현예에서, R은 임의로 치환된 C2-40 알킬이다. 특정 구현예에서, R은 직쇄 또는 분지형 알킬인 임의로 치환된 C2-40 알킬이다. 특정 구현예에서, R은 임의로 치환된 C3-8 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C40 알킬, C1-C20 알킬, C1-C10 알킬, C1-C8 알킬, C1-C5 알킬, C3-C5 알킬, C3 알킬, 또는 C5 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C20 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C10 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C8 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C5 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C7 알킬이다. 특정 구현예에서, R은 임의로 치환된 C3-C5 알킬이다. 특정 구현예에서, R은 임의로 치환된 C3 알킬이다. 특정 구현예에서, R은 비치환된 C3 알킬이다. 특정 구현예에서, R은 n-C3 알킬이다. 특정 구현예에서, R은 n-프로필이다. 특정 구현예에서, R은 n-부틸이다. 특정 구현예에서, R은 n-펜틸이다. 특정 구현예에서, R은 n-헥실이다. 특정 구현예에서, R은 n-헵틸이다. 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 임의로 치환된 C4 알킬이다. 특정 구현예에서, R은 비치환된 C4 알킬이다. 특정 구현예에서, R은 임의로 치환된 C5 알킬이다. 특정 구현예에서, R은 비치환된 C5 알킬이다. 특정 구현예에서, R은 임의로 치환된 C6 알킬이다. 특정 구현예에서, R은 비치환된 C6 알킬이다. 특정 구현예에서, R은 임의로 치환된 C7 알킬이다. 특정 구현예에서, R은 비치환된 C7 알킬이다. 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 부틸이다. 특정 구현예에서, R은 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 펜틸이다. 특정 구현예에서, R은 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 헥실이다. 특정 구현예에서, R은 임의로 치환된 n-헥실이다. 특정 구현예에서, R은 임의로 치환된 n-헵틸이다. 특정 구현예에서, R은 임의로 치환된 n-옥틸이다. 특정 구현예에서, R은 아릴(예를 들어, 페닐)로 임의로 치환된 알킬이다. 특정 구현예에서, R은 임의로 치환된 아실(예를 들어, -C(=O)Me)이다.
특정 구현예에서, R은 임의로 치환된 알케닐(예를 들어, 치환된 또는 비치환된 C2-6 알케닐)이다. 특정 구현예에서, R은 치환된 또는 비치환된 C2-6 알케닐이다. 특정 구현예에서, R은 치환된 또는 비치환된 C2-5 알케닐이다. 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 임의로 치환된 알키닐(예를 들어, 치환된 또는 비치환된 C2-6 알키닐)이다. 특정 구현예에서, R은 치환된 또는 비치환된 C2-6 알키닐이다. 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 임의로 치환된 카보사이클릴이다. 특정 구현예에서, R은 임의로 치환된 아릴(예를 들어, 페닐 또는 나프틸)이다.
전구체 기질의 사슬 길이는 C1-C40일 수 있다. 이들 기질은, 제한 없이, 지방족, 지환족 및 방향족을 포함하는 임의의 정도 및 임의의 종류의 분지화 또는 포화 또는 사슬 구조를 가질 수 있다. 또한, 이들은 하이드록시, 할로겐, 탄수화물, 포스페이트, 메틸-함유 또는 질소-함유 작용기를 포함하는 임의의 작용기를 포함할 수 있다.
예를 들어, 도 3은 칸나비노이드 경로에 대한 추정 전구체의 비배타적인 세트를 나타낸다. 4개 내지 8개의 총 탄소(도 3에서 "C4"-"C8") 및 선형 또는 분지형 사슬을 갖는 최대 10-12개의 총 탄소를 포함하는 지방족 카복실산이 이종 경로에 대한 전구체로서 사용될 수 있다. 비제한적인 예는 메탄산, 부티르산, 펜탄산, 헥산산, 헵탄산, 이소발레르산, 옥탄산, 및 데칸산을 포함한다. 추가의 전구체는 에탄산 및 프로판산을 포함할 수 있다. 일부 구현예에서, 산 이외에, 에스테르, 염 및 산 형태가 모두 기질로서 사용될 수 있다. 기질은, 제한 없이, 지방족, 지환족 및 방향족을 포함하는 임의의 정도 및 임의의 종류의 분지화, 포화 및 사슬 구조를 가질 수 있다. 또한, 이들은, 제한 없이, 할로겐화, 하이드록실화, 아민화, 아실화, 알킬화, 페닐화 및/또는 펜던트 탄수화물, 포스페이트, 설페이트, 헤테로사이클 또는 지질, 또는 임의의 다른 작용기의 도입을 포함하는 임의의 기능적 변형 또는 변형의 조합을 포함할 수 있다.
본 출원에 개시된 임의의 효소에 대한 기질은 외인성으로 제공될 수 있거나 숙주 세포에 의해 내인성으로 생성될 수 있다. 일부 구현예에서, 칸나비노이드는 글루코스 기질로부터 생성되어 도 2에 나타낸 화학식 1의 화합물 및 CoA 전구체가 세포에 의해 합성된다. 다른 구현예에서, 전구체는 반응에 공급된다. 일부 구현예에서, 전구체는 도 2의 화학식 1-8로부터 선택된 화합물이다.
본 출원에 개시된 방법에 의해 생성된 칸나비노이드는 희귀 칸나비노이드를 포함한다. 휘귀 칸나비노이드를 포함하여 칸나비노이드가 자연에서 발생하는 낮은 농도로 인해, 대마초 식물로부터 산업적으로 상당한 양의 단리된 또는 정제된 칸나비노이드를 생성하는 것은, 예를 들어, 큰 부피의 대마초 식물과 식물 재료를 재배, 수확 및/또는 처리하기 위한 막대한 양의 공간, 노동, 시간 및 자본 요구사항으로 인해 금지될 수 있다(예를 들어, 문헌(Crandall, K., 2016. A Chronic Problem: Taming Energy Costs and Impacts from Marijuana Cultivation. EQ Research; Mills, E., 2012. The carbon footprint of indoor Cannabis production. Energy Policy, 46, pp.58-67; Jourabchi, M. and M. Lahet. 2014. Electrical Load Impacts of Indoor Commercial Cannabis Production. Presented to the Northwest Power and Conservation Council; O'Hare, M., D. Sanchez, and P. Alstone. 2013. Environmental Risks and Opportunities in Cannabis Cultivation. Washington State Liquor and Cannabis Board; 2018. Comparing Cannabis Cultivation Energy Consumption. New Frontier Data; and Madhusoodanan, J., 2019. Can cannabis go green? Nature Outlook: Cannabis) 참조; 이들 모두는 본 개시내용에 참조로 포함됨). 본 출원에 제공된 개시내용은 희귀 칸나비노이드를 포함하는 칸나비노이드를 고수율로 생성하기 위한 잠재적으로 효율적인 방법을 나타낸다. 본 출원에 제공된 개시내용은 또한 전통적인 칸나비노이드 생성 방법과 관련된 농업 관행 및 물 사용과 관련된 문제를 해결하기 위한 잠재적인 방법을 나타낸다(본 개시내용에 참조로 포함된 문헌(Dillis et al. "Water storage and Irrigation practices for cannabis drive seasonal patterns of water extraction and use in Northern California." Journal of Environmental Management 272 (2020): 110955) 참조).
개시된 방법에 의해 생성된 칸나비노이드는 또한 휘귀하지 않은 칸나비노이드를 포함한다. 특정 이론에 국한되지 않고, 본 출원에 기재된 방법은 희귀하지 않은 칸나비노이드를 생성하기 위한 전통적인 식물 기반 방법과 비교하여 유리할 수 있다. 예를 들어, 본 출원에 제공된 방법은 휘귀하지 않은 칸나비노이드를 일관되고 높은 수율로 생성하기 위한 잠재적으로 효율적인 수단을 나타낸다. 칸나비노이드를 식물로부터 수확하는 전통적인 칸나비노이드 생성 방법으로는 기류, 영양분, 조명, 온도 및 습도를 포함하여 일관되고 균일한 조건을 유지하는 것이 어려울 수 있다. 예를 들어, 식물 기반 방법을 사용하면 분기에 의해 생성된 미기후(microclimate)가 있을 수 있으며, 이것은 일관성 없는 수확량과 부산물 형성을 초래할 수 있다. 일부 구현예에서, 본 출원에 기재된 방법은 식물로부터 칸나비노이드를 수확하는 것과 비교하여 관심 칸나비노이드를 생성하는 데 더 효율적이다. 예를 들어, 식물 기반 방법을 사용하면 종자에서 수확하는 데 최대 반년이 소요될 수 있는 반면, 절단에서 수확하는 데는 일반적으로 약 4개월이 소요된다. 건조, 경화 및 추출을 포함한 추가 단계는 일반적으로 식물 기반 방법에도 필요하다. 대조적으로, 일부 구현예에서, 본 출원에 기재된 발효 기반 방법은 단지 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10일이 소요된다. 일부 구현예에서, 본 출원에 기재된 발효 기반 방법은 단지 약 3-5일이 소요된다. 일부 구현예에서, 본 출원에 기재된 발효 기반 방법은 단지 약 5일이 소요된다. 일부 구현예에서, 본 출원에서 제공되는 방법은 규제 표준을 준수하는 데 필요한 보안의 양을 감소시킨다. 예를 들어, 식물 재배와 비교하여 본 출원에 기재된 방법을 실행하기 위해 더 작은 보안 영역을 모니터링하고 보호할 필요가 있을 수 있다. 일부 구현예에서, 본 출원에 기재된 방법은 식물로부터 얻어진 칸나비노이드보다 유리하다.
말단 신타제(TS)
본 출원에 기재된 숙주 세포는 말단 신타제(TS)를 포함할 수 있다. 본 출원에 사용된 바와 같이, "TS"는 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 고리-함유 생성물(예를 들어, 헤테로사이클릭 고리-함유 생성물)을 생성할 수 있는 효소를 지칭한다. 특정 구현예에서, TS는 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 카보사이클릭-고리 함유 생성물(예를 들어, 칸나비노이드)을 생성할 수 있다. 특정 구현예에서, TS는 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 헤테로고리-고리 함유 생성물(예를 들어, 칸나비노이드)을 생성할 수 있다. 특정 구현예에서, TS는 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 칸나비노이드를 생성할 수 있다.
TS 효소는 FAD-결합 및 BBE(Berberine Bridge Enzyme) 서열 모티프를 포함하는 단량체이다.
일부 구현예에서, TS는 "조상(ancestral)" 말단 신타제이다. 조상 TS는 전사체 데이터 세트를 기반으로 말단 신타제 계통발생에 적용된 돌연변이의 확률 모델로부터 생성될 수 있다. 예를 들어, Hochberg 등은 본 개시내용에 그 전체가 참조로 포함된 문헌(Annu. Rev. Biophys. 2017. 46:247-69)에서 조상 단백질을 재구성하는 과정을 설명한다.
a. 기질
TS는 하나 이상의 기질을 사용할 수 있다. 일부 경우에, 프레닐 기 및/또는 R 기의 위치는 TS 기질 간에 상이하다. 예를 들어, TS는 화학식 (8w), 화학식 (8x), 화학식 (8'), 화학식 (8y), 및/또는 화학식 (8z)의 하나 이상의 화합물 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 기질로서 사용할 수 있다:
상기 식에서, a는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이다.
특정 구현예에서, 화학식 (8')의 화합물은 하기 화학식 (8)의 화합물이다:
일부 구현예에서, R은 수소, 임의로 치환된 C1-C11 알킬, 임의로 치환된 C1-C11 알케닐, 임의로 치환된 C1-C11 알키닐, 또는 임의로 치환된 C1-C11 아르알킬이다.
일부 구현예에서, TS는 본 출원에 기재되고 도 2에 나타낸 화학식 (8)의 화합물의 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매한다. 특정 구현예에서, 화학식 (8)의 화합물은 하기 화학식 (8a)의 화합물이다:
일부 구현예에서, 화학식 (11)의 화합물의 생성은 대조군 기질로부터 화학식 (11)의 화합물의 생성과 비교하여 평가될 수 있다. 일부 구현예에서, 특정 기질로부터 화학식 (10)의 화합물의 생성은 대조군 기질로부터 화학식 (10)의 화합물의 생성과 비교하여 평가될 수 있다. 일부 구현예에서, 특정 기질로부터 화학식 (9)의 화합물의 생성은 대조군 기질로부터 화학식 (9)의 화합물의 생성과 비교하여 평가될 수 있다.
b. 생성물
일부 구현예에서, TS 효소는 CBG 유형 칸나비노이드로부터 CBD 유형 칸나비노이드, THC 유형 칸나비노이드 및/또는 CBC 유형 칸나비노이드의 형성을 촉매한다. CBGA가 기질인 구현예에서, TS 효소 CBDAS, THCAS 및 CBCAS는 일반적으로 칸나비디올산(CBDA), △9-테트라하이드로칸나비놀산(THCA) 및 칸나비크로멘산(CBCA)의 형성을 각각 촉매한다. 그러나, 일부 구현예에서, TS는 반응 조건에 따라 2개 초과의 상이한 생성물을 생성할 수 있다. 생성물의 다중기능성(promiscuity)이 대마초 말단 신타제 사이에서 언급되었다(예를 들어, Zirpel et al., J. Biotechnol. 2018 April 20; 272:40-7). 어떠한 이론에도 국한되지 않고, 반응 조건은 TS 효소의 기질 결합 부위를 형성하는 아미노산의 양성자화 상태 및 배향에 영향을 미치며, 이는 기질 및/또는 이들 효소의 생성물의 도킹에 영향을 미칠 수 있다. 예를 들어, 반응 환경의 pH는 THCAS 또는 CBDAS가 각각 THCA 또는 CBDAS보다 더 큰 비율로 CBCA를 생성하도록 할 수 있다(예를 들어, 그 전체가 참조로 포함된 Winnicki 및 Donsky의 미국 특허 번호 9,359,625 참조). 일부 구현예에서, TS는 세포질 조건 또는 세포소기관 조건과 같은 세포내 조건에서 소정의 생성물 특이성을 갖는다. 세포내 조건에 기초하여 소정의 생성물 특이성을 갖는 TS를 발현함으로써, TS를 발현하는 세포에 의해 생성된 생체내 생성물이 보다 예측 가능하게 생성될 수 있다. 일부 구현예에서, TS는 pH 5.5에서 원하는 생성물을 생성한다. 일부 구현예에서, TS는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14의 pH에서 원하는 생성물을 생성한다. 일부 구현예에서, TS는 4.5와 8.0 사이의 pH에서 원하는 생성물을 생성한다. 일부 구현예에서, TS는 5와 6 사이의 pH에서 원하는 생성물을 생성한다. 일부 구현예에서, TS는 그 사이의 모든 값을 포함하여 약 4.5, 4.6, 4.7, 4.8, 4.9, 5.0, 5,1, 5.2, 5.3, 5.4, 5.5, 5.6, 5.7, 5.8, 5.9, 6.0, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9, 7.0, 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 또는 8.0인 pH에서 원하는 생성물을 생성한다. 일부 구현예에서, 신포 펩티드가 TS에 의해 생성되는 생성물의 유형을 조절하는 특정 세포내 조건(예를 들어, 특정 세포소기관)을 갖는 특정 세포내 위치로 TS를 표적화하기 때문에 TS의 생성물 프로파일은 TS의 신호 펩티드에 의존한다. 예시적인 신호 펩티드는 아래에 더 상세히 논의된다. 세포내 조건의 차이는, 예를 들어, pH의 변화 및/또는 샤페론 단백질의 존재로 인한 TS 효소의 폴딩의 차이로 인해 TS 효소의 활성에 영향을 미칠 수 있다.
TS는 본 출원에 기재된 하나 이상의 기질을 사용하여 하나 이상의 생성물을 생성할 수 있다. TS 생성물의 비제한적인 예를 표 1에 나타낸다. 일부 경우에, TS는 하나의 기질을 사용하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 생성물을 생성할 수 있다. 일부 구현예에서, TS는 하나 초과의 기질을 사용하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 기질을 생성할 수 있다.
일부 구현예에서, TS는 하기 화학식 (X-A)의 화합물 및/또는 화학식 (X-B)의 화합물 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 생성할 수 있다:
R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;
RZ1은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;
RZ2는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;
또는 임의로, RZ1 및 RZ2는 이들의 개재 원자와 함께 취하여 임의로 치환된 카보사이클릭 고리를 형성하고;
R3A는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고;
R3B는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고/이거나;
RY는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이다.
일부 구현예에서, 화학식 (X-A)의 화합물은 하기 화합물이다:
특정 구현예에서, 화학식 (10)의 화합물()은 탄소 10에서 *로 표지된 키랄 원자 및 탄소 6에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (10a)의 화합물( )에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (10)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10)의 화합물()은 하기 화학식의 화합물이다: 특정 구현예에서, 화학식 (10)의 화합물( )에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (10)의 화합물()은 하기 화학식의 화합물이다:
특정 구현예에서, 화학식 (10a)의 화합물()은 탄소 10에서 *로 표지된 키랄 원자 및 탄소 6에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (10a)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 6 에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물()은 하기 화학식의 화합물이다: 특정 구현예에서, 화학식 (10a)의 화합물()에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물()은 하기 화학식의 화합물이다:
일부 구현예에서, 화학식 (X-A)의 화합물은 하기 화합물이다:
일부 구현예에서, 화학식 (X-A)의 화합물은 하기 화합물이다:
일부 구현예에서, 화학식 (X-B)의 화합물은 하기 화합물이다:
특정 구현예에서, 화학식 (9)의 화합물()은 탄소 3에서 *로 표지된 키랄 원자 및 탄소 4에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (9)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (9)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9)의 화합물의 화합물()은 하기 화학식의 화합물이다: 특정 구현예에서, 화학식 (9)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (9)의 화합물()은 하기 화학식의 화합물이다:
특정 구현예에서, 화학식 (9a)의 화합물(CBDA) ()은 탄소 3에서 *로 표지된 키랄 원자 및 탄소 4에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (9a)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물()은 하기 화학식의 화합물이다: 특정 구현예에서, 화학식 (9a)의 화합물()에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물()은 하기 화학식의 화합물이다:
일부 구현예에서, 도 2에 나타낸 바와 같이, TS는, 제한 없이, 임의의 다른 기질을 사용하여 화학식 (8')의 화합물:
(상기 식에서, a는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이고; R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴임)로부터 생성된 화학식 (9), (10) 또는 (11)의 화합물, 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 생성할 수 있는 효소를 포함하는 PT의 생성물로부터 칸나비노이드를 생성할 수 있다:
상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다. 특정 구현예에서, 화학식 (8')의 화합물은 하기 화학식 (8)의 화합물이다:
특정 구현예에서, 화학식 (9), (10), 또는 (11)의 화합물은, 예를 들어, 화학식 (8')의 기질 화합물(예를 들어, 화학식 (8)의 화합물)로부터 TS를 사용하여 생성된다. 화학식 (8')의 기질 화합물의 비제한적인 예는 칸나비게롤산(CBGA), 칸나비게로바린산(CBGVA), 또는 칸나비네롤산을 포함하지만 이에 제한되지 않는다. 특정 구현예에서, 화학식 (9), (10), 또는 (11)의 생성물 화합물의 하이드록실 기 중 적어도 하나는 추가로 메틸화된다. 특정 구현예에서, 화학식 (9)의 화합물은 메틸화되어 하기 화학식 (12)의 화합물 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 형성한다:
본 출원에 기재된 임의의 효소, 숙주 세포, 및 방법은 표 1에 제공된 것과 같은 칸나비노이드 및 칸나비노이드 전구체의 생성에 사용될 수 있다. 일반적으로, 용어 "생성"은, 예를 들어, 특정 기질 또는 반응물로부터 하나 이상의 생성물(예를 들어, 관심 생성물 및/또는 부산물/오프-산물(off-product))의 생성을 지칭하기 위해 사용된다. 생성량은 당업자에게 친숙한 측정기준을 사용하여 최종 생성물 또는 중간 생성물과 같은 경로의 임의의 하나 이상의 단계에서 평가될 수 있다. 예를 들어, 생성량은 단일 효소 반응(예를 들어, TS에 의한 화학식 (8)의 화합물의 화학식 (11)의 화합물로의 전환)에 대해 평가될 수 있다. 대안적으로 또는 추가로, 생성량은 일련의 효소 반응(예를 들어, 도 1 및/또는 도 2에 나타낸 생합성 경로)에 대해 평가될 수 있다. 생성은, 예를 들어, 부피 생산성, 효소 동역학/반응 속도, 비생산성, 바이오매쓰 특이적 생산성, 역가, 수율, 및 하나 이상의 생성물(예컨대, 관심 생성물 및/또는 부산물/오프-산물)의 총 역가를 평가함으로써 당업계에 공지된 임의의 측정기준에 의해 평가될 수 있다.
일부 구현예에서, 생성을 측정하는 데 사용되는 측정기준은 연속 공정이 모니터링되는지(예를 들어, 여러 칸나비노이드 생합성 단계가 조합되어 사용되는지) 또는 특정 최종 생성물이 측정되는지 여부에 의존할 수 있다. 예를 들어, 일부 구현예에서, 연속 공정에 의해 생성을 모니터링하는 데 사용되는 측정기준은 부피 생산성, 효소 동역학 및 반응 속도를 포함할 수 있다. 일부 구현예에서, 특정 생성물의 생성을 모니터링하는 데 사용되는 측정기준은 비생산성, 바이오매쓰-특이적 생산성, 역가, 수율, 및/또는 하나 이상의 생성물(예를 들어, 관심 생성물 및/또는 부산물/오프-산물)의 총 역가를 포함할 수 있다.
하나 이상의 생성물(예를 들어, 관심 생성물 및/또는 부산물/오프-산물)의 생성은, 예를 들어, 반응/발효 종료 후 남아 있는 기질의 양을 결정함으로써 간접적으로 평가될 수 있다. 예를 들어, 생성물(예를 들어, CBGA를 포함하는 화학식 (8)의 화합물 (화학식 8(a))로부터 칸나비크로멘산(CBCA)을 포함하는 화학식 (11)의 화합물 (화학식 (11a)))의 형성을 촉매하는 TS의 경우, 생성물의 생성은 화학식 (11)의 화합물을 직접 정량하거나 반응 후에 남아 있는 기질의 양(예를 들어, 화학식 (8)의 화합물의 양)을 정량함으로써 평가할 수 있다. 생성물(예를 들어, CBGA를 포함하는 화학식 (8)의 화합물 (화학식 8(a))로부터 테트라하이드로칸나비놀산(THCA)을 포함하는 화학식 (10)의 화합물 (화학식 (10a)))의 형성을 촉매하는 TS의 경우, 생성물의 생성은 화학식 (10)의 화합물을 직접 정량하거나 반응 후에 남아 있는 기질의 양(예를 들어, 화학식 (8)의 화합물의 양)을 정량함으로써 평가할 수 있다. 생성물(예를 들어, CBGA를 포함하는 화학식 (8)의 화합물 (화학식 8(a))로부터 칸나비디올산(CBDA)을 포함하는 화학식 (9)의 화합물 (화학식 (9a)))의 형성을 촉매하는 TS의 경우, 생성물의 생성은 화학식 (9)의 화합물을 직접 정량하거나 반응 후에 남아 있는 기질의 양(예를 들어, 화학식 (8)의 화합물의 양)을 정량함으로써 평가할 수 있다.
일부 구현예에서, 부산물의 생산량은 높지만 원하는 생성물의 생산량은 낮은 TS는, 예를 들어, 하나 이상의 아미노산 치환, 삽입 및/또는 결실이 TS에 도입되어 원하는 생성물로의 생성을 이동하는 경우, 또는 TS가 반응 조건이 원하는 생성물의 생성에 유리한 위치에서 표시될 수 있는 경우 여전히 사용될 수 있다. 일부 구현예에서, TS는 THCAS이거나, THCAS 활성을 갖는다. THCAS의 비제한적인 부산물은 화학식 (9) 및 (11)의 화합물, 및 화학식 (8)의 화합물의 테르펜이 다른 개방 -OH 기(탄소 1에서)로 고리화되어 생성된 생성물을 포함한다. 일부 구현예에서, TS는 CBDAS이거나, CBDAS 활성을 갖는다. CBDAS의 비제한적인 부산물은 화학식 (10) 및 (11)의 화합물, 및 화학식 (8)의 화합물의 테르펜이 다른 개방 -OH 기(탄소 1에서)로 고리화되어 생성된 생성물을 포함한다. 일부 구현예에서, TS는 CBCAS이거나, CBCAS 활성을 갖는다. CBCAS의 비제한적인 부산물은 화학식 (9) 또는 (10)의 화합물, 및 화학식 (8)의 화합물의 테르펜이 다른 개방 -OH 기(탄소 1에서)로 고리화되어 생성된 생성물을 포함한다. 화학식 (8)의 화합물에서 탄소는 다음과 같이 넘버링될 수 있다:
예를 들어, 문헌(Hanus et al., Nat Prod Rep. (2016) Nov 23;33(12):1357-1392)을 참조한다.
일부 구현예에서, 특정 TS에 의한 생성물(예를 들어, 관심 생성물 및/또는 부산물/오프-산물)의 생성은, 예를 들어, 대조군 TS에 대한 상대적 생성으로 평가될 수 있다. 일부 구현예에서, 특정 숙주 세포에 의한 생성물의 생성은 대조군 숙주 세포와 비교하여 평가될 수 있다.
일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군에 비해 더 높은 역가 또는 수율로 생성물을 생성할 수 있을 수 있다. 일부 구현예에서, TS는 대조군에 비해 더 빠른 속도로(예를 들어, 더 높은 생산성) 생성물을 생성할 수 있다. 일부 구현예에서, TS는 또 다른 기질에 비해 하나의 기질에 대해 우선적인 결합 및/또는 활성을 가질 수 있다. 일부 구현예에서, TS는 또 다른 생성물에 비해 하나의 생성물을 우선적으로 생성할 수 있다.
일부 구현예에서, TS는 그 사이의 모든 값을 포함하여 적어도 0.0001 μg/L, 적어도 0.001 μg/L, 적어도 0.01 μg/L, 적어도 0.02 μg/L, 적어도 0.03 μg/L, 적어도 0.04 μg/L, 적어도 0.05 μg/L, 적어도 0.06 μg/L, 적어도 0.07 μg/L, 적어도 0.08 μg/L, 적어도 0.09 μg/L, 적어도 0.1 μg/L, 적어도 0.11 μg/L, 적어도 0.12 μg/L, 적어도 0.13 μg/L, 적어도 0.14 μg/L, 적어도 0.15 μg/L, 적어도 0.16 μg/L, 적어도 0.17 μg/L, 적어도 0.18 μg/L, 적어도 0.19 μg/L, 적어도 0.2 μg/L, 적어도 0.21 μg/L, 적어도 0.22 μg/L, 적어도 0.23 μg/L, 적어도 0.24 μg/L, 적어도 0.25 μg/L, 적어도 0.26 μg/L, 적어도 0.27 μg/L, 적어도 0.28 μg/L, 적어도 0.29 μg/L, 적어도 0.3 μg/L, 적어도 0.31 μg/L, 적어도 0.32 μg/L, 적어도 0.33 μg/L, 적어도 0.34 μg/L, 적어도 0.35 μg/L, 적어도 0.36 μg/L, 적어도 0.37 μg/L, 적어도 0.38 μg/L, 적어도 0.39 μg/L, 적어도 0.4 μg/L, 적어도 0.41 μg/L, 적어도 0.42 μg/L, 적어도 0.43 μg/L, 적어도 0.44 μg/L, 적어도 0.45 μg/L, 적어도 0.46 μg/L, 적어도 0.47 μg/L, 적어도 0.48 μg/L, 적어도 0.49 μg/L, 적어도 0.5 μg/L, 적어도 0.51 μg/L, 적어도 0.52 μg/L, 적어도 0.53 μg/L, 적어도 0.54 μg/L, 적어도 0.55 μg/L, 적어도 0.56 μg/L, 적어도 0.57 μg/L, 적어도 0.58 μg/L, 적어도 0.59 μg/L, 적어도 0.6 μg/L, 적어도 0.61 μg/L, 적어도 0.62 μg/L, 적어도 0.63 μg/L, 적어도 0.64 μg/L, 적어도 0.65 μg/L, 적어도 0.66 μg/L, 적어도 0.67 μg/L, 적어도 0.68 μg/L, 적어도 0.69 μg/L, 적어도 0.7 μg/L, 적어도 0.71 μg/L, 적어도 0.72 μg/L, 적어도 0.73 μg/L, 적어도 0.74 μg/L, 적어도 0.75 μg/L, 적어도 0.76 μg/L, 적어도 0.77 μg/L, 적어도 0.78 μg/L, 적어도 0.79 μg/L, 적어도 0.8 μg/L, 적어도 0.81 μg/L, 적어도 0.82 μg/L, 적어도 0.83 μg/L, 적어도 0.84 μg/L, 적어도 0.85 μg/L, 적어도 0.86 μg/L, 적어도 0.87 μg/L, 적어도 0.88 μg/L, 적어도 0.89 μg/L, 적어도 0.9 μg/L, 적어도 0.91 μg/L, 적어도 0.92 μg/L, 적어도 0.93 μg/L, 적어도 0.94 μg/L, 적어도 0.95 μg/L, 적어도 0.96 μg/L, 적어도 0.97 μg/L, 적어도 0.98 μg/L, 적어도 0.99 μg/L, 적어도 1 μg/L, 적어도 1.1 μg/L, 적어도 1.2 μg/L, 적어도 1.3 μg/L, 적어도 1.4 μg/L, 적어도 1.5 μg/L, 적어도 1.6 μg/L, 적어도 1.7 μg/L, 적어도 1.8 μg/L, 적어도 1.9 μg/L, 적어도 2 μg/L, 적어도 2.1 μg/L, 적어도 2.2 μg/L, 적어도 2.3 μg/L, 적어도 2.4 μg/L, 적어도 2.5 μg/L, 적어도 2.6 μg/L, 적어도 2.7 μg/L, 적어도 2.8 μg/L, 적어도 2.9 μg/L, 적어도 3 μg/L, 적어도 3.1 μg/L, 적어도 3.2 μg/L, 적어도 3.3 μg/L, 적어도 3.4 μg/L, 적어도 3.5 μg/L, 적어도 3.6 μg/L, 적어도 3.7 μg/L, 적어도 3.8 μg/L, 적어도 3.9 μg/L, 적어도 4 μg/L, 적어도 4.1 μg/L, 적어도 4.2 μg/L, 적어도 4.3 μg/L, 적어도 4.4 μg/L, 적어도 4.5 μg/L, 적어도 4.6 μg/L, 적어도 4.7 μg/L, 적어도 4.8 μg/L, 적어도 4.9 μg/L, 적어도 5 μg/L, 적어도 5.1 μg/L, 적어도 5.2 μg/L, 적어도 5.3 μg/L, 적어도 5.4 μg/L, 적어도 5.5 μg/L, 적어도 5.6 μg/L, 적어도 5.7 μg/L, 적어도 5.8 μg/L, 적어도 5.9 μg/L, 적어도 6 μg/L, 적어도 6.1 μg/L, 적어도 6.2 μg/L, 적어도 6.3 μg/L, 적어도 6.4 μg/L, 적어도 6.5 μg/L, 적어도 6.6 μg/L, 적어도 6.7 μg/L, 적어도 6.8 μg/L, 적어도 6.9 μg/L, 적어도 7 μg/L, 적어도 7.1 μg/L, 적어도 7.2 μg/L, 적어도 7.3 μg/L, 적어도 7.4 μg/L, 적어도 7.5 μg/L, 적어도 7.6 μg/L, 적어도 7.7 μg/L, 적어도 7.8 μg/L, 적어도 7.9 μg/L, 적어도 8 μg/L, 적어도 8.1 μg/L, 적어도 8.2 μg/L, 적어도 8.3 μg/L, 적어도 8.4 μg/L, 적어도 8.5 μg/L, 적어도 8.6 μg/L, 적어도 8.7 μg/L, 적어도 8.8 μg/L, 적어도 8.9 μg/L, 적어도 9 μg/L, 적어도 9.1 μg/L, 적어도 9.2 μg/L, 적어도 9.3 μg/L, 적어도 9.4 μg/L, 적어도 9.5 μg/L, 적어도 9.6 μg/L, 적어도 9.7 μg/L, 적어도 9.8 μg/L, 적어도 9.9 μg/L, 적어도 10 μg/L, 적어도 10.1 μg/L, 적어도 10.2 μg/L, 적어도 10.3 μg/L, 적어도 10.4 μg/L, 적어도 10.5 μg/L, 적어도 10.6 μg/L, 적어도 10.7 μg/L, 적어도 10.8 μg/L, 적어도 10.9 μg/L, 적어도 11 μg/L, 적어도 11.1 μg/L, 적어도 11.2 μg/L, 적어도 11.3 μg/L, 적어도 11.4 μg/L, 적어도 11.5 μg/L, 적어도 11.6 μg/L, 적어도 11.7 μg/L, 적어도 11.8 μg/L, 적어도 11.9 μg/L, 적어도 12 μg/L, 적어도 12.1 μg/L, 적어도 12.2 μg/L, 적어도 12.3 μg/L, 적어도 12.4 μg/L, 적어도 12.5 μg/L, 적어도 12.6 μg/L, 적어도 12.7 μg/L, 적어도 12.8 μg/L, 적어도 12.9 μg/L, 적어도 13 μg/L, 적어도 13.1 μg/L, 적어도 13.2 μg/L, 적어도 13.3 μg/L, 적어도 13.4 μg/L, 적어도 13.5 μg/L, 적어도 13.6 μg/L, 적어도 13.7 μg/L, 적어도 13.8 μg/L, 적어도 13.9 μg/L, 적어도 14 μg/L, 적어도 14.1 μg/L, 적어도 14.2 μg/L, 적어도 14.3 μg/L, 적어도 14.4 μg/L, 적어도 14.5 μg/L, 적어도 14.6 μg/L, 적어도 14.7 μg/L, 적어도 14.8 μg/L, 적어도 14.9 μg/L, 적어도 15 μg/L, 적어도 15.1 μg/L, 적어도 15.2 μg/L, 적어도 15.3 μg/L, 적어도 15.4 μg/L, 적어도 15.5 μg/L, 적어도 15.6 μg/L, 적어도 15.7 μg/L, 적어도 15.8 μg/L, 적어도 15.9 μg/L, 적어도 16 μg/L, 적어도 16.1 μg/L, 적어도 16.2 μg/L, 적어도 16.3 μg/L, 적어도 16.4 μg/L, 적어도 16.5 μg/L, 적어도 16.6 μg/L, 적어도 16.7 μg/L, 적어도 16.8 μg/L, 적어도 16.9 μg/L, 적어도 17 μg/L, 적어도 17.1 μg/L, 적어도 17.2 μg/L, 적어도 17.3 μg/L, 적어도 17.4 μg/L, 적어도 17.5 μg/L, 적어도 17.6 μg/L, 적어도 17.7 μg/L, 적어도 17.8 μg/L, 적어도 17.9 μg/L, 적어도 18 μg/L, 적어도 18.1 μg/L, 적어도 18.2 μg/L, 적어도 18.3 μg/L, 적어도 18.4 μg/L, 적어도 18.5 μg/L, 적어도 18.6 μg/L, 적어도 18.7 μg/L, 적어도 18.8 μg/L, 적어도 18.9 μg/L, 적어도 19 μg/L, 적어도 19.1 μg/L, 적어도 19.2 μg/L, 적어도 19.3 μg/L, 적어도 19.4 μg/L, 적어도 19.5 μg/L, 적어도 19.6 μg/L, 적어도 19.7 μg/L, 적어도 19.8 μg/L, 적어도 19.9 μg/L, 적어도 20 μg/L, 적어도 25 μg/L, 적어도 30 μg/L, 적어도 35 μg/L, 적어도 40 μg/L, 적어도 45 μg/L, 적어도 50 μg/L, 적어도 55 μg/L, 적어도 60 μg/L, 적어도 65 μg/L, 적어도 70 μg/L, 적어도 75 μg/L, 적어도 80 μg/L, 적어도 85 μg/L, 적어도 90 μg/L, 적어도 95 μg/L, 적어도 100 μg/L, 적어도 105 μg/L, 적어도 110 μg/L, 적어도 115 μg/L, 적어도 120 μg/L, 적어도 125 μg/L, 적어도 130 μg/L, 적어도 135 μg/L, 적어도 140 μg/L, 적어도 145 μg/L, 적어도 150 μg/L, 적어도 155 μg/L, 적어도 160 μg/L, 적어도 165 μg/L, 적어도 170 μg/L, 적어도 175 μg/L, 적어도 180 μg/L, 적어도 185 μg/L, 적어도 190 μg/L, 적어도 195 μg/L, 적어도 200 μg/L, 적어도 205 μg/L, 적어도 210 μg/L, 적어도 215 μg/L, 적어도 220 μg/L, 적어도 225 μg/L, 적어도 230 μg/L, 적어도 235 μg/L, 적어도 240 μg/L, 적어도 245 μg/L, 적어도 250 μg/L, 적어도 255 μg/L, 적어도 260 μg/L, 적어도 265 μg/L, 적어도 270 μg/L, 적어도 275 μg/L, 적어도 280 μg/L, 적어도 285 μg/L, 적어도 290 μg/L, 적어도 295 μg/L, 적어도 300 μg/L, 적어도 305 μg/L, 적어도 310 μg/L, 적어도 315 μg/L, 적어도 320 μg/L, 적어도 325 μg/L, 적어도 330 μg/L, 적어도 335 μg/L, 적어도 340 μg/L, 적어도 345 μg/L, 적어도 350 μg/L, 적어도 355 μg/L, 적어도 360 μg/L, 적어도 365 μg/L, 적어도 370 μg/L, 적어도 375 μg/L, 적어도 380 μg/L, 적어도 385 μg/L, 적어도 390 μg/L, 적어도 395 μg/L, 적어도 400 μg/L, 적어도 405 μg/L, 적어도 410 μg/L, 적어도 415 μg/L, 적어도 420 μg/L, 적어도 425 μg/L, 적어도 430 μg/L, 적어도 435 μg/L, 적어도 440 μg/L, 적어도 445 μg/L, 적어도 450 μg/L, 적어도 455 μg/L, 적어도 460 μg/L, 적어도 465 μg/L, 적어도 470 μg/L, 적어도 475 μg/L, 적어도 480 μg/L, 적어도 485 μg/L, 적어도 490 μg/L, 적어도 495 μg/L, 적어도 500 μg/L, 적어도 600 μg/L, 적어도 700 μg/L, 적어도 800 μg/L, 적어도 900 μg/L, 적어도 1,000 μg/L, 적어도 2,000 μg/L, 적어도 3,000 μg/L, 적어도 4,000 μg/L, 적어도 5,000 μg/L, 적어도 6,000 μg/L, 적어도 7,000 μg/L, 적어도 8,000 μg/L, 적어도 900 μg/L, 적어도 10,000 μg/L, 적어도 11,000 μg/L, 적어도 12,000 μg/L, 적어도 13,000 μg/L, 적어도 14,000 μg/L, 적어도 15,000 μg/L, 적어도 16,000 μg/L, 적어도 17,000 μg/L, 적어도 18,000 μg/L, 적어도 19,000 μg/L, 적어도 20,000 μg/L, 적어도 21,000 μg/L, 적어도 22,000 μg/L, 적어도 23,000 μg/L, 적어도 24,000 μg/L, 적어도 25,000 μg/L, 적어도 26,000 μg/L, 적어도 27,000 μg/L, 적어도 28,000 μg/L, 적어도 29,000 μg/L, 적어도 30,000 μg/L, 적어도 31,000 μg/L, 적어도 32,000 μg/L, 적어도 33,000 μg/L, 적어도 34,000 μg/L, 적어도 35,000 μg/L, 적어도 36,000 μg/L, 적어도 37,000 μg/L, 적어도 38,000 μg/L, 적어도 39,000 μg/L, 적어도 40,000 μg/L, 적어도 41,000 μg/L, 적어도 42,000 μg/L, 적어도 43,000 μg/L, 적어도 44,000 μg/L, 적어도 45,000 μg/L, 적어도 46,000 μg/L, 적어도 47,000 μg/L, 적어도 48,000 μg/L, 적어도 49,000 μg/L, 적어도 50,000 μg/L, 적어도 51,000 μg/L, 적어도 52,000 μg/L, 적어도 53,000 μg/L, 적어도 54,000 μg/L, 적어도 55,000 μg/L, 적어도 56,000 μg/L, 적어도 57,000 μg/L, 적어도 58,000 μg/L, 적어도 59,000 μg/L, 적어도 60,000 μg/L, 적어도 61,000 μg/L, 적어도 62,000 μg/L, 적어도 63,000 μg/L, 적어도 64,000 μg/L, 적어도 65,000 μg/L, 적어도 66,000 μg/L, 적어도 67,000 μg/L, 적어도 68,000 μg/L, 적어도 69,000 μg/L, 적어도 70,000 μg/L, 적어도 71,000 μg/L, 적어도 72,000 μg/L, 적어도 73,000 μg/L, 적어도 74,000 μg/L, 적어도 75,000 μg/L, 적어도 76,000 μg/L, 적어도 77,000 μg/L, 적어도 78,000 μg/L, 적어도 79,000 μg/L, 적어도 80,000 μg/L, 적어도 81,000 μg/L, 적어도 82,000 μg/L, 적어도 83,000 μg/L, 적어도 84,000 μg/L, 적어도 85,000 μg/L, 적어도 86,000 μg/L, 적어도 87,000 μg/L, 적어도 88,000 μg/L, 적어도 89,000 μg/L, 적어도 90,000 μg/L, 적어도 91,000 μg/L, 적어도 92,000 μg/L, 적어도 93,000 μg/L, 적어도 94,000 μg/L, 적어도 95,000 μg/L, 적어도 96,000 μg/L, 적어도 97,000 μg/L, 적어도 98,000 μg/L, 적어도 99,000 μg/L, 적어도 100,000 μg/L, 적어도 105,000 μg/L, 적어도 110,000 μg/L, 적어도 115,000 μg/L, 적어도 120,000 μg/L, 적어도 125,000 μg/L, 적어도 130,000 μg/L, 적어도 135,000 μg/L, 적어도 140,000 μg/L, 적어도 145,000 μg/L, 적어도 150,000 μg/L, 적어도 155,000 μg/L, 적어도 160,000 μg/L, 적어도 165,000 μg/L, 적어도 170,000 μg/L, 적어도 175,000 μg/L, 적어도 180,000 μg/L, 적어도 185,000 μg/L, 적어도 190,000 μg/L, 적어도 195,000 μg/L, 적어도 200,000 μg/L, 적어도 205,000 μg/L, 적어도 210,000 μg/L, 적어도 215,000 μg/L, 적어도 220,000 μg/L, 적어도 225,000 μg/L, 적어도 230,000 μg/L, 적어도 235,000 μg/L, 적어도 240,000 μg/L, 적어도 245,000 μg/L, 적어도 250,000 μg/L, 적어도 255,000 μg/L, 적어도 260,000 μg/L, 적어도 265,000 μg/L, 적어도 270,000 μg/L, 적어도 275,000 μg/L, 적어도 280,000 μg/L, 적어도 285,000 μg/L, 적어도 290,000 μg/L, 적어도 295,000 μg/L, 적어도 300,000 μg/L, 적어도 305,000 μg/L, 적어도 310,000 μg/L, 적어도 315,000 μg/L, 적어도 320,000 μg/L, 적어도 325,000 μg/L, 적어도 330,000 μg/L, 적어도 335,000 μg/L, 적어도 340,000 μg/L, 적어도 345,000 μg/L, 적어도 350,000 μg/L, 적어도 355,000 μg/L, 적어도 360,000 μg/L, 적어도 365,000 μg/L, 적어도 370,000 μg/L, 적어도 375,000 μg/L, 적어도 380,000 μg/L, 적어도 385,000 μg/L, 적어도 390,000 μg/L, 적어도 395,000 μg/L, 적어도 400,000 μg/L, 적어도 405,000 μg/L, 적어도 410,000 μg/L, 적어도 415,000 μg/L, 적어도 420,000 μg/L, 적어도 425,000 μg/L, 적어도 430,000 μg/L, 적어도 435,000 μg/L, 적어도 440,000 μg/L, 적어도 445,000 μg/L, 적어도 450,000 μg/L, 적어도 455,000 μg/L, 적어도 460,000 μg/L, 적어도 465,000 μg/L, 적어도 470,000 μg/L, 적어도 475,000 μg/L, 적어도 480,000 μg/L, 적어도 485,000 μg/L, 적어도 490,000 μg/L, 적어도 495,000 μg/L, 적어도 500,000 μg/L, 적어도 600,000 μg/L, 적어도 700,000 μg/L, 적어도 800,000 μg/L, 적어도 900,000 μg/L, 또는 적어도 1,000,000 μg/L의 본원에 기재된 생성물을 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.
일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 것보다 더 많은 양의 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 하나 이상의 생성물의 양의 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%)를 생성할 수 있다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 하나 초과의 생성물을 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 9, 적어도 9, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.
일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 하나 이상의 생성물의 역가 또는 수율의 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%)를 생성할 수 있다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군과 비교하여 하나 이상의 생성물의 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 높은 역가 또는 수율을 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.
일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)의 속도에 비해 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%)인 속도로 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, TS는 대조군(예를 들어, 양성 대조군)에 비해 적어도 1%(예를 들어, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 빠른 속도로 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.
일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 것보다 적은 양의 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 비해 하나 이상의 생성물을 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 적게 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.
일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 비해 하나 이상의 생성물을 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 낮은 역가 또는 수율로 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.
일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 비해 적어도 0.5%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 느린 속도로 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.
실험 TS와 대조군의 비교를 포함하는 본원에 기재된 방법의 일부 구현예에서, 대조군은 야생형 참조 TS이다. 일부 구현예에서, 대조군은 야생형 씨. 사티바 THCAS(예를 들어, 서열 21 포함)이다. 일부 구현예에서, 대조군은 THCAS 활성 이외에 CBCAS 활성도 나타내는 야생형 씨. 사티바 THCAS(예를 들어, 서열번호 21 포함)이다. 일부 구현예에서, 대조군 TS는 실험 TS 내에서 하나 이상의 아미노산 치환, 삽입 또는 결실의 존재를 제외하고 실험 TS와 동일하다.
실험 숙주 세포와 대조군 숙주 세포의 비교를 포함하는 본원에 기재된 방법의 일부 구현예에서, 대조군 숙주 세포는 TS를 코딩하는 이종 폴리뉴클레오티드를 포함하지 않는 숙주 세포이다. 일부 구현예에서, 대조군 숙주 세포는 야생형 세포이다. 일부 구현예에서, 대조군 숙주 세포는 야생형 씨. 사티바 THCAS를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포이다. 일부 구현예에서, 대조군은 THCAS 활성 이외에 CBCAS 활성도 나타내는 야생형 씨. 사티바 THCAS이다. 대마초에서, 야생형 CsTHCAS는 선모(glandular trichome)로 분비된다. 그러나, 하기에 더 상세히 기재된 바와 같이, 예를 들어, 특정 세포 구획 및/또는 세포 분비 경로에 대한 재조합 숙주 세포에 의해 생성된 칸나비노이드의 국소화를 제어하는 것이 바람직할 수 있다. 따라서, 일부 구현예에서, 대조군은 CBCAS 활성을 또한 나타내는 야생형 씨. 사티바 THCAS이며, 여기서 천연 신호 서열이 제거되고(예를 들어, 서열 번호 21에 기재된 바와 같음), 임의로 하나 이상의 이종 신호 서열로 대체된다. 일부 구현예에서, 대조군 숙주 세포는 서열번호 22를 포함하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포이다. 일부 구현예에서, 대조군 숙주 세포는 실험 숙주 세포에서 이종 발현되는 TS 내의 하나 이상의 아미노산 치환, 삽입 또는 결실의 존재를 제외하고 실험 숙주 세포와 유전적으로 동일하다.
일부 구현예에서, TS는 생성물의 혼합물을 생성할 수 있다. 예를 들어, 혼합물은 하나 이상의 화학식 (11)의 화합물을 포함할 수 있다. 일부 구현예에서, 혼합물은 화학식 (9), 화학식 (10), 및/또는 화학식 (11)의 화합물을 포함한다. 일부 구현예에서, 생성물 혼합물 내의 화합물의 적어도 약 50-100%, 적어도 약 50-60%, 적어도 약 60-70%, 적어도 약 70-80%, 적어도 약 80-90%, 적어도 약 90-100%는 화학식 (11a)의 화합물이다. 일부 구현예에서, 생성물 혼합물 내의 화합물의 약 50-100%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 또는 적어도 약 90%는 CBCA이다. 일부 구현예에서, 생성물 혼합물 내의 화합물의 약 50-100%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 또는 적어도 약 90%는 CBCVA이다.
일부 구현예에서, TS는 화학식 (11)의 또 다른 화합물, 화학식 (10a)의 화합물, 화학식 (9a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (11a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 많이 생성할 수 있다. 일부 구현예에서, TS는 화학식 (11)의 또 다른 화합물, 화학식 (10a)의 화합물, 화학식 (9a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (11a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 적게 생성할 수 있다.
일부 구현예에서, 생성물 혼합물 내의 화합물의 적어도 약 50-100%, 적어도 약 50-60%, 적어도 약 60-70%, 적어도 약 70-80%, 적어도 약 80-90%, 적어도 약 90-100%는 화학식 (9a)의 화합물이다. 일부 구현예에서, TS는 화학식 (9)의 또 다른 화합물, 화학식 (10a)의 화합물, 화학식 (11a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (9a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 많이 생성할 수 있다. 일부 구현예에서, TS는 화학식 (9)의 또 다른 화합물, 화학식 (10a)의 화합물, 화학식 (11a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (9a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 적게 생성할 수 있다.
일부 구현예에서, 생성물 혼합물 내의 화합물의 적어도 약 50-100%, 적어도 약 50-60%, 적어도 약 60-70%, 적어도 약 70-80%, 적어도 약 80-90%, 적어도 약 90-100%는 화학식 (10a)의 화합물이다. 일부 구현예에서, TS는 화학식 (10)의 또 다른 화합물, 화학식 (9a)의 화합물, 화학식 (11a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (10a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 많이 생성할 수 있다. 일부 구현예에서, TS는 화학식 (10)의 또 다른 화합물, 화학식 (9a)의 화합물, 화학식 (11a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (10a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 적게 생성할 수 있다.
c. 신호 펩티드
TS를 포함하여 본 출원에 기재된 임의의 효소는 신호 펩티드를 포함할 수 있다. "신호 서열"로도 지칭되는 신호 펩티드는 일반적으로 약 15-30개의 아미노산을 포함하고 새로 번역된 단백질을 특정 세포 구획 및/또는 세포 분비 경로로 이동을 조절하는 데 관여한다.
일부 경우에, 신호 펩티드는 관심 효소의 국소화를 촉진한다. 세포내 공간에서 관심 효소의 국소화를 촉진하는 신호 펩티드의 비제한적인 예는 MF알파2 신호 펩티드이다. 예를 들어, UniProtKB - U3N2M0 (잔기 1-19) 및 문헌(Singh et al., Nucleic Acids Res. (1983) Jun 25; 11(12): 4049-4063)으로부터의 신호 서열을 참조한다. 다른 경우에, 신호 펩티드는 단백질이 소포체(ER)로부터 분비되는 것을 방지할 수 있고/있거나 이러한 단백질이 의도치 않게 내보내진 경우 이러한 단백질의 복귀를 촉진할 수 있다. 이러한 신호 펩티드는 "ER 체류 신호"로 지칭될 수 있다. 단백질이 ER로부터 분비되는 것을 방지할 수 있고/있거나 이러한 단백질이 의도치 않게 내보내진 경우 이러한 단백질의 복귀를 촉진할 수 있는 신호 펩티드의 비제한적인 예는 HDEL 신호 펩티드이다. 예를 들어, 문헌(Pelham et al., EMBO J (1988)7:1757-1762)을 참조한다.
신호 펩티드의 비제한적인 예는 하기 표 2에 열거된 것들을 포함한다. 당업자가 인식할 수 있는 바와 같이, 당업계에 공지된 다른 신호 펩티드도 본 개시내용의 양태와 양립할 수 있을 것이다. 신호 펩티드는 관심 효소를 코딩하는 서열에 대해 N-말단 또는 C-말단에 위치할 수 있다. 관심 효소를 코딩하는 서열은 2개 이상의 신호 펩티드에 연결될 수 있다. 일부 구현예에서, 관심 효소는 N-말단에서 하나 이상의 신호 펩티드 및 C-말단에서 하나 이상의 신호 펩티드에 연결될 수 있다. 예를 들어, 일부 구현예에서, MF알파2 신호 펩티드는 관심 효소를 코딩하는 서열의 N-말단에 위치할 수 있고/있거나 HDEL 신호 펩티드는 관심 효소를 코딩하는 서열의 C-말단에 위치할 수 있다. 다른 구현예에서, HDEL 신호 펩티드는 관심 효소를 코딩하는 서열의 N-말단에 위치할 수 있고/있거나 MF알파2 신호 펩티드는 관심 효소를 코딩하는 서열의 C-말단에 위치할 수 있다.
어떠한 이론에도 국한되지 않고, MF알파2 신호 펩티드 및/또는 HDEL 신호 펩티드에 연결된 TS 효소와 같은 효소는 ER 및/또는 골지체와 같은 분비 경로와 관련된 세포내 위치에 국소화될 것으로 여겨진다. 분비 경로의 조건 중 하나 이상이 씨. 사티바로부터 유래된 TS 효소의 개선된 활성에 기여하는 것으로 여겨진다. 예를 들어, ER 및 골지체는 이황화물 브릿지의 형성을 도울 수 있는 산화적 환경이다. 어떠한 이론에도 국한되지 않고, 신호 펩티드, 및 신호 펩티드를 포함하는 단백질의 결과적인 세포내 국소화는 단백질의 안정성 및/또는 반감기에 차등적으로 영향을 미칠 수 있다.
일부 구현예에서, 신호 펩티드는 서열번호 3, 4, 16-19, 31, 또는 32 중 하나 이상과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다.
일부 구현예에서, 신호 펩티드는 서열번호 3, 4, 16, 또는 31 중 어느 하나와 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 또는 18개 이하의 아미노산이 상이한 서열을 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 3, 4, 16, 또는 31의 서열에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 또는 18개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 17과 1, 2 또는 3개 이하의 아미노산이 상이한 단백질 서열을 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함한다.
관심 효소를 코딩하는 서열의 N-말단에 위치한 신호 펩티드는 신호 펩티드의 N-말단에 메티오닌을 포함할 수 있다. 일부 구현예에서, 신호 펩티드가 관심 효소를 코딩하는 서열의 N-말단에 위치할 경우 메티오닌이 신호 펩티드에 첨가된다. 일부 구현예에서, 일반적으로 관심 효소와 관련된 신호 펩티드(예를 들어, 자연 발생 관심 효소에 존재하는 자연 발생 신호 펩티드)는 관심 숙주 세포에서 특정 세포 구획으로 효소를 표적화하기에 적합한 하나 이상의 상이한 신호 펩티드로 제거되거나 대체될 수 있다.
표 2. 신호 펩티드의 비제한적인 예
일부 구현예에서, TS는 테트라하이드로칸나비놀산 신타제(THCAS), 칸나비디올산 신타제(CBDAS), 및/또는 칸나비크로멘산 신타제(CBCAS)이다. 당업자는 TS가 자연 발생 공급원 및 합성 공급원(예를 들어, 비자연 발생 TS)을 포함하는 임의의 공급원으로부터 얻어질 수 있음을 인식할 것이다.
테트라하이드로칸나비놀산 신타제(THCAS)
본 출원에 기재된 숙주 세포는 테트라하이드로칸나비놀산 신타제(THCAS)인 TS를 포함할 수 있다. 본 출원에 사용된 바와 같이, "테트라하이드로칸나비놀산 신타제(THCAS)" 또는 "△1-테트라하이드로칸나비놀산(THCA) 신타제"는 화학식 (8)의 화합물의 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 화학식 (10)의 고리-함유 생성물(예를 들어, 헤테로사이클릭 고리-함유 생성물, 카보사이클릭-고리 함유 생성물)을 생성할 수 있는 효소를 지칭한다. 특정 구현예에서, THCAS는 화학식 (8)의 화합물로부터 △9-테트라하이드로칸나비놀산(△-THCA, THCA, △-테트라하이드로-칸나비바린산 A(△-THCVA-C3 A), THCVA, THCPA, 또는 화학식 10(a)의 화합물을 생성할 수 있는 효소를 지칭한다. 특정 구현예에서, THCAS는 △9-테트라하이드로칸나비놀산(△9-THCA, THCA, 또는 화학식 10(a)의 화합물)을 생성할 수 있다. 특정 구현예에서, THCAS는 △9-테트라하이드로칸나비바린산(△-THCVA, THCVA, 또는 R이 n-프로필인 화학식 10의 화합물)을 생성할 수 있다.
일부 구현예에서, THCAS는 3-프레닐-2,4-디하이드록시-6-알킬벤조산과 같은 기질의 산화적 고리화를 촉매할 수 있다. 일부 구현예에서, THCAS는 칸나비게롤산(CBGA)을 기질로 사용할 수 있다. 일부 구현예에서, THCAS는 CBGA로부터 △9-THCA를 생성한다. 일부 구현예에서, THCAS는 칸나비게로바린산(CBGVA)의 산화적 고리화를 촉매할 수 있다. 일부 구현예에서, THCAS는 다른 기질과 비교하여 CBGA 기질에 대한 특이성을 나타낸다. 일부 구현예에서, THCAS는 R이 C4 알킬(예를 들어, n-부틸)이거나 R이 C7 알킬(예를 들어, n-헵틸)인 도 2의 화학식 (8)의 화합물을 기질로서 사용할 수 있다. 일부 구현예에서, THCAS는 R이 C4 알킬(예를 들어, n-부틸)인 화학식 (8)의 화합물을 기질로서 사용할 수 있다. 일부 구현예에서, THCAS는 R이 C7 알킬(예를 들어, n-헵틸)인 도 2의 화학식 (8)의 화합물을 기질로서 사용할 수 있다. 일부 구현예에서, THCAS는 생성물로서 THCP를 생성할 수 있는 기질에 대한 특이성을 나타낸다.
일부 구현예에서, THCAS는 씨. 사티바로부터 유래한다. 씨. 사티바 THCAS는 공유 결합된 플라빈 아데닌 디뉴클레오티드(FAD)를 보조인자로서 사용하고 분자 산소를 최종 전자 수용체로서 사용하여 칸나비게롤산(CBGA)(도 4 구조 8a)의 게라닐 모이어티의 산화적 고리화를 수행하여 테트라하이드로칸나비놀산(도 4 구조 10a)을 형성한다. THCAS는 씨. 사티바의 잎 싹으로부터 효소를 추출하고 CBGA를 기질로 부가할 때 시험관내에서 THCA 신타제 활성을 확인한 후 Taura 등(JACS. 1995)에 의해 처음 발견되고 특성화되었다. Shoyama 등(J Mol Biol. 2012 Oct 12;423(1):96-105)에 의해 발표된 효소의 결정 구조는 효소가 보조인자 FAD의 분자에 공유 결합된다는 것을 보여주었다. 예를 들어, 문헌(Sirikantarams et al., J. Biol. Chem. 2004 Sept 17; 279(38):39767-39774) 또한 참조한다. 씨. 사티바에는 여러 THCAS 동질효소가 있다.
일부 구현예에서, 씨. 사티바 THCAS(Uniprot KB 수탁 번호: I1V0C5)는 하기에 나타낸 아미노산 서열을 포함하며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:
일부 구현예에서, THCAS는 하기에 나타낸 서열을 포함한다:
서열번호 21을 코딩하는 뉴클레오티드 서열의 비제한적인 예는 다음과 같다:
일부 구현예에서, THCS는 하기에 나타낸 아미노산 서열을 포함하며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:
신호 펩티드를 코딩하는 서열에 밑줄 치고 볼드체로 표시된 서열번호 23을 코딩하는 뉴클레오티드 서열의 비제한적인 예를 하기에 나타낸다:
일부 구현예에서, 씨. 사티바 THCAS는 UniProtKB - Q8GTB6(서열번호 14)에 기재된 아미노산 서열을 포함하며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:
일부 구현예에서, THCAS는 하기에 나타낸 서열을 포함한다:
THCAS 효소의 추가의 비제한적인 예는 또한 미국 특허 번호 9,512,391 및 미국 공개 번호 2018/0179564에서 찾을 수 있으며, 이들은 그 전체가 본 출원에 참조로 포함된다.
칸나비디올산 신타제(CBDAS)
본 출원에 기재된 숙주 세포는 칸나비디올산 신타제(CBDAS)인 TS를 포함할 수 있다. 본 출원에 사용된 바와 같이, "CBDAS"는 화학식 (8)의 화합물의 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 화학식 9의 화합물을 생성할 수 있는 효소를 지칭한다. 일부 구현예에서, 화학식 9의 화합물은 화학식 (9a)의 화합물(칸나비디올산(CBDA)), CBDVA, 또는 CBDP이다. CBDAS는 칸나비게롤산(CBGA) 또는 칸나비네롤산을 기질로서 사용할 수 있다. 일부 구현예에서, 칸나비디올산 신타제는 칸나비게롤산(CBGA)을 산화적 고리화하여 칸나비디올산(CBDA)을 생성할 수 있다. 일부 구현예에서, CBDAS는 칸나비게로바린산(CBVGA)과 같은 3-게라닐-2,4-디하이드로-6-알킬벤조산과 같은 다른 기질의 산화적 고리화를 촉매할 수 있다. 일부 구현예에서, CBDAS는 CBGA 기질에 대한 특이성을 나타낸다.
일부 구현예에서, CBDAS는 대마초로부터 유래된다. 씨. 사티바에서, CBDAS는 CBDAS 유전자에 의해 코딩되며 플라보효소이다. CBDAS를 포함하는 아미노산 서열의 비제한적인 예는 씨. 사티바로부터의 UniProtKB - A6P6V9(서열번호 13)에 의해 제공되며, 여기서 신호 펩티드가 밑줄 치고 볼드체로 표시되어 있다:
일부 구현예에서, CBDAS는 하기에 나타낸 서열을 포함한다:
CBDAS 효소의 추가의 비제한적인 예는 또한 미국 특허 번호 9,512,391 및 미국 공개 번호 2018/0179564에서 찾을 수 있으며, 이들은 그 전체가 본 출원에 참조로 포함된다.
칸나비크로멘산 신타제(CBCAS)
본 출원에 기재된 숙주 세포는 칸나비크로멘산 신타제(CBCAS)인 TS를 포함할 수 있다. 본 출원에 사용된 바와 같이, "CBCAS"는 화학식 (8)의 화합물의 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 화학식 (11)의 화합물을 생성할 수 있는 효소를 지칭한다. 일부 구현예에서, 화학식 (11)의 화합물은 화학식 (11a)의 화합물(칸나비크로멘산(CBCA)), CBCVA, 또는 C7 알킬(헵틸) 기로서 R을 갖는 화학식 (8)의 화합물이다. CBCAS는 칸나비게롤산(CBGA)을 기질로서 사용할 수 있다. 일부 구현예에서, CBCAS는 칸나비게롤산(CBGA)으로부터 칸나비크로멘산(CBCA)을 생성한다. 일부 구현예에서, CBCAS는 칸나비게로바린산(CBVGA)과 같은 3-게라닐-2,4-디하이드로-6-알킬벤조산과 같은 다른 기질, 또는 C7 알킬 (헵틸) 기로서 R을 갖는 화학식 (8)의 기질의 산화적 고리화를 촉매할 수 있다. 일부 구현예에서, CBCAS는 CBGA 기질에 대한 특이성을 나타낸다.
일부 구현예에서, CBCAS는 대마초로부터 유래된다. 씨. 사티바 CBCAS는 하기와 같은 아미노산 서열을 가지며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:
일부 구현예에서, CBCAS는 하기에 나타낸 서열을 포함한다:
다른 구현예에서, CBCAS는 미국 특허 번호 9359625에 기재된 CBCAS일 수 있으며 상기 특허는 참조로 포함된다.
일부 구현예에서, CBCAS는 Uniprot KB 수탁 번호: I1V0C5에 상응하는 THCAS와 같은 THCAS 활성도 나타내는 씨. 사티바 효소일 수 있다. 일부 구현예에서, CBCAS는 서열번호 20-24 중 어느 하나에 상응하는 씨. 사티바 THCAS일 수 있다.
실시예 섹션에 기재된 바와 같이, 놀랍게도 에이. 니제르(곰팡이)로부터의 효소와 같은 아스페르길루스 과의 효소를 포함하는 다수의 진균 효소가 화학식 (8)의 화합물의 전환을 촉매하여 화학식 (11)의 화합물을 생성하고 일부 경우에, 또한 화학식 (10)의 화합물 및/또는 화학식 (9)의 화합물을 생성할 수 있다는 것을 발견하였다. 대마초 식물은 수 세기 동안 인간의 개입을 통해 칸나비노이드를 생성하기 위해 인위적으로 높은 선택 압력을 받았지만 에이. 니제르 곰팡이와 같은 진균 종은 칸나비노이드 생성을 위한 선택 압력을 받지 않았다. 따라서, 특정 이론에 국한되지 않고, 본 출원에 개시된 에이. 니제르 CBCAS와 같은 진균 CBCAS는 TS의 활성 및/또는 풍부도를 변경하기 위한 조작에 유용할 수 있다(예를 들어, 생성물 프로파일, 기질 프로파일, 및/또는 TS의 동역학(예를 들어, Kcat/Vmax 및/또는 Kd) 변화). 또한 실시에 섹션에 나타낸 바와 같이, 놀랍게도 본 개시내용에서 확인된 에이. 니제르 효소와 같은 아스페르길루스 과의 효소를 포함하는 많은 진균 효소가 CBCAS 활성, CBCVAS 활성, 또는 둘 모두를 나타내는 것으로 밝혀졌다. 이들 효소 중 일부는 추가로 THCAS 활성, THCVAS 활성, CBDAS 활성 또는 이들의 조합을 나타냈다.
일부 구현예에서, 에이. 니제르로부터의 CBCAS는 하기에 나타낸 아미노산 서열을 포함한다:
에스. 세레비지아에에서의 발현을 위한 서열번호 25를 코딩하는 핵산 서열의 비제한적인 예는 다음과 같다:
일부 구현예에서, 에이. 니제르로부터의 CBCAS는 하기에 나타낸 아미노산 서열을 포함한다(UniProt 수탁 번호 A0A254UC34에 상응함):
에스. 세레비지아에에서의 발현을 위한 서열번호 27을 코딩하는 핵산 서열의 비제한적인 예는 다음과 같다:
일부 구현예에서, CBCAS는 각각 서열번호 25; MF알파2 신호 펩티드; 및 HDEL 신호 펩티드를 포함한다. 일부 구현예에서, 이러한 CBCAS는 하기에 나타낸 아미노산 서열을 포함하며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:
서열번호 29를 코딩하는 핵산 서열의 비제한적인 예를 하기에 나타내고, 여기서 신호 펩티드를 코딩하는 서열은 밑줄 치고 불드체로 표시되어 있다:
일부 구현예에서, TS는 서열번호 20-30 또는 34-173 중 하나 이상, 표 15의 서열 중 어느 하나, 또는 본 출원에 개시된 임의의 TS와, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다. 일부 구현예에서, TS는 서열번호 25, 26, 27, 28, 35, 56, 64, 85, 92, 94, 95, 105, 126, 134, 155, 162, 164, 및 165 중 하나 이상과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다. 일부 구현예에서, TS는 서열번호 25, 26, 27, 28, 35, 42, 56, 60, 64, 105, 85, 92, 94, 95, 112, 126, 130, 134, 155, 162, 164, 165 중 하나 이상과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다. 일부 구현예에서, TS는 서열번호 25, 26, 27, 28, 35, 42, 56, 60, 64, 105, 85, 89, 92, 93, 94, 95, 96, 97, 102, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172 중 하나 이상과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다.
일부 구현예에서, TS는 서열번호 20-30 또는 34-173 중 하나 이상, 표 15의 서열 중 어느 하나, 또는 본 출원에 개시된 임의의 TS와, 그 사이의 모든 값을 포함하여 최대 5%, 최대 10%, 최대 15%, 최대 20%, 최대 25%, 최대 30%, 최대 35%, 최대 40%, 최대 45%, 최대 50%, 최대 55%, 최대 60%, 최대 65%, 최대 70%, 최대 71%, 최대 72%, 최대 73%, 최대 74%, 최대 75%, 최대 76%, 최대 77%, 최대 78%, 최대 79%, 최대 80%, 최대 81%, 최대 82%, 최대 83%, 최대 84%, 최대 85%, 최대 86%, 최대 87%, 최대 88%, 최대 89%, 최대 90%, 최대 91%, 최대 92%, 최대 93%, 최대 94%, 최대 95%, 최대 96%, 최대 97%, 최대 98%, 최대 99%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, TS는 서열번호 20-30 또는 34-173 중 하나 이상, 표 15의 서열 중 어느 하나, 또는 본 출원에 개시된 임의의 TS와, 그 사이의 모든 값을 포함하여 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함한다.
일부 구현예에서, 서열번호 29와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 TS 서열은 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드를 포함한다. 일부 구현예에서, 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 TS 서열의 N-말단에 위치한다. 예를 들어, 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 메티오닌 잔기 다음에 오는 TS 서열의 위치 2에서 시작할 수 있다.
일부 구현예에서, 서열번호 29와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 TS 서열은 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드를 포함한다. 일부 구현예에서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 29와 적어도 90% 동일한 서열의 C-말단에 위치한다.
일부 구현예에서, TS는 서열번호 25, 27 또는 104-173 중 어느 하나와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하고, 여기서 서열은 하나 이상의 신호 펩티드에 연결된다. 일부 구현예에서, 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27 또는 104-173 중 어느 하나와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열의 N-말단에 연결된다. 일부 구현예에서, 서열번호 27 또는 104-173 중 어느 하나의 N-말단 메티오닌 잔기는 서열이 N-말단 신호 펩티드에 연결되는 경우 포함되지 않는다. 일부 구현예에서, 메티오닌 잔기는 N-말단 신호 펩티드(예를 들어, 서열번호 16)의 N-말단에 부가된다. 일부 구현예에서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27 또는 104-173과 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열의 카복실 말단에 연결된다.
일부 구현예에서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172 중 어느 하나와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하고, 여기서 서열은 하나 이상의 신호 펩티드에 연결된다. 일부 구현예에서, 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열의 N-말단에 연결된다. 일부 구현예에서, 서열번호 27, 105, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172 중 어느 하나의 N-말단 메티오닌 잔기는 서열이 N-말단 신호 펩티드에 연결되는 경우 포함되지 않는다. 일부 구현예에서, 메티오닌 잔기는 N-말단 신호 펩티드(예를 들어, 서열번호 16)의 N-말단에 부가된다. 일부 구현예에서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172 중 어느 하나와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열의 카복실 말단에 연결된다.
일부 구현예에서, 서열번호 21에 비해, TS는 서열번호 21의 위치 1, 2, 3, 4, 5, 6, 8, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 33, 34, 35, 37, 39, 41, 48, 49, 51, 55, 58, 60, 61, 62, 70, 72, 74, 75, 76, 81, 88, 89, 91, 94, 97, 100, 101, 102, 104, 105, 106, 108, 110, 111, 112, 113, 114, 115, 116, 117, 119, 122, 123, 125, 127, 130, 132, 133, 135, 137, 138, 139, 140, 141, 142, 145, 147, 149, 150, 164, 165, 168, 169, 172, 173, 175, 176, 177, 180, 181, 183, 184, 185, 187, 193, 201, 208, 209, 212, 214, 215, 217, 222, 225, 226, 227, 229, 231, 233, 235, 236, 238, 239, 241, 242, 243, 244, 245, 246, 247, 250, 251, 253, 254, 255, 256, 257, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 277, 278, 279, 281, 282, 283, 284, 286, 287, 288, 290, 292, 293, 294, 295, 297, 298, 299, 301, 302, 309, 310, 311, 312, 315, 317, 322, 323, 324, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 344, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 357, 361, 362, 365, 366, 368, 369, 370, 371, 372, 373, 374, 376, 377, 379, 380, 381, 382, 383, 384, 385, 386, 387, 389, 394, 396, 401, 402, 411, 412, 414, 415, 416, 418, 419, 420, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 436, 437, 439, 440, 441, 447, 448, 451, 452, 459, 461, 463, 464, 465, 467, 468, 469, 470, 471, 473, 474, 477, 484, 485, 488, 492, 496, 497, 500, 505, 511, 513, 514, 515, 516, 및/또는 517에 상응하는 잔기에서 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, TS는 서열번호 21의 위치 1, 2, 3, 4, 5, 6, 8, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 33, 34, 35, 37, 39, 41, 48, 49, 51, 55, 58, 60, 61, 62, 70, 72, 74, 75, 76, 81, 88, 89, 91, 94, 97, 100, 101, 102, 104, 105, 106, 108, 110, 111, 112, 113, 114, 115, 116, 117, 119, 122, 123, 125, 127, 130, 132, 133, 135, 137, 138, 139, 140, 141, 142, 145, 147, 149, 150, 164, 165, 168, 169, 172, 173, 175, 176, 177, 180, 181, 183, 184, 185, 187, 193, 201, 208, 209, 212, 214, 215, 217, 222, 225, 226, 227, 229, 231, 233, 235, 236, 238, 239, 241, 242, 243, 244, 245, 246, 247, 250, 251, 253, 254, 255, 256, 257, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 277, 278, 279, 281, 282, 283, 284, 286, 287, 288, 290, 292, 293, 294, 295, 297, 298, 299, 301, 302, 309, 310, 311, 312, 315, 317, 322, 323, 324, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 344, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 357, 361, 362, 365, 366, 368, 369, 370, 371, 372, 373, 374, 376, 377, 379, 380, 381, 382, 383, 384, 385, 386, 387, 389, 394, 396, 401, 402, 411, 412, 414, 415, 416, 418, 419, 420, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 436, 437, 439, 440, 441, 447, 448, 451, 452, 459, 461, 463, 464, 465, 467, 468, 469, 470, 471, 473, 474, 477, 484, 485, 488, 492, 496, 497, 500, 505, 511, 513, 514, 515, 516, 및/또는 517에 상응하는 위치에서 서열번호 25에 존재하는 아미노산 잔기를 포함한다.
실시예 1 및 3은 CBCA를 생성하는데 놀랍게도 효과적인 진균 후보 TS의 확인을 설명한다. 표 14는 CBCA 생성에 효과적인 후보 TS의 서열이 풍부한 것으로 확인된 서열 모티프의 비제한적인 예를 제공한다. 일부 구현예에서, TS는 표 14에 제공된 하기 모티프 중 하나 이상을 포함한다: KVQARSGGH(서열번호 174), RASNTQNQD[VI][FL]FA[VI]K(서열번호 176), CPTI[KR]TGGH(서열번호 181), WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184), P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186), MKHF[TNS]QFSM(서열번호 189), P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193), RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200), RT[EQ][PQ]APGLAVQYSY(서열번호 207), 및/또는 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211). 일부 구현예에서, TS는 서열번호 27의 잔기 72-80에 상응하는 잔기에 모티프 KVQARSGGH(서열번호 174)를 포함한다.
일부 구현예에서, TS는 서열번호 27의 잔기 183-197에 상응하는 잔기에 모티프 RASNTQNQD[VI][FL]FA[VI]K(서열번호 176)를 포함한다. 일부 구현예에서, 모티프 RASNTQNQD[VI][FL]FA[VI]K(서열번호 176)는 RASNTQNQDVFFAVK(서열번호 177), RASNTQNQDILFAVK(서열번호 178), RASNTQNQDILFAIK(서열번호 179), 또는 RASNTQNQDVLFAVK(서열번호 180)이다.
일부 구현예에서, TS는 서열번호 27의 잔기 141-149에 상응하는 잔기에 모티프 CPTI[KR]TGGH(서열번호 181)를 포함한다. 일부 구현예에서, 모티프 CPTI[KR]TGGH(서열번호 181)는 CPTIKTGGH(서열번호 182) 또는 CPTIRTGGH(서열번호 183)이다.
일부 구현예에서, TS는 서열번호 27의 잔기 360-383에 상응하는 잔기에 모티프 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)를 포함한다. 일부 구현예에서, 모티프 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)는 WFVTLSLEGGAINDVAEDATAYAH(서열번호 185)이다.
일부 구현예에서, TS는 서열번호 27의 잔기 400-436에 상응하는 잔기에 모티프 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)을 포함한다. 일부 구현예에서, 모티프 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 PISDTTYEFTDGLYDVLARAVPESVGHAYLGCPDPRM(서열번호 187) 또는 PISETTYEFTDGLYDVLARAVPESVGHAYLGCPDPRM(서열번호 188)이다.
일부 구현예에서, TS는 서열번호 27의 잔기 98-106에 상응하는 잔기에 모티프 MKHF[TNS]QFSM(서열번호 189)을 포함한다. 일부 구현예에서, 모티프 MKHF[TNS]QFSM(서열번호 189)은 MKHFTQFSM(서열번호 190), MKHFSQFSM(서열번호 191), 또는 MKHFNQFSM(서열번호 192)이다.
일부 구현예에서, TS는 서열번호 27의 잔기 53-65에 상응하는 잔기에 모티프 P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193)를 포함한다. 일부 구현예에서, 모티프 P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193)는 PETAEQIAGIVKC(서열번호 194), PQSADEIAAVVKC(서열번호 195), PETAAQIAGVVKC(서열번호 196), PQSAEEIAAVVKC(서열번호 197), PETAEQIAGVVKC(서열번호 198), 또는 PETAEQIAAVVKC(서열번호 199)이다.
일부 구현예에서, TS는 서열번호 27의 잔기 10-32에 상응하는 잔기에 모티프 RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200)을 포함한다. 일부 구현예에서, 모티프 RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200)은 RDCLISAVGGNAAHVAFQDQLLY(서열번호 201), RDCLISALGGNSALAVFPNELLW(서열번호 202), RDCLISALGGNSALAAFPNELLW(서열번호 203), RDCLISALGGNSALAVFPNQLLW(서열번호 204), RDCLISALGGNSALAAFPNQLLW(서열번호 205), 또는 RDCLVSALGGNSALAAFPNQLLW (서열번호 206)이다.
일부 구현예에서, TS는 서열번호 27의 잔기 212-225에 상응하는 잔기에 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)를 포함한다. 일부 구현예에서, 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)는 RTEPAPGLAVQYSY(서열번호 208), RTEQAPGLAVQYSY(서열번호 209), 또는 RTQPAPGLAVQYSY(서열번호 210)이다.
일부 구현예에서, TS는 서열번호 27의 잔기 242-259에 상응하는 잔기에 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)을 포함한다. 일부 구현예에서, 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 WQSFISAKNLTRQFYNNM(서열번호 212) 또는 WQSFISAKNLTRQFYTNM(서열번호 213)이다.
일부 구현예에서, 상기 기재된 하나 이상의 모티프는 TS의 보조인자(FAD) 결합 부위와 접촉할 수 있다. 예를 들어, 도 15에 화살표로 나타낸 KVQARSGGH(서열번호 174), CPTI[KR]TGGH(서열번호 181), 및 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 보조인자 결합 부위와 접촉할 것으로 예측되고 따라서 보조인자 결합에 영향을 미칠 수 있다. 어떠한 이론에도 국한되지 않고, 이러한 모티프는 보조인자의 산화환원 전위 조절에 관여할 수 있으며, 예를 들어, 효소 회전율(turnover)을 조절함으로써 효소 활성에 중요할 수 있다.
일부 구현예에서, 상기 기재된 하나 이상의 모티프는 TS의 활성 부위의 공동에 라인을 형성할 수 있다. 예를 들어, 도 16에 화살표로 나타낸 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 활성 부위의 공동에 라인을 형성할 것으로 예측된다. 일부 구현예에서, 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207) 및 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)는 또한 활성 부위의 공동에 라인을 형성할 수 있고 기질 결합 포켓 근처에 있을 수 있다. 어떠한 이론에도 국한되지 않고, 이러한 모티프는 기질 또는 생성물 특이성에 영향을 미칠 수 있다.
일부 구현예에서, 본 개시내용과 관련된 TS는 본 개시내용에 제공된 임의의 TS의 서열과 관련된 하나 이상의 아미노산 치환, 결실, 부가 또는 삽입을 포함한다. 일부 구현예에서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 25, 33, 35, 39, 43, 55, 57, 61, 62, 63, 71, 102, 112, 114, 122, 126, 129, 131, 161, 180, 183, 202, 256, 257, 260, 262, 280, 287, 295, 341, 353, 386, 392, 394, 398, 410, 423, 426, 446, 450, 456, 458, 466, 469, 및/또는 472에 상응하는 잔기에 아미노산 치환을 포함한다. 일부 구현예에서, 서열번호 27의 서열에 비해, TS는 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에 아미노산 치환을 포함한다.
일부 구현예에서, TS는 서열번호 27의 위치 25에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 33에 상응하는 잔기에 아미노산 D; 서열번호 27의 위치 35에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 39에 상응하는 잔기에 아미노산 F; 서열번호 27의 위치 43에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 55에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 57에 상응하는 잔기에 아미노산 Q; 서열번호 27의 위치 57에 상응하는 잔기에 아미노산 E; 서열번호 27의 위치 61에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 62에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 63에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 71에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 102에 상응하는 잔기에 아미노산 N; 서열번호 27의 위치 102에 상응하는 잔기에 아미노산 Q; 서열번호 27의 위치 102에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 112에 상응하는 잔기에 아미노산 V; 서열번호 27의 위치 112에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 114에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 122에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 122에 상응하는 잔기에 아미노산 G; 서열번호 27의 위치 122에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 122에 상응하는 잔기에 아미노산 E; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 R; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 K; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 D; 서열번호 27의 위치 129에 상응하는 잔기에 아미노산 W; 서열번호 27의 위치 131에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 161에 상응하는 잔기에 아미노산 K; 서열번호 27의 위치 180에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 183에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 202에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 202에 상응하는 잔기에 아미노산 G; 서열번호 27의 위치 202에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 256에 상응하는 잔기에 아미노산 F; 서열번호 27의 위치 256에 상응하는 잔기에 아미노산 M; 서열번호 27의 위치 257에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 260에 상응하는 잔기에 아미노산 M; 서열번호 27의 위치 260에 상응하는 잔기에 아미노산 F; 서열번호 27의 위치 262에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 280에 상응하는 잔기에 아미노산 N; 서열번호 27의 위치 287에 상응하는 잔기에 아미노산 R; 서열번호 27의 위치 295에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 341에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 353에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 386에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 392에 상응하는 잔기에 아미노산 H; 서열번호 27의 위치 394에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에 아미노산 F; 서열번호 27의 위치 398에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 398에 상응하는 잔기에 아미노산 L; 서열번호 27의 위치 410에 상응하는 잔기에 아미노산 N; 서열번호 27의 위치 423에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 426에 상응하는 잔기에 아미노산 Y; 서열번호 27의 위치 446에 상응하는 잔기에 아미노산 P; 서열번호 27의 위치 450에 상응하는 잔기에 아미노산 K; 서열번호 27의 위치 456에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 458에 상응하는 잔기에 아미노산 W; 서열번호 27의 위치 466에 상응하는 잔기에 아미노산 N; 서열번호 27의 위치 469에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 472에 상응하는 잔기에 아미노산 R; 서열번호 27의 위치 472에 상응하는 잔기에 아미노산 A; 및/또는 서열번호 27의 위치 450에 상응하는 잔기에 아미노산 K를 포함한다.
일부 구현예에서, TS는 서열번호 27에 비해 하기 아미노산 치환: V25A; T33D; D35A Y39F; L43I; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; T102N; T102Q; T102S; E112V; E112T; V114T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; Q161K; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; F262I; D280N; H287R; N295S; A341S; H353A; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; T446P; R450K; E456A; L458W; H466N; G469S; P472R; P472A; 및/또는 R450K 중 하나 이상을 포함한다.
모두 큰 소수성 아미노산인 서열번호 27의 잔기 Y256, L392, 및 M394는 활성 부위 내에 위치할 것으로 예측된다. 어떠한 이론에도 국한되지 않고, 이러한 위치에서의 돌연변이는 CBDA 합성을 입체적으로 방지하는 방식으로 CBGA의 폴딩을 물리적으로 차단함으로써 적어도 부분적으로 생성물 프로파일을 CBCA 쪽으로 그리고 CBDA로부터 멀리 이동할 수 있다.
일부 구현예에서, 하나 이상의 아미노산 치환은 이러한 치환이 없는 TS와 비교하여 화학식 (11)의 화합물, CBCA, CBCVA 또는 이들의 조합에 대한 특이성과 같은 TS의 생성물 특이성을 증가시킨다. 일부 구현예에서, 하나 이상의 아미노산 치환은 A57Q 및 G61A; V260M; V62I; V386A; V260F; E112V 및 N122S; A57E 및 I126A; T33D 및 N257S; N202S 및 P472A; D410N; R450K; S180T; R183T; N122G 및 I126R; N122A 및 I126T; Y71I; H287R 및 A341S; T55S 및 I126T; N122G 및 V398F; M394T; A57E; N131S; V63I; N122G 및 I126R; P472R; S180T; V398A; R183T; V260M; V386A; H426Y; Y256M; N202S 및 P472A; N122G 및 I126K; V62I; R450K; Y129W; S423A; H287R 및 A341S; N295S; Y39F; V260F; L392H; A57E 및 N131S; E112V 및 N122S; T33D 및 N257S를 포함한다.
일부 구현예에서, 하나 이상의 아미노산 치환은 A57Q 및 G61A; Y71I; 및/또는 V260F를 포함한다.
표 3: 증가된 CBCA 역가를 나타내는 에이. 니제르 CBCAS의 돌연변이
추가 칸나비노이드 경로 효소
칸나비노이드 및 칸나비노이드 전구체의 생성 방법은 아실 활성화 효소(AAE); 폴리케타이드 신타제(PKS) (예를 들어, OLS); 폴리케타이드 사이클라제(PKC); 및 프레닐트랜스퍼라제(PT) 중 하나 이상의 발현을 추가로 포함할 수 있다.
아실 활성화 효소(AAE)
본 개시내용에 기재된 숙주 세포는 AAE를 포함할 수 있다. 본 개시내용에서 사용된 바와 같이, AAE는 티올과, 카복실산 모이어티를 갖는 기질(예를 들어, 임의로 치환된 지방족 또는 아릴 기) 사이의 에스테르화를 촉매할 수 있는 효소를 지칭한다. 일부 구현예에서, AAE는 하기 화학식 (1):
또는 이의 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체를 사용하여 화학식 (2)의 생성물을 생성할 수 있다:
R은 본 출원에서 정의된 바와 같다. 특정 구현예에서, R은 수소이다. 특정 구현예에서, R은 임의로 치환된 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-40 알킬이다. 특정 구현예에서, R은 임의로 치환된 C2-40 알킬이다. 특정 구현예에서, R은 직쇄 또는 분지형 알킬인 임의로 치환된 C2-40 알킬이다. 특정 구현예에서, R은 직쇄 또는 분지형 알킬인 임의로 치환된 C2-10 알킬, 임의로 치환된 C10-C20 알킬, 임의로 치환된 C20-C30 알킬, 임의로 치환된 C30-C40 알킬, 또는 임의로 치환된 C40-C50 알킬이다. 특정 구현예에서, R은 임의로 치환된 C3-8 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C40 알킬, C1-C20 알킬, C1-C10 알킬, C1-C8 알킬, C1-C5 알킬, C3-C5 알킬, C3 알킬, 또는 C5 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C20 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C20 분지형 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C20 알킬, 임의로 치환된 C1-C10 알킬, 임의로 치환된 C10-C20 알킬, 임의로 치환된 C20-C30 알킬, 임의로 치환된 C30-C40 알킬, 또는 임의로 치환된 C40-C50 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C10 알킬이다. 특정 구현예에서, R은 임의로 치환된 C3 알킬이다. 특정 구현예에서, R은 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 비치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 C1-C8 알킬이다. 일부 구현예에서, R은 C2-C6 알킬이다. 특정 구현예에서, R은 임의로 치환된 C1-C5 알킬이다. 특정 구현예에서, R은 임의로 치환된 C3-C5 알킬이다. 특정 구현예에서, R은 임의로 치환된 C3 알킬이다. 특정 구현예에서, R은 임의로 치환된 C5 알킬이다. 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 임의로 치환된 프로필이다. 특정 구현예에서, R은 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 부틸이다. 특정 구현예에서, R은 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 펜틸이다. 특정 구현예에서, R은 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 헥실이다. 특정 구현예에서, R은 임의로 치환된 n-헥실이다. 특정 구현예에서, R은 임의로 치환된 n-헵틸이다. 특정 구현예에서, R은 임의로 치환된 n-옥틸이다. 특정 구현예에서, R은 아릴(예를 들어, 페닐)로 임의로 치환된 알킬이다. 특정 구현예에서, R은 임의로 치환된 아실(예를 들어, -C(=O)Me)이다.
특정 구현예에서, R은 임의로 치환된 알케닐(예를 들어, 치환된 또는 비치환된 C2-6 알케닐)이다. 특정 구현예에서, R은 치환된 또는 비치환된 C2-6 알케닐이다. 특정 구현예에서, R은 치환된 또는 비치환된 C2-5 알케닐이다. 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 임의로 치환된 알키닐(예를 들어, 치환된 또는 비치환된 C2-6 알키닐)이다. 특정 구현예에서, R은 치환된 또는 비치환된 C2-6 알키닐이다. 특정 구현예에서, R은 하기 화학식이다: 특정 구현예에서, R은 임의로 치환된 카보사이클릴이다. 특정 구현예에서, R은 임의로 치환된 아릴(예를 들어, 페닐 또는 나프틸)이다.
일부 구현예에서, AAE에 대한 기질은 숙주 세포 내 지방산 대사에 의해 생성된다. 일부 구현예에서, AAE에 대한 기질은 외인성으로 제공된다.
일부 구현예에서, AAE는 헥산산과 조효소 A(CoA)로부터 헥사노일-조효소 A(헥사노일-CoA)의 형성을 촉매할 수 있다. 일부 구현예에서, AAE는 부탄산과 조효소 A(CoA)로부터 부타노일-조효소 A(부타노일-CoA)의 형성을 촉매할 수 있다.
당업자가 이해할 수 있는 바와 같이, AAE는 자연 발생 공급원 및 합성 공급원(예를 들어, 비-자연 발생 AAE)을 포함하는 임의의 공급원으로부터 얻어질 수 있다. 일부 구현예에서, AAE는 대마초 효소이다. AAE의 비제한적인 예는 미국 특허 번호 9,546,362호에 개시된 바와 같은 씨. 사티바 헥사노일-CoA 신타제 1(CsHCS1) 및 씨. 사티바 헥사노일-CoA 신타제 2(CsHCS2)를 포함하며, 상기 특허는 그 전체가 본 출원에 참조로 포함된다.
CsHCS1은 하기 서열을 갖는다:
CsHCS2는 하기 서열을 갖는다:
폴리케타이드 신타제(PKS)
본 출원에 기재된 숙주 세포는 PKS를 포함할 수 있다. 본 출원에 사용된 바와 같이, "PKS"는 폴리케타이드를 생성할 수 있는 효소를 지칭한다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (4), (5), 및/또는 (6)의 화합물로 전환시킨다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (4)의 화합물로 전환시킨다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (5)의 화합물로 전환시킨다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (4) 및/또는 (5)의 화합물로 전환시킨다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (5) 및/또는 (6)의 화합물로 전환시킨다.
일부 구현예에서, PKS는 테트라케타이드 신타제(TKS)이다. 특정 구현예에서, PKS는 올리베톨 신타제(OLS)이다. 본 출원에 사용된 바와 같이, "OLS"는 도 1에 나타낸 바와 같이 화학식 (2a)의 기질을 사용하여 화학식 (4a), (5a) 또는 (6a)의 화합물을 형성할 수 있는 효소를 지칭한다.
특정 구현예에서, PKS는 디바린산 신타제(DVS)이다.
특정 구현예에서, 폴리케타이드 신타제는 헥사노일-CoA 또는 임의의 아실-CoA 또는 하기 화학식 (2)의 생성물:
및 3개의 말로닐-CoA를 기질로서 사용하여 기질에 따라 3,5,7-트리옥소도데카노일-CoA 또는 기타 3,5,7-트리옥소-아실-CoA 유도체를 형성할 수 있거나; 하기 화학식 (4)의 화합물을 형성할 수 있다:
상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다. R은 본 출원에 정의된 바와 같다. 일부 구현예에서, R은 C2-C6 임의로 치환된 알킬이다. 일부 구현예에서, R은 프로필 또는 펜틸이다. 일부 구현예에서, R은 펜틸이다. 일부 구현예에서, R은 프로필이다. PKS는 또한 이소발레릴-CoA, 옥타노일-CoA, 헥사노일-CoA, 및 부티릴-CoA에 결합할 수 있다. 일부 구현예에서, PKS는 3,5,7-트리옥소알카노일-CoA(예를 들어, 3,5,7-트리옥소도데카노일-CoA)의 형성을 촉매할 수 있다. 일부 구현예에서, OLS는 3,5,7-트리옥소알카노일-CoA(예를 들어, 3,5,7-트리옥소도데카노일-CoA)의 형성을 촉매할 수 있다.
일부 구현예에서, PKS는 화학식 (2)의 기질을 사용하여 하기 화학식 (4)의 화합물을 형성한다:
상기 식에서, R은 비치환된 펜틸이다.
당업자는 OLS와 같은 PKS가 자연 발생 공급원 및 합성 공급원(예를 들어, 비-자연 발생 PKS)을 포함하는 임의의 공급원으로부터 얻어질 수 있음을 인식할 것이다. 일부 구현예에서, PKS는 대마초로부터 유래된다. 일부 구현예에서, PKS는 딕티오스텔리움(Dictyostelium)으로부터 유래된다. PKS 효소의 비제한적인 예는 US 6,265,633; WO 2018/148848 A1; WO 2018/148849 A1; 및 US 2018/155748에서 찾을 수 있으며, 상기 특허들은 그 전체가 본 출원에 참조로 포함된다.
OLS의 비제한적인 예는 씨. 사티바로부터 UniProtKB - B1Q2B6에 의해 제공된다. 씨. 사티바에서, 이 OLS는 헥사노일-CoA 및 말로닐-CoA를 기질로서 사용하여 3,5,7-트리옥소도데카노일-CoA를 형성한다. OLS(예를 들어, UniProtKB - B1Q2B6)는 올리베톨산 사이클라제(OAC)와 조합하여 씨. 사티바에서 올리베톨산(OA)을 형성한다.
UniProtKB - B1Q2B6의 아미노산 서열은 다음과 같다:
본 출원에 기재된 PKS 효소는 사이클라제 활성을 가질 수도 있고 갖지 않을 수도 있다. PKS 효소가 사이클라제 활성을 갖지 않는 일부 구현예에서, 폴리케타이드 사이클라제(PKC) 효소를 코딩하는 하나 이상의 외인성 폴리뉴클레오티드는 또한 헥산산 또는 부티르산의 전환 또는 올리베톨산 또는 디바리놀산 또는 칸나비노이드의 다른 전구체로의 다른 지방산 전환을 가능하게 하기 위해 동일한 숙주 세포에서 공동 발현될 수 있다. 일부 구현예에서, PKS 효소 및 PKC 효소는 별도의 개별 효소로서 발현된다. 일부 구현예에서, 사이클라제 활성이 결핍된 PKS 효소 및 PKC는 이기능성 PKS인 융합 폴리펩티드의 일부로서 연결된다. 일부 구현예에서, 이기능성 PKC는 이기능성 PKS-PKC로 지칭된다. 일부 구현예에서, 이기능성 PKC는 이기능성 테트라케타이드 신타제(TKS-TKC)이다. 본 출원에 사용된 바와 같이, 이기능성 PKS는 하기 화학식 (2)의 화합물:
및 하기 화학식 (3)의 화합물:
로부터 화학식 (6)의 화합물을 생성할 수 있는 효소이다:
일부 구현예에서, PKS는 하기 화학식 (5)의 화합물:
과 비교하여 하기 화학식 (6)의 화합물을 더 많이 생성한다:
비제한적인 예로서, 하기 화학식 (6)의 화합물:
은 하기 올리베톨산(화학식 (6a))이다:
비제한적인 예로서, 하기 화학식 (5)의 화합물:
은 하기 올리베톨(화학식 (5a))이다:
일부 구현예에서, 본 개시내용의 폴리케타이드 신타제는 하기 화학식 (2)의 화합물:
및 하기 화학식 (3)의 화합물:
을 촉매하여 하기 화학식 (4)의 화합물:
을 생성할 수 있고, 또한 화학식 (4)의 화합물:
을 추가로 촉매하여 하기 화학식 (6)의 화합물:
을 생성할 수 있다.
일부 구현예에서, PKS는 융합 단백질이 아니다. 일부 구현예에서, 하기 화학식 (2)의 화합물:
및 하기 화학식 (3)의 화합물:
을 촉매하여 하기 화학식 (4)의 화합물:
을 형성할 수 있고, 또한 하기 화학식 (4)의 화합물:
로부터 하기 화학식 (6)의 화합물의 화합물:
의 생성물을 추가로 촉매할 수 있는 PKS가 바람직한데, 이는 하기 화학식 (6)의 화합물을 생성하기 위해 추가의 폴리케타이드 사이클라제가 필요하지 않기 때문이다:
일부 구현예에서, 이기능성 PKS인 이러한 효소는 폴리케타이드 사이클라제의 추가와 함께 필요한 수송 고려사항을 제거하며, 이에 의해 PKS의 생성물인 화학식 (4)의 화합물은 기질로 사용하기 위해 PKS로 수송되어 화학식 (6)의 화합물로 전환되어야 한다.
일부 구현예에서, PKS는 하기 화학식 (2a)의 화합물:
및 하기 화학식 (3a):
의 존재 하에 올리베톨산을 생성할 수 있다.
일부 구현예에서, OLS는 하기 화학식 (2a)의 화합물:
및 하기 화학식 (3a):
의 존재 하에 올리베톨산을 생성할 수 있다.
폴리케타이드 사이클라제(PKC)
본 개시내용에 기재된 숙주 세포는 PKC를 포함할 수 있다. 본 출원에 사용된 바와 같이, "PKC"는 폴리케타이드를 고리화할 수 있는 효소를 지칭한다.
특정 구현예에서, 폴리케타이드 사이클라제(PKC)는 옥소 지방 아실-CoA(예를 들어, 화학식 (4)의 화합물:
또는 3,5,7-트리옥소도데카노일-COA, 3,5,7-트리옥소데카노일-COA)의 상응하는 분자내 고리화 생성물(예를 들어, 올리베톨산 및 디바린산을 포함하는 화학식 (6)의 화합물)로의 고리화를 촉매한다. 일부 구현예에서, PKC는 PKS의 존재 하에 발생하는 화합물의 형성을 촉매한다. PKC 기질은 트리옥소알칸올-CoA, 예컨대 3,5,7-트리옥소도데카노일-CoA, 또는 하기 화학식 (4)의 화합물을 포함한다:
상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다. 특정 구현예에서, PKC는 하기 화학식 (4)의 화합물:
(상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다)을 촉매하여; 기질로서 하기 화학식 (6)의 화합물을 형성한다:
상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다. R은 본 출원에서 정의된 바와 같다. 일부 구현예에서, R은 C2-C6 임의로 치환된 알킬이다. 일부 구현예에서, R은 프로필 또는 펜틸이다. 일부 구현예에서, R은 펜틸이다. 일부 구현예에서, R은 프로필이다. 특정 구현예에서, PKC는 올리베톨산 사이클라제(OAC)이다. 특정 구현예에서, PKC는 디바린산 사이클라제(DAC)이다.
당업자는 PKC가 자연 발생 공급원 및 합성 공급원(예를 들어, 비-자연 발생 PKC)을 포함하는 임의의 공급원으로부터 얻어질 수 있음을 인식할 것이다. 일부 구현예에서, PKC는 대마초로부터 유래된다. PKC의 비제한적인 예는 미국 특허 번호 9,611,460; US 10,059,971; 및 미국 특허 번호 2019/0169661에 개시된 것들을 포함하며, 상기 특허들은 그 전체가 본 출원에 참조로 포함된다.
일부 구현예에서, PKC는 OAC이다. 본 출원에 사용된 바와 같이, "OAC"는 올리베톨산(OA)의 형성을 촉매할 수 있는 효소를 지칭한다. 일부 구현예에서, OAC는 하기 화학식 (4a)의 기질(3,5,7-트리옥소도데카노일-CoA):
을 사용하여 하기 화학식 (6a)의 화합물(올리베톨산):
을 형성할 수 있는 효소이다.
씨. 사티바로부터의 올리베톨산 사이클라제(CsOAC)는 올리베톨 신타제의 테트라케타이드 생성물(도 4 구조 4a)의 비-데카복실화 고리화를 알돌 축합을 통해 수행하여 올리베톨산(도 4 구조 6a)을 형성하는 101 아미노산 효소이다. CsOAC는 전사체 마이닝을 통해 Gagne 등(PNAS 2012)에 의해 확인되고 특성화되었으며 그 고리화 기능은 CsOAC가 씨. 사티바에서 올리베톨산의 형성에 필요하다는 것을 입증하기 위해 시험관내에서 재점검하였다. 효소의 결정 구조는 Yang 등(FEBS J. 2016 Mar;283(6):1088-106)에 의해 발표되었는데, 이것은 효소가 동종이량체이고 단백질 폴딩의 α+β 배럴(DABB) 슈퍼패밀리에 속한다는 것을 밝혀냈다. CsOAC는 유일하게 알려진 식물 폴리케타이드 사이클라제이다. 폴리케타이드 신타제와 고리화 기능 둘 모두를 수행하는 다수의 진균 유형 III 폴리케타이드 신타제가 확인되었다(Funa et al., J Biol Chem. 2007 May 11;282(19):14476-81); 그러나, 식물에서 그러한 이중 기능 효소는 아직 발견되지 않았다.
씨. 사티바에서 OAC의 아미노산 서열의 비제한적인 예는 3,5,7-트리옥소도데카노일-CoA로부터 올리베톨산(OA)의 형성을 촉매하는 UniProtKB - I6WU39(서열 번호 1)에 의해 제공된다.
UniProtKB - I6WU39의 서열(서열번호 1)은 다음과 같다:
씨. 사티바 OAC를 코딩하는 핵산 서열의 비제한적인 예는 다음과 같다:
프레닐트랜스퍼라제(PT)
본 출원에 기재된 숙주 세포는 프레닐트랜스퍼라제(PT)를 포함할 수 있다. 본 출원에 사용된 바와 같이, "PT"는 프레닐 기를 수용체 분자 기질로 전달할 수 있는 효소를 지칭한다. 프레닐트랜스퍼라제의 비제한적인 예는 PCT 공개 번호 WO2018200888(예를 들어, CsPT4), 미국 특허 번호 8,884,100(예를 들어, CsPT1); 캐나다 특허 번호 CA2718469; 문헌(Valliere et al., Nat Commun. 2019 Feb 4;10(1):565; 및 Luo et al., Nature 2019 Mar;567(7746):123-126)에 기재되어 있으며, 이들은 그 전체가 참조로 포함된다. 일부 구현예에서, PT는 칸나비게롤산(CBGA), 칸나비게로바린산(CBGVA), 또는 기타 칸나비노이드 또는 칸나비노이드 유사 물질을 생성할 수 있다. 일부 구현예에서, PT는 칸나비게롤산 신타제(CBGAS)이다. 일부 구현예에서, PT는 칸나비게로바린산 신타제(CBGVAS)이다.
일부 구현예에서, PT는 NphB 프레닐트랜스퍼라제이다. 예를 들어, 미국 특허 번호 7544498; 및 문헌(Kumano et al., Bioorg Med Chem. 2008 Sep 1; 16(17): 8117-8126)을 참조하고, 이들은 그 전체가 본 출원에 참조로 포함된다. 일부 구현예에서, PT는 스트렙토마이세스 종(Streptomyces sp.)으로부터의 NphB에 상응한다(예를 들어, UniprotKB 수탁 번호 Q4R2T2 참조; 또한 미국 특허 7,361,483의 서열번호 2 참조). UniprotKB 수탁 번호 Q4R2T2에 상응하는 단백질 서열은 서열번호 8에 의해 제공된다:
NphB를 코딩하는 핵산 서열의 비제한적인 예는 다음과 같다:
다른 구현예에서, PT는 미국 특허 번호 8,884,100에서 서열번호 2로서 개시되어 있는 CsPT1에 상응한다(씨. 사티바; 본 출원의 서열 번호 10에 상응함):
일부 구현예에서, PT는 PCT 공개 번호 WO2019071000에서 서열번호 1로 개시되어 있는 CsPT4에 상응하며 이는 본 출원에서 서열번호 11에 상응한다:
일부 구현예에서, PT는 서열번호 12로 제공되는 절단된 CsPT4에 상응한다:
에스. 세레비지아에에서 이원체(paralog) 씨. 사티바 CBGAS 효소의 기능적 발현 및 주요 칸나비노이드 CBGA의 생성이 보고되었다(미국 특허 공개 2012/0144523, 및 Luo et al. Nature, 2019 Mar;567(7746):123-126). Luo 등은 천연 신호 펩티드가 제거된 씨. 사티바 CBGAS, CsPT4의 절단된 버전을 발현함으로써 에스. 세레비지아에에서 CBGA의 생성을 보고하였다. 특정 이론에 국한되지 않고, 씨. 사티바 CBGAS 효소의 내재-막(integral-membrane) 성질은 이종 숙주에서 씨. 사티바 CBGAS 효소의 기능적 발현을 어렵게 만들 수 있다. 막관통 도메인(들) 또는 신호 서열의 제거 또는 막과 연관되지 않고 내재 막 단백질이 아닌 프레닐트랜스퍼라제의 사용은 예를 들어, 세포 세포질 및/또는 국소화를 부여하는 펩티드를 사용하여 표적화될 수 있는 세포소기관에서 효소와 이용 가능한 기질 사이의 증가된 상호작용을 촉진할 수 있다.
일부 구현예에서, PT는 가용성 PT이다. 일부 구현예에서, PT는 세포질 PT이다. 일부 구현예에서, PT는 분비된 단백질이다. 일부 구현예에서, PT는 막-연관된 단백질이 아니다. 일부 구현예에서, PT는 내재 막 단백질이 아니다. 일부 구현예에서, PT는 막관통 도메인 또는 예측된 막관통을 포함하지 않는다. 일부 구현예에서, PT는 주로 세포질에서 검출될 수 있다(예를 들어, 세포막과 관련하여 검출된 것보다 더 큰 정도로 세포질에서 검출됨). 일부 구현예에서, PT는 하나 이상의 막관통 도메인이 제거 및/또는 돌연변이되어(예를 들어, 절단, 결실, 치환, 삽입, 및/또는 부가에 의해) PT가 숙주 세포의 세포질, 또는 숙주 세포 내의 세포질 세포소기관, 또는 박테리아 숙주의 경우 원형질막공간에 위치하거나 위치할 것으로 예상되는 단백질이다. 일부 구현예에서, PT는 하나 이상의 막관통 도메인이 제거되거나 돌연변이되어(예를 들어, 절단, 결실, 치환, 삽입 및/또는 부가에 의해) 막 국소화와 비교하여 PT가 숙주 세포의 세포질, 세포소기관 또는 원형질막공간으로의 국소화를 증가시킨다.
용어 "막관통 도메인"의 범위 내에는 경험적으로 결정된 막관통 도메인 이외에 예측되거나 추정되는 막관통 도메인이 있다. 일반적으로, 막관통 도메인은 세포막으로의 통합을 촉진하는 소수성 영역을 특징으로 한다. 단백질이 막 단백질인지 또는 막-연관된 단백질인지를 예측하는 방법은 당업계에 공지되어 있으며, 예를 들어, 아미노산 서열 분석, 친수도 플롯(hydropathy plot) 및/또는 단백질 국소화 검정을 포함할 수 있다.
일부 구현예에서, PT는 신호 서열이 제거 및/또는 돌연변이되어 PT가 세포 분비 경로로 향하지 않는 단백질이다. 일부 구현예에서, PT는 신호 서열이 제거 및/또는 돌연변이되어 PT가 세포질로 국한되거나 세포질로 국소화가 증가된 단백질이다(예를 들어, 분비 경로와 비교하여).
일부 구현예에서, PT는 분비된 단백질이다. 일부 구현예에서, PT는 신호 서열을 포함한다.
일부 구현예에서, PT는 융합 단백질이다. 예를 들어, PT는 숙주 세포의 대사 경로에서 하나 이상의 유전자에 융합될 수 있다. 특정 구현예에서, PT는 숙주 세포의 대사 경로에서 하나 이상의 유전자의 돌연변이 형태에 융합될 수 있다.
일부 구현예에서, 본 출원에 기재된 PT는 하기에 나타낸 화학식 (6)의 화합물에서 하나 이상의 프레닐 기를 위치 1, 2, 3, 4, 또는 5 중 어느 하나로 전달한다:
일부 구현예에서, PT는 하기에 나타낸 화학식 (6)의 화합물에서 프레닐 기를 위치 1, 2, 3, 4, 또는 5 중 어느 하나로 전달하여:
화학식 (8w), 화학식 (8x), 화학식 (8'), 화학식 (8y), 화학식 (8z) 중 어느 하나의 화합물 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 형성한다:
상기 식에서, a는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이다.
변이체
본 개시내용의 양태는 본 출원에 기재된 임의의 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS)를 코딩하는 핵산에 관한 것이다. 일부 구현예에서, 본 개시내용에 포함되는 핵산은 AAE, PKS, PKC, PT, 또는 TS를 코딩하는 핵산에 높은 또는 중간 엄격성(stringency) 조건 하에 혼성화하고 생물학적으로 활성인 핵산이다. 예를 들어, 65℃에서 0.2 내지 1 x SSC의 높은 엄격성 조건에 이어 65℃에서 0.2 x SSC로 세척할 수 있다. 일부 구현예에서, 본 개시내용에 포함되는 핵산은 낮은 엄격성 조건 하에 AAE, PKS, PKC, PT, 또는 TS를 코딩하는 핵산에 혼성화하고 생물학적으로 활성인 핵산이다. 예를 들어, 실온에서 6 x SSC의 낮은 엄격성 조건에 이어 실온에서 2 x SSC로 세척할 수 있다. 다른 혼성화 조건은 40 또는 50℃에서 3 x SSC에 이어 20, 30, 40, 50, 60 또는 65℃에서 1 또는 2 x SSC에서 세척을 포함한다.
혼성화는 포름알데히드, 예를 들어, 10%, 20%, 30% 40% 또는 50%의 존재 하에 수행될 수 있으며, 이는 혼성화의 엄격성을 추가로 증가시킨다. 핵산 혼성화의 이론 및 실제는, 예를 들어, 문헌(S. Agrawal (ed.) Methods in Molecular Biology, volume 20; and Tijssen (1993) Laboratory Techniques in biochemistry and molecular biology-hybridization with nucleic acid probes, e.g., part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays," Elsevier, New York provide a basic guide to nucleic acid hybridization)에 기재되어 있다.
본 출원에 기재된 효소 서열의 변이체(예를 들어, 핵산 또는 아미노산 서열을 포함하는 AAE, PKS, PKC, PT, 또는 TS)도 본 개시내용에 포함된다. 변이체는 참조 서열과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 100% 서열 동일성을 공유할 수 있다.
달리 언급되지 않는 한, 당업계에 공지된 바와 같이, 용어 "동일성 백분율"과 본 개시내용에서 상호교환적으로 사용되는 용어 "서열 동일성"은 서열 비교(정렬)에 의해 결정된 바와 같은 2개의 폴리펩티드 또는 폴리뉴클레오티드의 서열 사이의 관계를 지칭한다. 일부 구현예에서, 서열 동일성은 서열(예를 들어, AAE, PKS, PKC, PT, 또는 TS 서열)의 전장에 걸쳐 결정된다. 일부 구현예에서, 서열 동일성은 서열(예를 들어, AAE, PKS, PKC, PT, 또는 TS 서열)의 영역(예를 들어, 아미노산 또는 핵산의 스트레치, 예를 들어, 활성 부위를 포괄하는 서열)에 걸쳐 결정된다. 예를 들어, 일부 구현예에서, 서열 동일성은 참조 서열 길이의 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 100% 초과에 상응하는 영역에 걸쳐 결정된다.
동일성은 특정 수학적 모델, 알고리즘 또는 컴퓨터 프로그램에 의해 해결된 (만약 있다면) 갭 정렬에 의한 둘 이상의 서열 중 더 작은 것 사이의 동일한 일치 백분율을 측정한다.
관련된 폴리펩티드 또는 핵산 서열의 동일성은 당업자에게 공지된 임의 방법으로 쉽게 계산될 수 있다. 2개 서열(예를 들어, 핵산 또는 아미노산 서열)의 동일성 백분율은, 예를 들어, 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993)에서와 같이 변형된, 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990)의 알고리즘을 사용하여 결정될 수 있다. 이러한 알고리즘은 문헌(Altschul et al., J. Mol. Biol. 215:403-10, 1990)의 NBLAST® 및 XBLAST® 프로그램(버전 2.0)에 통합된다. BLAST® 단백질 검색은 본 출원에 기재된 단백질에 상동성인 아미노산 서열을 수득하기 위해서, 예를 들어, XBLAST 프로그램, 점수 = 50, 단어길이 = 3을 사용하여 수행될 수 있다. 2개 서열 간에 갭이 존재하는 경우, Gapped BLAST®는 예를 들어, 문헌(Altschul et al., Nucleic Acids Res. 25(17):3389-3402, 1997)에 기재된 바와 같이 이용될 수 있다. BLAST® 및 Gapped BLAST® 프로그램을 이용하는 경우, 각각의 프로그램(예를 들어, XBLAST® 및 NBLAST®)의 디폴트 매개변수가 사용될 수 있거나, 또는 매개변수는 당업자가 이해하게 되는 바와 같이 적절하게 조정될 수 있다.
예를 들어, 사용할 수 있는 또 다른 국소 정렬 기술은 스미스-워터만 (Smith-Waterman) 알고리즘(Smith, T.F. & Waterman, M.S. (1981) "Identification of common molecular subsequences." J. Mol. Biol. 147:195-197)을 기반으로 한다. 예를 들어, 사용할 수 있는 일반적인 전역 정렬 기술은 동적 프로그래밍을 기반으로 하는 니들만-분치(Needleman-Wunsch) 알고리즘(Needleman, S.B. & Wunsch, C.D. (1970) "A general method applicable to the search for similarities in the amino acid sequences of two proteins." J. Mol. Biol. 48:443-453)이다.
보다 최근에, 니들만-분치 알고리즘을 포함하는 다른 최적 전역 정렬 방법보다 더 빠른 핵산 및 아미노산 서열의 전역 정렬을 알려진 대로 생성하는 신속 최적 전역 서열 정렬 알고리즘(Fast Optimal Global Sequence Alignment Algorithm: FOGSAA)이 개발되었다. 일부 구현예에서, 2개 폴리펩티드의 동일성은 2개의 아미노산 서열을 정렬하고 동일한 아미노산의 수를 계산하고 아미노산 서열 중 하나의 길이로 나눔으로써 결정된다. 일부 구현예에서, 2개의 핵산의 동일성은 2개의 뉴클레오티드 서열을 정렬하고 동일한 뉴클레오티드의 수를 계산하고 핵산 중 하나의 길이로 나눔으로써 결정된다.
다중 서열 정렬을 위해, 클러스털 오메가(Clustal Omega)를 포함한 컴퓨터 프로그램(Sievers et al., Mol Syst Biol. 2011 Oct 11;7:539)이 사용될 수 있다.
바람직한 구현예에서, 핵산 또는 아미노산 서열을 포함하는 서열은 서열 동일성이 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993)에서와 같이 변형된, 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990)의 알고리즘(예를 들어, 각각의 프로그램의 디폴트 매개변수를 사용하는, BLAST®, NBLAST®, XBLAST® 또는 Gapped BLAST® 프로그램)을 사용하여 결정될 때 본 출원에 개시되고/되거나 청구범위에 인용된 서열과 같은 참조 서열과 명시된 동일성 백분율을 갖는 것으로 밝혀졌다.
일부 구현예에서, 핵산 또는 아미노산 서열을 포함하는 서열은 서열 동일성이 디폴트 매개변수를 사용하여 스미스-워터만 알고리즘(Smith, T.F. & Waterman, M.S. (1981) "Identification of common molecular subsequences." J. Mol. Biol. 147:195-197) 또는 니들만-분치 알고리즘(Needleman, S.B. & Wunsch, C.D. (1970) "A general method applicable to the search for similarities in the amino acids of two proteins." J. Mol. Biol. 48:443-453)을 사용하여 결정될 때 본 출원에 개시되고/되거나 청구범위에 인용된 서열과 같은 참조 서열과 명시된 동일성 백분율을 갖는 것으로 밝혀졌다.
일부 구현예에서, 핵산 또는 아미노산 서열을 포함하는 서열은 서열 동일성이 디폴트 매개변수를 사용한 신속 최적 전역 서열 정렬 알고리즘(FOGSAA)을 사용하여 결정될 때 본 출원에 개시되고/되거나 청구범위에 인용된 서열과 같은 참조 서열과 명시된 동일성 백분율을 갖는 것으로 밝혀졌다.
일부 구현예에서, 핵산 또는 아미노산 서열을 포함하는 서열은 서열 동일성이 디폴트 매개변수를 사용한 클러스털 오메가(Sievers et al., Mol Syst Biol. 2011 Oct 11;7:539)를 사용해 결정될 때 본 출원에 개시되고/되거나 청구범위에 인용된 서열과 같은 참조 서열과 명시된 동일성 백분율을 갖는 것으로 밝혀졌다.
본 출원에 사용된 바와 같이, 서열 "X"의 잔기(예컨대 핵산 잔기 또는 아미노산 잔기)는 서열 X 및 Y가 당업계에 공지된 아미노산 서열 정렬 도구를 사용해 정렬될 때 서열 "X"의 잔기가 서열 "Y"의 "Z"의 대응 위치에 있는 경우 상이한 서열 "Y"의 위치 또는 잔기(예컨대 핵산 잔기 또는 아미노산 잔기) "Z"에 상응하는 것으로 지칭된다.
본 출원에 사용된 바와 같이, 변이체 서열은 상동성 서열일 수 있다. 본 출원에 사용된 바와 같이, 상동성 서열은 특정 동일성 백분율(예를 들어, 그 사이의 모든 값을 포함하는 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성)를 공유하는 서열(예를 들어, 핵산 또는 아미노산 서열)이다. 상동성 서열은 파랄로그 또는 오솔로그 서열을 포함하지만, 이에 제한되지 않는다. 파랄로그 서열은 종의 게놈 내 유전자의 중복으로부터 발생되는 반면, 오솔로그 서열은 종분화 사건 이후에 분기된다.
일부 구현예에서, 폴리펩티드 변이체(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소 변이체)는 참조 폴리펩티드(예를 들어, 참조 AAE, PKS, PKC, PT, 또는 TS 효소)와 2차 구조(예를 들어, 알파 나선, 베타 시트)를 공유하는 도메인을 포함한다. 일부 구현예에서, 폴리펩티드 변이체(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소 변이체)는 참조 폴리펩티드(예를 들어, 참조 AAE, PKS, PKC, PT, 또는 TS 효소)와 3차 구조를 공유한다. 비제한적인 예로서, 폴리펩티드 변이체(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소)는 참조 폴리펩티드와 비교하여 낮은 1차 서열 동일성(예를 들어, 80% 미만, 75% 미만, 70% 미만, 65% 미만, 60% 미만, 55% 미만, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 또는 5% 미만의 서열 동일성)을 갖지만 하나 이상의 2차 구조(예를 들어, 루프, 알파 나선, 또는 베타 시트를 포함하지만 이에 제한되지 않음)를 공유하거나, 참조 폴리펩티드와 동일한 3차 구조를 가질 수 있다. 예를 들어, 루프는 베타 시트와 알파 나선 사이, 2개의 알파 나선 사이, 또는 2개의 베타 시트 사이에 위치될 수 있다. 상동성 모델링은 2개 이상의 3차 구조를 비교하는 데 사용될 수 있다.
본 출원에 개시된 재조합 AAE, PKS, PKC, PT, 또는 TS 효소의 기능적 변이체는 본 개시내용에 포함된다. 예를 들어, 기능적 변이체는 하나 이상의 동일한 기질에 결합하거나 하나 이상의 동일한 생성물을 생성할 수 있다. 기능적 변이체는 당업계에 공지된 임의의 방법을 사용하여 확인될 수 있다. 예를 들어, 상기 기재된 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990)의 알고리즘이 공지된 기능을 갖는 상동 단백질을 확인하는 데 사용될 수 있다.
추정의 기능적 변이체는 또한 기능적으로 주석이 달린 도메인을 갖는 폴리펩티드를 검색함으로써 확인될 수 있다. Pfam을 포함하는 데이터베이스(Sonnhammer et al., Proteins. 1997 Jul;28(3):405-20)를 사용하여 특정 도메인을 갖는 폴리펩티드를 확인할 수 있다.
상동성 모델링은 또한 기능에 영향을 미치지 않으면서 돌연변이(예를 들어, 치환, 결실 및/또는 삽입)될 수 있는 아미노산 잔기를 확인하는 데 사용될 수 있다. 이러한 방법의 비제한적인 예는 위치-특이적 스코어링 매트릭스(PSSM) 및 에너지 최소화 프로토콜의 사용을 포함할 수 있다.
위치-특이적 스코어링 매트릭스(PSSM)는 위치 가중치 매트릭스를 사용하여 컨센서스 서열(예컨대, 모티프)을 확인한다. PSSM은 핵산 또는 아미노산 서열에 대해 수행될 수 있다. 서열이 정렬되며 이 방법은 특정 위치에서 특정 잔기(예컨대, 아미노산 또는 뉴클레오티드)의 관찰된 빈도 및 분석된 서열 수를 고려한다. 예를 들어, 문헌(Stormo et al., Nucleic Acids Res. 1982 May 11;10(9):2997-3011)을 참조한다. 주어진 위치에서 특정 잔기를 관찰할 가능성이 계산될 수 있다. 특정 이론에 국한되지 않고, 높은 가변성을 갖는 서열의 위치는 기능적 상동체를 생성하기 위해 돌연변이(예를 들어, 치환, 결실 및/또는 삽입; 예를 들어, PSSM 점수 ≥0) 될 수 있다.
PSSM은 야생형 및 단일-점 돌연변이체 간의 차이를 결정하는 로제타(Rosetta) 에너지 함수의 계산과 쌍을 이룰 수 있다. 로제타 에너지 함수는 이 차이를 (△△G calc )로 계산한다. 로제타 함수를 사용하여, 돌연변이된 잔기와 주변 원자 간의 결합 상호작용을 사용하여 돌연변이가 단백질 안정성을 증가 또는 감소시키는지 여부를 결정한다. 예를 들어, PSSM 점수(예를 들어, PSSM 점수≥0)에 의해 유리하다고 지정된 돌연변이는 이어서 단백질 안정성에 대한 돌연변이의 잠재적 영향을 결정하기 위해서 로제타 에너지 함수를 사용해 분석될 수 있다. 특정 이론에 국한되지 않고, 잠재적으로 안정한 아미노산 돌연변이가 단백질 조작(예를 들어, 기능적 상동체의 생성)에 바람직하다. 일부 구현예에서, 잠재적으로 안정한 아미노산 돌연변이는 -0.1 미만 (예를 들어, -0.2 미만, -0.3 미만, -0.35 미만, -0.4 미만, -0.45 미만, -0.5 미만, -0.55 미만, -0.6 미만, -0.65 미만, -0.7 미만, -0.75 미만, -0.8 미만, -0.85 미만, -0.9 미만, -0.95 미만, 또는 -1.0 미만)의 로제타 에너지 단위(R.e.u.)의 △△G calc 값을 갖는다. 예를 들어, 문헌(Goldenzweig et al., Mol Cell. 2016 Jul 21;63(2):337-346. Doi: 10.1016/j.molcel.2016.06.012)을 참조한다.
일부 구현예에서, 코딩 서열은 참조 코딩 서열에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 100 초과 위치에 아미노산 돌연변이를 포함한다. 일부 구현예에서, 코딩 서열은 참조 코딩 서열에 비해 코딩 서열의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 이상의 코돈 중 아미노산 돌연변이를 포함한다. 당업자에 의해 이해되는 바와 같이, 코돈 내의 치환, 삽입 또는 결실은 유전자 코드의 축퇴성에 인해 코돈에 의해 코딩되는 아미노산을 변화시키거나 변화시키지 않을 수 있다. 일부 구현예에서, 코딩 서열의 하나 이상의 치환, 삽입, 또는 결실은 참조 폴리펩티드의 아미노산 서열에 비해 코딩 서열의 아미노산 서열을 변경시키지 않는다.
일부 구현예에서, 서열의 하나 이상의 돌연변이는 참조 폴리펩티드의 아미노산 서열에 비해 상응하는 폴리펩티드의 아미노산 서열을 변경시킨다. 일부 구현예에서, 하나 이상의 돌연변이는 참조 폴리펩티드의 아미노산 서열에 비해 폴리펩티드의 아미노산 서열을 변경시키고 참조 폴리펩티드에 비해 폴리펩티드의 활성을 변경(향상 또는 감소)시킨다.
본 출원에 기재된 임의의 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS)의 활성(예를 들어, 비활성)은 통상적인 방법을 이용하여 측정될 수 있다. 비제한적인 예로서, 재조합 폴리펩티드의 활성은 기질 특이성, 생성된 생성물(들), 생성된 생성물(들)의 농도, 또는 이들의 임의의 조합을 측정함으로써 결정될 수 있다. 본 출원에서 사용되는 바와 같이, 재조합 폴리펩티드의 "비활성"은 단위 시간당 재조합 폴리펩티드의 주어진 양(예를 들어, 농도)에 대해 생성된 특정 생성물의 양(예를 들어, 농도)을 지칭한다.
당업자는 또한 코딩 서열의 돌연변이가 상기 폴리펩티드의 기능적으로 동등한 변이체, 예를 들어, 폴리펩티드의 활성을 보유하는 변이체를 제공하기 위해 보존적 아미노산 치환을 초래할 수 있음을 인식할 것이다. 본 출원에 사용된 바와 같이, "보존적 아미노산 치환"은 아미노산 치환이 이루어지는 단백질의 상대적 전하 또는 크기 특징 또는 기능적 활성을 변경하지 않는 아미노산 치환을 지칭한다.
일부 경우에, 아미노산은 R 기에 의해 특징지어진다(예를 들어, 표 4 참조). 예를 들어, 아미노산은 비극성 지방족 R 기, 양으로 하전된 R 기, 음으로 하전된 R 기, 비극성 방향족 R 기, 또는 극성의 비하전된 R 기를 포함할 수 있다. 비극성 지방족 R 기를 포함하는 아미노산의 비제한적인 예는 알라닌, 글리신, 발린, 류신, 메티오닌, 및 이소류신을 포함한다. 양으로 하전된 R 기를 포함하는 아미노산의 비제한적인 예는 라이신, 아르기닌, 및 히스티딘을 포함한다. 음으로 하전된 R 기를 포함하는 아미노산의 비제한적인 예는 아스파르테이트 및 글루타메이트를 포함한다. 비극성 방향족 R 기를 포함하는 아미노산의 비제한적인 예는 페닐알라닌, 티로신, 및 트립토판을 포함한다. 극성의 비하전된 R 기를 포함하는 아미노산의 비제한적인 예는 세린, 트레오닌, 시스테인, 프롤린, 아스파라긴, 및 글루타민을 포함한다.
폴리펩티드의 기능적으로 동등한 변이체의 비제한적인 예는 본 출원에 개시된 단백질의 아미노산 서열에서 보존적 아미노산 치환을 포함할 수 있다. 본 출원에서 사용된 바와 같이, "보존적 치환"은 "보존적 아미노산 치환"과 상호교환적으로 사용되며, 표 4에 제공된 아미노산 치환 중 어느 하나를 지칭한다.
일부 구현예에서, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 20개 초과의 잔기가 변이체 폴리펩티드를 제조할 때 변화될 수 있다. 일부 구현예에서, 아미노산은 보존적 아미노산 치환으로 대체된다.
표 4. 보존적 아미노산 치환
원하는 특성 및/또는 활성을 갖는 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS) 변이체를 생성하기 위한 폴리펩티드의 아미노산 서열에서의 아미노산 치환은 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS)의 코딩 서열의 변경에 의해 이루어질 수 있다. 마찬가지로, 폴리펩티드의 기능적으로 동등한 변이체를 생성하기 위한 폴리펩티드의 아미노산 서열에서의 보존적 아미노산 치환은 전형적으로 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS)의 코딩 서열의 변경에 의해 이루어진다.
돌연변이(예를 들어, 치환, 삽입, 부가, 또는 결실)는 당업자에게 공지된 다양한 방법에 의해 핵산 서열에서 이루어질 수 있다. 예를 들어, 돌연변이(예를 들어, 치환, 삽입, 부가, 또는 결실)는 PCR 유도된 돌연변이, 쿤켈(Kunkel)의 방법(Kunkel, Proc. Nat. Acad. Sci. U.S.A. 82: 488-492, 1985)에 따른 부위 지정된 돌연변이유발, 폴리펩티드를 코딩하는 유전자의 화학적 합성, CRISPR, 또는 태그(예를 들어, HIS 태그 또는 GFP 태그)의 삽입과 같은 삽입에 의해 이루어질 수 있다. 돌연변이는, 예를 들어, 당업계에 공지된 임의의 방법에 의해 생성된 치환, 삽입, 부가, 결실, 및 전위를 포함할 수 있다. 돌연변이를 생성하는 방법은 문헌(Molecular Cloning: A Laboratory Manual, J. Sambrook, et al., eds., Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 2012, or Current Protocols in Molecular Biology, F.M. Ausubel, et al., eds., John Wiley & Sons, Inc., New York, 2010)과 같은 참조문헌에서 찾을 수 있다.
일부 구현예에서, 변이체를 생성하는 방법은 원형 순열을 포함한다(Yu and Lutz, Trends Biotechnol. 2011 Jan;29(1):18-25). 원형 순열에서, 폴리펩티드의 선형 1차 서열은 (예를 들어, 서열의 N-말단 및 C-말단 끝을 연결함으로써) 원형화될 수 있고, 폴리펩티드는 상이한 위치에서 절단("파단")될 수 있다. 따라서, 새로운 폴리펩티드의 선형 1차 서열은 선형 서열 정렬 방법(예를 들어, 클러스털 오메가 또는 BLAST)에 의해 결정 시 낮은 서열 동일성(예를 들어, 그 사이의 모든 값을 포함하여 80% 미만, 75% 미만, 70% 미만, 65% 미만, 60% 미만, 55% 미만, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 또는 5% 미만)을 가질 수 있다. 그러나, 2개의 단백질의 위상 분석은 2개의 폴리펩티드의 3차 구조가 유사하거나 유사하지 않다는 것을 밝힐 수 있다. 특정 이론에 국한되지 않고, 참조 폴리펩티드의 원형 순열을 통해 생성되고 참조 폴리펩티드와 유사한 3차 구조를 갖는 변이체 폴리펩티드는 유사한 기능적 특징(예를 들어, 효소 활성, 효소 동역학, 기질 특이성 또는 생성물 특이성)을 공유할 수 있다. 일부 경우에, 원형 순열은 2차 구조, 3차 구조 또는 4차 구조를 변경하고 상이한 기능적 특징(예를 들어, 증가 또는 감소된 효소 활성, 상이한 기질 특이성, 또는 상이한 생성물 특이성)을 갖는 효소를 생성할 수 있다. 예를 들어, 문헌(Yu and Lutz, Trends Biotechnol. 2011 Jan;29(1):18-25)을 참조한다.
원형 순열을 거친 단백질에서 단백질의 선형 아미노산 서열은 원형 순열을 거치지 않은 참조 단백질과 상이할 수 있음을 인식해야 한다. 그러나, 당업자는, 예를 들어, 서열을 정렬하고 보존된 모티프를 검출함으로써 및/또는 단백질의 구조 또는 예측된 구조를, 예를 들어, 상동성 모델링에 의해 비교함으로써 원형 순열을 거친 단백질의 어느 잔기가 원형 순열을 거치지 않은 참조 단백질의 잔기에 상응하는지를 쉽게 결정할 수 있을 것이다.
일부 구현예에서, 관심 서열과 본 출원에 기재된 참조 서열 사이의 동일성 백분율을 결정하는 알고리즘은 서열 사이의 원형 순열의 존재를 설명한다. 원형 순열의 존재는, 예를 들어, RASPODOM(Weiner et al., Bioinformatics. 2005 Apr 1;21(7):932-7)을 포함하는 당업계에 공지된 임의의 방법을 이용하여 검출될 수 있다. 일부 구현예에서, 원형 순열의 존재는 관심 서열과 본 출원에 기재된 서열 간의 동일성 백분율의 계산 전에 교정된다(예를 들어, 적어도 하나의 서열의 도메인이 재배열됨). 본 출원의 청구범위는 서열의 잠재적 원형 순열을 고려한 후에 참조 서열에 대한 동일성 백분율이 계산되는 서열을 포함하는 것으로 이해되어야 한다.
숙주 세포에서 핵산의 발현
본 개시내용의 양태는 재조합 효소, 이의 기능적 변형 및 변이체뿐만 아니라 이들의 용도에 관한 것이다. 예를 들어, 본 출원에 기재된 방법은 칸나비노이드 및/또는 칸나비노이드 전구체를 생성하는 데 사용될 수 있다. 상기 방법은 본 출원에 개시된 효소, 세포 용해물, 단리된 효소, 또는 이들의 임의의 조합을 포함하는 숙주 세포를 사용하는 것을 포함할 수 있다. 숙주 세포에서 본 출원에 개시된 효소를 코딩하는 유전자의 재조합 발현을 포함하는 방법이 본 개시내용에 포함된다. 반응 혼합물에서 하나 이상의 칸나비노이드 전구체 또는 칸나비노이드를 본 출원에 개시된 효소와 반응시키는 것을 포함하는 시험관내 방법이 또한 본 개시내용에 포함된다. 일부 구현예에서, 효소는 TS이다.
본 출원에 기재된 임의의 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소)를 코딩하는 핵산은 당업계에 공지된 임의의 방법을 통해 임의의 적절한 벡터에 혼입될 수 있다. 예를 들어, 벡터는 바이러스 벡터(예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, 또는 아데노 관련 바이러스 벡터), 일시적 발현에 적합한 임의의 벡터, 항상성 발현에 적합한 임의의 벡터, 또는 유도성 발현에 적합한 임의의 벡터(예를 들어, 갈락토스 유도성 또는 독시사이클린 유도성 벡터)를 포함하지만 이에 제한되지 않는 발현 벡터일 수 있다.
본 출원에 기재된 임의의 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소)를 코딩하는 벡터는 당업계에 공지된 임의의 방법을 사용하여 적합한 숙주 세포 내로 도입될 수 있다. 효모 형질전환 프로토콜의 비제한적인 예는 그 전체가 본원에 참조로 포함된 문헌(Gietz et al., Yeast transformation can be conducted by the LiAc/SS Carrier DNA/PEG method. Methods Mol Biol. 2006;313:107-20)에 기재되어 있다. 숙주 세포는 당업자에 의해 이해되는 바와 같이 적합한 임의의 조건 하에 배양될 수 있다. 예를 들어, 당업계에 공지된 임의의 배지, 온도 및 인큐베이션 조건이 사용될 수 있다. 유도성 벡터를 보유하는 숙주 세포의 경우, 세포는 발현을 촉진하기 위해 적절한 유도제와 함께 배양될 수 있다.
일부 구현예에서, 벡터는 세포에서 자율적으로 복제된다. 일부 구현예에서, 벡터는 세포 내 염색체에 통합된다. 벡터는 세포에서 복제될 수 있는 재조합 벡터를 생성하기 위해서 본 출원에 기재된 유전자를 함유하는 핵산을 삽입 및 결찰시키도록 제한 엔도뉴클레아제에 의해 절단되는 하나 이상의 엔도뉴클레아제 제한 부위를 함유할 수 있다. 벡터는 전형적으로 DNA로 구성되지만, RNA 벡터도 이용 가능하다. 클로닝 벡터는 플라스미드, 포스미드, 파지미드, 바이러스 게놈, 및 인공 염색체를 포함하지만 이에 제한되지 않는다. 본 출원에 사용된 바와 같이, 용어 "발현 벡터" 또는 "발현 작제물"은 숙주 세포(예를 들어, 미생물), 예컨대 효모 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 갖는, 재조합적으로 또는 합성적으로 생성된, 핵산 작제물을 지칭한다. 일부 구현예에서, 본 출원에 기재된 유전자의 핵산 서열은 조절 서열에 작동적으로 연결되어서, 일부 구현예에서, RNA 전사물로서 발현되도록 클로닝 벡터에 삽입된다. 일부 구현예에서, 벡터는 재조합 벡터로 형질전환되거나 형질감염된 세포를 확인하기 위해서, 본 출원에 기재된 바와 같은 선택 가능한 마커와 같은 하나 이상의 마커를 함유한다. 일부 구현예에서, 숙주 세포는 이미 하나 이상의 벡터로 형질전환되었다. 일부 구현예에서, 하나 이상의 벡터로 형질전환된 숙주 세포는 후속적으로 하나 이상의 벡터로 형질전환된다. 일부 구현예에서, 숙주 세포는 하나 초과의 벡터로 동시에 형질전환된다. 일부 구현예에서, 벡터 또는 발현 카세트로 형질전환된 세포는 벡터 또는 발현 카세트의 전부 또는 일부를 게놈에 통합한다. 일부 구현예에서, 본 출원에 기재된 유전자의 핵산 서열은 재코딩된다. 재코딩은 재코딩되지 않은 참조 서열에 비해 그 사이의 모든 값을 포함하여 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100%까지 유전자 생성물의 생성을 증가시킬 수 있다.
일부 구현예에서, 본 출원에 기재된 임의의 단백질을 코딩하는 핵산은 조절 서열(예를 들어, 인핸서 서열)의 제어 하에 있다. 일부 구현예에서, 핵산은 프로모터의 제어 하에 발현된다. 프로모터는 천연 프로모터, 예를 들어, 유전자의 발현의 정상 조절을 제공하는, 이의 내인성 환경에서의 유전자의 프로모터일 수 있다. 대안적으로, 프로모터는 유전자의 천연 프로모터와 상이한 프로모터일 수 있고, 예를 들어, 프로모터는 이의 내인성 상황에서의 유전자의 프로모터와 상이하다.
일부 구현예에서, 프로모터는 진핵생물 프로모터이다. 진핵생물 프로모터의 비제한적인 예는 당업자에게 공지된 바와 같은 TDH3, PGK1, PKC1, PDC1, TEF1, TEF2, RPL18B, SSA1, TDH2, PYK1, TPI1, GAL1, GAL10, GAL7, GAL3, GAL2, MET3, MET25, HXT3, HXT7, ACT1, ADH1, ADH2, CUP1-1, ENO2, 및 SOD1을 포함한다(예를 들어, Addgene 웹사이트: blog.addgene.org/plasmids-101-the-promoter-region 참조). 일부 구현예에서, 프로모터는 원핵생물 프로모터(예를 들어, 박테리오파지 또는 박테리아 프로모터)이다. 박테리오파지 프로모터의 비제한적인 예는 Pls1con, T3, T7, SP6, 및 PL을 포함한다. 박테리아 프로모터의 비제한적인 예는 Pbad, PmgrB, Ptrc2, Plac/ara, Ptac, 및 Pm을 포함한다.
일부 구현예에서, 프로모터는 유도성 프로모터이다. 본 출원에 사용된 바와 같이, "유도성 프로모터"는 분자의 존재 또는 부재에 의해 제어되는 프로모터이다. 이것은, 예를 들어, 효소의 발현을 제어 가능하게 유도시키기 위해 사용될 수 있다. 일부 구현예에서, 효소에 연결된 유도성 프로모터는, 예를 들어, 특정 시나리오에서(예를 들어, 특정 관할 구역의 규제 제한을 충족하기 위해 유전적으로 변형된 유기체를 수송하는 동안 또는 칸나비노이드가 배송되지 않을 수 있는 관할 구역 간에) 칸나비노이드 생성을 감소시키기 위해 효소(들)의 발현을 조절하는 데 사용될 수 있다. 일부 구현예에서, 효소에 연결된 유도성 프로모터는, 예를 들어, 특정 시나리오에서(예를 들어, 특정 관할 구역의 규제 제한을 충족하기 위해 유전적으로 변형된 유기체를 수송하는 동안 또는 칸나비노이드가 배송되지 않을 수 있는 관할 구역 간에) 칸나비노이드 생성을 감소시키기 위해 효소(들)의 발현을 조절하는 데 사용될 수 있다. 유도성 프로모터의 비제한적인 예는 화학적으로 조절되는 프로모터 및 물리적으로 조절되는 프로모터를 포함한다. 화학적으로 조절되는 프로모터의 경우, 전사 활성은 하나 이상의 화합물, 예컨대 알코올, 테트라사이클린, 갈락토스, 스테로이드, 금속, 아미노산, 또는 다른 화합물에 의해 조절될 수 있다. 물리적으로 조절되는 프로모터 경우, 전사 활성은 현상, 예컨대 광 또는 온도에 의해 조절될 수 있다. 테트라사이클린-조절된 프로모터의 비제한적인 예는 언하이드로테트라사이클린(aTc)-반응성 프로모터 및 다른 테트라사이클린-반응성 프로모터 시스템(예를 들어, 테트라사이클린 리프레서 단백질(tetR), 테트라사이클린 오퍼레이터 서열(tetO) 및 테트라사이클린 트랜스활성인자 융합 단백질(tTA))을 포함한다. 스테로이드-조절된 프로모터의 비제한적인 예는 래트 글루코코르티코이드 수용체, 인간 에스트로겐 수용체, 나방 엑디손 수용체를 기반으로 하는 프로모터, 및 스테로이드/레티노이드/갑상선 수용체 수퍼패밀리로부터의 프로모터를 포함한다. 금속-조절된 프로모터의 비제한적인 예는 메탈로티오네인(금속 이온에 결합하여 격리시키는 단백질) 유전자로부터 유래된 프로모터를 포함한다. 발병기전-조절된 프로모터의 비제한적인 예는 살리실산, 에틸렌 또는 벤조티아디아졸(BTH)에 의해 유도되는 프로모터를 포함한다. 온도/열-유도성 프로모터의 비제한적인 예는 열충격 프로모터를 포함한다. 광-조절된 프로모터의 비제한적인 예는 식물 세포 유래의 광 반응성 프로모터를 포함한다. 특정 구현예에서, 유도성 프로모터는 갈락토스-유도성 프로모터이다. 특정 구현예에서, 유도성 프로모터는 하나 이상의 생리적 조건(예를 들어, pH, 온도, 방사선, 삼투압, 염수 구배, 세포 표면 결합, 또는 하나 이상의 외인성 또는 내인성 유도제의 농도)에 의해 유도된다. 외인성 유도인자 또는 유도제의 비제한적인 예는 아미노산 및 아미노산 유사체, 사카라이드 및 폴리사카라이드, 핵산, 단백질 전사 활성인자 및 리프레서, 사이토카인, 독소, 석유-기반 화합물, 금속 함유 화합물, 염, 이온, 효소 기질 유사체, 호르몬 또는 임의의 조합을 포함한다.
일부 구현예에서, 프로모터는 항상성 프로모터이다. 본 출원에 사용된 바와 같이, "항상성 프로모터"는 유전자의 연속 전사를 허용하는 비조절된 프로모터를 지칭한다. 항상성 프로모터의 비제한적인 예는 TDH3, PGK1, PKC1, PDC1, TEF1, TEF2, RPL18B, SSA1, TDH2, PYK1, TPI1, HXT3, HXT7, ACT1, ADH1, ADH2, ENO2, 및 SOD1을 포함한다.
당업자에게 공지되어 있을 수 있는 합성 프로모터를 포함하는 다른 유도성 프로모터 또는 항상성 프로모터가 또한 고려된다.
유전자 발현에 필요한 조절 서열의 정확한 성질은 종 또는 세포 유형 간에 다양할 수 있지만, 일반적으로 필요에 따라, 각각 전사 및 번역의 개시에 관여되는 5' 비-전사 및 5' 비-번역 서열, 예컨대 TATA 박스, 캡핑 서열, CAAT 서열 등을 포함한다. 특히, 이러한 5' 비-전사 조절 서열은 작동적으로 연결된 유전자의 전사 제어를 위한 프로모터 서열을 포함하는 프로모터 영역을 포함할 것이다. 조절 서열은 또한 인핸서 서열 또는 상류 활성자 서열을 포함할 수 있다. 개시된 벡터는 5' 리더(leader) 또는 신호 서열을 포함할 수 있다. 조절 서열은 또한 종결자 서열을 포함할 수 있다. 일부 구현예에서, 종결자 서열은 전사 동안 DNA 내 유전자의 끝을 표시한다. 이종 유기체에서 본 출원에 기재된 하나 이상의 유전자의 발현을 유도하는 데 적합한 하나 이상의 적절한 벡터의 선택 및 설계는 당업자의 능력 및 재량 내에 있다.
발현에 필요한 요소를 함유하는 발현 벡터는 상업적으로 입수 가능하고 당업자에게 공지되어 있다(예를 들어, 문헌(Sambrook et al., Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, 2012) 참조).
숙주 세포
개시된 칸나비노이드 생합성 방법 및 숙주 세포는 에스. 세레비지아에로 예시되지만, 당업자에 의해 이해될 수 있는 바와 같이 다른 숙주 세포에도 적용 가능하다.
적합한 숙주 세포는 효모 세포, 박테리아 세포, 조류 세포, 식물 세포, 진균 세포, 곤충 세포, 및 포유동물 세포를 포함한 동물 세포를 포함하지만 이에 제한되지 않는다. 예시적인 일 구현예에서, 적합한 숙주 세포는 이. 콜라이(예를 들어, 매사추세츠주 입스에 위치한 New England BioLabs로부터 입수 가능한 ShuffleTM 컴피턴트 이. 콜라이)를 포함한다.
본 개시내용의 다른 적합한 숙주 세포는 코리네박테리움(Corynebacterium) 속의 미생물을 포함한다. 일부 구현예에서, 바람직한 코리네박테리움 균주/종은 다음을 포함한다: 기탁형 균주가 DSM44549인 씨 에피시엔스(C. efficiens), 기탁형 균주가 ATCC13032인 씨. 글루타미쿰(C. glutamicum), 및 기탁형 균주가 ATCC6871인 씨. 암모니아게네스(C. ammoniagenes). 일부 구현예에서, 본 개시내용의 바람직한 숙주 세포는 씨. 글루타미쿰이다.
코리네박테리움 속, 특히 코리네박테리움 글루타미쿰 종의 적합한 숙주 세포는 특히 공지된 야생형 균주이다: 코리네박테리움 글루타미쿰 ATCC13032, 코리네박테리움 아세토글루타미쿰(Corynebacterium acetoglutamicum) ATCC15806, 코리네박테리움 아세토아시도필름(Corynebacterium acetoacidophilum) ATCC13870, 코리네박테리움 멜라세콜라(Corynebacterium melassecola) ATCC17965, 코리네박테리움 써모아미노게네스(Corynebacterium thermoaminogenes) FERM BP-1539, 브레비박테리움 플라붐(Brevibacterium flavum) ATCC14067, 브레비박테리움 락토퍼멘툼(revibacterium lactofermentum) ATCC13869, 및 브레비박테리움 디바리카툼(Brevibacterium divaricatum) ATCC14020; 및 L-아미노산-생성 돌연변이체, 또는 이로부터 제조된 균주, 예를 들어, L-리신-생성 균주: 코리네박테리움 글루타미쿰 FERM-P 1709, 브레비박테리움 플라붐 FERM-P 1708, 브레비박테리움 락토퍼멘툼 FERM-P 1712, 코리네박테리움 글루타미쿰 FERM-P 6463, 코리네박테리움 글루타미쿰 FERM-P 6464, 코리네박테리움 글루타미쿰 DM58-1, 코리네박테리움 글루타미쿰 DG52-5, 코리네박테리움 글루타미쿰 DSM5714, 및 코리네박테리움 글루타미쿰 DSM12866.
적합한 효모 숙주 세포는 칸디다(Candida), 한세눌라(Hansenula), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 피키아(Pichia), 클루이베로마이세스(Kluyveromyces), 및 야로위아(Yarrowia)를 포함하지만 이에 제한되지 않는다. 일부 구현예에서, 효모 세포는 한세눌라 폴리모르파(Hansenula polymorpha), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 사카로마이세스 칼스베르겐시스(Saccaromyces carlsbergensis), 사카로마이세스 디아스타티커스(Saccharomyces diastaticus), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 이전에 피키아 파스토리스(Pichia pastoris), 피키아 핀란디카(Pichia finlandica), 피키아 트레할로필라(Pichia trehalophila), 피키아 코다마에(Pichia kodamae), 피키아 멤브라나에파시엔스(Pichia membranaefaciens), 피키아 오푼티아에(Pichia opuntiae), 피키아 써모톨레란스(Pichia thermotolerans), 피키아 살릭타리아(Pichia salictaria), 피키아 쿠에르쿠움(Pichia quercuum), 피키아 피지페리(Pichia pijperi), 피키아 스티피티스(Pichia stipitis), 피키아 메타놀리카(Pichia methanolica), 피키아 안구스타(Pichia angusta)로 공지된 코마가타엘라 파피(Komagataella phaffii), 클루이베로마이세스 락티스(Kluyveromyces lactis), 칸디다 알비칸스(Candida albicans), 또는 야로위아 리폴리티카(Yarrowia lipolytica)이다.
일부 구현예에서, 효모 균주는 산업용 배수체 효모 균주이다. 진균 세포의 다른 비제한적인 예는 아스페르길루스(Aspergillus) 종, 페니실리움(Penicillium) 종, 푸사리움(Fusarium) 종, 리조푸스(Rhizopus) 종, 아크레모니움(Acremonium) 종, 뉴로스포라(Neurospora) 종, 솔다리아(Sordaria) 종, 마그나포르테(Magnaporthe) 종, 알로마이세스(Allomyces) 종, 우스틸라고(Ustilago) 종, 보트리티스(Botrytis) 종, 및 트리코더마(Trichoderma) 종으로부터 얻어진 세포를 포함한다.
특정 구현예에서, 숙주 세포는 조류 세포, 예컨대 클라미도모나스(Chlamydomonas) (예를 들어, 씨. 레인하르티이(C. Reinhardtii)) 및 포르미디움(Phormidium) (피. 종 ATCC29409)이다.
다른 구현예에서, 숙주 세포는 원핵생물 세포이다. 적합한 원핵생물 세포는 그람 양성, 그람 음성, 및 그람-가변성 박테리아 세포를 포함한다. 숙주 세포는 아그로박테리움(Agrobacterium), 알리시클로바실러스(Alicyclobacillus), 아나바에나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써머스(Acidothermus), 아트로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움 (Brevibacterium), 부티리비브리오(Butyrivibrio), 부크네라(Buchnera), 캄페스트리스(Campestris), 캄필로박터(Campylobacter), 클로스트리듐(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로코커스(Coprococcus), 에스케리치아(Escherichia), 엔테로코커스(Enterococcus), 엔테로박터(Enterobacter), 어위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움 (Flavobacterium), 지오바실러스(Geobacillus), 해모필러스(Haemophilus), 헬리코박터(Helicobacter), 클렙시엘라(Klebsiella), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 일리오박터(Ilyobacter), 미크로코커스(Micrococcus), 미크로박테리움(Microbacterium), 메소리조비움(Mesorhizobium), 메틸로박테리움 (Methylobacterium), 메틸로박테리움(Methylobacterium), 미코박테리움 (Mycobacterium), 네이세리아(Neisseria), 판토에아 (Pantoea), 슈도모나스(Pseudomonas), 프로클로로코커스(Prochlorococcus), 로도박터(Rhodobacter), 로도슈도모나스(Rhodopseudomonas), 로도슈도모나스(Rhodopseudomonas), 로세부리아 (Roseburia), 로도스피릴룸(Rhodospirillum), 로도코커스(Rhodococcus), 세네데스머스(Scenedesmus), 스트렙토마이세스(Streptomyces), 스트렙토코커스(Streptococcus), 시네코커스(Synecoccus), 사카로모노스포라(Saccharomonospora), 사카로폴리스포라(Saccharopolyspora), 스타필로코커스(Staphylococcus), 세라티아(Serratia), 살모넬라(Salmonella), 시겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테머큘라(Temecula), 써모시네코코커스(Thermosynechococcus), 써모코커스(Thermococcus), 우레아플라스마(Ureaplasma), 잔토모나스(Xanthomonas), 자일렐라(Xylella), 여시니아(Yersinia), 및 자이모모나스(Zymomonas)의 종일 수 있지만, 이에 제한되지 않는다.
일부 구현예에서, 박테리아 숙주 균주는 산업용 균주이다. 수많은 박테리아 산업용 균주가 공지되어 있고 본 출원에 기재된 방법 및 조성물에 적합하다.
일부 구현예에서, 박테리아 숙주 세포는 아그로박테리움(Agrobacterium) 종(예를 들어, 에이. 라디오박터(A. radiobacter), 에이. 리조게네스(A. rhizogenes), 에이. 루비(A. rubi)), 아트로박터(Arthrobacter) 종(예를 들어, 에이. 아우레센스(A. aurescens), 에이. 시트레우스(A. citreus), 에이. 글롭포르미스(A. globformis), 에이. 하이드로카르보글루타미커스(A. hydrocarboglutamicus), 에이. 미소렌스(A. mysorens), 에이. 니코티아나에(A. nicotianae), 에이. 파라피네우스(A. paraffineus), 에이. 프로토폰니아에(A. protophonniae), 에이. 로세오파라피너스(A. roseoparaffinus), 에이. 술푸레우스(A. sulfureus), 에이. 우레아파시엔스(A. ureafaciens)), 바실러스(Bacillus) 종(예를 들어, 비. 투린지엔시스(B. thuringiensis), 비. 안트라시스(B. anthracis), 비. 메가테리움(B. megaterium), 비. 서브틸리스(B. subtilis), 비. 렌터스(B. lentus), 비. 서큘라스(B. circulars), 비. 푸밀러스(B. pumilus), 비. 라우터스(B. lautus), 비. 코아굴란스(B. coagulans), 비. 브레비스(B. brevis), 비. 퍼머스(B. firmus), 비. 알카오피우스(B. alkaophius), 비. 리체니포르미스(B. licheniformis), 비. 클라우시이(B. clausii), 비. 스테아로써모필러스(B. stearothermophilus), 비. 할로두란스(B. halodurans) 및 비. 아밀로리케파시엔스(B. amyloliquefaciens)의 것이다. 특정 구현예에서, 숙주 세포는 비. 서브틸리스(B. subtilis), 비. 푸밀러스(B. pumilus), 비. 리체니포르미스(B. licheniformis), 비. 메가테리움(B. megaterium), 비. 클라우시이(B. clausii), 비. 스테아로써모필러스(B. stearothermophilus) 및 비. 아밀로리케파시엔스(B. amyloliquefaciens)를 포함하지만 이에 제한되지 않는 산업용 바실러스 균주일 것이다. 일부 구현예에서, 숙주 세포는 산업용 클로스트리듐 종(예를 들어, 씨. 아세토부틸리컴(C. acetobutylicum), 씨. 테타니(C. tetani) E88, 씨. 리투세부렌스(C. lituseburense), 씨. 사카로부틸리컴(C. saccharobutylicum), 씨. 퍼프린젠스(C. perfringens), 씨. 베이제린키이(C. beijerinckii))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 코리네박테리움 종(예를 들어, 씨. 글루타미컴(C. glutamicum), 씨. 아세토아시도필럼(C. acetoacidophilum))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 에스케리치아 종(예를 들어, 이. 콜라이)일 것이다. 일부 구현예에서, 숙주 세포는 산업용 어위니아 종(예를 들어, 이. 우레도보라(E. uredovora), 이. 카로토보라(E. carotovora), 이. 아나나스(E. ananas), 이. 허비콜라(E. herbicola), 이. 푼타타(E. punctata), 이. 테레우스(E. terreus))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 판토에아 종(예를 들어, 피. 시트레아 (P. citrea), 피. 아글로머란스(P. agglomerans))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 슈도모나스 종(예를 들어, 피. 푸티다(P. putida), 피. 애루지노사(P. aeruginosa), 피. 메발로니이(P. mevalonii))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 스트렙토코커스 종(예를 들어, 에스. 에퀴시밀레스(S. equisimiles), 에스. 피오게네스(S. pyogenes), 에스. 우베리스(S. uberis))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 스트렙토마이세스 종(예를 들어, 에스. 암보파시엔스(S. ambofaciens), 에스, 아크로모게네스(S. achromogenes), 에스. 아버미틸리스(S. avermitilis), 에스. 코엘리콜러(S. coelicolor), 에스. 아우레오파시엔스(S. aureofaciens), 에스. 아우레우스(S. aureus), 에스. 푼지시디커스(S. fungicidicus), 에스. 그리세우스(S. griseus), 에스. 리비단스(S. lividans))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 자이모모나스 종(예를 들어, 지. 모빌리스(Z. mobilis), 지. 리폴리티카(Z. lipolytica)) 등일 것이다.
본 개시내용은 또한 포유동물 세포, 예를 들어, 인간(293, HeLa, WI38, PER.C6 및 바우스 흑색종 세포 포함), 마우스(3T3, NS0, NS1, Sp2/0 포함), 햄스터(CHO, BHK), 원숭이(COS, FRhL, Vero), 곤충 세포, 예를 들어, 가을 거미벌레(Sf9 및 Sf21 포함), 누에나방(BmN 포함), 양배추 자벌레(BTI-Tn-5B1-4 포함) 및 일반 초파리(슈나이더(Schneider) 2 포함), 및 하이브리도마 세포주를 포함한 다양한 동물 세포 유형과 함께 사용하기에 적합하다.
다양한 구현예에서, 균주는 원핵생물 및 진핵생물 균주 둘 모두를 포함하여 본 개시내용의 실시에서 사용될 수 있으며 수많은 생물자원 센터, 예컨대 미국 생물자원 센터(American Type Culture Collection) (ATCC), 독일 생물자원 센터(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH) (DSM), 네덜란드 곰팡이 자원 센터(Centraalbureau Voor Schimmelcultures) (CBS), 및 농업 특허 자원 센터, 북부 연구소(Agricultural Research Service Patent Culture Collection, Northern Regional Research Center) (NRRL)에서 공공으로 쉽게 접근 가능하다. 본 개시내용은 또한 다양한 식물 세포 유형과 함께 사용하기에 적합하다. 일부 구현예에서, 식물은 대마초과의 대마초 속이다. 특정 구현예에서, 식물은 대마초 사티바, 대마초 인디카, 또는 대마초 루데랄리스 종이다. 다른 구현예에서, 식물은 가지과의 니코티아나 속의 식물이다. 특정 구현예에서, 식물은 니코티아나 루스티카(Nicotiana rustica) 종이다.
본 출원에 사용된 용어 "세포"는 단일 세포, 또는 동일한 세포주 또는 균주에 속하는 세포 집단과 같은 세포 집단을 지칭할 수 있다. 단수 용어 "세포"의 사용은 세포 집단보다 단일 세포를 명시적으로 지칭하는 것으로 해석되어서는 안된다. 숙주 세포는 야생형 대응물에 대한 유전자 변형을 포함할 수 있다. 숙주 세포에서 유전자 발현 및/또는 유전자 불활성화의 감소는 유전자의 결실, 유전자에 점 돌연변이의 도입, 유전자의 선택적 편집 및/또는 유전자의 절단을 포함하지만 이에 제한되지 않는 임의의 적합한 방법을 통해 달성될 수 있다. 예를 들어, 중합효소 연쇄 반응(PCR)-기반 방법이 사용될 수 있다(예를 들어, 문헌(Gardner et al., Methods Mol Biol. 2014;1205:45-78) 참조). 비제한적인 예로서, 유전자는 유전자 교체(예를 들어, 선택 마커를 포함하는 마커로)를 통해 결실될 수 있다. 유전자는 또한 트랜스포존 시스템의 사용을 통해 절단될 수 있다(예를 들어, 문헌(Poussu et al., Nucleic Acids Res. 2005; 33(12): e104) 참조). 유전자는 또한 CRISPR 기반 기술과 같은 당업계에 공지된 유전자 편집 기술의 사용을 통해 편집될 수 있다.
숙주 세포 배양
본 출원에 개시된 임의의 세포는 핵산의 접촉 및/또는 통합 이전, 동안 및/또는 이후에 임의의 유형(풍부 또는 최소) 및 임의의 조성의 배지에서 배양될 수 있다. 배양 또는 배양 공정의 조건은 당업자에 의해 이해되는 바와 같이 통상적인 실험을 통해 최적화될 수 있다. 일부 구현예에서, 선택된 배지는 다양한 성분으로 보충된다. 일부 구현예에서, 보충 성분의 농도 및 양이 최적화된다. 일부 구현예에서, 배지의 다른 양태 및 성장 조건(예를 들어, pH, 온도 등)은 통상적인 실험을 통해 최적화된다. 일부 구현예에서, 하나 이상의 보충 성분이 배지에 보충되는 빈도, 및 세포가 배양되는 시간량이 최적화된다.
본 출원에서 기재된 세포의 배양은 당업계에 공지되어 사용되는 배양 용기에서 수행될 수 있다. 일부 구현예에서, 통기형 반응 용기(예를 들어, 교반식 탱크 반응기)가 세포를 배양하는 데 사용된다. 일부 구현예에서, 생물반응기 또는 발효기를 사용하여 세포를 배양한다. 따라서, 일부 구현예에서, 세포는 발효에 사용된다. 본 출원에 사용된 바와 같이, 용어 "생물반응기" 및 "발효기"는 상호교환적으로 사용되며, 살아있는 유기체, 살아있는 유기체의 일부를 포함하는, 생물학적, 생화학적, 및/또는 화학적 반응이 일어나는, 인클로저 또는 부분 인클로저를 지칭한다. "대규모 생물반응기" 또는 "산업적 규모 생물반응기"는 상업적 또는 준-상업적 규모로 생성물을 생성하는 데 사용되는 생물반응기이다. 대규모 생물반응기는 전형적으로 리터, 수백 리터, 수천 리터 또는 그 초과의 범위의 부피를 갖는다.
생물반응기의 비제한적인 예는 교반식 탱크 발효기, 회전식 혼합 장치, 케모스타트에 의해 교반되는 생물반응기, 진탕 장치로 교반되는 생물반응기, 에어리프트 발효기, 충전층 반응기, 고정층 반응기, 유동층 생물반응기, 파동 유발 교반을 사용한 생물반응기, 원심 생물반응기, 롤러병(roller bottle), 및 중공 섬유 생물반응기, 롤러 장비(예를 들어, 벤치탑, 카트-장착, 및/또는 자동화 버라이어티), 수직-적층 플레이트, 스피너 플라스크, 교반식 또는 진동식 플라스크, 진탕 다중-웰 플레이트, MD 병, T-플라스크, 루(Roux) 병, 다중-표면 조직 배양 전파기, 변형식 발효기, 및 코팅된 비드(예를 들어, 세포 부착을 방지하기 위해 혈청 단백질, 니트로셀룰로오스, 또는 카복시메틸 셀룰로오스로 코팅된 비드)를 포함한다.
일부 구현예에서, 생물반응기는 세포(예를 들어, 효모 세포)가 이동하는 액체 및/또는 가스 버블과 접촉하는 세포 배양 시스템을 포함한다. 일부 구현예에서, 세포 또는 세포 배양물은 현탁 성장된다. 다른 구현예에서, 세포 또는 세포 배양물은 고상(solid phase) 담체에 부착된다. 담체 시스템의 비제한적인 예는 마이크로담체(예를 들어, 다공성 또는 비-다공성일 수 있는 중합체구, 마이크로비드, 및 마이크로디스크), 특별한 화학기(예를 들어, 4차 아민 기)가 충전된 가교결합된 비드(예를 들어, 덱스트란), 비다공성 중합체 섬유에 포획된 세포를 포함하는 2D 마이크로담체, 3D 담체(예를 들어, 캐리어 섬유, 중공 섬유, 다중카트리지 반응기, 및 다공성 섬유를 포함할 수 있는 반투과성막), 이온 교환 능력이 감소된 마이크로담체, 캡슐화 세포, 모세관, 및 응집체를 포함한다. 일부 구현예에서, 담체는 덱스트란, 젤라틴, 유리, 또는 셀룰로오스와 같은 재료로 제작된다.
일부 구현예에서, 산업적 규모의 과정은 연속식, 반-연속식, 또는 비-연속식 방식으로 작업된다. 작업 방식의 비제한적인 예는 배치식, 유가식(fed batch), 확장형 배치식, 반복형 배치식, 추출/충전(draw/fill), 회전-벽, 스피닝 플라스크, 및/또는 관류 작업 방식을 포함한다. 일부 구현예에서, 생물반응기는 기질 스톡, 예를 들어, 탄수화물 공급원의 연속 또는 반연속 보충 및/또는 생물반응기로부터 생성물의 연속 또는 반연속 분리를 허용한다.
일부 구현예에서, 생물반응기 또는 발효기는 반응 매개변수를 측정하고/하거나 조정하기 위한 센서 및/또는 제어 시스템을 포함한다. 반응 매개변수의 비제한적인 예는 생물학적 매개변수(예를 들어, 성장 속도, 세포 크기, 세포 수, 세포 밀도, 세포 유형, 또는 세포 상태 등), 화학적 매개변수(예를 들어, pH, 산화환원 전위, 반응 기질 및/또는 생성물의 농도, 용존 가스의 농도, 예컨대 산소 농도 및 CO2 농도, 영양소 농도, 대사산물 농도, 올리고펩티드의 농도, 아미노산의 농도, 비타민의 농도, 호르몬의 농도, 첨가제의 농도, 혈청 농도, 이온 강도, 이온의 농도, 상대 습도, 몰농도, 삼투압 농도, 다른 화학 물질, 예를 들어 완충제, 보강제 또는 반응 부산물의 농도), 물리적/기계적 매개변수(예를 들어, 밀도, 전도도, 교반 정도, 압력, 및 유속, 전단 응력, 전단 속도, 점도, 색상, 탁도, 흡광도, 혼합율, 전환율뿐만 아니라 열역학적 매개변수, 예컨대 온도, 광 강도/품질 등)를 포함한다. 본 출원에 기재된 매개변수를 측정하기 위한 센서는 관련 기계 및 전자 분야의 당업자에게 익히 공지되어 있다. 본 출원에 기재된 센서로부터 투입물 기반으로 생물반응기의 매개변수를 조정하기 위한 제어 시스템은 생물반응기 조작의 당업자에게 익히 공지되어 있다.
일부 구현예에서, 방법은 배치식 발효(예를 들어, 진탕 플라스크 발효)를 포함한다. 배치식 발효(예를 들어, 진탕 플라스크 발효)에 대한 일반 고려사항은 산소 및 글루코스 수준을 포함한다. 예를 들어, 배치식 발효(예를 들어, 진탕 플라스크 발효)는 산소 및 글루코스가 제한될 수 있어서, 일부 구현예에서, 잘-설계된 유가식 발효에서 수행하는 균주의 능력이 과소평가된다. 또한, 최종 생성물(예를 들어, 칸나비노이드 또는 칸나비노이드 전구체)은 가용성, 독성, 세포 축적 및 분비의 관점에서 기질과 일부 편차를 나타낼 수 있고 일부 구현예에서 상이한 발효배양 동역학을 가질 수 있다.
일부 구현예에서, 본 개시내용의 세포는 생체내에서 칸나비노이드 또는 칸나비노이드 전구체를 생성하도록 적응된다. 일부 구현예에서, 세포는 칸나비노이드 합성을 위한 하나 이상의 효소(예를 들어, AAE, PKS, PKC, PT 또는 TS)를 분비하도록 적응된다. 일부 구현예에서, 본 개시내용의 세포는 용해되고, 나머지 용해물은 후속 사용을 위해 회수된다. 이러한 구현예에서, 분비되거나 용해된 효소는 시험관내 또는 생체외 과정에서 생물전환에 의한 칸나비노이드 또는 전구체의 생성을 위한 반응을 촉매할 수 있다. 일부 구현예에서, 본 출원에 기재된 임의의 모든 전환은 시험관내 또는 생체내에서 화학적으로 또는 효소적으로 수행될 수 있다.
일부 구현예에서, 본 개시내용의 숙주 세포는 생체내에서 칸나비노이드 또는 칸나비노이드 전구체를 생성하도록 적응된다. 일부 구현예에서, 숙주 세포는 하나 이상의 칸나비노이드 경로 기질, 중간체 및/또는 말단 생성물(예를 들어, 올리베톨, THCA, THC, CBDA, CBD, CBGA, CBGVA, THCVA, CBDVA, CBCVA, 또는 CBCA)을 분비하도록 적응된다. 일부 구현예에서, 본 개시내용의 숙주 세포는 용해되고, 용해물은 후속 사용을 위해 회수된다. 이러한 구현예에서, 분비된 기질, 중간체 및/또는 말단 생성물은 배양 배지로부터 회수될 수 있다.
정제 및 추가 처리
일부 구현예에서, 본 출원에 기재된 임의의 방법은 생성된(예를 들어, 생물반응기에서 생성된) 칸나비노이드 및/또는 칸나비노이드 전구체의 단리 및/또는 정제를 포함할 수 있다. 예를 들어, 단리 및/또는 정제는 세포 용해, 원심분리, 추출, 컬럼 크로마토그래피, 증류, 결정화 및 동결건조 중 하나 이상을 포함할 수 있다.
본 출원에 기재된 방법은 당업계에 공지된 임의의 칸나비노이드 또는 칸나비노이드 전구체의 생성을 포함한다. 본 출원에 개시된 임의의 재조합 세포, 또는 본 출원에 기재된 임의의 시험관내 방법에 의해 생성되는 칸나비노이드 또는 칸나비노이드 전구체는 당업계에 공지된 임의의 방법을 사용하여 확인 및 추출될 수 있다. 질량 분석법(예를 들어, LC-MS, GC-MS)은 확인 방법의 비제한적인 예이며 관심 화합물을 추출하는 데 사용될 수 있다.
일부 구현예에서, 본 출원에 기재된 임의의 방법은 칸나비노이드 또는 칸나비노이드 전구체의 탈카복실화를 추가로 포함한다. 비제한적인 예로서, 칸나비노이드 또는 칸나비노이드 전구체의 산 형태는 칸나비노이드 또는 칸나비노이드 전구체를 탈카복실화하기 위해 가열(예를 들어, 적어도 90℃)될 수 있다. 예를 들어, 미국 특허 번호 10,159,908, 미국 특허 번호 10,143,706, 미국 특허 번호 9,908,832 및 미국 특허 번호 7,344,736을 참조한다. 또한, 예를 들어, 문헌(Wang et al., Cannabis Cannabinoid Res. 2016; 1(1): 262 - 271)을 참조한다.
조성물, 키트, 및 투여
본 개시내용은 본 출원에 기재된 임의의 방법에 의해 생성된 칸나비노이드 또는 칸나비노이드 전구체, 또는 이의 약학적으로 허용되는 염, 및 임의로 약학적으로 허용되는 부형제를 포함하는 약학 조성물을 포함한 조성물을 제공한다.
특정 구현예에서, 본 출원에 기재된 칸나비노이드 또는 칸나비노이드 전구체는 약학 조성물과 같은 조성물에 유효량으로 제공된다. 특정 구현예에서, 유효량은 치료학적 유효량이다. 특정 구현예에서, 유효량은 예방학적 유효량이다.
본 출원에 기재된 약학 조성물과 같은 조성물은 당업계에 공지된 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 본 출원에 기재된 화합물(예를 들어, "활성 성분")을 담체 또는 부형제, 및/또는 하나 이상의 다른 보조 성분과 회합되도록 하는 단계, 및 이어서 필요하고/하거나 바람직하다면, 바람직한 단일 용량 단위 또는 다중 용량 단위로 생성물을 성형 및/또는 포장하는 단계를 포함한다.
약학 조성물은 단일 단위 용량 및/또는 복수의 단일 단위 용량으로서 대량으로 제조, 포장 및/또는 판매될 수 있다. "단위 용량"은 소정량의 활성 성분을 포함하는 약학 조성물의 별개의 양이다. 활성 성분의 양은 일반적으로 대상체에게 투여될 활성 성분의 투여량 및/또는 이러한 투여량의 1/2 또는 1/3과 같은 이러한 투여량의 편리한 분획과 동일하다.
본 출원에 기재된 약학 조성물 중 활성 성분, 약학적으로 허용되는 부형제 및/또는 임의의 추가 성분의 상대적인 양은 치료 대상체의 정체, 크기, 및/또는 상태에 따라 그리고 조성물이 투여될 경로에 따라 추가로 달라질 것이다. 조성물은 0.1%와 100% (w/w) 사이의 활성 성분을 포함할 수 있다.
약학 조성물의 제조에 사용되는 약학적으로 허용되는 부형제는 불활성 희석제, 분산제 및/또는 과립화제, 표면 활성제 및/또는 유화제, 붕해제, 결합제, 방부제, 완충제, 윤활제 및/또는 오일을 포함한다. 코코아 버터 및 좌약 왁스와 같은 부형제, 착색제, 코팅제, 감미제, 향미제, 및 방향제가 또한 조성물에 존재할 수 있다. 예시적인 부형제는 본 출원에 개시된 바와 같은 희석제, 분산제 및/또는 과립화제, 표면 활성제 및/또는 유화제, 붕해제, 결합제, 방부제, 완충제, 윤활제, 및/또는 오일(예를 들어, 합성 오일, 반합성 오일)을 포함한다.
예시적인 희석제는 탄산칼슘, 탄산나트륨, 인산칼슘, 인산이칼슘, 황산칼슘, 인산수소칼슘, 인산나트륨 락토스, 수크로스, 셀룰로오스, 미정질 셀룰로오스, 카올린, 만니톨, 소르비톨, 이노시톨, 염화나트륨, 건조 전분, 옥수수 전분, 분말 설탕 및 이들의 혼합물을 포함한다.
예시적인 과립화제 및/또는 분산제는 감자 전분, 옥수수 전분, 타피오카 전분, 나트륨 전분 글리콜레이트, 점토, 알긴산, 구아 검, 감귤 펄프, 한천, 벤토나이트, 셀룰로오스, 및 목제품, 천연 스펀지, 양이온 교환 수지, 탄산칼슘, 규산염, 탄산나트륨, 가교결합된 폴리(비닐-피롤리돈) (크로스포비돈), 나트륨 카복시메틸 전분(나트륨 전분 글리콜레이트), 카복시메틸 셀룰로오스, 가교결합된 나트륨 카복시메틸 셀룰로오스(크로스카르멜로스), 메틸셀룰로오스, 전호화 전분(전분 1500), 미정질 전분, 수불용성 전분, 칼슘 카복시메틸 셀룰로오스, 마그네슘 알루미늄 실리케이트(Veegum), 나트륨 라우릴 설페이트, 4차 암모늄 화합물, 및 이들의 혼합물을 포함한다.
예시적인 표면 활성제 및/또는 유화제는 천연 유화제(예를 들어, 아카시아, 한천, 알긴산, 알긴산나트륨, 트라가칸트, 콘드룩스, 콜레스테롤, 크산탄, 펙틴, 젤라틴, 난황, 카제인, 양모지방, 콜레스테롤, 왁스, 레시틴), 콜로이드 점토(예를 들어, 벤토나이트(규산알루미늄) 및 Veegum(규산알루미늄 마그네슘)), 장쇄 아미노산 유도체, 고분자량 알코올(예를 들어, 스테아릴 알코올, 세틸 알코올, 올레일 알코올, 트리아세틴 모노스테아레이트, 에틸렌 글리콜 디스테아레이트, 글리세릴 모노스테아레이트, 및 프로필렌 글리콜 모노스테아레이트, 폴리비닐 알코올), 카보머(예를 들어, 카복시 폴리메틸렌, 폴리아크릴산, 아크릴산 중합체 및 카복시비닐 중합체), 카라기난, 셀룰로오스 유도체(예를 들어, 카복시메틸셀룰로오스 나트륨, 분말 셀룰로오스, 하이드록시메틸 셀룰로오스, 하이드록시프로필 셀룰로오스, 하이드록시프로필 메틸셀룰로오스, 메틸셀룰로오스), 소르비탄 지방산 에스테르(예를 들어, 폴리옥시에틸렌 소르비탄 모노라우레이트(Tween® 20), 폴리옥시에틸렌 소르비탄(Tween® 60), 폴리옥시에틸렌 소르비탄 모노올레에이트(Tween® 80), 소르비탄 모노팔미테이트(Span® 40), 소르비탄 모노스테아레이트(Span® 60), 소르비탄 트리스테아레이트(Span® 65), 글리세릴 모노올레에이트, 소르비탄 모노올레에이트(Span® 80), 폴리옥시에틸렌 에스테르(예를 들어, 폴리옥시에틸렌 모노스테아레이트(Myrj® 45), 폴리옥시에틸렌 경화 피마자유, 폴리에톡실화 피마자유, 폴리옥시메틸렌 스테아레이트, 및 Solutol®), 수크로스 지방산 에스테르, 폴리에틸렌 글리콜 지방산 에스테르(예를 들어, Cremophor®), 폴리옥시에틸렌 에테르(예를 들어, 폴리옥시에틸렌 라우릴 에테르(Brij® 30)), 폴리(비닐-피롤리돈), 디에틸렌 글리콜 모노라우레이트, 트리에탄올아민 올레에이트, 올레산나트륨, 올레산칼륨, 올레산에틸, 올레산, 에틸 라우레이트, 나트륨 라우릴 설페이트, Pluronic® F-68, 폴록사머 P-188, 브롬화세트리모늄, 염화세틸피리디늄, 염화벤잘코늄, 도쿠세이트 나트륨 및/또는 이들의 혼합물을 포함한다.
예시적인 결합제는 전분(예를 들어, 옥수수 전분 및 전분 페이스트), 젤라틴, 당(예를 들어, 수크로스, 글루코스, 덱스트로스, 덱스트린, 당밀, 락토스, 락티톨, 만니톨 등), 천연 및 합성 검(예를 들어, 아카시아, 알긴산나트륨, 아일랜드 이끼(Irish moss) 추출물, 판와르 검(panwar gum), 가티 검, 이사폴 껌집의 점액질, 카복시메틸셀룰로오스, 메틸셀룰로오스, 에틸셀룰로오스, 하이드록시에틸셀룰로오스, 하이드록시프로필 셀룰로오스, 하이드록시프로필 메틸셀룰로오스, 미정질 셀룰로오스, 셀룰로오스 아세테이트, 폴리(비닐-피롤리돈), 마그네슘 알루미늄 실리케이트(Veegum®), 및 낙엽송 아라보갈락탄), 알지네이트, 폴리에틸렌 옥사이드, 폴리에틸렌 글리콜, 무기 칼슘 염, 규산, 폴리메타크릴레이트, 왁스, 물, 알코올, 및/또는 이들의 혼합물을 포함한다.
예시적인 방부제는 항산화제, 킬레이트제, 항미생물 방부제, 항진균 방부제, 항원충 방부제, 알코올 방부제, 산성 방부제, 및 기타 방부제를 포함한다. 특정 구현예에서, 방부제는 항산화제이다. 다른 구현예에서, 방부제는 킬레이트제이다.
예시적인 항산화제는 알파 토코페롤, 아스코르브산, 아코르빌 팔미테이트, 부틸화 하이드록시아니솔, 부틸화 하이드록시톨루엔, 모노티오글리세롤, 메타중아황산칼륨, 프로피온산, 프로필 갈레이트, 아스코르브산나트륨, 중아황산나트륨, 메타중아황산나트륨 및 아황산나트륨을 포함한다.
예시적인 킬레이트제는 에틸렌디아민테티라아세트산(EDTA) 및 이의 염 및 수화물(예를 들어, 에데트산나트륨, 에데트산이나트륨, 에데트산삼나트륨, 에데트산칼슘이나트륨, 에데트산이칼륨 등), 시트르산 및 이의 염 및 수화물(예를 들어, 시트르산 일수화물), 푸마르산 및 이의 염 및 수화물, 말산 및 이의 염 및 수화물, 인산 및 이의 염 및 수화물, 및 타르타르산 및 이의 염 및 수화물을 포함한다. 예시적인 항미생물 방부제는 염화벤잘코늄, 염화벤제토늄, 벤질 알코올, 브로노폴, 세트리미드, 세틸피리디늄 클로라이드, 클로르헥시딘, 클로로부탄올, 클로로크레졸, 클로록실레놀, 크레졸, 에틸 알코올, 글리세린, 헥세티딘, 이미두레아, 페놀, 페녹시에탄올, 페닐에틸 알코올, 질산페닐수은, 프로필렌 글리콜 및 티메로살을 포함한다.
예시적인 항진균 방부제는 부틸 파라벤, 메틸 파라벤, 에틸 파라벤, 프로필 파라벤, 벤조산, 하이드록시벤조산, 벤조산칼륨, 소르브산칼륨, 벤조산나트륨, 프로피온산타륨, 및 소르브산을 포함한다.
예시적인 알코올 방부제는 에탄올, 폴리에틸렌 글리콜, 페놀, 페놀 화합물, 비스페놀, 클로로부탄올, 하이드록시벤조에이트, 및 페닐에틸 알코올을 포함한다.
예시적인 산성 방부제는 비타민 A, 비타민 C, 비타민 E, 베타-카로틴, 시트르산, 아세트산, 데하이드로아세트산, 아스코르브산, 소르브산 및 피트산(phytic acid)을 포함한다.
다른 방부제는 토코페롤, 토코페롤 아세테이트, 데테록심 메실레이트, 세트리미드, 부틸화 하이드록시아니솔(BHA), 부틸화 하이드록시톨루엔(BHT), 에틸렌디아민, 나트륨 라우릴 설페이트(SLS), 나트륨 라우릴 에테르 설페이트(SLES), 중아황산나트륨, 메타중아황산나트륨, 아황산칼륨, 메타중아황산칼륨, Glydant® Plus, Phenonip®, 메틸파라벤, Germall® 115, Germaben® II, Neolone®, Kathon®, 및 Euxyl®을 포함한다.
예시적인 완충제는 시트레이트 완충 용액, 아세테이트 완충 용액, 포스페이트 완충 용액, 염화암모늄, 탄산칼슘, 염화칼슘, 시트르산칼슘, 글루비온산칼슘, 글루셉산칼슘, 글루콘산칼슘, D-글루콘산, 글리세로인산칼슘, 락트산칼슘, 프로판산, 레불린산칼슘, 펜탄산, 이염기성 인산칼슘, 인산, 삼염기성 인산칼슘, 수산화칼슘 인산염, 아세트산칼륨, 염화칼륨, 글루콘산칼륨, 칼륨 혼합물, 이염기성 인산칼륨, 일염기성 인산칼륨, 인산칼륨 혼합물, 아세트산나트륨, 중탄산나트륨, 염화나트륨, 시트르산나트륨, 락트산나트륨, 이염기성 인산나트륨, 일염기성 인산나트륨, 인산나트륨 혼합물, 트로메타민, 수산화마그네슘, 수산화알루미늄, 알긴산, 발열원 없는 물, 등장 식염수, 링거액, 에틸 알코올, 및 이들의 혼합물을 포함한다.
예시적인 윤활제는 마그네슘 스테아레이트, 칼슘 스테아레이트, 스테아르산, 실리카, 활석, 맥아, 글리세릴 베헤네이트, 경화 식물성 오일, 폴리에틸렌 글리콜, 벤조산나트륨, 아세트산나트륨, 염화나트륨, 류신, 마그네슘 라우릴 설페이트, 나트륨 라우릴 설페이트, 및 이들의 혼합물을 포함한다.
예시적인 천연 오일은 아몬드, 살구씨, 아보카도, 바바수야자나무(babassu), 베르가못, 블랙 커런트 씨(black current seed), 서양지치(borage), 케이드(cade), 카밀레(camomile), 캐놀라, 캐러웨이(caraway), 카나우바, 피마자, 계피, 코코아 버터, 코코넛, 대구 간, 커피, 옥수수, 목화씨, 에뮤(emu), 유칼립투스, 달맞이꽃, 생선, 아마씨, 게라니올(geraniol), 박(gourd), 포도씨, 헤이즐넛, 우슬초, 이소프로필 미리스테이트, 호호바, 쿠쿠이넛(kukui nut), 라반딘, 라벤더, 레몬, 리체아 큐베바(litsea cubeba), 마카데미아 넛, 당아욱(mallow), 망고 씨, 메도우폼 씨(meadowfoam seed), 밍크, 육두구(nutmeg), 올리브, 오렌지, 오렌지 러피(orange roughy), 팜, 팜 커널, 복숭아 커널, 땅콩, 양귀비씨, 호박씨, 유채, 쌀겨, 로즈마리, 잇꽃, 백단, 사스콰나(sasquana), 세이버리, 바다 갈매 나무속(sea buckthorn), 참깨, 시어 버터, 실리콘, 대두, 해바라기, 티 트리(tea tree), 엉겅퀴, 츠바키(tsubaki), 베티버, 호두 및 밀 배아 오일을 포함한다. 예시적인 합성 또는 반합성 오일은 부틸 스테아레이트, 중쇄 트리글리세리드(예컨대 카프릴산 트리글리세리드 및 카프르산 트리글리세리드), 사이클로메티콘, 디에틸 세바케이트, 디메티콘 360, 이소프로필 미리스테이트, 미네랄 오일, 옥틸도데칸올, 올레일 알코올, 실리콘 오일 및 이들의 혼합물을 포함하지만 이에 제한되지 않는다. 특정 구현예에서, 예시적인 합성 오일은 중쇄 트리글리세리드(예컨대 카프릴산 트리글리세리드 및 카프릴산 트리글리세리드)를 포함한다.
경구 및 비경구 투여를 위한 액체 투여 형태는 약학적으로 허용되는 에멀젼, 마이크로에멀젼, 용액, 현탁액, 시럽 및 엘릭시르를 포함한다. 활성 성분 이외에, 액체 투여 형태는, 예를 들어, 물 또는 기타 용매, 가용화제 및 유화제, 예컨대 에틸 알코올, 이소프로필 알코올, 에틸 카보네이트, 에틸 아세테이트, 벤질 알코올, 벤질 벤조에이트, 프로필렌 글리콜, 1,3-부틸렌 글리콜, 디메틸포름아미드, 오일(예를 들어, 면실유, 땅콩유, 옥수수유, 배아유, 올리브유, 피마자유 및 참기름), 글리세롤, 테트라하이드로푸르푸릴 알코올, 폴리에틸렌 글리콜 및 소르비탄의 지방산 에스테르, 및 이들의 혼합물과 같은 당업계에 일반적으로 사용되는 불활성 희석제를 포함할 수 있다. 불활성 희석제 이외에, 경구 조성물은 습윤제, 유화제 및 현탁제, 감미제, 향미제 및 방향제와 같은 애쥬번트를 포함할 수 있다. 비경구 투여를 위한 특정 구현예에서, 본 출원에 기재된 접합체는 Cremophor®, 알코올, 오일, 개질된 오일, 글리콜, 폴리소르베이트, 사이클로덱스트린, 중합체 및 이들의 혼합물과 같은 가용화제와 혼합된다.
주사 가능한 제제, 예를 들어, 멸균 주사 가능한 수성 또는 유성 현탁액은 적합한 분산제 또는 습윤제 및 현탁제를 사용하여 공지된 기술에 따라 제형화될 수 있다. 멸균 주사 가능한 제제는 무독성 비경구적으로 허용되는 희석제 또는 용매 중의 멸균 주사 가능한 용액, 현탁액 또는 에멀젼, 예를 들어 1,3-부탄디올 중의 용액일 수 있다. 사용될 수 있는 허용되는 비히클 및 용매 중에는 물, 링거액, USP 및 등장성 염화나트륨 용액이 있다. 또한, 멸균 고정유는 통상적으로 용매 또는 현탁 매질로서 사용된다. 이를 위해, 합성 모노- 또는 디-글리세리드를 포함한 임의의 무자극(bland) 고정유가 사용될 수 있다. 또한, 주사제의 제조에는 올레산과 같은 지방산이 사용된다.
주사 가능한 제형은, 예를 들어, 박테리아-보유 필터를 통한 여과에 의해, 또는 사용 전에 멸균수 또는 다른 멸균 주사 가능한 매질에 용해 또는 분산될 수 있는 멸균 고체 조성물의 형태로 멸균제를 혼입함으로써 멸균될 수 있다.
약물의 효과를 연장하기 위해, 종종 피하 또는 근육내 주사로부터 약물의 흡수를 늦추는 것이 바람직하다. 이는 불량한 수용성의 결정질 또는 무정형 물질의 액체 현탁액을 사용하여 달성될 수 있다. 이어서, 약물의 흡수 속도는 용해 속도에 따라 달라지며, 이는 차례로 결정 크기와 결정질 형태에 따라 달라질 수 있다. 대안적으로, 비경구 투여된 약물 형태의 지연된 흡수는 오일 비히클에 약물을 용해 또는 현탁시킴으로써 달성될 수 있다.
직장 또는 질 투여용 조성물은 전형적으로, 주위 온도에서는 고체이지만 체온에서는 액체이므로 직장 또는 질강에서 용해되어 활성 성분을 방출하는, 본 출원에 기재된 접합체를 적합한 비자극성 부형제 또는 담체, 예컨대 코코아 버터, 폴리에틸렌 글리콜, 또는 좌약 왁스와 혼합하여 제조될 수 있는 좌약이다.
경구 투여용 고체 투여 형태는 캡슐, 정제, 환제, 분말 및 과립을 포함한다. 이러한 고체 투여 형태에서, 활성 성분은 적어도 하나의 불활성, 약학적으로 허용되는 부형제 또는 담체, 예컨대 시트르산나트륨 또는 인산이칼슘 및/또는 (a) 충전제 또는 증량제, 예컨대 전분, 락토스, 수크로스, 글루코스, 만니톨, 및 규산, (b) 결합체, 예를 들어, 카복시메틸셀룰로오스, 알지네이트, 젤라틴, 폴리비닐피롤리디논, 수크로스, 및 아카시아, (c) 보습제, 예컨대 글리세롤, (d) 붕해제, 예컨대 한천, 탄산칼슘, 감자 또는 타피오카 전분, 알긴산, 특정 규산염 및 탄산나트륨, (e) 용액 지연제, 예컨대 파라핀, (f) 흡수 촉진제, 예컨대 4차 암모늄 화합물, (g) 습윤제, 예를 들어, 세틸 알코올 및 글리세롤 모노스테아레이트, (h) 흡수제, 예컨대 카올린 및 벤토나이트 점토, 및 (i) 윤활제, 예컨대 활석, 칼슘 스테아레이트, 마그네슘 스테아레이트, 나트륨 폴리에틸렌 글리콜, 나트륨 라우릴 설페이트, 및 이들의 혼합물과 혼합된다. 캡슐, 정제, 및 환제의 경우, 투여 형태는 완충제를 포함할 수 있다.
유사한 유형의 고체 조성물은 고분자량 폴리에틸렌 글리콜 등뿐만 아니라 락토스 또는 유당과 같은 부형제를 사용하여 연질 및 경질-충전된 젤라틴 캡슐에서 충전제로서 사용될 수 있다. 정제, 당의정, 캡슐, 환제, 및 과립의 고체 투여 형태는 장용 코팅 및 약리학 분야에 익히 공지된 기타 코팅과 같은 코팅 및 쉘로 제조될 수 있다. 이들은 임의로 불투명화제를 포함할 수 있고 활성 성분(들)만을 또는 우선적으로 장관의 특정 부분에서 임의로 지연된 방식으로 방출하는 조성물일 수 있다. 사용될 수 있는 캡슐화 조성물의 예는 중합체 물질 및 왁스를 포함한다. 유사한 유형의 고체 조성물은 고분자량 폴리에틸렌 글리콜 등뿐만 아니라 락토스 또는 유당과 같은 부형제를 사용하여 연질 및 경질-충전된 젤라틴 캡슐에서 충전제로서 사용될 수 있다.
활성 성분은 상기 언급된 바와 같이 하나 이상의 부형제와 함께 마이크로-캡슐화된 형태일 수 있다. 정제, 당의정, 캡슐, 환제, 및 과립의 고체 투여 형태는 장용 코팅, 방출 제어 코팅, 및 제약 제형화 분야에서 익히 공지된 기타 코팅과 같은 코팅 및 쉘로 제조될 수 있다. 이러한 고체 투여 형태에서, 활성 성분은 수크로스, 락토스 또는 전분과 같은 적어도 하나의 불활성 희석제와 혼합될 수 있다. 이러한 투여 형태는 일반적인 관행에서와 같이 불활성 희석제 이외의 추가 물질, 예를 들어, 정제화 윤활제 및 기타 정제화 보조제, 예컨대 마그네슘 스테아레이트 및 미정질 셀룰로오스를 포함할 수 있다. 캡슐, 정제 및 환제의 경우, 투여 형태는 완충제를 포함할 수 있다. 이들은 임의로 불투명화제를 포함할 수 있고 활성 성분(들)만을 또는 우선적으로 장관의 특정 부분에서 임의로 지연된 방식으로 방출하는 조성물일 수 있다. 사용할 수 있는 캡슐화제의 예는 중합체 물질 및 왁스를 포함한다.
본 출원에 기재된 화합물의 국소 및/또는 경피 투여를 위한 투여 형태는 연고, 페이스트, 크림, 로션, 겔, 분말, 용액, 스프레이, 흡입제 및/또는 패치를 포함할 수 있다. 일반적으로, 활성 성분은 멸균 조건 하에 약학적으로 허용되는 담체 또는 부형제 및/또는 요구될 수 있는 임의의 필요한 방부제 및/또는 완충제와 혼합된다. 추가로, 본 개시내용은 종종 신체에 활성 성분의 제어된 전달을 제공하는 추가 이점을 갖는 경피 패치의 사용을 고려한다. 이러한 투여 형태는, 예를 들어, 활성 성분을 적절한 매질에 용해 및/또는 분배함으로써 제조될 수 있다. 대안적으로 또는 추가로, 속도는 속도 조절 막을 제공하고/하거나 활성 성분을 중합체 매트릭스 및/또는 겔에 분산시킴으로써 조절될 수 있다.
본 출원에 기재된 피내 약학 조성물을 전달하는 데 사용하기에 적합한 장치는 짧은 바늘 장치를 포함한다. 피내 조성물은 피부로의 바늘의 유효 침투 길이를 제한하는 장치에 의해 투여될 수 있다. 대안적으로 또는 추가로, 통상적인 주사기는 피내 투여의 고전적인 망투(mantoux) 방법에서 사용될 수 있다. 액체 제트 주입기를 통해 및/또는 각질층을 관통하고 진피에 도달하는 제트를 생성하는 바늘을 통해 액체 제형을 진피에 전달하는 제트 주입 장치가 적합하다. 압축 가스를 사용하여 피부의 외부 층을 통해 진피까지 분말 형태의 화합물을 가속화하는 탄도 분말/입자 전달 장치가 적합하다.
국소 투여에 적합한 제형은 액체 및/또는 반액체 제제, 예컨대 도찰제, 로션, 수중유 및/또는 유중수 에멀젼, 예컨대 크림, 연고, 및/또는 페이스트, 및/또는 용액 및/또는 현탁액을 포함하지만 이에 제한되지 않는다. 국소 투여 가능한 제형은, 예를 들어, 약 1% 내지 약 10% (w/w) 활성 성분을 포함할 수 있지만, 활성 성분의 농도는 용매 중의 활성 성분의 용해도 한계만큼 높을 수 있다. 국소 투여용 제형은 본 출원에 기재된 추가 성분 중 하나 이상을 추가로 포함할 수 있다.
본 출원에 기재된 약학 조성물은 협측강을 통한 폐 투여에 적합한 제형으로 제조, 포장 및/또는 판매될 수 있다. 이러한 제형은 활성 성분을 포함하고 약 0.5 내지 약 7 나노미터, 또는 약 1 내지 약 6 나노미터 범위의 직경을 갖는 건조 입자를 포함할 수 있다. 이러한 조성물은 분말을 분산시키기 위해 추진제의 스트림이 지향될 수 있는 건조 분말 저장소를 포함하는 장치를 사용하고/하거나 밀봉된 용기 내의 저비점 추진제에 용해 및/또는 현탁된 활성 성분을 포함하는 장치와 같은 자체 추진 용매/분말 분배 용기를 사용하여 투여하기 위한 건조 분말 형태로 편리하게 존재한다. 이러한 분말은 중량 기준으로 입자의 적어도 98%가 0.5 나노미터 초과의 직경을 갖고 개수 기준으로 입자의 적어도 95%가 7 나노미터 미만의 직경을 갖는 입자를 포함한다. 대안적으로, 중량 기준으로 입자의 적어도 95%는 1 나노미터 초과의 직경을 갖고, 개수 기준으로 입자의 적어도 90%는 6 나노미터 미만의 직경을 갖는다. 건조 분말 조성물은 당과 같은 고체 미세 분말 희석제를 포함할 수 있고 단위 용량 형태로 편리하게 제공된다.
저비점 추진제는 일반적으로 대기압에서 65°F 미만의 비점을 갖는 액체 추진제를 포함한다. 일반적으로, 추진제는 조성물의 50 내지 99.9% (w/w)를 구성할 수 있고, 활성 성분은 조성물의 0.1 내지 20% (w/w)를 구성할 수 있다. 추진제는 액체 비이온성 및/또는 고체 음이온성 계면활성제 및/또는 고체 희석제(활성 성분을 포함하는 입자와 동일한 차수의 입자 크기를 가질 수 있음)와 같은 추가 성분을 추가로 포함할 수 있다.
본 출원에 제공된 약학 조성물에 대한 설명은 주로 인간에게 투여하기에 적합한 약학 조성물에 관한 것이지만, 이러한 조성물은 일반적으로 모든 종류의 동물에 투여하기에 적합하다는 것이 당업자에 의해 이해될 것이다. 다양한 동물에 대한 투여에 적합한 조성물을 만들기 위한 인간에 대한 투여에 적합한 약학 조성물의 변형은 잘 이해되며, 통상의 숙련된 수의 약리학자는 일반적인 실험을 통해 이러한 변형을 설계 및/또는 수행할 수 있다.
본 출원에서 제공된 화합물은 전형적으로 투여의 용이성과 투여량의 균일성을 위해 투여 단위 형태로 제형화된다. 그러나, 본 출원에 기재된 조성물의 총 1일 사용량은 건전한 의학적 판단의 범위 내에서 의사에 의해 결정될 것임을 이해할 것이다. 임의의 특정 대상체 또는 유기체에 대한 특정 치료적 유효 용량 수준은 치료되는 질환 및 장애의 중증도를 포함하는 다양한 인자; 사용된 특정 활성 성분의 활성; 사용된 특정 조성; 대상체의 연령, 체중, 일반적인 건강, 성별 및 식단; 사용된 특정 활성 성분의 투여 시간, 투여 경로 및 배설 속도; 치료 기간; 사용된 특정 활성 성분과 함께 또는 동시에 사용되는 약물; 및 의학계에서 익히 공지된 유사 인자에 따라 달라질 것이다.
본 출원에서 제공되는 화합물 및 조성물은 장내(예를 들어, 경구), 비경구, 정맥내, 근육내, 동맥내, 골수내, 척수내, 피하, 뇌실내, 경피, 피내, 직장, 질내, 복강내, 국소(분말, 연고, 크림, 및/또는 점적제에 의해), 점막, 비강, 협측, 설하를 포함한 임의의 경로에 의해; 기관내 점적, 기관지 점적 및/또는 흡입에 의해; 및/또는 경구 스프레이, 비강 스프레이, 및/또는 에어로졸에 의해 투여될 수 있다. 구체적으로 고려되는 경로는 경구 투여, 정맥내 투여(예를 들어, 전신 정맥내 주사), 혈액 및/또는 림프 공급을 통한 국소(regional) 투여, 및/또는 환부로의 직접 투여이다. 일반적으로, 가장 적절한 투여 경로는 제제의 성질(예를 들어, 위장관 환경에서의 안정성) 및/또는 대상체의 상태(예를 들어, 대상체가 경구 투여를 견딜 수 있는지 여부)를 포함한 다양한 인자에 따라 달라질 것이다.
일부 구현예에서, 본 출원에 개시된 화합물 또는 조성물은 나노입자로 제형화되고/되거나 투여된다. 나노입자는 나노규모의 입자이다. 일부 구현예에서, 나노입자는 직경이 1 μm 미만이다. 일부 구현예에서, 나노입자는 직경이 약 1 nm와 100 nm 사이이다. 나노입자는 덴드리머, 리포솜 또는 중합체 나노입자와 같은 유기 나노입자를 포함한다. 나노입자는 또한 풀러렌, 양자점 및 금 나노입자와 같은 무기 나노입자를 포함한다. 조성물은 나노입자의 응집체를 포함할 수 있다. 일부 구현예에서, 나노입자의 응집체는 균질한 반면, 다른 구현예에서, 나노입자의 응집체는 이질적이다.
유효량을 달성하는 데 필요한 화합물의 정확한 양은, 예를 들어, 대상체의 종, 연령 및 일반적인 상태, 부작용 또는 장애의 중증도, 특정 화합물의 실체, 투여 방식 등에 따라 대상체마다 다를 것이다. 유효량은 단일 용량(예를 들어, 단일 경구 용량) 또는 다중 용량(예를 들어, 다중 경구 용량)에 포함될 수 있다. 특정 구현예에서, 다중 용량이 대상체에게 투여되거나 조직 또는 세포에 적용되는 경우, 다중 용량의 임의의 2회 용량은 본 출원에 기재된 화합물의 상이하거나 실질적으로 동일한 양을 포함한다. 특정 구현예에서, 다중 용량이 대상체에게 투여되거나 조직 또는 세포에 적용되는 경우, 대상체에게 다중 용량을 투여하거나 조직 또는 세포에 다중 용량을 적용하는 빈도는 1일 3회 용량, 1일 2회 용량, 1일 1회 용량, 격일에 1회 용량, 3일에 1회 용량, 매주 1회 용량, 2주에 1회 용량, 3주에 1회 용량, 또는 4주에 1회 용량이다. 특정 구현예에서, 대상체에게 다중 용량을 투여하거나 조직 또는 세포에 다중 용량을 적용하는 빈도는 1일에 1회 용량이다. 특정 구현예에서, 대상체에게 다중 용량을 투여하거나 조직 또는 세포에 다중 용량을 적용하는 빈도는 1일에 2회 용량이다. 특정 구현예에서, 대상체에게 다중 용량을 투여하거나 조직 또는 세포에 다중 용량을 적용하는 빈도는 1일에 3회 용량이다. 특정 구현예에서, 다중 용량이 대상체에게 투여되거나 조직 또는 세포에 적용되는 경우, 다중 용량의 제1 투여와 마지막 투여 사이의 기간은 1일, 2일, 4일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 6개월, 9개월, 1년, 2년, 3년, 4년, 5년, 7년, 10년, 15년, 20년, 또는 대상체, 조직 또는 세포의 수명이다. 특정 구현예에서, 다중 용량의 제1 용량과 마지막 용량 사이의 기간은 3개월, 6개월 또는 1년이다. 특정 구현예에서, 다중 용량의 제1 용량과 마지막 용량 사이의 기간은 대상체, 조직 또는 세포의 수명이다. 특정 구현예에서, 본 출원에 기재된 용량(예를 들어, 단일 용량, 또는 다중 용량의 임의의 용량)은 독립적으로 0.1 μg에서 1 μg까지, 0.001 mg에서 0.01 mg까지, 0.01 mg에서 0.1 mg까지, 0.1 mg에서 1 mg까지, 1 mg에서 3 mg까지, 3 mg에서 10 mg까지, 10 mg에서 30 mg까지, 30 mg에서 100 mg까지, 100 mg에서 300 mg까지, 300 mg에서 1,000 mg까지, 또는 1 g에서 10 g까지의 본 출원에 기재된 화합물을 포함한다. 특정 구현예에서, 본 출원에 기재된 용량은 독립적으로 1 mg에서 3 mg까지의 본 출원에 기재된 화합물을 포함한다. 특정 구현예에서, 본 출원에 기재된 용량은 독립적으로 3 mg에서 10 mg까지의 본 출원에 기재된 화합물을 포함한다. 특정 구현예에서, 본 출원에 기재된 용량은 독립적으로 10 mg에서 30 mg까지의 본 출원에 기재된 화합물을 포함한다. 특정 구현예에서, 본 출원에 기재된 용량은 독립적으로 30 mg에서 100 mg까지의 본 출원에 기재된 화합물을 포함한다.
본 출원에 기재된 용량 범위는 제공된 약학 조성물을 성인에게 투여하기 위한 지침서를 제공한다. 예를 들어, 어린이 또는 청소년에게 투여되는 양은 의료 종사자 또는 당업자에 의해 결정될 수 있고 성인에게 투여되는 양보다 더 낮거나 동일할 수 있다.
본 출원에 기재된 바와 같은 화합물 또는 조성물은 하나 이상의 추가 약제(예를 들어, 치료적 및/또는 예방적 활성제)와 조합하여 투여될 수 있다. 화합물 또는 조성물은 이들의 활성을 개선하고, 생체이용률을 개선하고, 안전성을 개선하고, 약물 내성을 감소시키고, 대사를 감소 및/또는 변형하고, 배설을 억제하고/하거나 대상체 또는 세포에서 분포를 변형시키는 추가 약제와 조합하여 투여될 수 있다. 또한 사용된 요법이 동일한 장애에 대해 원하는 효과를 달성할 수 있고/있거나 상이한 효과를 달성할 수 있음을 인식할 것이다. 특정 구현예에서, 본 출원에 기재된 화합물 및 추가 약제를 포함하는 본 출원에 기재된 약학 조성물은 화합물 및 추가 약제 중 하나를 포함하지만 둘 모두가 아닌 약학 조성물에 없는 상승 효과를 나타낸다.
화합물 또는 조성물은, 예를 들어, 조합 요법으로서 유용할 수 있는 하나 이상의 추가 약제와 동시에, 그 이전에 또는 이후에 투여될 수 있다. 약제는 치료적 활성제를 포함한다. 약제는 또한 예방적 활성제를 포함한다. 약제는 작은 유기 분자, 예컨대 약물 화합물(예를 들어, 연방규정집(Code of Federal Regulations: CFR)에 제공된 바와 같이 미국 식품의약국(U.S. Food and Drug Administration)에 의한 인간 또는 동물용으로 승인된 화합물), 펩티드, 단백질, 탄수화물, 모노사카라이드, 올리고사카라이드, 폴리사카라이드, 핵단백질, 점액단백질, 지단백질, 합성 폴리펩티드 또는 단백질, 단백질에 연결된 소분자, 당단백질, 스테로이드, 핵산, DNA, RNA, 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드, 안티센스 올리고뉴클레오티드, 지질, 호르몬, 비타민 및 세포를 포함한다. 특정 구현예에서, 추가 약제는 질환(예를 들어, 증식성 질환, 신경학적 질환, 통증 병태, 정신 장애 또는 대사 장애)을 치료 및/또는 예방하는 데 유용한 약제이다. 각각의 추가 약제는 해당 약제에 대해 결정된 용량 및/또는 시간 스케줄에 따라 투여될 수 있다. 추가 약제는 또한 단일 용량으로 서로 및/또는 본 출원에 기재된 화합물 또는 조성물과 함께 투여되거나 상이한 용량으로 개별적으로 투여될 수 있다. 용법에서 사용하기 위한 특정 조합은 본 출원에 기재된 화합물과 추가 약제(들)의 상용성 및/또는 달성하고자 하는 원하는 치료 및/또는 예방 효과를 고려할 것이다. 일반적으로, 추가 약제(들)를 조합하여 이들의 개별적으로 사용되는 수준을 초과하지 않는 수준으로 사용할 것으로 예상된다. 일부 구현예에서, 조합하여 사용되는 수준은 개별적으로 사용되는 수준보다 더 낮을 것이다.
일부 구현예에서, 본 출원에 기재된 하나 이상의 조성물이 대상체에게 투여된다. 특정 구현예에서, 대상체는 동물이다. 동물은 두 성별 모두일 수 있고 어떠한 발달 단계에도 있을 수 있다. 특정 구현예에서, 대상체는 인간이다. 다른 구현예에서, 대상체는 비인간 동물이다. 특정 구현예에서, 대상체는 포유동물이다. 특정 구현예에서, 대상체는 비인간 포유동물이다. 특정 구현예에서, 대상체는 가축, 예컨대 개, 고양이, 소, 돼지, 말, 양, 닭, 또는 염소이다. 특정 구현예에서, 대상체는 반려 동물, 예컨대 개 또는 고양이이다. 특정 구현예에서, 대상체는 가축, 예컨대 소, 돼지, 말, 양, 닭, 또는 염소이다. 특정 구현예에서, 대상체는 동물원 동물이다. 또 다른 구현예에서, 대상체는 연구 동물, 예컨대 설치류(예를 들어, 마우스, 래트), 개, 돼지, 또는 인간 이외의 영장류이다.
또한 본 개시내용에 포함되는 것은 키트(예를 들어, 약학적 팩)이다. 제공된 키트는 조성물, 예컨대 약학 조성물, 또는 본 출원에 기재된 화합물 및 용기(예를 들어, 바이알, 앰풀, 병, 주사기 및/또는 디스펜서 패키지, 또는 기타 적합한 용기)를 포함할 수 있다. 일부 구현예에서, 제공된 키트는 임의로 본 출원에 기재된 약학 조성물 또는 화합물의 희석 또는 현탁액을 위한 약학적 부형제를 포함하는 제2 용기를 추가로 포함할 수 있다. 일부 구현예에서, 제1 용기 및 제2 용기에 제공된 본 출원에 기재된 약학 조성물 또는 화합물은 조합되어 하나의 단위 투여 형태를 형성한다.
따라서, 한 양태에서, 본 출원에 기재된 화합물 또는 조성물을 포함하는 제1 용기를 포함하는 키트가 제공된다. 특정 구현예에서, 키트는 이를 필요로 하는 대상체에서 질환을 치료하는 데 유용하다. 특정 구현예에서, 키트는 이를 필요로 하는 대상체에서 질환을 예방하는 데 유용하다. 특정 구현예에서, 키트는 이를 필요로 하는 대상체에서 질환이 발병할 위험을 감소시키는 데 유용하다.
특정 구현예에서, 본 출원에 기재된 키트는 키트를 사용하기 위한 지침서를 추가로 포함한다. 본 출원에 기재된 키트는 미국 식품의약국(FDA)과 같은 규제 기관에 의해 요구되는 정보를 포함할 수도 있다. 특정 구현예에서, 키트에 포함된 정보는 처방 정보이다. 특정 구현예에서, 키트 및 지침서는 이를 필요로 하는 대상체에서 질환을 치료하기 위해 제공된다. 특정 구현예에서, 키트 및 지침서는 이를 필요로 하는 대상체에서 질환을 예방하기 위해 제공된다. 특정 구현예에서, 키트 및 지침서는 이를 필요로 하는 대상체에서 질환이 발병할 위험을 감소시키기 위해 제공된다. 본 출원에 기재된 키트는 별도의 조성물로서 본 출원에 기재된 하나 이상의 추가 약제를 포함할 수 있다.
일부 구현예에서, 조성물은 소비재, 예컨대 식료품, 화장품, 세면도구, 음용 가능, 흡입 가능 및 웰빙 제품을 포함한다. 예시적인 소비재는 연고, 왁스, 분말 농축액, 페이스트, 추출물, 팅크제(tincture), 분말, 오일, 캡슐, 피부 패치, 설하 경구 용량 점적제, 점막 경구 스프레이 용량, 메이크업, 향수, 샴푸, 화장품 비누, 화장품 크림, 스킨 로션, 아로마 에센셜 오일, 마사지 오일, 면도용 제제, 세면용 오일, 립밤, 화장품 오일, 세안 워시, 보습 크림, 보습 바디 로션, 보습 페이스 로션, 목욕 소금, 목욕 젤, 액체 형태의 목욕 비누, 샤워 젤, 배스 밤(bath bomb), 헤어 케어 제제, 샴푸, 컨디셔너, 초콜릿 바, 브라우니, 초콜릿, 쿠키, 크래커, 케이크, 컵케이크, 푸딩, 꿀, 초콜릿 과자, 냉동 과자, 과일 기반 과자, 설탕 과자, 젤리 사탕, 당의정, 패스트리, 시리얼 바, 초콜릿, 시리얼 기반 에너지 바, 사탕, 아이스크림, 차 기반 음료, 커피 기반 음료 및 허브 주입물을 포함한다.
본 발명은 하기 실시예에 의해 추가로 예시되며, 이는 결코 제한하는 것으로 해석되어서는 안 된다. 본 출원 전반에 걸쳐 인용된 모든 참조(문헌 참조, 허여된 특허, 공개 특허 출원 및 계류중 특허 출원 포함)의 전체 내용은 본원에 명시적으로 참조로 포함된다. 본 출원에 포함된 참조는 그 정의가 본 개시내용에서 정의된 것과 동일한 용어의 정의와 모순되거나 양립할 수 없는 용어를 포함하는 경우, 본 개시내용의 용어에 부여된 의미가 우선될 것이다. 그러나, 본 출원에 인용된 임의의 참조, 논물, 공개물, 특허, 특허 공보 및 특허 출원에 대한 언급은 이들이 유효한 선행 기술을 구성하거나 전 세계 모든 국가에서 공통 일반 지식의 일부를 형성한다는 제안의 임의의 형태 또는 승인으로서 간주되어서는 안된다.
실시예
실시예 1: 칸나비크로멘산 신타제(CBCAS)의 기능적 발현을 확인하기 위한 1차 고처리량 스크린
숙주 세포에서 기능적으로 발현될 수 있는 CBCAS 유전자를 확인하기 위해, 약 3000개의 후보 CBCAS 유전자의 라이브러리는 내부 코드베이스 및 도메인 지식을 기반으로 설계되었으며, 효소 패밀리, 생태적 지위(ecological niche) 및 구조적 상동성에 걸쳐 샘플링되었다. 단백질 서열은 에스. 세레비지아에에서의 발현을 위해 인 실리코로 기록되었고 도 5에 나타낸 통합 효모 발현 벡터에서 합성되었다. 각각의 후보 효소 발현 작제물은 도 2에서 반응 R4를 촉매할 수 있는 프레닐트랜스퍼라제 효소를 또한 발현하는 에스. 세레비지아에 CEN PK 균주로 형질전환되었다. GFP를 발현하는 균주 t616313은 효소 활성에 대한 음성 대조군으로서 라이브러리 스크린에 포함되었다.
이전에 개시된 추정 씨. 사티바 CBCAS 효소는 활성인 것으로 밝혀지지 않았다. 대신에, 씨. 사티바 THCAS 효소(서열번호 23에 기재됨)는 본 실시예에 기재된 검정을 사용하여 THCAS 활성 이외에 CBCAS 활성을 나타내는 것으로 밝혀졌으며, 따라서 CBCAS 활성에 대한 양성 대조군(균주 t616315)으로서 사용되었다. 라이브러리의 모든 후보 효소뿐만 아니라 양성 대조군 균주 t616315에 의해 발현된 효소는 N-말단 MF알파2 신호 펩티드(서열번호 16), (MF알파2 신호 펩티드의 N-말단에 부가된 메티오닌 잔기 포함), 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 포함하였다.
TS 활성을 검출하기 위한 검정을 다음과 같이 수행하였다: 후보 CBCAS 형질전환체의 해동된 글리세롤 스톡 각각을 YEP + 4% 덱스트로스 배지의 웰에 스탬핑하였다. 샘플을 2일 동안 진탕 인큐베이터에서 30℃에서 인큐베이션하였다. 생성된 배양물 각각의 일부를 YEP + 4% 갈락토스 + 1 mM 올리베톨산의 웰에 스탬핑하였다(도 1 구조 6a). 샘플을 20℃에서 인큐베이션하고 진탕 인큐베이터에서 4일 동안 진탕하였다. 그 4일 동안 24시간마다 2% 갈락토오스와 1 mM 올리베톨산을 배양액에 첨가하였다. pH 5.5로 조정된 시트르산나트륨 완충액을 100 mM의 최종 농도로 각 웰에 첨가하였다. 샘플을 20℃에서 인큐베이션하고 진탕 인큐베이터에서 2일 동안 진탕하였다. 생성된 생성물 배양물 각각의 일부를 인산염 완충 식염수(PBS)의 웰에 스탬핑하였다. 광학 측정은 플레이트 판독기에서 수행되었으며 이때 흡광도는 600 nm에서 측정되었고 485 nm의 여기로 형광은 528 nm에서 측정되었다. 샘플을 2일 동안 진탕 인큐베이터에서 30℃에서 인큐베이션하였다. 100% 메탄올을 절반-높이 딥웰 플레이트에서 생성 배양물에 스탬핑하였다. 플레이트를 열 밀봉하고 동결시켰다. 이어서, 샘플을 30분 동안 해동하고 4℃에서 회전하였다. 상층액의 일부를 절반-영역 96웰 플레이트에 스탬핑하였다. 샘플에서 CBCA, THCA 및 CBDA 생성은 액체 크로마토그래피-질량 분석법(LC-MS)을 통해 정량화되었다.
후보 CBCAS 효소의 라이브러리는 상기 기재된 검정을 사용하여 1차 고처리량 스크린에서 활성에 대해 검정하였다. LC-MS 분석은 측정 가능한 양의 CBCA를 생성하는 단일 "히트" CBCAS(균주 t619896, N-말단 MF알파2 신호 펩티드 (MF알파2 신호 펩티드의 N-말단에 부가된 메티오닌 잔기와 함께) 및 C-말단 HDEL 신호 펩티드에 연결된 서열번호 25의 에이. 니제르 단백질을 발현함)를 밝혀냈다.
놀랍게도, 후보 에이. 니제르 CBCAS 효소는 씨. 사티바 CBCAS 및 THCAS 효소와 매우 낮은 서열 동일성을 갖는다. 에이. 니제르 CBCAS 효소(서열번호 27 (UniProt 수탁 번호 A0A254UC34), 서열번호 25 + N-말단에서 메티오닌 잔기에 상응함)와 추정 씨. 사티바 CBCAS 효소(서열번호 15) 및 씨. 사티바 THCAS 효소(서열번호 20, UniProt 수탁 번호 I1V0C5에 상응함)의 정렬은 디폴트 매개변수를 갖는 BLASTP를 사용하여 각각 21.15% 동일성 및 21.71% 동일성을 나타낸다.
1차 스크린에서 확인된 후보 CBCAS 효소의 활성을 확인하기 위해, 2차 스크리닝을 수행하여 CBCA 생성을 확인하였다. 2차 스크린에 대한 실험 프로토콜은 균주당 추가 생물학적 복제물이 포함되었고 각 균주에 대한 복제물 생산 배양물에 1 mM 올리베톨산 또는 1 mM 디바르산을 별도로 공급했다는 것을 제외하고는 1차 스크리닝과 동일하였다. 모든 균주를 4중으로 스크리닝하였다.
1차 스크린과 일치하게, 2차 스크린은 이 균주에 의해 생성된 CBCA의 역가에 의해 나타난 바와 같이 균주 t619896에 대한 CBCAS 활성을 나타냈다(표 5 및 도 6).
표 5: 에스
.
세레비지아에에서 CBCAS 후보 효소의 2차 스크리닝으로부터의 CBCA 역가
놀랍게도, 균주 t619896은 또한 이 균주에 의해 생성된 CBCVA의 역가에 의해 나타난 바와 같이 CBCVAS 활성을 나타냈다(표 6 및 도 7). 2차 스크린에서 CBCA의 생성을 위한 양성 대조군으로 사용된 균주 t616315는 CBCVAS 활성을 나타내지 않았다(표 6 및 도 7).
표 6: 에스
.
세레비지아에에서 CBCAS 후보 효소의 2차 스크리닝으로부터의 CBCVA 역가
균주 t619896은 또한 89.60% CBCA, 5.67% CBDA, 및 4.73% THCA로 이루어진 말단 칸나비노이드 생성물 프로파일을 생성하는 THCA 및 CBDA의 생성을 나타냈다(표 7).
표 7: 에스. 세레비지아에에서 CBCAS 후보 효소의 2차 스크리닝으로부터의 CBCA, THCA, 및 CBDA 역가
따라서, 약 3000개의 후보 유전자 중에서, 하나의 CBCAS가 에스. 세레비지아에 숙주 세포서 발현될 때 측정 가능한 양의 CBCA 및 CBCVA를 생성할 수 있는 것으로 놀랍게도 확인되었다. 이러한 스크린에서 확인된 CBCAS는 칸나비노이드 생합성에 유용할 수 있다.
실시예 2: 에이. 니제르 CBCAS 의 단백질 조작
실시예 1에서 확인된 에이. 니제르 CBCAS(서열번호 29(신호 펩티드를 가짐); 서열번호 27(신호 펩티드를 갖지 않으며 N-말단 메티오닌(UniProt 수탁 번호 A0A254UC34)를 포함함); 또는 서열번호 25(신호 펩티드를 갖지 않고 N-말단 메티오닌을 갖지 않음)에 상응함)의 조작이 CBCAS 기질 특이성, 생성물 특이성 및/또는 생성된 생성물의 양을 변경할 수 있는지 여부를 결정하기 위해, 점 돌연변이는 에이. 니제르 CBCAS에서 생성되었고 단백질의 돌연변이체 버전은 에스. 세레비지아에에서 발현되었다. 1047개 에이. 니제르 CBCAS 돌연변이체를 포함하는 라이브러리가 생성되었고 스크리닝되었다. 실시예 1에서와 같이, 라이브러리의 각 CBCAS 돌연변이체뿐만 아니라 양성 대조군 균주에 의해 발현된 효소는 N-말단 MF알파2 신호 펩티드(서열번호 16) (MF알파2 신호 펩티드의 N-말단에 부가된 메티오닌 잔기를 가짐) 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 포함하였다.
에이. 니제르 CBCAS의 돌연변이된 버전을 균주 발현함으로써 화학식 (9a), (10a), 및/또는 (11a)의 화합물을 포함한 화학식 (9), (10), 및/또는 (11)의 생성을 정량화하여 야생형 에이. 니제르 CBCAS를 발현하는 균주, 씨. 사티바 THCAS를 발현하는 균주 및 씨. 사티바 CBDAS를 발현하는 균주에 의한 동일한 화합물의 생성과 비교하였다. 균주는 실시예 1에 기재된 것과 동일한 검정을 사용하여 스크리닝하였다. 샘플에서 CBCA, THCA 및/또는 CBDA의 생성은 LC-MS를 통해 정량화하였다.
원래의 1047개의 라이브러리 구성원 중, 55개 균주가 2차 스크리닝으로 상승되어 CBCA 생성을 확인하였다. 2차 스크린에 대한 실험 프로토콜은 균주당 추가 생물학적 복제물이 포함되었고 각 균주에 대한 복제물 생성 배양물에 1 mM 올리베톨산 또는 1 mM 디바르산을 별도로 공급했다는 것을 제외하고는 1차 스크리닝과 동일하였다. 모든 균주를 4중으로 스크리닝하였다.
2차 스크린에서 평가된 55개 균주 중에서, 21개는 다음을 포함하여 에이. 니제르 양성 대조군보다 더 높은 평균 CBCA 역가를 나타냈다: 서열번호 27에 비해 A57Q 및 G61A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878470; 서열번호 27에 비해 V260M 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이 변이체를 발현하는 균주 t865743; 서열번호 27에 비해 V62I 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865737; 서열번호 27에 비해 V386A 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865746; 서열번호 27에 비해 V260F 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865744; 서열번호 27에 비해 E112V 및 N122S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865717; 서열번호 27에 비해 A57E 및 I126A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865694; 서열번호 27에 비해 T33D 및 N257S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865726; 서열번호 27에 비해 N202S 및 P472A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878465; 서열번호 27에 비해 D410N 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865771; 서열번호 27에 비해 R450K 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865739; 서열번호 27에 비해 S180T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865750; 서열번호 27에 비해 R183T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878464; 서열번호 27에 비해 N122G 및 I126R 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865689; 서열번호 27에 비해 N122A 및 I126T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865690; 서열번호 27에 비해 Y71I 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865749; 서열번호 27에 비해 H287R 및 A341S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865728; 서열번호 27에 비해 T55S 및 I126T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865805; 서열번호 27에 비해 N122G 및 V398F 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865711; 서열번호 27에 비해 M394T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865714; 및 서열번호 27에 비해 A57E 및 N131S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865729. (도 8a; 표 8)
놀랍게도, 이러한 21개의 돌연변이체 CBCAS 히트는 또한 CBCA에 대한 향상된 생성물 특이성을 나타냈다. 예를 들어, 에이. 니제르 양성 대조군은 73.74% CBCA, 21.55% CBDA, 및 4.72% THCA로 이루어진 말단 칸나비노이드 생성물 프로파일을 생성하는 반면, 80% 초과(CBCA (80-83% CBCA, 13-14% CBDA 및 3-5% THCA)를 생성하는 특정 CBCAS 돌연변이체가 확인되었다.
2차 스크린에서 평가된 55개 균주 중에서, 24개는 다음을 포함하여 에이. 니제르 양성 대조군보다 더 높은 평균 CBCVA 역가를 나타냈다: 서열번호 27에 비해 V63I 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865745; 서열번호 27에 비해 N122G 및 I126R 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865689; 서열번호 27에 비해 P472R 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865718; 서열번호 27에 비해 S180T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865750; 서열번호 27에 비해 V398A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865747; 서열번호 27에 비해 R183T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878464; 서열번호 27에 비해 V260M 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865743; 서열번호 27에 비해 V386A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865746; 서열번호 27에 비해 H426Y 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865732; 서열번호 27에 비해 Y256M 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865741; 서열번호 27에 비해 N202S 및 P472A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878465; 서열번호 27에 비해 N122G 및 I126K 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865720; 서열번호 27에 비해 V62I 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865737; 서열번호 27에 비해 R450K 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865739; 서열번호 27에 비해 Y129W 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865723; 서열번호 27에 비해 S423A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865751; 서열번호 27에 비해 H287R 및 A341S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865728; 서열번호 27에 비해 N295S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865736; 서열번호 27에 비해 Y39F 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865748; 서열번호 27에 비해 V260F 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865744; 서열번호 27에 비해 L392H 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865755; 서열번호 27에 비해 A57E 및 N131S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865729; 서열번호 27에 비해 E112V 및 N122S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865717; 및 서열번호 27에 비해 T33D 및 N257S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865726. (도 9a; 표 9) 올리베톨산에서 확인된 히트와는 달리, 디바르산으로부터 생성된 말단 칸나비노이드 사이에서는 생성물 프로파일의 변화가 관찰되지 않았다. 오히려, 이러한 생성물 프로파일은 에이. 니제르 대조군 및 돌연변이체 히트 둘 모두에 대해 67-70% CBCVA 및 30-33% THCVA였다. 놀랍게도, CBDVA는 이 스크린에서 평가된 CBCAS 후보에 의해 생성된 생성물 중에서 관찰되지 않았다.
다중 라이브러리 균주가 THCA 및 THCVA를 생성하는 것으로 관찰되었다. 에이. 니제르 CBCAS를 발현하는 균주 t865768은 양성 대조군 THCAS 균주보다 더 높은 평균 THCA 역가를 생성하였다 (도 8b; 표 8). 추가로, 에이. 니제르 CBCAS 돌연변이체를 발현하는 33개의 라이브러리 균주는 양성 대조군 THCAS 균주보다 더 높은 평균 THCA 역가를 생성하였다 (도 8b; 표 8). 추가로, 에이. 니제르 CBCAS를 발현하는 균주 t865768, 및 에이. 니제르 CBCAS 돌연변이체를 발현하는 대부분의 시험된 라이브러리 균주는 양성 대조군 THCAS 균주보다 더 많은 THCVA를 생성하였다 (도 9b; 표 9).
다중 라이브러리 균주가 CBDA를 생성하는 것으로 관찰되었다. 에이. 니제르 CBCAS를 발현하는 균주 t865768, 및 대마초 CBDAS를 발현하는 에이. 니제르 CBCAS 돌연변이체를 발현하는 대부분의 시험된 라이브러리 균주는 양성 대조군 CBDAS 균주(t876607)보다 더 많은 CBDA를 생성하였다. 이전 보고서(Luo et al. Nature, 2019 Mar;567(7746):123-126)와 일치하게, 대마초 CBDAS는 에스. 세레비지아에 숙주 세포에서 활성이 낮거나 활성이 전혀 없다: (도 8c; 표 8). 시험된 어떠한 라이브러리 균주도 CBDVA를 생성하는 것으로 발견되지 않았다 (도 9c; 표 9).
표 8: 에스
.
세레비지아에에서 CBCAS 후보 효소의 단백질 조작으로부터의 CBCA, THCA, 및 CBDA 역가
표 9: 에스
.
세레비지아에에서 CBCAS 후보 효소의 단백질 조작으로부터의 CBCVA, THCVA, 및 CBDVA 역가
실시예 3: 메타게놈 칸나비크로멘산 신타제(CBCAS)를 확인하기 위한 고처리량 스크린
우리가 아는 한, 실시예 1에서 확인된 에이. 니제르로부터의 CBCAS는 대마초 속 외부에서 발견된 이러한 활성을 가진 제1 효소를 나타낸다. 더 넓은 메타게놈에 다른 추정 CBCAS가 존재할 수 있는지 여부를 조사하기 위해, 1072개의 후보 CBCAS 유전자의 라이브러리는 실시예 1에서 확인된 에이. 니제르 CBCAS 효소를 참조로 사용하여 설계되었다. 단백질 서열은 에스. 세레비지아에에서의 발현을 위해 인 실리코로 기록되었고 도 5에 나타낸 통합 효모 발현 벡터에서 합성되었다. 각각의 후보 효소 발현 작제물을 도 2에서 반응 R4를 촉매할 수 있는 프레닐트랜스퍼라제 효소를 또한 발현하는 에스. 세레비지아에 CEN.PK 균주로 형질전환시켰다. GFP를 발현하는 균주 t616313은 효소 활성에 대한 음성 대조군으로서 라이브러리 스크린에 포함되었다. 실시예 1에서 확인된 에이. 니제르 효소를 발현하는 균주 t807925는 효소 활성에 대한 양성 대조군으로 라이브러리 스크린에 포함되었다. 라이브러리의 모든 후보 효소뿐만 아니라 양성 대조군 균주 t807925에 의해 발현된 효소는 N-말단 MF알파2 신호 펩티드(서열번호 16) (MF알파2 신호 펩티드의 N-말단에 부가된 메티오닌 잔기 포함) 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 포함하였다.
후보 CBCAS 효소의 라이브러리는 실시예 1에 기재된 검정을 사용하여 1차 고처리량 스크린에서 활성에 대해 검정하였다. 샘플에서 CBCA, THCA 및/또는 CBDA의 생성은 LC-MS를 통해 정량화하였다.
1차 스크린의 결과에 기초하여, 70개의 균주를 2차 스크린으로 넘겨 1차 스크린에서 관찰된 활성을 확인하였다. 2차 스크린에 대한 실험 프로토콜은 균주당 추가 기술 복제물이 포함되었고 각 균주에 대한 복제물 생성 배양물에 1 mM 올리베톨산 또는 1 mM 디바르산을 별도로 공급했다는 것을 제외하고는 1차 스크린과 동일하였다. 모든 균주를 4중 스크리닝하였다 (도 10a-10c, 표 10 및 11). 균주 ID 및 이들의 상응하는 서열을 표 15에 나타낸다.
이러한 결과는 놀랍게도 CBCA 및/또는 CBCVA를 생성할 수 있는 다중 균주를 확인하였다. 구체적으로, 17개의 균주는 양성 대조군(균주 t807925의 평균 CBCA 역가의 적어도 표준 편차 1 내에서 평균 CBCA 역가에 상응함)에 의해 생성된 양에 필적하는 양의 CBCA를 생성한 반면, 2개의 균주(t808223 및 t808199)는 균주 t807925의 평균 CBCA 역가의 표준 편차 1 초과의 역가로 CBCA를 생성하였다(도 10a). 28개의 균주는 양성 대조군에 필적하는 CBCVAS 활성을 나타내었다(도 11a). 이러한 17개의 균주 중, t807854 - 서열번호 112, t807933 - 서열번호 130, t808225 - 서열번호 166, t808026 - 서열번호 144, 및 t8082001 - 서열번호 164를 포함하는 다중 균주는 에이. 니제르 양성 대조군보다 CBCA의 백분율이 더 높은 말단 칸나비노이드 생성물 프로파일을 생성했으며, 1개의 균주(t807854 - 서열번호 112)는 97% 초과의 CBCA 프로파일을 갖는 말단 칸나비노이드 생성물을 생성하였다.
실시예 1에서 확인된 에이. 니제르 CBCAS와 > 95% 서열 동일성을 나타내는 후보 CBCAS의 서브세트가 확인되었다 (도 13).
CBCA 및/또는 CBCVA를 생성하는 여러 균주가 이들의 각각의 기질(예를 들어, CBGA 또는 CBGVA)을 완전히 고갈시킨 것으로 관찰되었다 (도 12a-12b, 표 12). 따라서, CBCA 및/또는 CBCVA를 생성할 수 있는 다중 균주가 확인되었지만, 관찰된 기질 고갈은 CBCA의 생성에 기반하여 균주 간의 효과적인 순위를 배제한다.
표 10: 에스
.
세레비지아에에서 CBCAS 후보 효소의 메타게놈 스크리닝으로부터의 CBCA, THCA, 및 CBDA 역가
* 표에 제공된 TS 서열번호는 각 TS의 완전한 단백질 서열에 상응한다. 스크린과 관련하여, 2개의 신호 펩티드가 각각의 TS 서열에 부착되었다. N-말단에서, N-말단 메티오닌이 각각의 TS 서열로부터 제거되고, TS 서열이 서열번호 16에 상응하는 신호 펩티드에 연결되고, 메티오닌 잔기가 서열번호 16의 N-말단에 부가되었다. C-말단에서, 각각의 TS 서열이 서열번호 17에 상응하는 신호 펩티드에 연결되었다.
표 11: 에스. 세레비지아에에서 CBCAS 후보 효소의 메타게놈 스크리닝으로부터의 CBCVA, THCVA, 및 CBDVA 역가
* 표에 제공된 TS 서열번호는 각 TS의 완전한 단백질 서열에 상응한다. 스크린과 관련하여, 2개의 신호 펩티드가 각각의 TS 서열에 부착되었다. N-말단에서, N-말단 메티오닌이 각각의 TS 서열로부터 제거되고, TS 서열이 서열번호 16에 상응하는 신호 펩티드에 연결되고, 메티오닌 잔기가 서열번호 16의 N-말단에 부가되었다. C-말단에서, 각각의 TS 서열이 서열번호 17에 상응하는 신호 펩티드에 연결되었다.
표 12: 에스. 세레비지아에에서 CBCAS 후보 효소의 메타게놈 스크리닝으로부터의 CBGA 및 CBGVA 잔류 기질
* 표에 제공된 TS 서열번호는 각 TS의 완전한 단백질 서열에 상응한다. 스크린과 관련하여, 2개의 신호 펩티드가 각각의 TS 서열에 부착되었다. N-말단에서, N-말단 메티오닌이 각각의 TS 서열로부터 제거되고, TS 서열이 서열번호 16에 상응하는 신호 펩티드에 연결되고, 메티오닌 잔기가 서열번호 16의 N-말단에 부가되었다. C-말단에서, 각각의 TS 서열이 서열번호 17에 상응하는 신호 펩티드에 연결되었다.
실시예 4: CBCAS 활성에 대한 신호 펩티드에 대한 요건 평가
번역 후 변형(예를 들어, 분자내 이황화 브릿지 형성, 번역 후 글리코실화 등)은 대마초 말단 신타제의 활성에 중요한 것으로 공지되어 있다. 말단 신타제 효소 상의 신호 펩티드의 존재는 번역 후 변형을 촉진하는 데 도움이 될 수 있다. 그러나, 실시예 1에서 확인된 에이. 니제르 CBCAS 또는 실시예 3에서 확인된 추가 CBCAS가 신호 펩티드가 활성화되어야 하는지 여부는 공지되어 있지 않았다.
N-말단 MF알파2 신호 펩티드(서열번호 16) 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 갖거나 갖지 않는 CBCAS 효소의 버전을 포함하는, 실시예 1 및 3으로부터 선택된 20개의 CBCAS 효소의 라이브러리가 합성되었다. 각각의 후보 효소 발현 작제물을 도 2에서 반응 R4를 촉매할 수 있는 프레닐트랜스퍼라제 효소를 또한 발현하는 에스. 세레비지아에 CEN.PK 균주로 형질전환시켰다. 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t861555는 Mf알파2 및 HDEL 신호 펩티드를 둘 모두 보유하고 효소 활성에 대한 양성 대조군으로서 라이브러리 스크린에 포함되었다. 균주 t861565는 Mf알파2 및 HDEL 신호 펩티드를 갖지 않는 동일한 에이. 니제르 CBCAS를 발현하였다.
다음을 제외하고 실시예 1에 기재된 검정을 사용하여 균주를 스크리닝하였다: 4일 차에 샘플을 pH 조정하지 않고 20℃에서 추가로 2일 동안 인큐베이션하였다.
12개의 균주는 t861555 양성 대조군보다 더 큰 평균 CBCAS 활성을 나타내었다(도 14, 표 13). 놀랍게도, 2개의 신호 펩티드의 영향은 CBCAS 후보의 실체에 따라 달라지는 것으로 밝혀졌다: 일부 경우에, 2개의 신호 펩티드의 존재가 CBCAS 활성을 향상시키는 것으로 관찰된 반면, 다른 경우에는 활성을 감소시키는 것으로 관찰되었다. 에이. 니제르 CBCAS로부터의 2개의 신호 펩티드의 부재는 CBCAS 활성에 상당한 긍정적인 영향을 미쳤다. 신호 펩티드 없이 에이. 니제르 CBCAS를 발현하는 t861565 균주는 신호 펩티드를 갖는 에이. 니제르 CBCAS를 발현하는 t861555 균주보다 약 4배 더 높은 CBCA 역가를 나타냈다.
표 13: 에스
.
세레비지아에에서 신호 펩티드를 갖거나 갖지 않는 CBCAS 후보 효소의 스크리닝으로부터의 CBCA 역가
* 표에 제공된 TS 서열번호는 각 TS의 완전한 단백질 서열에 상응한다. 스크린과 관련하여, 신호 펩티드로 TS 서열을 발현하기 위해 "Y"로 표시된 균주의 경우, 2개의 신호 펩티드가 각각의 TS 서열에 부착되었다. N-말단에서, N-말단 메티오닌이 각각의 TS 서열로부터 제거되고, TS 서열이 서열번호 16에 상응하는 신호 펩티드에 연결되고, 메티오닌 잔기가 서열번호 16의 N-말단에 부가되었다. C-말단에서, 각각의 TS 서열이 서열번호 17에 상응하는 신호 펩티드에 연결되었다.
**단일 생체복제, 표준 편차 해당 없음
실시예 5: 실시예 1-4에서 확인된 CBCAS 효소가 풍부한 서열 모티프의 확인
실시예 4로부터의 CBCAS 효소의 분석은 에이. 니제르 CBCAS보다 더 큰 평균 CBCA 역가를 생성하는 CBCAS 효소가 풍부한 다중 서열 모티프를 확인하였다. 표 14는 확인된 모티프에 대한 서열 정보를 제공한다.
TS 효소의 3차원 구조 내에서 서열 모티프가 어디에 위치하는지를 결정하기 위해 관련 단백질로부터의 결정 구조를 사용하여 구조 모델을 생성하였다. 도 15 및 16은 몇몇 확인된 서열 모티프의 예측된 국소화를 나타내는 리본 다이어그램을 도시한다. 도 15에서 화살표로 나타낸 서열 모티프 KVQARSGGH(서열번호 174), CPTI[KR]TGGH(서열번호 181), 및 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 보조인자 결합 부위와 접촉할 것으로 예측되고 따라서 보조인자 결합에 영향을 미칠 수 있다.
도 16에서 화살표로 나타낸 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)는 기질 결합 포켓 근처에 있을 것으로 예측된다. 도 16에서 화살표로 나타낸 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 활성 부위의 공동에 라인을 형성할 것으로 예측되며 잠재적으로 기질 또는 생성물 특이성에 영향을 미칠 수 있다.
표 14. 후보 CBCAS에서 확인된 모티프 서열
* 표는 실시예 4에 제시된 데이터를 기반으로 모든 TS에 대한 2개의 균주를 포함한다. 각각의 TS에 대해, 하나의 균주는 신호 펩티드를 갖는 TS를 발현하고(각 균주에 대한 상단 행), 하나의 균주는 신호 펩티드가 없이 TS를 발현하였다(각 균주에 대한 하단 행).
** 표에 제공된 TS 서열번호는 각 TS의 완전한 단백질 서열에 상응한다. 스크린과 관련하여, 신호 펩티드로 TS를 발현하는 균주(각 균주에 대한 상단 행)에 대해, 2개의 신호 펩티드가 각 TS 서열에 부착되었다. N-말단에서, N-말단 메티오닌이 각각의 TS 서열로부터 제거되고, TS 서열이 서열번호 16에 상응하는 신호 펩티드에 연결되고, 메티오닌 잔기가 서열번호 16의 N-말단에 부가되었다. C-말단에서, 각각의 TS 서열이 서열번호 17에 상응하는 신호 펩티드에 연결되었다.
실시예 6: 조작된 에스. 세레비지아에 숙주 세포에서 칸나비노이드의 생합성
CoA-티오에스테르에 대한 유기산의 활성화, 및 이 티오에스테르와 다수의 말로닐-CoA 분자 또는 기타 유사한 폴리케타이드 증량제 단위의 후속 축합은 공지된 모든 칸나비노이드의 생합성에서 처음 두 단계를 나타낸다. CBGA(도 1, 화학식 8a), CBDA(도 1, 화학식 9a), THCA(도 1, 화학식 10a), 및/또는 CBCA(도 1, 화학식 11a)의 생합성을 입증하기 위해, 도 1 에 나타낸 칸나비노이드 생합성 경로는 원시영양 에스. 세레비지아에 CEN.PK 숙주 세포의 게놈에서 어셈블리되며, 여기서 각각의 효소(R1a-R5a)는 하나 이상의 카피로 존재할 수 있다. 예를 들어, 에스. 세레비지아에 숙주 세포는 AAE, OLS, OAC, PT, 및 TS 중 하나 이상의 하나 이상의 카피를 발현할 수 있다.
사용된 AAE 효소는 헥산산에 대한 활성을 갖는 에스. 세레비지아에 또는 이의 변이체에서 기능적으로 발현되는 자연 발생 또는 합성 AAE일 수 있다. OLS 효소는 에스. 세레비지아에에서 기능적으로 발현되는 자연 발생 또는 합성 OLS일 수 있다. OAC 효소는 에스. 세레비지아에에서 기능적으로 발현되는 자연 발생 또는 합성 OLS일 수 있다. 이기능성 OLS가 사용되는 경우, 별도의 OAC 효소를 생략하거나 생략하지 않을 수 있다. PT 효소는 에스. 세레비지아에에서 기능적으로 발현되는 자연 발생 또는 합성 PT일 수 있다.
TS 효소는 씨. 사티바로부터의 TS, 씨. 사티바로부터의 TS의 변이체 및/또는 비-대마초 종으로부터의 TS를 포함하는, 에스. 세레비지아에 또는 이의 변이체에서 기능적으로 발현되는 자연 발생 또는 합성 TS일 수 있다. TS 효소는 CBCA, CBCVA, THCA, THCVA, CBDA, 및 CBDVA 중 하나 이상을 주요 생성물로 생성하는 TS일 수 있다. TS 효소는 본 개시내용에 제공된 하나 이상의 TS 효소를 포함할 수 있다.
칸나비노이드 발효 절차는 생성 배양물의 인큐베이션을, 예를 들어, 48-144시간 동안 지속할 수 있고 생성 배양물을, 예를 들어, 24시간마다 4% 갈락토스 및 1 mM 헥사노산나트륨으로 보충할 수 있다는 것을 제외하고는 상기 실시예에 기재된 검정과 유사할 수 있다. CBCA, CBCVA, THCA, THCVA, CBDA, 및 CBDVA의 역가는 LC-MS를 통해 정량화된다.
개시내용과 관련된 서열
표 15. 실시예 3* 및 실시예 4**에 기재된 후보 CBCAS의 서열
* 실시예 3의 라이브러리 스크린의 경우, N-말단 MF알파2 신호 펩티드(서열번호 16) 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 갖는 표 15에 제공된 TS 서열이 발현되었다. 메티오닌 잔기는 도 15에 제공된 TS 서열의 N-말단으로부터 제거되었다. 메티오닌 잔기는 서열번호 16의 N-말단에 대신에 부가되었다.
** 실시예 4의 라이브러리 스크린의 경우, N-말단 및 C-말단 신호 펩티드를 갖거나 갖지 않은 TS 서열이 발현되었다. 신호 펩티드를 갖는 TS 서열이 발현되는 경우, 실시예 3에 대해 상기 기재된 것과 동일한 접근법을 사용하였다.
본 출원에 개시된 서열은 신호 서열을 포함하거나 포함하지 않을 수 있음을 인식해야 한다. 본 출원에 개시된 서열은 신호 서열이 있거나 없는 버전을 포함한다. 또한, 본 출원에 개시된 단백질 서열은 개시 코돈(M)이 있거나 없는 것으로 도시될 수 있음을 이해해야 한다. 본 출원에 개시된 서열은 개시 코돈이 있거나 없는 버전을 포함한다. 따라서, 일부 경우에 아미노산 넘버링은 개시 코돈을 포함하는 단백질 서열에 상응할 수 있는 반면, 다른 경우에 아미노산 넘버링은 개시 코돈을 포함하지 않는 단백질 서열에 상응할 수 있다. 또한, 본 출원에 개시된 서열은 정지 코돈이 있거나 없는 것으로 도시될 수 있음을 이해해야 한다. 본 출원에 개시된 서열은 정지 코돈이 있거나 없는 버전을 포함한다. 본 개시내용의 양태는 본 출원에 기재된 임의의 서열 및 이의 단편을 포함하는 숙주 세포를 포함한다.
등가물
당업자는 본원에 기재된 본 발명의 특정 구현예에 대한 많은 등가물을 인식하거나 통상적인 실험만 사용하여 확인할 수 있을 것이다. 이러한 등가물은 하기 청구범위에 의해 포함되도록 의도된다.
특허 문서를 포함한 모든 참조문헌은 그 전체가 참조로 포함된다.
SEQUENCE LISTING
<110> Ginkgo Bioworks, Inc.
<120> BIOSYNTHESIS OF CANNABINOIDS AND CANNABINOID PRECURSORS
<130> G0919.70059WO00
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> US 63/000,419
<151> 2020-03-26
<160> 215
<170> PatentIn version 3.5
<210> 1
<211> 101
<212> PRT
<213> C. sativa
<400> 1
Met Ala Val Lys His Leu Ile Val Leu Lys Phe Lys Asp Glu Ile Thr
1 5 10 15
Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val Asn Leu Val Asn
20 25 30
Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys Asp Val Thr Gln
35 40 45
Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu Val Thr Phe Glu
50 55 60
Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro Ala His Val Gly
65 70 75 80
Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu Leu Ile Phe Asp
85 90 95
Tyr Thr Pro Arg Lys
100
<210> 2
<211> 303
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
atggcagtga agcatttgat tgtattgaag ttcaaagatg aaatcacaga agcccaaaag 60
gaagaatttt tcaagacgta tgtgaatctt gtgaatatca tcccagccat gaaagatgta 120
tactggggta aagatgtgac tcaaaagaat aaggaagaag ggtacactca catagttgag 180
gtaacatttg agagtgtgga gactattcag gactacatta ttcatcctgc ccatgttgga 240
tttggagatg tctatcgttc tttctgggaa aaacttctca tttttgacta cacaccacga 300
aag 303
<210> 3
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 3
aattgctcag cattttcctt ttggtttgtt tgcaaaataa tatttttctt tctctcattc 60
aatatccaaa tttcaata 78
<210> 4
<211> 27
<212> PRT
<213> C. sativa
<400> 4
Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe Phe
1 5 10 15
Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala
20 25
<210> 5
<211> 719
<212> PRT
<213> C. sativa
<400> 5
Met Gly Lys Asn Tyr Lys Ser Leu Asp Ser Val Val Ala Ser Asp Phe
1 5 10 15
Ile Ala Leu Gly Ile Thr Ser Glu Val Ala Glu Thr Leu His Gly Arg
20 25 30
Leu Ala Glu Ile Val Cys Asn Tyr Gly Ala Ala Thr Pro Gln Thr Trp
35 40 45
Ile Asn Ile Ala Asn His Ile Leu Ser Pro Asp Leu Pro Phe Ser Leu
50 55 60
His Gln Met Leu Phe Tyr Gly Cys Tyr Lys Asp Phe Gly Pro Ala Pro
65 70 75 80
Pro Ala Trp Ile Pro Asp Pro Glu Lys Val Lys Ser Thr Asn Leu Gly
85 90 95
Ala Leu Leu Glu Lys Arg Gly Lys Glu Phe Leu Gly Val Lys Tyr Lys
100 105 110
Asp Pro Ile Ser Ser Phe Ser His Phe Gln Glu Phe Ser Val Arg Asn
115 120 125
Pro Glu Val Tyr Trp Arg Thr Val Leu Met Asp Glu Met Lys Ile Ser
130 135 140
Phe Ser Lys Asp Pro Glu Cys Ile Leu Arg Arg Asp Asp Ile Asn Asn
145 150 155 160
Pro Gly Gly Ser Glu Trp Leu Pro Gly Gly Tyr Leu Asn Ser Ala Lys
165 170 175
Asn Cys Leu Asn Val Asn Ser Asn Lys Lys Leu Asn Asp Thr Met Ile
180 185 190
Val Trp Arg Asp Glu Gly Asn Asp Asp Leu Pro Leu Asn Lys Leu Thr
195 200 205
Leu Asp Gln Leu Arg Lys Arg Val Trp Leu Val Gly Tyr Ala Leu Glu
210 215 220
Glu Met Gly Leu Glu Lys Gly Cys Ala Ile Ala Ile Asp Met Pro Met
225 230 235 240
His Val Asp Ala Val Val Ile Tyr Leu Ala Ile Val Leu Ala Gly Tyr
245 250 255
Val Val Val Ser Ile Ala Asp Ser Phe Ser Ala Pro Glu Ile Ser Thr
260 265 270
Arg Leu Arg Leu Ser Lys Ala Lys Ala Ile Phe Thr Gln Asp His Ile
275 280 285
Ile Arg Gly Lys Lys Arg Ile Pro Leu Tyr Ser Arg Val Val Glu Ala
290 295 300
Lys Ser Pro Met Ala Ile Val Ile Pro Cys Ser Gly Ser Asn Ile Gly
305 310 315 320
Ala Glu Leu Arg Asp Gly Asp Ile Ser Trp Asp Tyr Phe Leu Glu Arg
325 330 335
Ala Lys Glu Phe Lys Asn Cys Glu Phe Thr Ala Arg Glu Gln Pro Val
340 345 350
Asp Ala Tyr Thr Asn Ile Leu Phe Ser Ser Gly Thr Thr Gly Glu Pro
355 360 365
Lys Ala Ile Pro Trp Thr Gln Ala Thr Pro Leu Lys Ala Ala Ala Asp
370 375 380
Gly Trp Ser His Leu Asp Ile Arg Lys Gly Asp Val Ile Val Trp Pro
385 390 395 400
Thr Asn Leu Gly Trp Met Met Gly Pro Trp Leu Val Tyr Ala Ser Leu
405 410 415
Leu Asn Gly Ala Ser Ile Ala Leu Tyr Asn Gly Ser Pro Leu Val Ser
420 425 430
Gly Phe Ala Lys Phe Val Gln Asp Ala Lys Val Thr Met Leu Gly Val
435 440 445
Val Pro Ser Ile Val Arg Ser Trp Lys Ser Thr Asn Cys Val Ser Gly
450 455 460
Tyr Asp Trp Ser Thr Ile Arg Cys Phe Ser Ser Ser Gly Glu Ala Ser
465 470 475 480
Asn Val Asp Glu Tyr Leu Trp Leu Met Gly Arg Ala Asn Tyr Lys Pro
485 490 495
Val Ile Glu Met Cys Gly Gly Thr Glu Ile Gly Gly Ala Phe Ser Ala
500 505 510
Gly Ser Phe Leu Gln Ala Gln Ser Leu Ser Ser Phe Ser Ser Gln Cys
515 520 525
Met Gly Cys Thr Leu Tyr Ile Leu Asp Lys Asn Gly Tyr Pro Met Pro
530 535 540
Lys Asn Lys Pro Gly Ile Gly Glu Leu Ala Leu Gly Pro Val Met Phe
545 550 555 560
Gly Ala Ser Lys Thr Leu Leu Asn Gly Asn His His Asp Val Tyr Phe
565 570 575
Lys Gly Met Pro Thr Leu Asn Gly Glu Val Leu Arg Arg His Gly Asp
580 585 590
Ile Phe Glu Leu Thr Ser Asn Gly Tyr Tyr His Ala His Gly Arg Ala
595 600 605
Asp Asp Thr Met Asn Ile Gly Gly Ile Lys Ile Ser Ser Ile Glu Ile
610 615 620
Glu Arg Val Cys Asn Glu Val Asp Asp Arg Val Phe Glu Thr Thr Ala
625 630 635 640
Ile Gly Val Pro Pro Leu Gly Gly Gly Pro Glu Gln Leu Val Ile Phe
645 650 655
Phe Val Leu Lys Asp Ser Asn Asp Thr Thr Ile Asp Leu Asn Gln Leu
660 665 670
Arg Leu Ser Phe Asn Leu Gly Leu Gln Lys Lys Leu Asn Pro Leu Phe
675 680 685
Lys Val Thr Arg Val Val Pro Leu Ser Ser Leu Pro Arg Thr Ala Thr
690 695 700
Asn Lys Ile Met Arg Arg Val Leu Arg Gln Phe Ser His Phe Glu
705 710 715
<210> 6
<211> 543
<212> PRT
<213> C. sativa
<400> 6
Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr Arg Ser Leu Arg
1 5 10 15
Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser Met Val Ser Phe
20 25 30
Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro Ala Leu Ile Asp
35 40 45
Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe Lys Ser Thr Val
50 55 60
Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile Lys Lys Asn Asp
65 70 75 80
Val Val Leu Ile Tyr Ala Pro Asn Ser Ile His Phe Pro Val Cys Phe
85 90 95
Leu Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr Ser Asn Pro Leu
100 105 110
Tyr Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp Ser Asn Pro Lys
115 120 125
Leu Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val Lys Gly Phe Asn
130 135 140
Leu Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln Glu Ser Ser Ser
145 150 155 160
Asp Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu Gly Gly Ser Ser
165 170 175
Gly Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln Ser Asp Thr Ala
180 185 190
Ala Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser Lys Gly Val Val
195 200 205
Leu Thr His Lys Asn Phe Ile Ala Ser Ser Leu Met Val Thr Met Glu
210 215 220
Gln Asp Leu Val Gly Glu Met Asp Asn Val Phe Leu Cys Phe Leu Pro
225 230 235 240
Met Phe His Val Phe Gly Leu Ala Ile Ile Thr Tyr Ala Gln Leu Gln
245 250 255
Arg Gly Asn Thr Val Ile Ser Met Ala Arg Phe Asp Leu Glu Lys Met
260 265 270
Leu Lys Asp Val Glu Lys Tyr Lys Val Thr His Leu Trp Val Val Pro
275 280 285
Pro Val Ile Leu Ala Leu Ser Lys Asn Ser Met Val Lys Lys Phe Asn
290 295 300
Leu Ser Ser Ile Lys Tyr Ile Gly Ser Gly Ala Ala Pro Leu Gly Lys
305 310 315 320
Asp Leu Met Glu Glu Cys Ser Lys Val Val Pro Tyr Gly Ile Val Ala
325 330 335
Gln Gly Tyr Gly Met Thr Glu Thr Cys Gly Ile Val Ser Met Glu Asp
340 345 350
Ile Arg Gly Gly Lys Arg Asn Ser Gly Ser Ala Gly Met Leu Ala Ser
355 360 365
Gly Val Glu Ala Gln Ile Val Ser Val Asp Thr Leu Lys Pro Leu Pro
370 375 380
Pro Asn Gln Leu Gly Glu Ile Trp Val Lys Gly Pro Asn Met Met Gln
385 390 395 400
Gly Tyr Phe Asn Asn Pro Gln Ala Thr Lys Leu Thr Ile Asp Lys Lys
405 410 415
Gly Trp Val His Thr Gly Asp Leu Gly Tyr Phe Asp Glu Asp Gly His
420 425 430
Leu Tyr Val Val Asp Arg Ile Lys Glu Leu Ile Lys Tyr Lys Gly Phe
435 440 445
Gln Val Ala Pro Ala Glu Leu Glu Gly Leu Leu Val Ser His Pro Glu
450 455 460
Ile Leu Asp Ala Val Val Ile Pro Phe Pro Asp Ala Glu Ala Gly Glu
465 470 475 480
Val Pro Val Ala Tyr Val Val Arg Ser Pro Asn Ser Ser Leu Thr Glu
485 490 495
Asn Asp Val Lys Lys Phe Ile Ala Gly Gln Val Ala Ser Phe Lys Arg
500 505 510
Leu Arg Lys Val Thr Phe Ile Asn Ser Val Pro Lys Ser Ala Ser Gly
515 520 525
Lys Ile Leu Arg Arg Glu Leu Ile Gln Lys Val Arg Ser Asn Met
530 535 540
<210> 7
<211> 385
<212> PRT
<213> C. sativa
<400> 7
Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val Leu Ala Ile Gly
1 5 10 15
Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu Phe Pro Asp Tyr
20 25 30
Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln Leu Lys Glu Lys
35 40 45
Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys Arg Asn Cys Phe
50 55 60
Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu Val Glu His Glu
65 70 75 80
Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val Val Glu Val Pro
85 90 95
Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys Glu Trp Gly Gln
100 105 110
Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser Ala Ser Thr Thr
115 120 125
Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu Leu Gly Leu Ser
130 135 140
Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly Cys Tyr Gly Gly
145 150 155 160
Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu Asn Asn Lys Gly
165 170 175
Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala Cys Leu Phe Arg
180 185 190
Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly Gln Ala Ile Phe
195 200 205
Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu Pro Asp Glu Ser
210 215 220
Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr Gly Gln Thr Ile
225 230 235 240
Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile Arg Glu Ala Gly
245 250 255
Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu Ile Ser Asn Asn
260 265 270
Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile Gly Ile Ser Asp
275 280 285
Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly Lys Ala Ile Leu
290 295 300
Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp Lys Phe Val Asp
305 310 315 320
Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser Ser Ser Thr Val
325 330 335
Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu Glu Glu Gly Lys
340 345 350
Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu Phe Gly Phe Gly
355 360 365
Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser Val Pro Ile Lys
370 375 380
Tyr
385
<210> 8
<211> 307
<212> PRT
<213> Unknown
<220>
<223> Streptomyces sp.
<400> 8
Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala Ala Met Glu Glu
1 5 10 15
Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp Lys Ile Tyr Pro
20 25 30
Leu Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly Gly Ser Val Val
35 40 45
Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu Leu Asp Phe Ser
50 55 60
Ile Ser Val Pro Thr Ser His Gly Asp Pro Tyr Ala Thr Val Val Glu
65 70 75 80
Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp Asp Leu Leu Ala
85 90 95
Asp Thr Gln Lys His Leu Pro Val Ser Met Phe Ala Ile Asp Gly Glu
100 105 110
Val Thr Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe Pro Thr Asp Asn
115 120 125
Met Pro Gly Val Ala Glu Leu Ser Ala Ile Pro Ser Met Pro Pro Ala
130 135 140
Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly Leu Asp Lys Val
145 150 155 160
Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val Asn Leu Tyr Phe
165 170 175
Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser Val Leu Ala Leu
180 185 190
Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu Gly Leu Lys Phe
195 200 205
Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn Trp Glu Thr Gly
210 215 220
Lys Ile Asp Arg Leu Cys Phe Ala Val Ile Ser Asn Asp Pro Thr Leu
225 230 235 240
Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe His Asn Tyr Ala
245 250 255
Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg Thr Leu Val Tyr
260 265 270
Gly Leu Thr Leu Ser Pro Lys Glu Glu Tyr Tyr Lys Leu Gly Ala Tyr
275 280 285
Tyr His Ile Thr Asp Val Gln Arg Gly Leu Leu Lys Ala Phe Asp Ser
290 295 300
Leu Glu Asp
305
<210> 9
<211> 924
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 9
atgtcagaag ccgcagatgt cgaaagagtt tacgccgcta tggaagaagc cgccggtttg 60
ttaggtgttg cctgtgccag agataagatc tacccattgt tgtctacttt tcaagataca 120
ttagttgaag gtggttcagt tgttgttttc tctatggctt caggtagaca ttctacagaa 180
ttggatttct ctatctcagt tccaacatca catggtgatc catacgctac tgttgttgaa 240
aaaggtttat ttccagcaac aggtcatcca gttgatgatt tgttggctga tactcaaaag 300
catttgccag tttctatgtt tgcaattgat ggtgaagtta ctggtggttt caagaaaact 360
tacgctttct ttccaactga taacatgcca ggtgttgcag aattatctgc tattccatca 420
atgccaccag ctgttgcaga aaatgcagaa ttatttgcta gatacggttt ggataaggtt 480
caaatgacat ctatggatta caagaaaaga caagttaatt tgtacttttc tgaattatca 540
gcacaaactt tggaagctga atcagttttg gcattagtta gagaattggg tttacatgtt 600
ccaaacgaat tgggtttgaa gttttgtaaa agatctttct cagtttatcc aactttaaac 660
tgggaaacag gcaagatcga tagattatgt ttcgcagtta tctctaacga tccaacattg 720
gttccatctt cagatgaagg tgatatcgaa aagtttcata actacgctac taaagcacca 780
tatgcttacg ttggtgaaaa gagaacatta gtttatggtt tgactttatc accaaaggaa 840
gaatactaca agttgggtgc ttactaccac attaccgacg tacaaagagg tttattgaaa 900
gcattcgata gtttagaaga ctaa 924
<210> 10
<211> 395
<212> PRT
<213> C. sativa
<400> 10
Met Gly Leu Ser Ser Val Cys Thr Phe Ser Phe Gln Thr Asn Tyr His
1 5 10 15
Thr Leu Leu Asn Pro His Asn Asn Asn Pro Lys Thr Ser Leu Leu Cys
20 25 30
Tyr Arg His Pro Lys Thr Pro Ile Lys Tyr Ser Tyr Asn Asn Phe Pro
35 40 45
Ser Lys His Cys Ser Thr Lys Ser Phe His Leu Gln Asn Lys Cys Ser
50 55 60
Glu Ser Leu Ser Ile Ala Lys Asn Ser Ile Arg Ala Ala Thr Thr Asn
65 70 75 80
Gln Thr Glu Pro Pro Glu Ser Asp Asn His Ser Val Ala Thr Lys Ile
85 90 95
Leu Asn Phe Gly Lys Ala Cys Trp Lys Leu Gln Arg Pro Tyr Thr Ile
100 105 110
Ile Ala Phe Thr Ser Cys Ala Cys Gly Leu Phe Gly Lys Glu Leu Leu
115 120 125
His Asn Thr Asn Leu Ile Ser Trp Ser Leu Met Phe Lys Ala Phe Phe
130 135 140
Phe Leu Val Ala Ile Leu Cys Ile Ala Ser Phe Thr Thr Thr Ile Asn
145 150 155 160
Gln Ile Tyr Asp Leu His Ile Asp Arg Ile Asn Lys Pro Asp Leu Pro
165 170 175
Leu Ala Ser Gly Glu Ile Ser Val Asn Thr Ala Trp Ile Met Ser Ile
180 185 190
Ile Val Ala Leu Phe Gly Leu Ile Ile Thr Ile Lys Met Lys Gly Gly
195 200 205
Pro Leu Tyr Ile Phe Gly Tyr Cys Phe Gly Ile Phe Gly Gly Ile Val
210 215 220
Tyr Ser Val Pro Pro Phe Arg Trp Lys Gln Asn Pro Ser Thr Ala Phe
225 230 235 240
Leu Leu Asn Phe Leu Ala His Ile Ile Thr Asn Phe Thr Phe Tyr Tyr
245 250 255
Ala Ser Arg Ala Ala Leu Gly Leu Pro Phe Glu Leu Arg Pro Ser Phe
260 265 270
Thr Phe Leu Leu Ala Phe Met Lys Ser Met Gly Ser Ala Leu Ala Leu
275 280 285
Ile Lys Asp Ala Ser Asp Val Glu Gly Asp Thr Lys Phe Gly Ile Ser
290 295 300
Thr Leu Ala Ser Lys Tyr Gly Ser Arg Asn Leu Thr Leu Phe Cys Ser
305 310 315 320
Gly Ile Val Leu Leu Ser Tyr Val Ala Ala Ile Leu Ala Gly Ile Ile
325 330 335
Trp Pro Gln Ala Phe Asn Ser Asn Val Met Leu Leu Ser His Ala Ile
340 345 350
Leu Ala Phe Trp Leu Ile Leu Gln Thr Arg Asp Phe Ala Leu Thr Asn
355 360 365
Tyr Asp Pro Glu Ala Gly Arg Arg Phe Tyr Glu Phe Met Trp Lys Leu
370 375 380
Tyr Tyr Ala Glu Tyr Leu Val Tyr Val Phe Ile
385 390 395
<210> 11
<211> 398
<212> PRT
<213> C. sativa
<400> 11
Met Gly Leu Ser Leu Val Cys Thr Phe Ser Phe Gln Thr Asn Tyr His
1 5 10 15
Thr Leu Leu Asn Pro His Asn Lys Asn Pro Lys Asn Ser Leu Leu Ser
20 25 30
Tyr Gln His Pro Lys Thr Pro Ile Ile Lys Ser Ser Tyr Asp Asn Phe
35 40 45
Pro Ser Lys Tyr Cys Leu Thr Lys Asn Phe His Leu Leu Gly Leu Asn
50 55 60
Ser His Asn Arg Ile Ser Ser Gln Ser Arg Ser Ile Arg Ala Gly Ser
65 70 75 80
Asp Gln Ile Glu Gly Ser Pro His His Glu Ser Asp Asn Ser Ile Ala
85 90 95
Thr Lys Ile Leu Asn Phe Gly His Thr Cys Trp Lys Leu Gln Arg Pro
100 105 110
Tyr Val Val Lys Gly Met Ile Ser Ile Ala Cys Gly Leu Phe Gly Arg
115 120 125
Glu Leu Phe Asn Asn Arg His Leu Phe Ser Trp Gly Leu Met Trp Lys
130 135 140
Ala Phe Phe Ala Leu Val Pro Ile Leu Ser Phe Asn Phe Phe Ala Ala
145 150 155 160
Ile Met Asn Gln Ile Tyr Asp Val Asp Ile Asp Arg Ile Asn Lys Pro
165 170 175
Asp Leu Pro Leu Val Ser Gly Glu Met Ser Ile Glu Thr Ala Trp Ile
180 185 190
Leu Ser Ile Ile Val Ala Leu Thr Gly Leu Ile Val Thr Ile Lys Leu
195 200 205
Lys Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile Phe Gly Ile Phe Ala
210 215 220
Gly Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp Lys Gln Tyr Pro Phe
225 230 235 240
Thr Asn Phe Leu Ile Thr Ile Ser Ser His Val Gly Leu Ala Phe Thr
245 250 255
Ser Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu Pro Phe Val Trp Arg
260 265 270
Pro Ala Phe Ser Phe Ile Ile Ala Phe Met Thr Val Met Gly Met Thr
275 280 285
Ile Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu Gly Asp Ala Lys Tyr
290 295 300
Gly Val Ser Thr Val Ala Thr Lys Leu Gly Ala Arg Asn Met Thr Phe
305 310 315 320
Val Val Ser Gly Val Leu Leu Leu Asn Tyr Leu Val Ser Ile Ser Ile
325 330 335
Gly Ile Ile Trp Pro Gln Val Phe Lys Ser Asn Ile Met Ile Leu Ser
340 345 350
His Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln Thr Arg Glu Leu Ala
355 360 365
Leu Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln Phe Phe Glu Phe Ile
370 375 380
Trp Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr Val Phe Ile
385 390 395
<210> 12
<211> 323
<212> PRT
<213> C. sativa
<400> 12
Met Ser Ala Gly Ser Asp Gln Ile Glu Gly Ser Pro His His Glu Ser
1 5 10 15
Asp Asn Ser Ile Ala Thr Lys Ile Leu Asn Phe Gly His Thr Cys Trp
20 25 30
Lys Leu Gln Arg Pro Tyr Val Val Lys Gly Met Ile Ser Ile Ala Cys
35 40 45
Gly Leu Phe Gly Arg Glu Leu Phe Asn Asn Arg His Leu Phe Ser Trp
50 55 60
Gly Leu Met Trp Lys Ala Phe Phe Ala Leu Val Pro Ile Leu Ser Phe
65 70 75 80
Asn Phe Phe Ala Ala Ile Met Asn Gln Ile Tyr Asp Val Asp Ile Asp
85 90 95
Arg Ile Asn Lys Pro Asp Leu Pro Leu Val Ser Gly Glu Met Ser Ile
100 105 110
Glu Thr Ala Trp Ile Leu Ser Ile Ile Val Ala Leu Thr Gly Leu Ile
115 120 125
Val Thr Ile Lys Leu Lys Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile
130 135 140
Phe Gly Ile Phe Ala Gly Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp
145 150 155 160
Lys Gln Tyr Pro Phe Thr Asn Phe Leu Ile Thr Ile Ser Ser His Val
165 170 175
Gly Leu Ala Phe Thr Ser Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu
180 185 190
Pro Phe Val Trp Arg Pro Ala Phe Ser Phe Ile Ile Ala Phe Met Thr
195 200 205
Val Met Gly Met Thr Ile Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu
210 215 220
Gly Asp Ala Lys Tyr Gly Val Ser Thr Val Ala Thr Lys Leu Gly Ala
225 230 235 240
Arg Asn Met Thr Phe Val Val Ser Gly Val Leu Leu Leu Asn Tyr Leu
245 250 255
Val Ser Ile Ser Ile Gly Ile Ile Trp Pro Gln Val Phe Lys Ser Asn
260 265 270
Ile Met Ile Leu Ser His Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln
275 280 285
Thr Arg Glu Leu Ala Leu Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln
290 295 300
Phe Phe Glu Phe Ile Trp Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr
305 310 315 320
Val Phe Ile
<210> 13
<211> 544
<212> PRT
<213> C. sativa
<400> 13
Met Lys Cys Ser Thr Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe
1 5 10 15
Phe Phe Phe Ser Phe Asn Ile Gln Thr Ser Ile Ala Asn Pro Arg Glu
20 25 30
Asn Phe Leu Lys Cys Phe Ser Gln Tyr Ile Pro Asn Asn Ala Thr Asn
35 40 45
Leu Lys Leu Val Tyr Thr Gln Asn Asn Pro Leu Tyr Met Ser Val Leu
50 55 60
Asn Ser Thr Ile His Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro Lys
65 70 75 80
Pro Leu Val Ile Val Thr Pro Ser His Val Ser His Ile Gln Gly Thr
85 90 95
Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly
100 105 110
Gly His Asp Ser Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val
115 120 125
Ile Val Asp Leu Arg Asn Met Arg Ser Ile Lys Ile Asp Val His Ser
130 135 140
Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr
145 150 155 160
Trp Val Asn Glu Lys Asn Glu Asn Leu Ser Leu Ala Ala Gly Tyr Cys
165 170 175
Pro Thr Val Cys Ala Gly Gly His Phe Gly Gly Gly Gly Tyr Gly Pro
180 185 190
Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His
195 200 205
Leu Val Asn Val His Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu
210 215 220
Asp Leu Phe Trp Ala Leu Arg Gly Gly Gly Ala Glu Ser Phe Gly Ile
225 230 235 240
Ile Val Ala Trp Lys Ile Arg Leu Val Ala Val Pro Lys Ser Thr Met
245 250 255
Phe Ser Val Lys Lys Ile Met Glu Ile His Glu Leu Val Lys Leu Val
260 265 270
Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Leu Leu
275 280 285
Met Thr His Phe Ile Thr Arg Asn Ile Thr Asp Asn Gln Gly Lys Asn
290 295 300
Lys Thr Ala Ile His Thr Tyr Phe Ser Ser Val Phe Leu Gly Gly Val
305 310 315 320
Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly Ile
325 330 335
Lys Lys Thr Asp Cys Arg Gln Leu Ser Trp Ile Asp Thr Ile Ile Phe
340 345 350
Tyr Ser Gly Val Val Asn Tyr Asp Thr Asp Asn Phe Asn Lys Glu Ile
355 360 365
Leu Leu Asp Arg Ser Ala Gly Gln Asn Gly Ala Phe Lys Ile Lys Leu
370 375 380
Asp Tyr Val Lys Lys Pro Ile Pro Glu Ser Val Phe Val Gln Ile Leu
385 390 395 400
Glu Lys Leu Tyr Glu Glu Asp Ile Gly Ala Gly Met Tyr Ala Leu Tyr
405 410 415
Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu Ser Ala Ile Pro Phe
420 425 430
Pro His Arg Ala Gly Ile Leu Tyr Glu Leu Trp Tyr Ile Cys Ser Trp
435 440 445
Glu Lys Gln Glu Asp Asn Glu Lys His Leu Asn Trp Ile Arg Asn Ile
450 455 460
Tyr Asn Phe Met Thr Pro Tyr Val Ser Lys Asn Pro Arg Leu Ala Tyr
465 470 475 480
Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Asp Pro Lys Asn Pro
485 490 495
Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly Lys
500 505 510
Asn Phe Asp Arg Leu Val Lys Val Lys Thr Leu Val Asp Pro Asn Asn
515 520 525
Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Arg His Arg His
530 535 540
<210> 14
<211> 545
<212> PRT
<213> C. sativa
<400> 14
Met Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe
1 5 10 15
Phe Phe Leu Ser Phe His Ile Gln Ile Ser Ile Ala Asn Pro Arg Glu
20 25 30
Asn Phe Leu Lys Cys Phe Ser Lys His Ile Pro Asn Asn Val Ala Asn
35 40 45
Pro Lys Leu Val Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Ile Leu
50 55 60
Asn Ser Thr Ile Gln Asn Leu Arg Phe Ile Ser Asp Thr Thr Pro Lys
65 70 75 80
Pro Leu Val Ile Val Thr Pro Ser Asn Asn Ser His Ile Gln Ala Thr
85 90 95
Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly
100 105 110
Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val
115 120 125
Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile Asp Val His Ser
130 135 140
Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr
145 150 155 160
Trp Ile Asn Glu Lys Asn Glu Asn Leu Ser Phe Pro Gly Gly Tyr Cys
165 170 175
Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala
180 185 190
Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His
195 200 205
Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu
210 215 220
Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile
225 230 235 240
Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro Ser Lys Ser Thr
245 250 255
Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu
260 265 270
Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Val
275 280 285
Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp Asn His Gly Lys
290 295 300
Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe His Gly Gly
305 310 315 320
Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly
325 330 335
Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile Asp Thr Thr Ile
340 345 350
Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn Phe Lys Lys Glu
355 360 365
Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys
370 375 380
Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala Met Val Lys Ile
385 390 395 400
Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Ala Gly Met Tyr Val Leu
405 410 415
Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu Ser Ala Ile Pro
420 425 430
Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Ser
435 440 445
Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser
450 455 460
Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala
465 470 475 480
Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn His Ala Ser
485 490 495
Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly
500 505 510
Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Val Asp Pro Asn
515 520 525
Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro His His
530 535 540
His
545
<210> 15
<211> 545
<212> PRT
<213> C. sativa
<400> 15
Met Asn Cys Ser Thr Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe
1 5 10 15
Phe Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala Asn Pro Gln Glu
20 25 30
Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn Asn Pro Ala Asn
35 40 45
Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Val Leu
50 55 60
Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro Lys
65 70 75 80
Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His Ile Gln Ala Ser
85 90 95
Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly
100 105 110
Gly His Asp Ala Glu Gly Leu Ser Tyr Ile Ser Gln Val Pro Phe Ala
115 120 125
Ile Val Asp Leu Arg Asn Met His Thr Val Lys Val Asp Ile His Ser
130 135 140
Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr
145 150 155 160
Trp Ile Asn Glu Met Asn Glu Asn Phe Ser Phe Pro Gly Gly Tyr Cys
165 170 175
Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala
180 185 190
Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His
195 200 205
Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu
210 215 220
Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile
225 230 235 240
Ile Ala Ala Cys Lys Ile Lys Leu Val Val Val Pro Ser Lys Ala Thr
245 250 255
Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu
260 265 270
Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Met
275 280 285
Leu Thr Thr His Phe Arg Thr Arg Asn Ile Thr Asp Asn His Gly Lys
290 295 300
Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe Leu Gly Gly
305 310 315 320
Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly
325 330 335
Ile Lys Lys Thr Asp Cys Lys Glu Leu Ser Trp Ile Asp Thr Thr Ile
340 345 350
Phe Tyr Ser Gly Val Val Asn Tyr Asn Thr Ala Asn Phe Lys Lys Glu
355 360 365
Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys
370 375 380
Leu Asp Tyr Val Lys Lys Leu Ile Pro Glu Thr Ala Met Val Lys Ile
385 390 395 400
Leu Glu Lys Leu Tyr Glu Glu Glu Val Gly Val Gly Met Tyr Val Leu
405 410 415
Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu Ser Ala Ile Pro
420 425 430
Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Thr
435 440 445
Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser
450 455 460
Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala
465 470 475 480
Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn Pro Glu Ser
485 490 495
Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly
500 505 510
Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Ala Asp Pro Asn
515 520 525
Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro Arg His
530 535 540
His
545
<210> 16
<211> 18
<212> PRT
<213> Saccharomyces cerevisiae
<400> 16
Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser Val
1 5 10 15
Thr Ala
<210> 17
<211> 4
<212> PRT
<213> Saccharomyces cerevisiae
<400> 17
His Asp Glu Leu
1
<210> 18
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
aagtttatca gtaccttctt gacctttatc ttggccgctg tctccgtaac cgct 54
<210> 19
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
catgatgaat ta 12
<210> 20
<211> 545
<212> PRT
<213> C. sativa
<400> 20
Met Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe
1 5 10 15
Phe Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala Asn Pro Gln Glu
20 25 30
Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn Asn Pro Ala Asn
35 40 45
Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Val Leu
50 55 60
Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro Lys
65 70 75 80
Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His Ile Gln Ala Ser
85 90 95
Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly
100 105 110
Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val
115 120 125
Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile Asp Val His Ser
130 135 140
Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr
145 150 155 160
Trp Ile Asn Glu Lys Asn Glu Asn Phe Ser Phe Pro Gly Gly Tyr Cys
165 170 175
Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala
180 185 190
Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His
195 200 205
Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu
210 215 220
Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile
225 230 235 240
Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro Ser Lys Ser Thr
245 250 255
Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu
260 265 270
Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Val
275 280 285
Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp Asn His Gly Lys
290 295 300
Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe His Gly Gly
305 310 315 320
Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly
325 330 335
Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile Asp Thr Thr Ile
340 345 350
Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn Phe Lys Lys Glu
355 360 365
Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys
370 375 380
Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala Met Val Lys Ile
385 390 395 400
Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Val Gly Met Tyr Val Leu
405 410 415
Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu Ser Ala Ile Pro
420 425 430
Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Ser
435 440 445
Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser
450 455 460
Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala
465 470 475 480
Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn Pro Glu Ser
485 490 495
Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly
500 505 510
Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Ala Asp Pro Asn
515 520 525
Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro His His
530 535 540
His
545
<210> 21
<211> 517
<212> PRT
<213> C. sativa
<400> 21
Asn Pro Gln Glu Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn
1 5 10 15
Asn Pro Ala Asn Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr
20 25 30
Met Ser Val Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp
35 40 45
Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His
50 55 60
Ile Gln Ala Ser Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg
65 70 75 80
Thr Arg Ser Gly Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln
85 90 95
Val Pro Phe Val Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile
100 105 110
Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly
115 120 125
Glu Val Tyr Tyr Trp Ile Asn Glu Lys Asn Glu Asn Phe Ser Phe Pro
130 135 140
Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly
145 150 155 160
Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile
165 170 175
Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys
180 185 190
Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu
195 200 205
Asn Phe Gly Ile Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro
210 215 220
Ser Lys Ser Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly
225 230 235 240
Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp
245 250 255
Lys Asp Leu Val Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp
260 265 270
Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile
275 280 285
Phe His Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe
290 295 300
Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile
305 310 315 320
Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn
325 330 335
Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala
340 345 350
Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala
355 360 365
Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Val Gly
370 375 380
Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu
385 390 395 400
Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp
405 410 415
Tyr Thr Ala Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn
420 425 430
Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn
435 440 445
Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr
450 455 460
Asn Pro Glu Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu
465 470 475 480
Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys
485 490 495
Ala Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu
500 505 510
Pro Pro His His His
515
<210> 22
<211> 1551
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 22
aacccgcaag aaaactttct aaaatgcttt tctgaataca ttcctaacaa ccctgccaac 60
ccgaagttta tctacacaca acacgatcaa ttgtatatga gcgtgttgaa tagtacaata 120
cagaacctga ggtttacatc cgacacaacg ccgaaaccgc tagtgatcgt cacaccctcc 180
aacgtaagcc acattcaggc aagcatttta tgcagcaaga aagtcggact gcagataagg 240
acgaggtccg gaggacacga cgccgaaggg atgagctata tctcccaggt accttttgtg 300
gtggtagact tgagaaatat gcactctatc aagatagacg ttcactccca aaccgcttgg 360
gttgaggcgg gagccaccct tggtgaggtc tactactgga tcaacgaaaa gaatgaaaat 420
tttagctttc ctgggggata ttgcccaact gtaggtgttg gcggccactt ctcaggaggc 480
ggttatgggg ccttgatgcg taactacgga cttgcggccg acaacattat agacgcacat 540
ctagtgaatg tagacggcaa agttttagac aggaagagca tgggtgagga tcttttttgg 600
gcaattagag gcggaggggg agaaaatttt ggaattatcg ctgcttggaa aattaagcta 660
gttgcggtac cgagcaaaag cactatattc tctgtaaaaa agaacatgga gatacatggt 720
ttggtgaagc tttttaataa gtggcaaaac atcgcgtaca agtacgacaa agatctggtt 780
ctgatgacgc attttataac gaaaaatatc accgacaacc acggaaaaaa caaaaccaca 840
gtacatggct acttctctag tatatttcat gggggagtcg attctctggt tgatttaatg 900
aacaaatcat tcccagagtt gggtataaag aagacagact gtaaggagtt ctcttggatt 960
gacacaacta tattctattc aggcgtagtc aactttaaca cggcgaattt caaaaaagag 1020
atccttctgg acagatccgc aggtaagaaa actgcgttct ctatcaaatt ggactatgtg 1080
aagaagccta ttcccgaaac cgcgatggtc aagatacttg agaaattata cgaggaagat 1140
gtgggagttg gaatgtacgt actttatccc tatggtggga taatggaaga aatcagcgag 1200
agcgccattc catttcccca tcgtgccggc atcatgtacg agctgtggta tactgcgagt 1260
tgggagaagc aagaagacaa cgaaaagcac attaactggg tcagatcagt ttacaatttc 1320
accaccccat acgtgtccca gaatccgcgt ctggcttact tgaactaccg tgatcttgac 1380
ctgggtaaaa cgaacccgga gtcacccaac aattacactc aagctagaat ctggggagag 1440
aaatactttg ggaagaactt caacaggtta gtaaaggtta aaaccaaggc agatccaaac 1500
aactttttta gaaatgaaca atccattccc ccgctacccc cgcaccatca c 1551
<210> 23
<211> 540
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 23
Met Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser
1 5 10 15
Val Thr Ala Asn Pro Gln Glu Asn Phe Leu Lys Cys Phe Ser Glu Tyr
20 25 30
Ile Pro Asn Asn Pro Ala Asn Pro Lys Phe Ile Tyr Thr Gln His Asp
35 40 45
Gln Leu Tyr Met Ser Val Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe
50 55 60
Thr Ser Asp Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn
65 70 75 80
Val Ser His Ile Gln Ala Ser Ile Leu Cys Ser Lys Lys Val Gly Leu
85 90 95
Gln Ile Arg Thr Arg Ser Gly Gly His Asp Ala Glu Gly Met Ser Tyr
100 105 110
Ile Ser Gln Val Pro Phe Val Val Val Asp Leu Arg Asn Met His Ser
115 120 125
Ile Lys Ile Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala
130 135 140
Thr Leu Gly Glu Val Tyr Tyr Trp Ile Asn Glu Lys Asn Glu Asn Phe
145 150 155 160
Ser Phe Pro Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe
165 170 175
Ser Gly Gly Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala
180 185 190
Asp Asn Ile Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu
195 200 205
Asp Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly
210 215 220
Gly Gly Glu Asn Phe Gly Ile Ile Ala Ala Trp Lys Ile Lys Leu Val
225 230 235 240
Ala Val Pro Ser Lys Ser Thr Ile Phe Ser Val Lys Lys Asn Met Glu
245 250 255
Ile His Gly Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr
260 265 270
Lys Tyr Asp Lys Asp Leu Val Leu Met Thr His Phe Ile Thr Lys Asn
275 280 285
Ile Thr Asp Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe
290 295 300
Ser Ser Ile Phe His Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn
305 310 315 320
Lys Ser Phe Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe
325 330 335
Ser Trp Ile Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Phe Asn
340 345 350
Thr Ala Asn Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys
355 360 365
Lys Thr Ala Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro
370 375 380
Glu Thr Ala Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val
385 390 395 400
Gly Val Gly Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu
405 410 415
Ile Ser Glu Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr
420 425 430
Glu Leu Trp Tyr Thr Ala Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys
435 440 445
His Ile Asn Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val
450 455 460
Ser Gln Asn Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu
465 470 475 480
Gly Lys Thr Asn Pro Glu Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile
485 490 495
Trp Gly Glu Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val
500 505 510
Lys Thr Lys Ala Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile
515 520 525
Pro Pro Leu Pro Pro His His His His Asp Glu Leu
530 535 540
<210> 24
<211> 1620
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 24
atgaagttta tcagtacctt cttgaccttt atcttggccg ctgtctccgt aaccgctaac 60
ccgcaagaaa actttctaaa atgcttttct gaatacattc ctaacaaccc tgccaacccg 120
aagtttatct acacacaaca cgatcaattg tatatgagcg tgttgaatag tacaatacag 180
aacctgaggt ttacatccga cacaacgccg aaaccgctag tgatcgtcac accctccaac 240
gtaagccaca ttcaggcaag cattttatgc agcaagaaag tcggactgca gataaggacg 300
aggtccggag gacacgacgc cgaagggatg agctatatct cccaggtacc ttttgtggtg 360
gtagacttga gaaatatgca ctctatcaag atagacgttc actcccaaac cgcttgggtt 420
gaggcgggag ccacccttgg tgaggtctac tactggatca acgaaaagaa tgaaaatttt 480
agctttcctg ggggatattg cccaactgta ggtgttggcg gccacttctc aggaggcggt 540
tatggggcct tgatgcgtaa ctacggactt gcggccgaca acattataga cgcacatcta 600
gtgaatgtag acggcaaagt tttagacagg aagagcatgg gtgaggatct tttttgggca 660
attagaggcg gagggggaga aaattttgga attatcgctg cttggaaaat taagctagtt 720
gcggtaccga gcaaaagcac tatattctct gtaaaaaaga acatggagat acatggtttg 780
gtgaagcttt ttaataagtg gcaaaacatc gcgtacaagt acgacaaaga tctggttctg 840
atgacgcatt ttataacgaa aaatatcacc gacaaccacg gaaaaaacaa aaccacagta 900
catggctact tctctagtat atttcatggg ggagtcgatt ctctggttga tttaatgaac 960
aaatcattcc cagagttggg tataaagaag acagactgta aggagttctc ttggattgac 1020
acaactatat tctattcagg cgtagtcaac tttaacacgg cgaatttcaa aaaagagatc 1080
cttctggaca gatccgcagg taagaaaact gcgttctcta tcaaattgga ctatgtgaag 1140
aagcctattc ccgaaaccgc gatggtcaag atacttgaga aattatacga ggaagatgtg 1200
ggagttggaa tgtacgtact ttatccctat ggtgggataa tggaagaaat cagcgagagc 1260
gccattccat ttccccatcg tgccggcatc atgtacgagc tgtggtatac tgcgagttgg 1320
gagaagcaag aagacaacga aaagcacatt aactgggtca gatcagttta caatttcacc 1380
accccatacg tgtcccagaa tccgcgtctg gcttacttga actaccgtga tcttgacctg 1440
ggtaaaacga acccggagtc acccaacaat tacactcaag ctagaatctg gggagagaaa 1500
tactttggga agaacttcaa caggttagta aaggttaaaa ccaaggcaga tccaaacaac 1560
ttttttagaa atgaacaatc cattcccccg ctacccccgc accatcacca tgatgaatta 1620
<210> 25
<211> 472
<212> PRT
<213> Aspergillus niger
<400> 25
Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala Leu
1 5 10 15
Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp Thr
20 25 30
Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala Ala
35 40 45
Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys Cys
50 55 60
Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His Ser
65 70 75 80
Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val Asp
85 90 95
Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu Ala
100 105 110
Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu Tyr
115 120 125
Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile Lys
130 135 140
Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg Gln
145 150 155 160
Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu Ala
165 170 175
Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val Phe
180 185 190
Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu Phe
195 200 205
Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr
210 215 220
Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys Asp
225 230 235 240
Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Asn
245 250 255
Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe Phe
260 265 270
Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe Ala
275 280 285
Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly Met
290 295 300
Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn Thr
305 310 315 320
Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr Leu
325 330 335
Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn His
340 345 350
Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly Gly
355 360 365
Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg Asp
370 375 380
Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val Gly Pro Ile
385 390 395 400
Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu Ala
405 410 415
Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro Asp
420 425 430
Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu Pro
435 440 445
Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe His
450 455 460
His Pro Gln Gly Val Met Pro Ala
465 470
<210> 26
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 26
ggtaatacga cctctattgc cggcagagat tgtttgatct cagctttagg tggtaactcc 60
gctcttgcag tttttccaaa cgagttgcta tggacagctg acgtacacga atataatctg 120
aacttgcctg tcactcccgc tgctataacc tacccagaaa ccgccgctca gattgccggt 180
gtggttaagt gcgcttctga ttacgactat aaagtccaag caaggtccgg aggtcatagt 240
ttcggtaatt acggcttggg tggagctgac ggtgcagttg tcgttgatat gaagcacttc 300
actcaatttt cgatggacga tgaaacttac gaagctgtta tcggtccagg tacaacttta 360
aacgatgtcg acatcgaatt gtacaacaac ggtaaaagag ccatggctca tggtgtatgt 420
ccaaccatta agactggtgg tcacttcacc atcggtggtc taggacctac ggctcgtcaa 480
tggggtctgg ctttggacca tgtcgaggaa gttgaagttg tgttagctaa ctctagcatt 540
gttagagcct ctaatacaca aaatcaagat gttttctttg cagtcaaggg tgctgctgct 600
aacttcggaa tcgtcactga atttaaagtt agaactgaac cagccccagg tttggctgta 660
cagtactcct ataccttcaa cttgggttca actgccgaga aggctcaatt cgttaaggat 720
tggcaatctt tcatttcggc taagaaccta accagacaat tttataataa catggtcatt 780
tttgatggtg acataatctt ggaaggttta ttcttcggta gcaaggaaca atacgacgcc 840
ttgggccttg aagatcactt cgcaccaaag aatccaggta acatattggt tttaacagat 900
tggctaggca tggtgggtca cgcattggaa gacactattt taaaattggt cggtaatacc 960
ccaacatggt tctatgctaa gtccttgggt tttagacaag acactctgat cccttctgcc 1020
ggtattgacg aatttttcga atacattgct aaccataccg ccggcactcc tgcttggttt 1080
gttactttgt ccttagaggg tggtgctatc aacgatgtcg cagaagatgc tacggcctat 1140
gctcacagag atgttttgtt ctgggtccaa ctattcatgg ttaatccagt cggtcctatc 1200
tctgacacta cctacgagtt tacagacggc ttgtacgatg tgttggcccg tgctgttcca 1260
gaaagcgtgg gacatgctta ccttggttgt ccagatccaa gaatggaaga cgctcaacag 1320
aagtattggc gtaccaattt gccccgtctg caagaactaa aggaagagtt ggatccaaaa 1380
aacaccttcc atcacccaca gggtgttatg ccagcttaa 1419
<210> 27
<211> 473
<212> PRT
<213> Aspergillus niger
<400> 27
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val Gly Pro
385 390 395 400
Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Met Pro Ala
465 470
<210> 28
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 28
atgggtaata cgacctctat tgccggcaga gattgtttga tctcagcttt aggtggtaac 60
tccgctcttg cagtttttcc aaacgagttg ctatggacag ctgacgtaca cgaatataat 120
ctgaacttgc ctgtcactcc cgctgctata acctacccag aaaccgccgc tcagattgcc 180
ggtgtggtta agtgcgcttc tgattacgac tataaagtcc aagcaaggtc cggaggtcat 240
agtttcggta attacggctt gggtggagct gacggtgcag ttgtcgttga tatgaagcac 300
ttcactcaat tttcgatgga cgatgaaact tacgaagctg ttatcggtcc aggtacaact 360
ttaaacgatg tcgacatcga attgtacaac aacggtaaaa gagccatggc tcatggtgta 420
tgtccaacca ttaagactgg tggtcacttc accatcggtg gtctaggacc tacggctcgt 480
caatggggtc tggctttgga ccatgtcgag gaagttgaag ttgtgttagc taactctagc 540
attgttagag cctctaatac acaaaatcaa gatgttttct ttgcagtcaa gggtgctgct 600
gctaacttcg gaatcgtcac tgaatttaaa gttagaactg aaccagcccc aggtttggct 660
gtacagtact cctatacctt caacttgggt tcaactgccg agaaggctca attcgttaag 720
gattggcaat ctttcatttc ggctaagaac ctaaccagac aattttataa taacatggtc 780
atttttgatg gtgacataat cttggaaggt ttattcttcg gtagcaagga acaatacgac 840
gccttgggcc ttgaagatca cttcgcacca aagaatccag gtaacatatt ggttttaaca 900
gattggctag gcatggtggg tcacgcattg gaagacacta ttttaaaatt ggtcggtaat 960
accccaacat ggttctatgc taagtccttg ggttttagac aagacactct gatcccttct 1020
gccggtattg acgaattttt cgaatacatt gctaaccata ccgccggcac tcctgcttgg 1080
tttgttactt tgtccttaga gggtggtgct atcaacgatg tcgcagaaga tgctacggcc 1140
tatgctcaca gagatgtttt gttctgggtc caactattca tggttaatcc agtcggtcct 1200
atctctgaca ctacctacga gtttacagac ggcttgtacg atgtgttggc ccgtgctgtt 1260
ccagaaagcg tgggacatgc ttaccttggt tgtccagatc caagaatgga agacgctcaa 1320
cagaagtatt ggcgtaccaa tttgccccgt ctgcaagaac taaaggaaga gttggatcca 1380
aaaaacacct tccatcaccc acagggtgtt atgccagctt aa 1422
<210> 29
<211> 495
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 29
Met Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser
1 5 10 15
Val Thr Ala Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile
20 25 30
Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu
35 40 45
Leu Trp Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr
50 55 60
Pro Ala Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val
65 70 75 80
Val Lys Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly
85 90 95
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val
100 105 110
Val Val Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr
115 120 125
Tyr Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile
130 135 140
Glu Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro
145 150 155 160
Thr Ile Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr
165 170 175
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
180 185 190
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln
195 200 205
Asp Val Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val
210 215 220
Thr Glu Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln
225 230 235 240
Tyr Ser Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe
245 250 255
Val Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln
260 265 270
Phe Tyr Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly
275 280 285
Leu Phe Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp
290 295 300
His Phe Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp
305 310 315 320
Leu Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val
325 330 335
Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln
340 345 350
Asp Thr Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile
355 360 365
Ala Asn His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu
370 375 380
Glu Gly Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala
385 390 395 400
His Arg Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val
405 410 415
Gly Pro Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp
420 425 430
Val Leu Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly
435 440 445
Cys Pro Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr
450 455 460
Asn Leu Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn
465 470 475 480
Thr Phe His His Pro Gln Gly Val Met Pro Ala His Asp Glu Leu
485 490 495
<210> 30
<211> 1488
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 30
atgaagttta tcagtacctt cttgaccttt atcttggccg ctgtctccgt aaccgctggt 60
aatacgacct ctattgccgg cagagattgt ttgatctcag ctttaggtgg taactccgct 120
cttgcagttt ttccaaacga gttgctatgg acagctgacg tacacgaata taatctgaac 180
ttgcctgtca ctcccgctgc tataacctac ccagaaaccg ccgctcagat tgccggtgtg 240
gttaagtgcg cttctgatta cgactataaa gtccaagcaa ggtccggagg tcatagtttc 300
ggtaattacg gcttgggtgg agctgacggt gcagttgtcg ttgatatgaa gcacttcact 360
caattttcga tggacgatga aacttacgaa gctgttatcg gtccaggtac aactttaaac 420
gatgtcgaca tcgaattgta caacaacggt aaaagagcca tggctcatgg tgtatgtcca 480
accattaaga ctggtggtca cttcaccatc ggtggtctag gacctacggc tcgtcaatgg 540
ggtctggctt tggaccatgt cgaggaagtt gaagttgtgt tagctaactc tagcattgtt 600
agagcctcta atacacaaaa tcaagatgtt ttctttgcag tcaagggtgc tgctgctaac 660
ttcggaatcg tcactgaatt taaagttaga actgaaccag ccccaggttt ggctgtacag 720
tactcctata ccttcaactt gggttcaact gccgagaagg ctcaattcgt taaggattgg 780
caatctttca tttcggctaa gaacctaacc agacaatttt ataataacat ggtcattttt 840
gatggtgaca taatcttgga aggtttattc ttcggtagca aggaacaata cgacgccttg 900
ggccttgaag atcacttcgc accaaagaat ccaggtaaca tattggtttt aacagattgg 960
ctaggcatgg tgggtcacgc attggaagac actattttaa aattggtcgg taatacccca 1020
acatggttct atgctaagtc cttgggtttt agacaagaca ctctgatccc ttctgccggt 1080
attgacgaat ttttcgaata cattgctaac cataccgccg gcactcctgc ttggtttgtt 1140
actttgtcct tagagggtgg tgctatcaac gatgtcgcag aagatgctac ggcctatgct 1200
cacagagatg ttttgttctg ggtccaacta ttcatggtta atccagtcgg tcctatctct 1260
gacactacct acgagtttac agacggcttg tacgatgtgt tggcccgtgc tgttccagaa 1320
agcgtgggac atgcttacct tggttgtcca gatccaagaa tggaagacgc tcaacagaag 1380
tattggcgta ccaatttgcc ccgtctgcaa gaactaaagg aagagttgga tccaaaaaac 1440
accttccatc acccacaggg tgttatgcca gcttaacatg atgaatta 1488
<210> 31
<211> 27
<212> PRT
<213> C. sativa
<400> 31
Asn Cys Ser Thr Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe Phe
1 5 10 15
Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala
20 25
<210> 32
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 32
aattgctcaa cattctcctt ttggtttgtt tgcaaaataa tatttttctt tctctcattc 60
aatatccaaa tttcaatagc t 81
<210> 33
<211> 517
<212> PRT
<213> C. sativa
<400> 33
Asn Pro Gln Glu Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn
1 5 10 15
Asn Pro Ala Asn Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr
20 25 30
Met Ser Val Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp
35 40 45
Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His
50 55 60
Ile Gln Ala Ser Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg
65 70 75 80
Thr Arg Ser Gly Gly His Asp Ala Glu Gly Leu Ser Tyr Ile Ser Gln
85 90 95
Val Pro Phe Ala Ile Val Asp Leu Arg Asn Met His Thr Val Lys Val
100 105 110
Asp Ile His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly
115 120 125
Glu Val Tyr Tyr Trp Ile Asn Glu Met Asn Glu Asn Phe Ser Phe Pro
130 135 140
Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly
145 150 155 160
Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile
165 170 175
Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys
180 185 190
Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu
195 200 205
Asn Phe Gly Ile Ile Ala Ala Cys Lys Ile Lys Leu Val Val Val Pro
210 215 220
Ser Lys Ala Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly
225 230 235 240
Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp
245 250 255
Lys Asp Leu Met Leu Thr Thr His Phe Arg Thr Arg Asn Ile Thr Asp
260 265 270
Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile
275 280 285
Phe Leu Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe
290 295 300
Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Leu Ser Trp Ile
305 310 315 320
Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Tyr Asn Thr Ala Asn
325 330 335
Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala
340 345 350
Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Leu Ile Pro Glu Thr Ala
355 360 365
Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Glu Val Gly Val Gly
370 375 380
Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu
385 390 395 400
Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp
405 410 415
Tyr Thr Ala Thr Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn
420 425 430
Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn
435 440 445
Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr
450 455 460
Asn Pro Glu Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu
465 470 475 480
Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys
485 490 495
Ala Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu
500 505 510
Pro Pro Arg His His
515
<210> 34
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 34
atgggcaatg gacaatccac cccactgcaa cagtgtttaa acacggtatg caacggtcgt 60
cttggttgtg tcgctttccc ttcggatgca ttgtaccaag ccgcttgggt gaagccatat 120
aatttggacg ttcccgttac tccaatcgct gtctttaaac catcttctac tgaagacgtt 180
gccggtgcta ttaagtgtgc tgtcgcaagc aacgttcatg ttcaagctaa gtcaggtggt 240
cacagttacg ctaacttcgg tttgggtggt caagatggtg agttaatgat agacttggcc 300
aatctacaag attttcacat ggataaaacc tcctggcagg ctaccttcgg cgctggttac 360
aggttgggtg acctagataa gaagttgcaa gcaaacggaa acagagccat tgctcatggt 420
acatgtccag gtgtaggtat cggaggtcac gctactattg gtggtttagg tcctatgtca 480
agaatgtggg gctctgctct ggatcatgtc ttgtccgttc aagtcgttac tgccgacggt 540
tctatcaaaa atgcatcaga atctgaaaat tctgacttgt tctgggcttt gagaggtgct 600
ggtgccagtt ttggtgtcat cacaaagttc actgttaaga cccacccagc cccaggttcc 660
gtggttcaat atacttacaa aatttcgtta ggatctcagg ctcaaatggc tcctgtttat 720
gctgcctggc aagcattagc tggtgacgct aagttggata gaagattctc aacccttttt 780
attgctgaac cattgggagc cttaataaca ggtacttttt acggtacaaa ggccgaatat 840
gaagctaccg gtattgctgc aagacttcca tccggcggta ccttggacct aaagttattg 900
gattggttgg gtagcttggc tcatatcgct gaagttgtcg gtctgacttt aggtgatatt 960
cctacttctt tctacggtaa atcgttggcc ttgagggaag aagacatgtt ggatagaaca 1020
tccatcgacg gtttgtttcg ttacatggga gatgcagatg ctggtacgct attgtggttc 1080
gtgatattca actctgaggg tggcgctatg gccgatactc cagctggtgc cactgcttac 1140
cctcacagag ataagttgat tatgtatcaa tcttatgtga tcggtattcc aacgcttact 1200
aaagcaacta gagactttgc tgacggtgta cacgatagag tccgtatggg agctccagcc 1260
gctaacagta cctacgctgg ttatatcgac agaaccttat caagagaagc cgctcaagag 1320
ttttactggg gcgctcagtt accaagacta agggaagtta agaaggcttg ggaccctaaa 1380
gacgttttcc ataatccaca atccgtcgat ccagctgaa 1419
<210> 35
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 35
atgggaaata caacttcaat tgcaggcaga gattgcttga tcagtgctct aggtggtaac 60
tctgccttag ctgtgtttcc taaccaactt ctgtggacgg ccgacgtcca tgagtataat 120
ttgaacttgc cagttactcc agctgctata acctacccag aaaccgctga acagattgcc 180
ggtatcgtta aatgtgcttc cgattacgac tataaggtcc aagctcgttc tggtggtcac 240
tcgttcggta actacggttt aggaggtact gatggcgcag ttgtagttga catgaagcac 300
ttcaaccaat ttagcatgga cgatcaaacc tacgaagctg tcattggtcc cggtactacc 360
ttgaatgatg tagacatcga attgtataac aatggtaaaa gagctatggc acatggtgtt 420
tgtccaacta taaagacagg tggacacttc acaattggtg gtttaggacc tactgccaga 480
caatggggtc tagctttgga ccacgttgag gaagtcgaag ttgtcttggc taattcctct 540
atcgttaggg cttcaaacac ccagaaccaa gatgtgttct ttgctgtaaa gggtgccgct 600
gctgacttcg gtattgtcac ggaatttaaa gtcagaactg aaccagcccc aggtcttgcc 660
gtccaatact cttacacctt caacctaggt tcgactgctg aaaaggctca attcgttaag 720
gattggcaat ctttcatttc cgccaagaat ttgacgagac aattttataa caacatggtt 780
atctttgacg gtgatattat cttggaaggt ttattctttg gcagtaaaga acaatacgat 840
gcattaggtt tggaagacca tttcgctccc aagaatccag gtaatatctt ggttttaacc 900
gattggctag gtatggtggg acatgcctta gaggacacta tattgaagtt ggttggcaac 960
actccaacat ggttttacgc taaatccttg ggtttcaggc aggatacttt aattccaagt 1020
gctggtatcg atcaattttt cgaatacatt gctaaccaca ccgctggtac tcctgcatgg 1080
ttcgtaacct tgtctctgga gggtggtgcc atcaatgacg ttgctgaaga cgccactgct 1140
tatgctcaca gagatgtcct attctgggtc caacttttca tggttaaccc attgggtcca 1200
atttctgaaa caacttacga atttaccgat ggattgtacg acgtgctagc acgtgcagtt 1260
ccagaaagcg tcggtcacgc ttatttgggt tgtcctgatc caagaatgga gaacgcccct 1320
caaaagtatt ggagaacgaa tcttccaaga cttcaagaac tgaaggaaga gttggatcca 1380
aagaacactt ttcatcatcc tcaaggtgtc atcccagct 1419
<210> 36
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 36
atgggaaaca cgaccagcat agctggtcgt gactgtctga tctctgcctt gggtggcaat 60
tcagcattag ctgctttccc aaaccaacta ttgtggactg ccgatgtcca cgaatacaac 120
cttaatttgc ctgtgacacc agctgctatt acttatcccg agactgccga acagatcgct 180
ggtattgtta agtgcgcctc tgattacgac tacaaagtac aagctagatc gggtggtcat 240
tcctttggta attatggttt gggtggtacc gatggtgctg tcgttgttga catgaagcac 300
ttcaaccaat tttctatgga tgatcaaacc tacgaagcag tcattggacc aggtactacc 360
ttaaacgacg tagatatcga attgtacaat aacggtaaaa gagctatggc ccatggtgtg 420
tgtccaacaa tcaagactgg aggtcacttc accattggcg gcttgggtcc aactgctaga 480
caatggggtt tagctttaga ccatgttgaa gaggttgaag ttgtcttggc caactccagt 540
attgttaggg catctaatac tcaaaaccag gacgttttct ttgctgtcaa gggtgctgct 600
gctgacttcg gtatcgtgac cgaatttaaa gttagaacag aacctgcccc aggtttggcc 660
gtccaatatt cctacacctt caatcttggt tcaactgctg aaaaggcaca attcgtaaag 720
gattggcaat acttcatctc tgctaaaaac ctaacaagac aattttacaa caacatggtt 780
atttttgacg gtgatataat tttggaaggt ctgttcttcg gtagtaagga acaatatgac 840
gccttgggtt tggaggatca ctttgctccc aagaatccag gaaatatttt agtcctaacg 900
gattggttgg gcatggttgg tcacgcatta gaagatacta ttctaaaatt ggtcggtaac 960
acgccaactt ggttctatgc taagtccttg ggttttcgtc aggacaccct tatcccttct 1020
gctggtattg atgaattttt cgagtacatc gctaatcata ccgccggtac tccagcttgg 1080
tttgttactt tatctttgga aggtggagct atcaacgacg tcgctgaaga tgccacagca 1140
tacgcacata gagatgtgtt attctgggtt caattgttca tggttaaccc tcttggtcca 1200
atttcagaaa caacttatga atttaccgat ggattgtacg acgttttagc tagagctgtc 1260
ccagaatctg taggtcacgc ttacttgggt tgtccagacc caagaatgga gaacgcacct 1320
caaaagtatt ggaggacaaa cttgccaaga ctacaggaac tgaaagagga attggacccc 1380
aagaatactt ttcaccatcc acaaggtgtt atcccagct 1419
<210> 37
<211> 1539
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 37
atggatccaa tcgaggacgc cattttgcag tgcttaagcc tacacagtga cccttcgcat 60
ccaatatcag gcgtaacgta tttccccaat acaccatctt acattcctat cctgcactcc 120
tacattcgta accttagatt tacctctcca tccactagaa aaccattgtt catcgttgct 180
ccaactcata tatctcacat ccaagcatca attatctgtt gtaagtcttt tcaattgcaa 240
attaggatta gaagtggagg tcacgattat gatggtttgt cctacgtcag ccaatctccc 300
ttcgctatta tggacatgtt cgctatgaga tccgttgaag tcaacttaga agatgaaacc 360
gtttgggttg actctggttc cactatcggt gaattgtacc atggtattgc cgaaagatct 420
aaggtccatg gtttcccagc tggtgtgtgt cactcagttg gcgtcggtgg acacttttcc 480
ggtggtggtt atggtaatat gatgagaaag ttcggtttgt ctgtggacca tgttctggat 540
gctgttatcg ttgatgcaga aggccgtgtc ttagacagaa aaaagatggg tgaagaccta 600
ttctggggta taagaggtgg tggtggcgct tcgtttggtg ttatcgtcag ttggagaatt 660
aaattggtcc cagtgcctga ggttgtaacc gtcttccgtg ttttgaagac cttggaacaa 720
ggtgccacag atgtcgttca cagatggcaa tacgtcgccg acaacatcca cgatgactta 780
tttattagag ttgttctatc tccagttaag agaaaaggtc agaagactat cagagctaag 840
tttaatgctt tgttcttggg taacgctcaa gaattactgc gtgtcatgtc tgattctttt 900
ccagaattgg gattagtggg tgaagactgt atcgagatga gctggattga ctccgtattg 960
ttctgggata actttccagt aggtacatct gtagatgttt tattgcagcg tcacgacact 1020
cctgaaaaat tcttgaagaa gaaatccgat tacgttcaac aaccaatctc taagactgga 1080
ttagaaggtg tttggaataa aatgatggaa cttgaaaagc cagtgttgac cttgaatcca 1140
tatggtggta gaatgggtga aataagtgaa atggaaattc cttttccaca tagagctggt 1200
aacttgtaca agatccaata ctcggtcaac tggaaggagg aaggtgagga tgttgcaaac 1260
aggtatcttg acctgattag aatgttatac gactacatga ccccatatgt ttcaaagtcc 1320
cccagatcaa gttatttgaa ctacagagat gtcgatatag gagtcaatgg tccaggcaat 1380
gccacttatg ctgaagctag agtctgggga gagaaatact tcaagagaaa ctttgacaga 1440
ttggttgaag tcaaaactag ggttgatcca agtaacttct tcaggtacga acaatctata 1500
ccttccttgg ccgcttcgag cctaggtatt atgtcggaa 1539
<210> 38
<211> 1518
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 38
atggtccaca atatattact acttggtttg atgccactgt tggttcgtgc atcacctttg 60
ccaatttatc ataactaccc cccacaatcg actatcaacg actgcttgca ggccgctgat 120
gttccagcta tcttacaaag ctctgcttcc tttgatgcct tgagtcaacc tctaaattcc 180
agattaaaat ctaagccagc tgtgattaca atccctacga ccgctttgca cgtcagttct 240
gctgttaagt gtgccgcaca attcaagctg aaagtaactc caagaggcgg tggacattct 300
tacaacgcac aatccttagg tgacggtgct gtcgttattg atatgcaaca gttccacgac 360
gttgtctacg actctaagac tcaactagct aggattggtg gtggagctag attgggtaac 420
gttgcccaaa aattgtatga tcaaggtaag agagctatgc cacatggtac ctgtccagat 480
gtcggtattg gcggtcactc cgccggtggt tttggttgga cctcacgtca gtggggtatc 540
actgtagatc acatagacga ggttgaagtg gtaacagctg acggttctat cagaagagct 600
aataaggatc aaaattccga tttgttctgg gcattgagag gagctgcccc atcgttcggt 660
gttattacta acttttggtt ttctaccttg gaagctcctg attctaacgt tatttacagt 720
tataagttca ctggtttatc tttagacgaa atcagtacag ctttgttgga agtgcaaaag 780
ttcggtcaaa ccgctcccaa agaagtcggc atgcttatcc aaatattaga caatggttct 840
ggtttcagat tgtacggtac gtactataac actacccgtc aacaatttga taatttattc 900
ggccaacttt tgcaaagatt gccatcccca ggtaacagcg ctgaggtttc tgtcaagggt 960
tggattgact cgttgatatt tgcctctggc ggtagcaagg gtcttactgt tccagaactg 1020
ggtggaacta accagcattc ttccttttac acaaaatcat tgatgactgc tcaagattac 1080
ccattaaccc tggattcaat taagtccgtg ttcaagtatg ccatgaacca aggtagagcc 1140
gccaccgaaa ggggtctacc atggatggta tttatctctt tgttgggtgg tagatatagc 1200
actctaccaa cgccttccgc tgcttcagat aactctttct acggcagaaa cactttgtgg 1260
gctttttctt tcaccgctta cctaggtaac gtcacagaac aaagcaatag agactcaatt 1320
tacttcttga atggtttcga cacttccgta agaagatccg ttgacaccgc ttacatcaac 1380
ggtcacgata ctgaatattc gagagaagaa gcacatagat tatactacgg tgacaaatat 1440
caaaggttgt ctgtcttaaa gaagcaatgg gatcctgagc aagttttctg gtatccacaa 1500
tccatcgacc ccgccaat 1518
<210> 39
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 39
atgggtaaca caacttcaat cgcagctggc agggattgct tactgtccgc cgtcggaggt 60
aatcacgctc atgttgcttt tcaggaccaa ttgctatatc aagctaccgc agtggaacca 120
tacaacttga atattcccgt tacgccagcc gctgttacct accctcaatc ggctgatgag 180
gttgccgctg tcgtaaaatg tgcagccgac tatggttaca aggtgcaagc tagaagcggt 240
ggtcacagtt tcggtaacta cggtttaggc ggtgaagacg gtgctatagt cgttgatatg 300
aagcatttcg atcaattttc tatggacgaa tctacttata ctgctactat tggtccaggt 360
atcaccttgg gagacttgga taccgcccta tacaatgctg gccatagagc catggctcac 420
ggtatttgtc caacaattcg tactggtggt caccttacca tcggaggttt gggtccaact 480
gctagacaat ggggtttggc cttagatcac gttgaagaag tcgaagttgt cttggcaaac 540
agctccatcg tcagagcatc agacactcag aaccaagaga tcttgttcgc tgttaagggt 600
gctgctgctt ctttcggtat agtaactgaa tttaaagtta gaacagaaga agctcctggt 660
cttgccgtcc aatactcctt caccttcaac ttaggtacag ctgccgagaa ggctaaattg 720
gttaaggact ggcaagcttt tattgcacaa gaagatttga cgtggaagtt ctactctaac 780
atgaatatta tcgacggtca aattatccta gaaggcatat atttcggttc taaggctgaa 840
tacgatgcct taggtttgga ggaaaagttt ccaaccagtg aaccaggcac tgttttagtc 900
ttgacggact ggctgggtat ggttggtcat ggtttggaag atgttatttt gcgtttagta 960
ggcaatgctc caacttggtt ctatgctaaa tctttaggtt ttgctcccag ggcattgatc 1020
ccagattccg ctattgacga tttcttcgaa tacattcaca agaacaatcc tggtaccgtt 1080
agttggttcg tcacactatc gttggaaggt ggtgcaataa acaaggtgcc agaagatgcc 1140
actgcttacg gacatagaga tgttttgttt tgggttcaaa tctttatgat taacccacta 1200
ggtcctgttt ctcagaccat ttacgacttt gccgacggtc tttatgacgt tctggctaaa 1260
gccgtccccg aatccgcagg tcatgcttat ttgggctgtc cagacccaag aatgccaaat 1320
gctcaacaag cctactggag aaataacttg ccaagactag aggaattgaa gggtgactta 1380
gatccaaagg atatcttcca caacccacag ggtgtcatgg ttgtctct 1428
<210> 40
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 40
atgggtaaca ctaccagcat tgccggccgt gactgcctag tttccgcttt gggtggtaat 60
gcaggtctgg tggcttttca gtcacaacca ttataccaaa caaccgctgt ccatgagtat 120
aaccttaaca tacccgttac tccagccgct atcgcttacc ctgaaactgc cgaacaaatt 180
gctgctgtcg taaaatgtgc atcggaatat gattacaagg ttcaagcaag atccggtggt 240
cactctttcg gaaattacgg tttgggtggt acggatggtg ctgttgtggt cgacatgaag 300
cacttcaacc aatttagtat ggacgatcaa acctatgaag ctgttatcgg cccaggtact 360
actttgggcg acgtcgatac tgagctatac aataacggta agagagccat ggcccatggt 420
atctgtccaa caatttctac cggtggccac ttcacgatgg gtggtttagg tccaacggct 480
agacagtggg gtttggcatt ggatcacgtt gaagaagtag aagtcgtttt ggctaattct 540
tctatcgtga gggcttccaa cacccaaaac caagaagttt tctttgccgt taaaggagct 600
gctgcttcat ttggtattgt caccgaattt aaggttagaa ctcaaccagc tcctggattg 660
gctgtccaat actcttacac tttcaacttg ggttcgagtg ctgaaaaggc tcaattcgtc 720
aaggattggc aatctttcat ctctgctaaa aacttaacaa gacagtttta taccaatatg 780
gttatattcg acggcgacat tattttggaa ggtctgttct ttggtagcaa ggagcaatac 840
gaagcccttg gtttggaaga acgtttcgtc ccaaagaatc ctggtaacat tcttgtttta 900
actgattggt tgggtatggt tggtcatgct ttggaggaca ctatcttaag attagtcggt 960
aacaccccaa cctggttcta cgcaaaatcc ctaggcttca ccccagatac tttgataccc 1020
tcctcaggta ttgatgaatt tttcgaatat atcgagaata ataaggccgg tacctctaca 1080
tggtttgtaa cattatctct tgaaggtggt gccatcaacg acgttccagc tgatacgaca 1140
gcatacggtc acagagatgt attgttttgg gtccagatat tcatggtttc cccaactggt 1200
ccagtttcct ctacaactta cgattttgct gacggcttgt ataacgtgtt gactaaggca 1260
gttcctgaaa gcgaaggtca tgcttacttg ggatgtcctg accctaagat ggctaacgcc 1320
caacaaaaat attggagaca aaatctacca agactggagg aattgaaagc tactcttgac 1380
ccaaaggata cctttcataa cccccaaggt atcttgccag ta 1422
<210> 41
<211> 1449
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 41
atgaatcctt ctataccctc aagctccatg ggtaacacaa cgtctatcgc tggacgtgac 60
tgtttagtta gtgccctggg tggtaacgct ggtttggtag cattccaaaa tcagccacta 120
taccaaacca ctgctgtgca cgagtataac ttaaacattc cagtcactcc agccgctatt 180
acctacccag aaactgctga acaaatcgcc gctgttgtca aatgcgcatc ccaatatgat 240
tacaaggttc aagctaggtc tggtggccat tcgtttggta actacggtct tggtggcacc 300
gatggtgctg ttgtcgttga catgaagtat ttcaatcaat tttccatgga cgatcagaca 360
tacgaagcag ttattggtcc tggtactacc ttgggagatg tcgatgtcga attgtataac 420
aatggtaaaa gagctatggc ccacggtgtg tgtccaacta tctctaccgg tggccatttc 480
actatgggtg gtttaggtcc aacagctaga caatggggat tggccttgga ccacgttgag 540
gaagttgaag tggttctagc taattcatct atcgtcagag cttcaaacac ccaaaaccaa 600
gaagttttct ttgccgtaaa gggtgctgct gcctcgtttg gtattgtcac cgaatttaag 660
gttagaactc agcctgcacc aggtattgct gtgcaatact cttacacttt caacttgggt 720
tcctccgcag aaaaagctca attcatcaag gactggcaat ctttcgtttc tgctaagaat 780
cttacgagac aattctacac taacatggtc atatttgacg gtgatattat tttggaagga 840
ttgttcttcg gtagtaaaga gcaatatgaa gccttgggtt tagaagaaag gtttgtccct 900
aagaacccag gtaatatcat ggttctaaca gattggttgg gtatggttgg ccatgctctg 960
gaagatacga ttttgagatt ggtaggtaat acgccaactt ggttctacgc taagtccctg 1020
ggttttactc cagacacatt aatccccagc agcggtattg acgaattttt cgaatatata 1080
gaaaacaaca aggcaggaac cagtacttgg ttcgtcaccc tatctttgga gggtggtgct 1140
attaacgatg tgccagcaga tgctaccgct tacggtcaca gagatgtttt attctgggta 1200
cagattttta tggtttctcc cactggtcca gtttcctcca ctacctacga ctttgccgac 1260
ggcttgtaca atgtcttgac taaggctgtt ccagagtctg aaggccacgc ctatttgggc 1320
tgtccagacc ctaaaatggc taacgctcaa caaaagtact ggagacaaaa cttgccacgt 1380
ctggaagagc ttaaggaaac attagatcca aaagacactt tccacaatcc tcaaggtatc 1440
ttgccagca 1449
<210> 42
<211> 1518
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 42
atggcccgtg tccccgcact gttcttgggc ctatcttcag tgtgtttgtt agttttcttt 60
tgcagtttga ttaacccaac cactccttta catcagcacg gtaagcaaac atctatcgct 120
ggtagggatt gtcttgtatc cgctttgggt ggaaatactg gtttagttgc ttttcaagac 180
caattgttgt accaaaccac ggctgtccac gagtataacc tgaacatacc agttactcca 240
gccgctatca cctacccaga aacctcggaa caaattgctg ccgttgttaa atgtgcatct 300
gaatacgatt ataaggtcca ggccagatcc ggtggtcata gcttcggtaa ttacggattg 360
ggtggtgctg acggtgctgt tgtcgttgat atgaagcact tcactcaatt ttctatggac 420
gaacaaacct atgaagctgt aattggccca ggtacaactc taggtgatgt ggataccgag 480
ttgtacaaca acggtaaaag agctatggcc catggtatct gtcctactat ctccactggc 540
ggtcacttca ccatgggtgg tcttggccca acagcaagac aatggggatt ggctcttgac 600
cacgtcgaag aagtggaagt tgttttggct aattcctcta ttgtcagagc atcaaacact 660
caaaatcaag aagttttctt tgctgttaag ggtgctgccg cctccttcgg tatcgtcact 720
gaatttaaag tcagaactca accagcccca ggattagctg ttcaatactc ttatacgttt 780
aacttgggta gctcagctga gaaggctcaa ttcgtcaagg actggcaatc tttcatttct 840
gctaagaatt taaccagaca gttttacaca aacatggtaa ttttcgatgg taacataatc 900
ctagaaggcc tatttttcgg ttccaaagaa caatacgaag ctttgggttt ggaggaccgt 960
tttgttccaa agaatcctgg taatatctta gtcttgacag attggctagg tatggttggc 1020
catgcattgg aggacactat tttgagattg gtcggtaaca cccccacatg gttctacgca 1080
aagagcttgg gtttcactcc agacacgtta atacctagtt caggtattga tgaatttttc 1140
gattatatag aaaacaacaa ggctggtacc ctgacgtggt tcgttacttt gagtttagaa 1200
ggtggtgcca ttaacgatgt gccaaaggat gctactgctt atggtcacag agatgtgctt 1260
ttttgggttc agatcttcat ggcttctcca acaggtcctg tctcttccac tacctacgac 1320
ttcgccgatg gtttgtataa tgtcttgacc aaagccgttc cagaatccga aggacatgct 1380
tacctgggtt gtccagaccc aaagatggct gacgctcaac aaaagtactg gaggcaaaac 1440
ttacctagac ttgaagaatt gaaagcaacc ttagatccaa aagatacttt tcacaatcca 1500
caaggtatct tgccagca 1518
<210> 43
<211> 1281
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 43
atgacaacca agtgtaggca tgcagtggag gctactgctc taggcacgat ggtagcctac 60
ctgattagaa ataacccacg tagacctagt tcaactaacg ctaatgtttt ggacacaggt 120
ttgggtggtg ccgatggtgc tgttgtcgtc gatatgaaac actttactca gttctccatg 180
gacgatgaaa cctatgaagc tgttatcgga ccaggtacca ctttaaacga cgttgatata 240
gaattgtaca acaacggtaa gagagctatg gcacacggtg tctgccccac cattaagact 300
ggtggtcatt tcaccatcgg cggacttggt ccaactgcca gacaatgggg tttggcctta 360
gatcacgttg aagaggttga agtcgtgttg gctaattcgt ctattgtaag agctagcaac 420
acacaaaacc aagacgtttt ctttgcagtt aaaggtgctg ccgctaattt cggaatcgtc 480
actgaattta aggtcagaac cgaaccagct cctggtttgg ctgttcaata ttcctacact 540
ttcaatttag gttctactgc tgaaaaggct caattcgtga aagattggca atcttttatc 600
tctgctaaga atctaacgag acagttctac aacaacatgg ttatttttga cggtgatatc 660
attcttgagg gtttgttttt cggttccaag gaacaatatg acgccttggg cttggaagat 720
catttcgctc caaagaatcc aggtaacatc ttagtcctga cagactggct aggtatggtt 780
ggacacgcct tggaagacac cattttgaag cttgttggta acaccccaac ctggttctac 840
gccaaatcgt tgggttttag acaagataca ttaattccat cagctggtat agacgaattt 900
ttcgaataca tagctaacca cactgctggt actcccgcat ggttcgtcac acttagtttg 960
gaaggtggtg ctattaatga tgtcgcagaa gatgccacgg catatgctca ccgtgacgtc 1020
ttgttctggg tacaactgtt tatggtgaac cctttgggtc ccatctctga cacgacttac 1080
gaatttactg acggtttata tgatgttttg gcaagagctg ttccagagtc cgtgggccat 1140
gcttacttag gttgtccaga tcctagaatg gaagatgctc agcaaaagta ttggcgtacc 1200
aacttgccaa ggttgcaaga gttgaaagaa gaactagacc caaagaacac tttccaccat 1260
ccacaaggtg ttatgccagc c 1281
<210> 44
<211> 1425
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 44
atgggtcatg gacaatccac tcccggtgag aactgtttaa atgcaatatg cggtaacaga 60
acggactgtg tatcataccc attggatcct ctattccaca tcgcttgggc ccgtccatat 120
aaccttcagg tgcctgttac accagctgct gtcctgaggc cagacaatgc tcaagatgtt 180
gctgatgccg ttaaatgtgc caacgaaaat ggcattaagg tccaagctag atctggtggt 240
cactcgtacg gtaactttgg tttgggaggt gacgacggtg cattggtttt ggatctagtc 300
aatttacaag gtttcactat ggacgaagaa aactggcatg ctgctgttgg cgcaggtatt 360
agattgggta agctggatga acacttgcat aaaaatggtg gtagagctat ggctcacggt 420
acctgtccag gcgtaggtat cggtggtcac gccaccatcg gaggtttagg tccaatgagc 480
agaatgtggg gttctgcctt ggatcatgtc gtcgaagttg aagttgttac tgctgacggc 540
tctattcaac gtgctaacga aacagaaaat agtgatttat tttgggcctt gagaggtgct 600
ggtgcttcct tcggtataat cactgagttt gtagttagaa cccacccaga accaggagat 660
gtaattgaat atacctactc tctgaccttc ggttcacaag cagaaatggc tcctatttac 720
caagaatggc aggaatttat tggtgaccca gacttggata gaaggttctc ctctcaattc 780
attgctcaac cattgggtgc tatcatcact ggaaccttct acggtactga agacgaatat 840
agagagagtg gtatccccga taagatacca ggaggtggta gtgatggtgt tggtatttta 900
gttacagact ggttgggttc tctaggccac caagccgaaa gatccggtct tgctatttcg 960
gatcttccaa gcccttttta ttctaagtcg ttggccttca gaaaggaaga cttgttgcca 1020
aaagagggta taactgagtt attccagtac ttgaacgacg ctgaccatgg tacattgatc 1080
tgggtcgtca tctttaactc cgaaggaggt gcaatgggtg atactgccgc aaacgctaca 1140
gcctacccac atcgtgataa gaccatgatg tatcaatcct acgtcattgg tatccccgaa 1200
gtgagtggca ccgcaagaag attcctggag ggtgttcacg ctaagattca agatgctgct 1260
cctggtgcta attcaacgta tgctggttac atcgatacgg aattaggcag agctgaagct 1320
caagaagtgt actggggtag ccagttgcct caattgagaa agatcaaaaa ggactgggac 1380
ccaaaggaca ggttttcaaa cccacaatct gtccaagccg ccaga 1425
<210> 45
<211> 1548
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 45
atgcgtgtcg ttggaaagat gggtgctttg caaagcactc tggagaaatc tatcaaggcc 60
gcattagctg gtgacgatga tctatacgct gtgcccggta aaccatttta tcagatacaa 120
catgtcaagc cttacaactt gtcgattcca atcgaaccag ccgctattac ctatcctaag 180
acaactgctc aagtagccgc aattatcaag tgcgctgttg ctgctaattt gaaggtccaa 240
gccagatcag gtggccactc ctacgctaac tactgtattg gtggtgtttc tggtgctgtt 300
gttatcgacc ttaaacactt ccaaagattc agtatggata gaaccacgtg gcaagcagcc 360
gtcggtgctg gcactttatt gggtaatttg accaagagga tgcatgaagc tggtaacaga 420
gccatggctc acggtacttg tccacaagtg ggaattggtg gtcacgcaac cataggtggc 480
cttggtccat cttcaagatt gtggggtacg gctttagacc atgttgaaga agtcgaaata 540
gtcttggctg attccacaat taagagatgt tctgctactc agaatccaga catcttttgg 600
gccgttaagg gagctggtgc atccttcggt gttgtgactg aatttaaatt aagaaccgag 660
cccgaaccat ctgaagctgt acatttctct tattcgttca ctgttggttc ctacgcaagc 720
ttggctgctg tttttaaatc atggcaatct ttcgtcgctg acccaggtct tactcgtaag 780
ttctcctctg aagtcatcat tacagagatc ggtatgatta tatcaggcac ttattttggt 840
agtcaagctg aatacgatgc cctagatatg aagtctcaat tgagaggtga cagtgttgct 900
aagatcattg tttttaagga ctggttagga ttgttgggtc actgggccga agatgtgggc 960
ctaagaattg ccggtggttt acctgcccct ttgtacgcta aaaccttgac cttcaacggt 1020
gccaacctga tcccagatga agtcatcgat aaattgttcg cctacctgga caaggttgaa 1080
aagggagctt tggtatggtt cgtcattttt gacctggctg gaggtgccgt taatgacata 1140
gctcaagatg ctacatccta tgctcatcgt gatgccttgt tctacttgca gtcatatgca 1200
gtgggtttag gtaacgtttc acaaacaact aaggattttc ttaccggtat aaacacgact 1260
attaccaacg gtatgccaga aggtggtgac ttcggtgctt acccaggcta cgttgacttg 1320
gaattaccaa atggtccaca cgcttactgg agaaccaacc ttccaaggtt ggaacaaatc 1380
aaagccctgg tagatcctaa tgatgtcttc cacaacccac aatcttattt gtgcatccta 1440
tttttgctaa acttgctaaa cagagctttg gcttgggctc cagttggtac tgtccagcca 1500
ttccaagtct taaggtactc cattgacaca ggtcctcttg tgcttttg 1548
<210> 46
<211> 1434
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 46
atgggtcagg gctcgagcgg tgtgcaatct aaccccttag aagattgttt gaaggtagct 60
acaagtccac taggttcata cgccttccat gacaaattgc tgtttcaact taccgatgtt 120
aagccttata atttagacta cccagtcaac ccaatcgctg ttacgtatcc aggttccact 180
aaagaggttg cacaaattat aaagtgcgct accacttacg ataagaaggt ccaagccaga 240
agcggaggtc actcttacgc taatttcgct ttgggtgacg gtgacggtgc aattgttatc 300
gatatgcaaa aatttaagca attctccatg gacacttcta cctggcaggc tacaattggt 360
cctggtactt tgttgggtga tgtctccaag cgtttacacg aaaacggtaa cagggtaatc 420
ccacatggaa cctctccaca aataggtttc ggaggccacg gtactattgg tggtctgggc 480
cctttgtctc gtatgtacgg tttaaccttg gactccatcg aagaagttga agccgtcttg 540
gctaacggtc aaattgttag agctagtaaa actcaaaatg aagatctatt ttttgctatt 600
agaggagccg ccgcttcagt cgcagttgtc acagaattta aggttagaac ctatccagag 660
ccctctagtt ctgtgttata ttcttacact ttacaaggtg gttcagttgc ttccagagct 720
aacgctttca agcagtggca aaaattgacg acagatccat cggtcagcag aaagttcgct 780
tctactttcg ttctatccga agccataacc gtcgtcacgg gtactttctt cggtactcaa 840
gctgagtttg attccttgga catcacctct aggttgcctg ccgacatgat ctccaataat 900
acagaagtta agaactggtt gggtgtcgtt ggccattggg gtgaatcatt ggctttgaga 960
gccggtggtg gtattccagc acacttttac tccaagtctt tgggtttcaa aaaggatgag 1020
atcatggatg atgctactgt ggacaagcta ttcaattata ttgacaaagc tgataaagga 1080
ggtgctgttt ggttcgttat ttgggacctt gaaggaggtg ctatctctga tgttccaacc 1140
actgaaactt cttacggtca tagagatgca atctttttcc aacagtctta tgcaattaac 1200
ttattgggta gagttaagga cgacacccac gaatttttga acagagttaa tagtgtaatt 1260
atggaatcta acccaggtgg ttactggggt gcctacccag gttatgtcga tactgctcta 1320
ggtaattcca gcgctaaggc ctactggggt atcaacagcg aaagattaca aaccataaaa 1380
agttgggtag acgctggtga tgtgtttcac aacccacaat cagttagacc caag 1434
<210> 47
<211> 1578
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 47
atgcagcctt ttacaagcct tactaggtcc cccttccgtt cagcccacgt tatcagttgt 60
ccagtcgctt tggacaatcc accatcggta ccaattataa tgggacaaaa gccttcctct 120
ccattagcta cctgcttgga taaagtttgt aacggtagat ctagttgtgt cggttaccca 180
aacgaccccc tattccaaat caattgggtt aagccatata acttggatat tcctgtccaa 240
ccaattgcag tgactagacc atctaccgct gaggatgttg ccggttttgt taagtgtgct 300
gctgaaaaca atgtcaaagt ccaagcaaag tctggcggtc attcctacgg taacttcgct 360
atcggtggta ctgacggtgc cttagttatt gatctggtga attttcaaaa cttcagcatg 420
gatacaaaca cctggcaggc tacgttcggt ggaggccaca agttgcatga agttactcaa 480
aaactacacg acaatggtaa gagagctatc gcccacggta cctgtccagg tgttggtata 540
ggtggacatg ctactattgg tggtttgggt ccatcttctc gtatgtgggg ctcctgcttg 600
gatcacgtag ttgaagtcga agtcgttacc gcagacggta agatccaaag agctaacgat 660
aagcaaaatt ccgacttgtt ctttgcctta aaaggtgcag gagctggttt tggtgtcatt 720
actgagttcg tgatgagaac ccatccagaa cctggtgacg ttgttcaata ttcttacgct 780
atcacttttg ctaaacacag agacttggtt cctgtattca agcaatggca agaactgatt 840
ttcgatccaa cacttgatag acgtttctca tctgaatttg tcatgcaaga attaggtgtc 900
gctataacgg ccacttttta cggcacggag gatgaattta agaagactgg tattccagac 960
agaatcccca aaggtaaagt ttccgtcgtt ataaacaatt ggttgggtga tgtcgcacag 1020
aaggctcaag atgcagcctt gtggcttagt gatattcaat cagctttcac ctctaagtcc 1080
ttggctttca cccataacga cctaatctcg gaagacggta tccaaactat gatggactat 1140
gttgattcag tcgatagagg cacattaatt tggttcttga ttttggattc tactggagga 1200
gctattaatg acgttccaat gaacgctaca gcctacagac acagggacaa agtgatgttc 1260
ttccaaggtt acggtgttgg tataccaacc ctttctggta agaccaagga ttttatgtcc 1320
ggtgttgctg ataagatccg taaggcctct cctaacgaat tgagcactta cgctggatac 1380
gtagacccaa ctttggacaa tgctcaagaa agatattggg gtccaaactt accagcccta 1440
gaaagaataa aagctacctg ggatcctaag gacttattct caaacccaca gtcagtgagg 1500
ccaaacgctt ccgccaagga tgtcgaacct gccgcatctg gtggttccaa taattcgggt 1560
tctaaaggtg gagacagt 1578
<210> 48
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 48
atgggatccg gtcatagttc tggcttggcc acttgcttag atgcagtgtg taatggtcgt 60
cacgcttgtg tagcttaccc tgaccaccta ctgtatcaag cctcttgggt cgatagatac 120
aaccttgaca tcccagttca tcccatagct gttaccaggc catcaaacgc agacgatgtc 180
agcggttttg ttaaatgtgc tgccgctaat aacgtcagag ttcaggctaa gtctggtggt 240
cactcgtatg ctaattacgg cttgggtggt gaggatggtg aattagttat tgacttgaga 300
catttgcaac acttctcaat ggatacgaac acttggcaag ctaccattgg tgccggtcac 360
agattatggg acgttacaca taagttgcac gaaaacggta agagagcagt cagccacgga 420
acttgcccag gtgttggtat tggcggtcat gccaccatcg gtggtctagg tccatcctct 480
cgtatgtggg gatcgtgttt ggatcacgtg gtcgaagttg aagttgtgac tgctgacggt 540
tctataagaa gagcttccga aagagaaaac gctgatttgt tctttgcttt aaaaggtgcc 600
ggtgctggtt tcggtgtgat caccgaattt gtaatgaaga ctcaccctga accaggatct 660
gttgtcatga ggtacacata ctccgttaat ttcggtagac atgcagacat ggtcgacgta 720
ttcgatcaat ggcaagcttt gatttctgat ccaggtctgg atagaagatt tggaagtgaa 780
attatcatgc acgcattcgg cctagtcatt tccgctacgt tccatggtac cagagatgag 840
tatgaagctt ctggtatccc agacagaatc cctcgtggta acgtgtccgt tttgttggac 900
aattggttag gtgtcgttgg taatcaggcc caagatgctg gattgtgggt ttctgaggtt 960
agatcgagtt tcacttcacg ttcattggct tttagaaggg accaacttct atctcgtgat 1020
gatattgtca gaatgatgga ctttttggac agaactgata agggtacgtt agtctggttt 1080
ttgattttcg acgtcacagg tggtgctatt ggcgacgtta gaactgacgc aaccgcctac 1140
gctcatagag ataagatcat gttctgtcaa ggttacgcag ttggtatacc agctcttacc 1200
agaaaaactc gtgtcttcat ggacggttta atttccacta tcagggaaac cgccaactct 1260
actctaacca cctatcccgg atacgtcgat ccaagtttgc acgacgctca agcttcctac 1320
tggggtccta acttgccaag attaacagaa gttaagacta agtgggatcc acaggatgtt 1380
tttcacaacc cacaatctgt aagaccatct ggtaaagat 1419
<210> 49
<400> 49
000
<210> 50
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 50
atgggtaaca ctacatcaat agctgccggc cgtgactgcc tattgagcgc tgtgggtgga 60
aatcacgcac atgttgcttt tcaggatcaa cttttatacc aagctaccgc cgtcgaaccc 120
tataacttga atatccctgt aactccagca gctgttacgt acccacaaag tgctgatgag 180
gttgccgctg tcgttaaatg tgccgctgac tacggttata aggttcaagc taggtccggt 240
ggtcactcgt tcggtaacta cggtttggga ggtgaagacg gtgctattgt cgttgatatg 300
aagcatttcg atcagttttc catggacgaa tctacctata ctgcaacgat cggtccaggc 360
attactttag gtgatctgga taccgccttg tacaacgctg gtcacagagc tatggctcat 420
ggtatctgtc caacaattag aactggtggt caccttacca ttggtggatt aggtcctaca 480
gctagacaat ggggcttggc cctggaccac gttgaagaag tggaagtcgt cttggctaac 540
tcgtctatag ttagagcatc tgacacccaa aatcaagaaa tcttgttcgc tgtaaaaggt 600
gctgctgcct cattcggtat tgtgactgaa tttaaggttc gtactgagga agccccaggt 660
ttggccgtcc aatattcttt cacctttaat ttaggtactg ctgctgaaaa ggcaaagctg 720
gttaaagact ggcaagcttt catcgctcag gaggatctta cttggaagtt ctactctaac 780
atgaacatta ttgatggtca aatcatcttg gaaggcatct actttggttc taaggccgaa 840
tatgacgctc taggtttgga ggaaaaattt ccaacctccg aaccaggaac cgtcttggta 900
ttgactgact ggctaggcat ggtgggtcac ggtttggaag atgttatatt aagattggtc 960
ggtaatgccc caacttggtt ctacgccaag tcccttggat ttgcaccaag agcactaatt 1020
cctgattccg caattgatga cttcttcgaa tacatccata agaacaaccc cggtaccgtt 1080
tcttggttcg ttactttgag tttagagggt ggtgctataa ataaggtccc agaagatgct 1140
accgcttatg gtcatagaga tgttctattc tgggtacaaa ttttcatgat caatcctttg 1200
ggtccagtct cacaaactat ttacgacttt gcagacggat tgtacgatgt tttagccaaa 1260
gctgttccag aaagcgctgg tcatgcttac ttgggttgtc ccgacccaag aatgccaaac 1320
gctcaacaag cttactggag gaacaatttg cctagattag aagaacttaa gggtgatttg 1380
gacccaaaag atatattcca caacccacaa ggtgtcatgg ttgtttcc 1428
<210> 51
<211> 1431
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 51
atgggtcaat cccccagttc acttttagcc acttgcctaa ataccgtttg tgacggcaga 60
acagattgtg tagcataccc taacaaccca ttgtatcaga tcagctgggt caaccgttac 120
aatctggatt tgccagttac tcctattgct gtcaccagac cacaaacggt tcaagacgtg 180
tctgcttttg ttaaatgtgc tgccactaac aatataaagg tccaaccaaa gtctggtgga 240
cactcttacg ctaactatgg tggtgaagac ggtgctttag ttattgattt gttgaagttg 300
caagatttct ccatggacgc caaaacctgg caggctacta tcggtggtgg tacaaagttg 360
gctgatgtca ccaagagact gcatgataac ggtaaaaggg caatttctca cggtacttgt 420
ccaggcgttg gtatcggtgg tcatgctacc atcggtggct tgggacctac ttcgagaatg 480
tggggttcct gcttagacca cgtcgtggag gctgaagttg tgactgccga tggtagtatt 540
aagagagcct ctgaaacaga aaatcgtgac ttgttcttcg ctcttaaagg tgcaggagca 600
ggttttggtg ttgtcacgaa gtttgttatg aagacccacc cagaaccagg tagcatggta 660
caatactcct attcactatc tttcggtaaa catactgata tggtaccagt ttttaagcaa 720
tggcaagatt tagtcagtga ccccaatttg gacagaagat tcggcactga atttgttgct 780
catgagttgg gtgctattat caccgctact ttctacggta cagaagctga atgggatgct 840
agcggcatcc cacaaagaat cccaaagggt aagatatccg tcattattga tgattggcta 900
gccgttattt cccagcaagc agaggacgct gccctatatt tgtctgacat tcactccgct 960
ttcaccgtgc gttctttggc cttcaccgct gaagaaacat tgtctgaaca aactatcact 1020
agagttatga agtacatcga cgatacgaac agaggtacct tgttatggtt tttaatattc 1080
gacgcaacgg gtggtgctat aagcgatatt cccatgaatg ctactgccta ctcccacagg 1140
gacaagatca tgtactgtca aggctacggt attggtctac cagtcttaaa ccaacatact 1200
aaagatttcc ttacgggtct taccgacact atccaggctt ctatgagaca aaacttgact 1260
acctacccag gttatgttga tccttcattg gctaatccac aacaatctta ttggggccca 1320
aaccttgcaa tgttggaatc aattaagacc acgtatgacc caaacgattt gttccataac 1380
ccacaatccg ttagaccagg taataaaaag gcttctatga ctcaagagtt t 1431
<210> 52
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 52
atgagtaata acacccttat tcaagcttgc ctgttagccg ctctaggatt caactctact 60
agagtaaaat ttcctgaagc aggtacaatc gacgccgatc catataactt ggacttgccc 120
atagttccag ctgctattac tgtcccacgt tccacggctc aggtggccaa tgtcgttaag 180
tgtgctgcat cgaacggtta caaggttcaa tcaagatctg gcggtcacag ctacggtaat 240
catggtttgg gcggtaccga tggtgctatc gttgtggatt taaaagactt aaagcaattc 300
tctatggatg agtccactta cattgcatct atcggttcag gtatgttgtt ggacgaagtc 360
acccacaagt tgtatgataa cggtaagaga gccatggctc atggagtttg tccacaagtc 420
ggtgtgggtg gtcactttac aattggtggt ttgggaccta ctgctagaca gtggggttcc 480
tctcttgacc atgttgaaga agttgaggtc gttttggcca attctagtat agttagggct 540
tccaacactc aaaaccaaga cgtcctattc gctatcaaag gtgctgctgc ttctttcggt 600
attgtgaccg aatttaaggt tagaaccgaa ccagccccag atgtcgcagt tcaatacact 660
tatgaattaa ttttgggtaa tatcacagaa agagctagga ttatggtcga ttggcaggac 720
ttcatatccg accccgatct ttctcgtaaa tttgcatcga ttatgatcgt cttcgaacac 780
ggtatgttgc tgtccggcga tttctacggt tcgaagaagg aatttgatga cctgggtttg 840
gctgacagat tcccaattag aaagccaggt aacgttgcta ttttgactga ttggttagga 900
atgacaggtc atgctgttga ggaattggct ttaggtatcg taggtggcat ccctttgcac 960
ttttatgcca agagtatggc tttcacccgt gacagtttaa tgtctccatc tacgttcgaa 1020
aaattgtttg attaccttga taacactgat aagggcacct tgctatggct aatttacttc 1080
gatttgcaat caggcgccac ttcagacgta ccaaataatt ctacagcata cgctcacaga 1140
gacactttgt actggctgca atcctacgta gttaacttgg tgggtccagt cagtaacacc 1200
accacagctt ttcttgaagg tataaataac ttgatcgccc aagacgtacc ttccgccaac 1260
actagagctt atccaggtta cgttgatcca ttaatgccca acccacaatg gcgttattgg 1320
ggttcgaatt taccaaagtt ggaaaagata aaagcagcta ttgaccctaa tgacgtcttc 1380
cataacccac aatcagtcaa gcctagaaaa caagcaccc 1419
<210> 53
<211> 1512
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 53
atgggacaga gccaagcatt gtcagccttt aaaaaggacc tagctgctgc tcttaataac 60
gatgatgaat tgttcgctct gccagacgag cctttctaca ttaaggacca cgtcaagcgt 120
tataacttag atatcgaaac cacaccctta gccgtaacgt acccaaaaac taccgcacaa 180
gtttcttcca tagtgaagtt ggctaaggat aacaatttga aagttcaagc taagtgcggt 240
ggtcattctt atgccaattt ttgtgatcca aacggtggca tcattgtcga ccttaaacac 300
ttccaaaagt ttgaaattga cgaaaacact tggagatgta gggtcggtgg tggtactttg 360
ctaggtgatt tgactaagag aatgttcgaa ccacataaga gagctatggc tcacggtacc 420
tgtccaacag ttggtatcgg aggtcatgca accatcggtg gcttgggtcc tagttcgaga 480
ttatggggtg ctgccttaga ccacgtagag gaagtcgaaa tggttgttgc taacggtgac 540
gttattagag ccaacgaaaa cgaaaattcc gatatattct gggctgtcaa aggcgctggt 600
gcctcttttg gtgttattac tgaatttgtt gtaagaactg agccagctcc aggtagattg 660
gttcaatact cttattcctt cacaaccggt tcatggaagg acatggccaa gactttcaag 720
gcttggcaaa cctacgtcag ccaacctgat ttgacgcgta gtttcgcaag tactgctacg 780
atcaccgaac tgggtttgac tatttctgtc acatacttcg gcactgacga agaatttgat 840
aaaataaatt tcgctaaaaa tttcccaggt aaccagaccc caaagaccat cgtttttgat 900
gattacttgg gtgctgtggg acattgggcc gaagatgttg ctttagaaat tatctctcct 960
ttgcccgccc actcctatac aaagactttg acttttaacc actgcaacca aattccagac 1020
tctgtgattg atagaatgtt caaatacttc gaggaagttt cgaagggtac gttagtttgg 1080
tttgccatct tcgatttggc tggtggtaga gtcaatgaca tcccacaaga cgctaccgca 1140
tatgctcata gagatgcttt gttctactta caatcctacg ctgtgaaccc atttggtccc 1200
gtttctaata aaagtaagca atttctgcaa ggccttaaca aggtcatccg tgatggaatg 1260
gctgaagctg gtgaaaatac agacttgggt gcatatgccg gctacgttga tctggaatta 1320
ggtgctggtg ctcagaaggc ctactggaga actaacttgc cacgtttgga gtctattaag 1380
ctaaagtggg acccagagga tgtattccac aatcctcaat ccgtcagacc aggtggtaac 1440
gacgttattt ctaccccaaa ggtagtctac aaaaaggctg gtttcctagc taggttaaaa 1500
ggttgtttca ga 1512
<210> 54
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 54
atgggtaata caaccagcat tgctggaagg gattgcctag tctctgcatt gggcggtaac 60
gccgacttag ttgcttttca aaaccagttg ctttaccaaa ctactgctgt gcacgagtat 120
aatctgaaca tacccgttac gcctgccgct atcacctacc cagaaactgc tgaacaaatt 180
gctgctgtcg ttaaatgtgc ctccgaatac gattataagg tacaagccag atcaggtggt 240
cattctttcg gtaattacgg tttgggtgga accgacggtg ctgttgtcgt tgatatgaag 300
cacttcaacc aatttagtat ggacgatcaa acttatgaag ctgttttagg tccaggtact 360
accttgggcg acgtcgatac agaattgtac aacaacggta agcgtgctat ggcacatggt 420
atctgtccaa cgatttcaac cggtggtcac ttcactatgg gtggcttggg tccaaccgcc 480
agacaatggg gtttagctct tgaccatgtc gaagaagtcg aggttatcct tgctaattct 540
tccatcgtaa gagcctcgaa cacccagaat caagaagttt tctttgcagt taaaggagct 600
gccgctagtt tcggtattgt cacagagttt aaggtcagaa ctcaaccagc acctggtttg 660
gctgttcagt attcttacac cttcaacttg ggttcttccg ctaagaaagc tcaattcgtt 720
aaggattggc aaagctttat atccgctaaa aatctaacta gacaatttta cactaacatg 780
gtaatcttcg acggtgatat tattttggaa ggcttattct tcggctctaa ggaacaatac 840
gaagcactgg gtttggaaga acgttttgtt ccaaagaatc caggtaacat cttggttcta 900
acagactggt tgggtatggt gggtcacgcc ttggaagaca ctatattgag acttgtcggt 960
aacactccta cctggtttta cgcaaagagc ttgggtttca ctccagatac gttaattcct 1020
tctgctggta ttgatgaatt tttcgaatat atcgaaaaca acaaggctgg cacatccacc 1080
tggtttgtca ccttatcttt agaaggtggt gccattaatg acgtaccagc tgatgctacg 1140
gcatacggtc acagagatgt gttgttctgg gttcagattt tcatggtcag tccaactgga 1200
ccagtttcgt ctaccactta tgacttcgct gatggtctgt acaacgtctt gaccaaagct 1260
gtgccagaga gtgagggtca tgcttacttg ggttgtcccg atccaaaaat ggccaatgct 1320
caacaaaagt attggagaca aaaccttcct agactggaag aattgaaggc tatcttagat 1380
ccaaaggaca cttttcataa cccacaagga attttacccg cc 1422
<210> 55
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 55
atgggtaata ccacatccat cgccgctgga cgtgattgcc tattgtcggc tgttggcggt 60
aaccacgcac atgtcgcctt ccaggaccaa ttattgtatc aagctactgc tgtggagcca 120
tacaacctta acatacctgt tactccagct gctgtcacgt acccccaaag cgcagacgaa 180
attgccgctg tagttaagtg tgctgctgaa tacggttata aagtccaagc aagatcaggt 240
ggtcactctt ttggcaatta cggtctgggt ggtgaagatg gtgccattgt tgttgaaatg 300
aagcatttca accaattttc tatggacgaa agtacctata ctgctaccat cggcccaggt 360
attactcttg gtgatttgga tacaggtttg tacaacgccg gtcacagggc aatggctcat 420
ggtatctgtc caactattag aaccggaggt cacttgacta tgggtggttt aggtccaaca 480
gctagacagt ggggattagc tttggaccat gttgaagagg tcgaagtggt tttggcaaat 540
tcctctattg tcagagctag cgacacccaa aatcaagata tattcttcgc tgttaagggt 600
gccgctgcct cttttggtat cgtaactgaa tttaaagtca gaaccgaaga agctcctgga 660
ttagctgtcc aatactcctt cactttcaac ttgggtaccg ccgccgaaaa ggctaaactt 720
gttaaggact ggcaagcttt cattgctcaa gaggatttga cctggaagtt ttactccaac 780
atgaacatct tcgatggtca aataatctta gaaggtattt actttggttc taaggaagaa 840
tatgatgcat tgggtttaga agagagattc ccaacctctg aacctggtac tgttctggtg 900
ttgacagact ggttgggtat ggttggacac ggcctagagg atgtcatttt gaggttagtg 960
ggtaatactc caacttggtt ttatgccaaa tcactaggtt tcgccccacg tgccttgatc 1020
ccagacagtg ctattgatga tttcttttct tatatacacg aaaacaaccc aggtactgtt 1080
tcttggttcg taacgcttag cttggaaggt ggcgctatca acaaggttcc cgaagacgct 1140
accgcttacg gtcacagaga tgtgttgttt tgggtacaaa ttttcatgat taatccttta 1200
ggtccagttt cgcagactac ctacggtttc gcagacggat tgtacgacgt cctagctaag 1260
gctgtcccag aatcagctgg tcatgcatac ctgggttgtc ccgacccacg tatgccaaac 1320
gcccaacaag cttattggag atccaacttg ccaagattgg aagaattaaa aggtgaattg 1380
gatccaaagg atatctttca taatccacag ggtgttatgg ttgtttct 1428
<210> 56
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 56
atgggaaata ccactagcat tgcaggtcgt gactgcctaa tatctgcctt aggtggtaac 60
tcagctcttg ctgctttccc taaccaactg ttgtggacgg ccgatgtaca cgaatataat 120
ttaaacttgc cagttacacc agctgctatc acttaccccg agactgccga acagattgca 180
ggcatcgtca agtgtgcttc cgactacgat tacaaagtgc aagctaggtc tggtggtcat 240
agttttggta attatggttt gggcggaacc gacggtgccg tcgttgttga tatgaagcac 300
ttcaaccaat tttcaatgga cgatcaaacc tacgaagctg ttattggtcc aggtacaact 360
ttgaacgatg ttgatataga attatacaat aacggtaaga gagccatggc tcatggcgtc 420
tgtcctacta tcaaaaccgg aggtcacttc actattggtg gtttgggtcc aaccgctaga 480
caatggggtc ttgctttgga ccacgtagaa gaggtcgaag tcgttttggc taactcttcc 540
atcgttagag caagtaatac ccaaaaccaa gatgtcttgt tcgccgttaa gggtgctgcc 600
gctgactttg gaattgtaac cgaatttaag gttagaactg aaccagctcc aggtttggcc 660
gttcagtatt cgtatacgtt caacctaggt tctactgctg aaaaagctca attcgtgaag 720
gactggcaat ctttcatttc cgctaaaaat ttaaccagac aattttacaa caatatggtc 780
atcttcgatg gtgatatcat tctggagggt ttgttctttg gtagcaagga acaatacgat 840
gccctaggtt tggaagacca tttcgcaccc aagaacccag gtaacatcct ggttttaacc 900
gactggcttg gcatggtcgg ccacgctttg gaagatacaa tacttaagtt ggtcggtaat 960
actccaactt ggttttatgc caagtctttg ggtttcagac aagatacttt gattccttcc 1020
gctggtattg atgaattttt cgaatacata gacaaccaca cggctggtac tccagcttgg 1080
ttcgttacat tatcattgga gggtggtgcc atcaatgacg tggccgaaga tgctactgca 1140
tacgcccatc gtgatgtttt attctgggtt cagttgttta tggtcaaccc acttggtcca 1200
atctctgaaa caacctacga atttacggat ggtttgtatg acgttctagc tagagctgtt 1260
cctgagtctg ttggtcatgc ctacttggga tgtccagatc cacgtatgga aaacgcacct 1320
cagaagtact ggagaactaa tttacctaga ttgcaagaac tgaaggaaga attggaccca 1380
aaaaatacat tccaccatcc acaaggtgtt attccagct 1419
<210> 57
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 57
atgggtaata ccacatctat tgccggcaga gactgcctaa tcagcgcttt aggtggagat 60
tccgcactgg ctgtcttccc aaaccagctt ttgtggactg ctgatgtgca cgaatacaac 120
ttaaatcttc ctgtaactcc agccgctata acctatcccg agacagctga acaaattgcc 180
ggtatcgtta aatgtgcttc agactacgat tataaggttc aagcacgtag tggtggtcat 240
tcctttggca actacggttt gggtggtact gacggtgctg ttgtcgtcga catgaagcac 300
ttcaatcaat tttctatgga tgatcaaacc tacgaagcag ttattggtcc aggtactacc 360
ttgaacgacg ttgacatcga attgtacaac aatggaaaga gagctatggc tcatggtgta 420
tgtccaacca taaaaactgg tggtcatttc acgattggtg gtttgggtcc tacggccaga 480
caatggggct tggctttaga tcacgttgaa gaagttgagg tcgtcttggc caactcttcg 540
atcgtcaggg cttctaatac tcaaaaccaa gatgtctttt tcgctgttaa gggcgccgca 600
gctgacttcg gtattgtgac tgaatttaag gttagaacag aaccagctcc aggattggcc 660
gtgcagtata gctatacttt caaccttggt agtaccgctg aaaaagctca attcgttaag 720
gattggcaaa gctttatctc cgccaagaac ttgacgagac aattctacaa taatatggtc 780
attttcgacg gtgatattat cttagagggt ttgttctttg gttcgaagga acaatacgac 840
gctttgggtt tggaagacca ctttgcacca aaaaacccag gtaacattct agttctaacc 900
gattggttag gtatggtagg acacgcttta gaagatacta tcttgaagct agttggtaat 960
acccccactt ggttctatgc aaagtctttg ggttttagac aggacacact gatcccttct 1020
gctggaattg atgaattttt cgaatacatt gctaaccaca ccaccggtac tcctgtttgg 1080
ctggttactt tgtcattaga aggtggtgcc attaatgatg tagctgagga tgcaacagct 1140
tacgctcata gagatgtcct attttgggtt caattgttca tggttaaccc attgggtcct 1200
atttctgaaa caacttatga atttacagac ggattgtacg acgtcttggc ccgtgctgtc 1260
ccagagtccg tcggtcatgc ctacttaggc tgtccagacc caagaatgga agatgctcca 1320
caaaagtact ggcgtaccaa cttgccaaga ttgcaagaat tgaaggaaga attagaccca 1380
aaaaacacgt tccaccatcc acaaggtgtt atacccgcc 1419
<210> 58
<211> 1446
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 58
atgggtaata aagcaagtac cacaacgata atcaccactg ctgtacacaa gtgccttctg 60
tcggccgtga acggcaactc agctcaggtt tccgtccaaa acgacttatt gtacggtgtt 120
accgctgttc atgaatataa tttgaacttt ccaatgactc ccgctgccgt cactttccct 180
gagacttccg aacaagttgc tgcattggtc aagtgtgctg ccgaatacaa gtataaagtg 240
caagctagga gcggaggtca ctctttcggt aaccatggtc taggtggtgc tgatggagct 300
attgttgtcg atatgaagca ctttcaacaa ttctctatgg acaatgaaac ccacgttgcc 360
acaattggcc caggtttgag tctaggtgac atcgatacac ttttgtacaa cgctggtggt 420
agagccatga gccatggtat ttgtccagaa atacgtgccg gaggtcactt aactatcggt 480
ggtttgggtt tgacttctcg tcaatggggt atgtctttag accatatcga agaagtcgag 540
gtagttttgc caaattcctc gatcgttaga gcttctgaaa ccgaaaatgc tgatctatta 600
ttcgctgtta agggcgcagc tgcatctttt ggtgttgtca ctgaatttaa ggtaagaacg 660
caacttgcac ctaaagaagc tattcagtac tcatacagtt tcaaattggg ttccgctgcc 720
caaagagcta gattgttcgc tgattggcaa gacttggcat taaggagaga tttgtctcgt 780
aagttcacat ccgatttcat ttgtttgcaa gactctgtca ttgtgaaggg tgtgtttttc 840
ggttccaaaa aggaatataa cgccctaaga attgaacatc acttaccagg ctctgacagt 900
tctaaggttt tggtcttaga tgactggttg ggtattgtta cccacgttgt cgatgatctg 960
gctgttagat taggtggttc catgtcaact tacttttatg ccaagtcact tggttttacc 1020
agagatactt tgatgccacc atcgacgatc acctctttat tcacttactt ggacaaagct 1080
aagaaaggca caataacttg gttcgtcacc ttcagcttgg tcggtggtgc tatcaatgat 1140
taccctaaga acgccacggc ttatccacac agagatgtta tctactggat gcaatctttt 1200
gctattaacg ctctgggtcc tgttttgaac tccacttacg acttcttgga cggcatcaat 1260
gagctagtcg cacgtgattt accaggttgt gccggacacg cttatttagg ttgcccagat 1320
cccagaatgg agggtgctga aagagcctat tggggttcaa acttaggtag acttgaagac 1380
atgaaaggtg tctttgaccc agttgacgtt ttctggaatc cacaaggcgt cggtgtccct 1440
gttgct 1446
<210> 59
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 59
atgggtaaca ccacttccat agcaggccgt gattgcctaa ttagcgctct tggtggtaat 60
agtgctctgg ccgtgttccc caaccagtta ttgtggacag ctgacgtcca tgaatacaat 120
ttgaacttac ctgttactcc agcagctatc acgtatccag agactgctga acaaatcgct 180
ggaattgtta aatgtgcctc tgattacgac tataaggttc aagctaggtc tggtggtcac 240
tcctttggta actacggttt gggcggtacc gacggtgccg tcgtagtcga tatgaagcac 300
ttcactcaat tttctatgga tgaccaaacc tacgaagcag ttataggtcc aggaacaact 360
ttgaatgacg ttgatattga attgtataac aacggtaaaa gagctatggc tcatggtgtt 420
tgtccaacca tcaagacagg tggtcacttc actattggtg gtttaggtcc aaccgccaga 480
caatggggat tggctttaga ccacgtcgag gaagttgaag tcgttttggc taactcatcg 540
atcgtcagag ccagcaatac ccaaaatcag gatgtctttt tcgctgtaaa gggtgcagct 600
gccgacttcg gcatcgttac tgaatttaaa gttagaaccg aacctgctcc aggtttggcc 660
gtgcaatact cgtatacatt caacctaggt tccacggctg agaaggctca attcgtcaag 720
gattggcaat cttttattag tgcaaagaac ttgactagac aattctacaa caacatggtt 780
attttcgacg gtgatattat cttggaaggt ttgttctttg gctcaaaaga acagtacgat 840
gctcttggtt tggaagatca tttcgctcca aagaatccag gcaacatctt agttttgact 900
gactggctgg gtatggtggg tcacgctctg gaagatacga ttttgaagct tgtcggtaat 960
acccccacct ggttctatgc taagtctcta ggttttagac aagataccct gattcctagt 1020
gctggcatcg atgagttctt tgaatacatc gacaatcaca ctgccggaac tccagcttgg 1080
ttcgtaactt tatccttgga aggaggtgcc ataaatgatg ttgccgaaga cgctactgcc 1140
tatgctcata gagatgtttt attttgggtt caattgttta tggtcaaccc tttgggtcca 1200
atatctgaaa ctacatacga atttactgat ggtttatacg acgtattggc cagagcagta 1260
ccagaatccg ttggtcatgc ttaccttggt tgtccagacc cacgtatgga aaatgcacct 1320
caaaagtact ggaggactaa cttgcccaga cttcaggaat tgaaagaaga gctagaccca 1380
aagaacacct tccaccatcc acaaggtgtc attccagct 1419
<210> 60
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 60
atgggcaaca ccacatctat cgctggtagg gactgcttgg tatcagccct gggtggtaat 60
gctggtcttg ttgcatttca aaaccagcct ttgtatcaaa ctactgctgt gcacgaatac 120
aatttaaaca taccagttac cccagccgct attacgtacc cagagactgc tgaacaaatt 180
gccgctgtcg tcaagtgtgc atcccaatac gattataaag tccaagctag aagtggaggt 240
catagcttcg gtaattacgg tctaggcggt acagatggtg ctgttgttgt tgacatgaag 300
tacttcaacc aattttctat ggacgatcag acctacgaag ctgtcatcgg tcctggtaca 360
accttgggag atgtcgacgt cgaattatat aacaacggta agcgtgccat ggctcacggt 420
gtttgtccaa ctatttcgac tggaggtcat ttcactatgg gtggtttggg tcccaccgcc 480
agacaatggg gcttagcctt ggaccacgtt gaagaagtag aagtagtttt agcaaactcc 540
tctatcgtga gagctagcaa tacgcaaaat caagaggttt tctttgctgt taaaggcgct 600
gctgcctctt tcggtattgt cactgaattt aaggttagaa ctcagccagc tccaggtata 660
gcagtccaat attcctacac cttcaacttg ggttcgtctg ctgagaaggc tcaattcatc 720
aaagattggc aatcatttgt ctccgctaag aacttgacca gacaattcta caccaatatg 780
gttattttcg atggtgatat tatcctagaa ggtttgtttt tcggttccaa ggaacagtat 840
gaagcattgc gtcttgaaga gagatttgtg ccaaaaaacc caggtaacat cttggttcta 900
actgactggc taggtatggt cggacatgcc ttggaagaca caatcttgag acttgttggt 960
aatactccta cttggtttta cgctaagtct ctgggtttca caccagatac gttgattcca 1020
tcttctggaa ttgatgaatt tttcaagtac atagaaaaca ataaggccgg cacctccact 1080
tggtttgtta cattatcatt ggaaggcggt gctatcaacg atgtacctgc tgacgccacc 1140
gcttatggtc acagagatgt tttattctgg gtccaaattt tcatggtttc accaactggt 1200
ccagtttctt ctaccaccta tgacttcgct gatggtttat acaatgtctt gactaaagct 1260
gtacccgaga gtgaaggcca tgcttacttg ggttgtccag accctaagat ggctaatgca 1320
caacaaaagt actggagaca aaacctacca agacttgaag aattgaaaga aaccctagac 1380
cccaaggata cttttcacaa cccacaaggt atcctaccag cc 1422
<210> 61
<211> 1449
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 61
atgaatccct caattccatc ctctagtatg ggcaacacta cctcgatagc cggtagagac 60
tgtctagtgt ctgcacttgg aggtaacgct ggtttagttg ctttccaaaa ccagccactg 120
tatcaaacaa ctgctgtaca cgaatacaat ttgaataccc ctgttacgcc agccgctatc 180
acttacccag agacagctga acatattgct gccgtcgtta aatgcgcaag ccaatatgat 240
tacaaggtcc aagctcgttc tggtggtcac tcctttggta actacggttt gggtggtacc 300
gatggagctg tcgttgttga catgaagtat ttcaaccaat tttctatgga tgaccaaacc 360
tacgaagctg ttatcggtcc tggtactact ttgggtgatg tggatgtaga attgtataac 420
aacggtaaaa gagccatggc tcatggtgtc tgtccaacta tttccaccgg cggtcacttc 480
acaatgggcg gtttaggtcc aactgctaga caatggggtt tggctcttga ccacgtcgaa 540
gaagttgagg tggttctagc aaatagttct atcgtcaggg cctcgaatac tcagaatcaa 600
gaagttttct ttgcagtaaa gggagctgct gcttcttttg gtatcgttac cgaatttaag 660
gtcagaacgc aaccagctcc aggaattgct gttcaatact catacacctt caacttgggt 720
tccagcgccg aaaaggctca gttcattaag gactggcaat ctttcgtgtc cgctaaaaac 780
ttaaccagac aattctacac aaacatggtt atatttgacg gtgatattat cttggaaggt 840
ctatttttcg gttccaaaga gcaatatgaa gctttgggtt tggaagaaag attcgtccca 900
aagaaccctg gcaatatcct agttttaacg gattggttgg gtatggtcgg acatgcctta 960
gaggatacaa tattgagatt ggttggtaac actcccacct ggttctacgc caagtccctt 1020
ggttttactc cagacacatt gattccttct tctggtatcg atgaattttt cgaatatatt 1080
gaaaacaata aggcaggtac ttctacctgg tttgtcaccc tttcattgga aggtggtgcc 1140
attaacgacg tcccagctga tgctactgca tacggtcatc gtgacgtgct attctgggtt 1200
cagatattta tggtaagtcc cactggccca gtaagttcca cgacttacga tttcgctgac 1260
ggtttatata atgttctgac taaagctgtg ccagaatctg agggtcacgc ctacttagga 1320
tgtccagatc caaagatggc taatgcacaa caaaaatact ggagacaaaa cttgccaaga 1380
ttggaagaac taaaggaaac tttggaccca aaagatacct tccataatcc tcaaggcatc 1440
cttcccgcc 1449
<210> 62
<211> 1848
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 62
atgggtaata ctacctcaat agccggcaga gattgcctag tctccgcttt gggaggtaac 60
gcaggtctgg tggcttttca aaaccagcct ttgtatcaaa cgacagctgt acacgaatac 120
aatcttaaca ttcccgtcac tccagccgct atcacctacc cagagactgc tgaacaaatc 180
gccgcagttg ttaaatgtgc ttcgcaatac gactataagg ttcaagctag gtctggtggt 240
cattccttcg gtaactacgg attaggcggt acagacggtg ccgtcgttgt tgatttgaag 300
tacttcaatc agttttctat ggatgaccaa acctatgaag ctgtcattgg tccaggtact 360
accttgggtg atgtagacgt tgaattatat aacaacggta agcgtgctat ggcccacggt 420
gtatgtccaa ctattagcac gggtggtcat ttcactatgg gtggtcttgg acctacggct 480
agacaatggg gtttagcctt ggatcacgtc gaagaagttg aggtcgtttt ggctaactct 540
agtatcgtta gagctagcaa tacccaaaat caagaagtgt ttttcgctgt taaaggcgca 600
gccgcttcgt tcggtattgt cactgaattt aaggttagaa ctcaaccagc tccaggtatt 660
gctgttcaat actcttacac cttcaatttg ggctcttccg ccgagaaggc acagtttata 720
aaagactggc aatcattcgt ttctgctaag aacttgacaa gacaattcta taccaacatg 780
gtcatctttg acggtgatat tatcctagaa ggtctgtttt tcggtagtaa ggaacaatac 840
gaagctttgc gtttagaaga aagattcgtg cccaagaacc ctggtaacat tttggtttta 900
actgattggc taggtatggt cggtcacgct ttggaggaca caatcctaag attggttgga 960
aataccccaa cttggttcta cgctaagtcc ttgggattta ctccagatac tttgatacca 1020
tcttccggta tcgacgaatt tttcgaatat attgaaaaca ataaagccgg tacctctaca 1080
tggttcgtaa ccctttctct tgagggtgga gccatcaacg acgttccagc tgatgctact 1140
gcatacggtc atagagatgt cttgttttgg gtacagattt tcatggtcag ccctacaggt 1200
ccagtttcct ctacgaccta tgactttgct gatggtttat acaacgtttt gactaaggtg 1260
gttccagaat ccgaaggcca cgcttactta ggttgtccag acccaaaaat ggccaatgct 1320
caacaaaagt attggaggca aaatttgcca agactagaag aactaaaaga aacactggac 1380
cctaaggata cttttcacaa tccacaaggc gtcttgatca ccgaggttgg ttccgccacg 1440
gacttctgga acttagttga agctattatc ttaatctctc agttgcatga atcagtcggc 1500
caaacataca acatggtgcc cgagatgggt gaacaacctg ttagagaaat gactaagatg 1560
ttccgtatgt tggaaaagac tattcaagtc agcttggaag gtcttccata cgaggaatgg 1620
ttgaacagac tgcaagtgga aaacgatgat gatccactga ggccactgtt gccaatgttt 1680
gaagaaaaag tctacgacgg tagatgccaa tgggaaatgt acgagaacat gcctatttcg 1740
gacaccgaaa acttgagaca atacttgcaa gatgttcctg aattagcaac ttgtccattc 1800
ttggatcaag atatatttaa gaagttcctt tcctctcttg gtttggca 1848
<210> 63
<400> 63
000
<210> 64
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 64
atgggcaata caacttcgat agctggtaga gactgcctta tttcagcact gggtggaaac 60
agcgccttag ctgcttttcc caacgagcta ttgtggacgg ccgatgtcca tgaatacaat 120
ttgaacttgc cagtgactcc tgctgctatc acctatccag aaaccgctga acaaattgca 180
ggagtagtta aatgtgcctc tgactacgat tacaaggtcc aggctcgttc cggtggtcac 240
agtttcggta actatggttt aggtggtgca gatggtgctg ttgtcgttga catgaagcac 300
ttcactcaat tttctatgga cgatgaaacc tacgaagctg ttatcggtcc aggcactaca 360
ttgaatgatg ttgacattga attatataac aacggtaaga gagccatggc tcatggtgtg 420
tgtcctacca tcaaaacagg tggtcacttc actattggcg gtttgggtcc aactgctaga 480
caatggggtt tagctttgga tcacgtcgag gaagtcgaag ttgttttggc caactcttcc 540
attgtcaggg catctaatac ccaaaaccaa gacgtgtttt tcgctgttaa gggcgccgct 600
gctaacttcg gaatcgttac cgaatttaag gtcagaactg aaccagcacc aggtttggcc 660
gtccagtact cgtatacttt caatttgggt agtaccgccg aaaaagctca atttgttaag 720
gactggcaat ctttcatttc cgctaagaat cttactagac aattttacaa taacatggta 780
atcttcgatg gtgatatcat tttggaaggt ttgttctttg gttccaaaga acaatacgat 840
gctctgggtc ttgaagatca tttcgctcca aagaaccctg gtaacatatt ggtcctaacc 900
gactggctag gtatggttgg tcatgcctta gaagacacca tcttgaagct tgttggtaat 960
acaccaactt ggttctatgc aaaatctttg ggctttcgtc aagatactct gatcccatca 1020
gctggcattg acgaattttt cgagtacatc gctaaccaca ccgctggtac tccagcctgg 1080
tttgtaacgt tgtctttaga gggtggtgct attaacgata tcgccgaaga tgctacggct 1140
tacgcccata gagatgttct attctgggtc caactgttca tggtcaaccc tttgggtcca 1200
ataagcgaca caacttacga atttactgat ggattatatg acgtattggc aagagcagtt 1260
cccgaatccg ttggtcacgc ttacttaggt tgtccagatc caagaatgga agatgctcaa 1320
caaaagtact ggagaaccaa cctgcctcgt ttgcaagagc ttaaagaaga attggaccca 1380
aagaatactt tccatcaccc acagggtgtc atgccagct 1419
<210> 65
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 65
atgggtaata cgacatcaat cgcagccgga agagactgcc ttctgtcggc tgtcggtggc 60
aaccacgctc atgtagcctt tcaggatcaa ttattgtacc aagctactgc tgtggagcca 120
tataacctaa acatacctgt tacccccgcc gctgttactt acccacaatc tgctgaagaa 180
attgcagctg tcgttcaatg tgcttccgaa tatggttaca aggttcaagc tcgtagcggt 240
ggtcactcct tcggtaatta cggtttgggc ggtgaagatg gtgccatcgt cgttgaaatg 300
aaacatttca atcaattttc tatggacgaa tctaccaaca ttgctactat tggtccaggt 360
atcaccttgg gtgacttgga tactgcttta tacaacgccg gatatagagc aatggctcac 420
ggtatatgtc caacaatcag aacaggtgga catttgacca tgggtggtct aggtcctact 480
gccaggcagt ggggcttggc cttggatcac gttgaggaag tcgaagttgt gttagctaac 540
tcttccattg ttagagcttc agatactcaa aatcaagaca ttttcttcgc tgtcaagggt 600
gctgccgcta gttttggtat tgttaccgaa tttaaggtca gaactgaaca agctccaggt 660
cttgccgtac aatattcttt cactttcaac ttacagaccc cagcagaaaa agcaaagttg 720
gtaaaagact ggcaagcttt catcgcccaa gaggatttaa catggaagtt ttactcaaat 780
atgaatattt tcgatggtca aatcattctg gaaggaatct acttcggttc caaggctgaa 840
tatgacgctc taggtttgga gaagagattt cccacttctg aaccaggtac cgtcttggtc 900
ttgacagatt ggctaggtat ggtcggtcac ggcttagaag atgttatatt gcgtttagtt 960
ggtaacaccc caacttggtt ttacgccaaa agtttgggct tcacgccaag agctttgatc 1020
ccagactctg ctattgatga ctttttcaac tatatccaca agaataaccc tggtactgtt 1080
agttggttcg ttactttgtc tcttgaaggt ggtgctataa ataaagtccc agaagacgct 1140
accgcctacg gtcatagaga tgtattgttt tgggttcaga tatttatgat taacccatta 1200
ggccccgtca gccaaactac atacggtttc gctgacggtt tgtacgatgt tttggctaag 1260
gcagttccag agtccgcagg tcatgcttac ttgggctgtc ctgacccaag gatgccaaac 1320
gcccaacaag catactggag atccaaccta cctagattgg aagaactgaa gggtgaattg 1380
gatccaaaag acgtttttca taaccctcaa ggtgtaatgg tcgtcagc 1428
<210> 66
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 66
atgggtaaca cgacctctat cgctgccgga cgtgactgtc tgatttcggc agtcggtgct 60
gctaatgttg ccttccagga tcaattattg taccaagcta cagctgtaca accttataac 120
ctaaacatac cagttactcc agccgctgtt acctacccac aaagcgcaga cgaaattgct 180
gccgtggtca agtgcgcttc agagtatggc tacaaagttc aagctaggtc cggtggtcac 240
tcctttggta attacggtct tggtggccaa gatggtgcca tcgttattga aatgaagcat 300
ttctctcagt tttctatgga tgaatcaacc ttcatcgcta ctataggtcc cggtattact 360
ttgggtgact tggatactga cttgtacaac gccggacaca gagctatggc tcatggtatc 420
tgtccaacta ttagaacggg tggtcactta acagtcggtg gactaggtcc taccgctaga 480
caatggggtt tggcattgga tcacgtagaa gaagtcgagg tggttttagc caacagctcc 540
attgtcagag cttctgacac tcaaaatcaa gatttgttct ttgctattaa gggtgcagct 600
gcctctttcg gaatcgttac cgaatttaaa gtcagaactg aacaagctcc aggtatggct 660
gtccaatata gttacacttt ccatctgggc acatccgcag aaaaggctaa gttcgttaaa 720
gattggcagg cattcatcgc tcaagagaac ttaacttgga agttttatac caatttggtt 780
attttcgacg atcaaatcat actagaaggt atctactttg gtacgaagga agaatacgat 840
agtttaggtt tggaacaacg tttcccacct acggacgccg gcactgtttt gattttaacc 900
gattggctag ctatgatcgg tcatggtttg gaggacacca tcttgaagct agtcggtgat 960
acaccaacct ggttttacgc caagtcttta ggttttaccc caagagcttt gattcccgac 1020
agtgctatcg acgaattttt cgattatatc cacgaaaata acccaggaac tttggcatgg 1080
ttcgttactt tgtctttgga aggtggtgcc attaacgctg tccctgaaga tgctacagct 1140
tacggtcata gagatgtgct tttttggttc caacttttcg tgattaaccc attgggtcca 1200
atttcccaaa ccacatacgg atttgctgac ggtctttatg atgttttggc ccaagctgtc 1260
ccagaatctg tgagccacgc atatatgggt tgtccagacc ctagattgcc aaatgcccaa 1320
tacgcttatt ggcgttccaa tttaccaaag ttggaggaat taaaaggtat attagaccca 1380
gaagacatct ttcacaaccc acagggtgtt gttccttca 1419
<210> 67
<211> 1488
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 67
atgttatcaa caatggcctt ctcttttgtt ttgagaattt tgtcccctct attcttgata 60
ctacagctta gcacggctgc ttcgaccagt actttgcgtc aatgcttgct gaccgcagtc 120
caaaacgatc caactttagt agctgtggac ggtgatttgt tgtatcaaac tttagccgtt 180
caagtttaca atcttaactg gccagtcaca cccgctgctg ttgcatttcc aaaatctacc 240
caacaagttg cttctatcgt aaattgtgcc gcttccctag gctacaaggt ccaagccaag 300
tctggaggtc actcctacgg taactatggt ctgggtggta ctaacggtgc tattagcatc 360
aacttaaaga atatgaaatc attctctatg aattacacca actaccaggc tacagtcggt 420
gccggtatgt tgaatggcga attggacgag tatttacata acgctggtgg tagggccgtt 480
gctcacggaa cctctccaca aattggtgtc ggtggtcatg ctactatcgg tggattgggt 540
ccatctgcaa gacaatacgg tatggaactt gaccacgttt tggaagctga agttgttctg 600
gctaacggca cggtagtcag agcaagttca actcaaaact cagatttgtt gttcgccatt 660
aagggtgctg gtgccagctt tggtgttgtc actgagttcg tctttagaac agaacctgaa 720
ccaggtagtg ctgtgcagta taccttcact tttggtttag gctccacgtc tgctagagca 780
gatttgttca agaaatggca atccttcata tcccaaccag acttgactcg taagtttgcc 840
tctatctgta cgctattgga tcatgtactt gtaattagcg gtaccttttt cggtactaag 900
gaagaatacg acgctttggg acttgaagat caattccccg gtcacactaa ttcgaccgtt 960
atcgtgttta ccgattggtt aggcttggtt gctcaatggg ctgagcaatc tatcttggac 1020
ttgactggcg acattccagc tgatttctac gccagatgtc tgtcctttac cgaaaaaacc 1080
ctgattcctt ctaacggtgt cgaccagtta ttcgaatatt tggatagtgc agacactggt 1140
gctttattat ggttcgtcat tttcgacttg gaaggtggtg ctattaacga tgttccaatg 1200
gatgctactg gttacgcaca cagagatacc ttgttttggc tacaatcata cgctatcaca 1260
ttgggttctg tttccgaaac cacttatgat ttcttagatt ctgttaacga aatcataaga 1320
aataataccc ctggtttggg taatggtgtt taccctggtt acgtcgaccc aagattagaa 1380
aacgctagag aagcttattg gggttctaat ttgccacgtt tgatgcaaat aaagtctttg 1440
tatgacccaa cagacttgtt tcataaccca caaggtgtac taccagcc 1488
<210> 68
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 68
atgggcaata ccacatccat tgccggacgt gattgcctga tcagtgcatt gggtggtaac 60
tcggctttag ctgtctttcc taacgaattg ctatggacgg ctgacgtgca tgagtataat 120
ttgaaccttc ccgttactcc agctgccata acttacccag aaaccgctgc tcagattgca 180
ggagttgtca agtgtgccag cgattacgac tataaagttc aagctagatc aggtggtcac 240
tctttcggta actacggttt aggtggtgca gatggagctg tagttgttga catgaagcac 300
ttcactcaat tttctatgga tgacgaaact tacgaagctg tcatcggtcc aggtaccaca 360
ttgaatgacg ttgatattga attgtacaac aatggtaaaa gggccatggc tcatggtgtc 420
tgtcctacca tcaagactgg tggccacttc accattggtg gtttaggccc aactgccaga 480
caatggggtc tggctttaga tcatgttgaa gaggtagaag tcgtgttggc taactcttcc 540
atagtcagag cctctaatac acaaaaccaa gatgtcttct ttgctgttaa gggtgcagct 600
gcaaacttcg gtattgttac cgaatttaag gtgagaactg aaccagctcc aggtttggct 660
gttcaatatt cgtacacttt caatttgggt tctaccgccg aaaaagctca gttcgtcaag 720
gactggcaat cctttatctc cgcaaagaac ttgacgcgtc aattctataa taacatggtt 780
atctttgacg gagacattat ccttgagggt ttgtttttcg gttcaaagga acaatacgat 840
gccctaggtt tagaagatca cttcgctcca aagaaccccg gcaacatctt ggttcttact 900
gactggttag gtatggtagg tcacgctttg gaagatacta ttttgaaact ggttggtaac 960
acaccaacat ggttctacgc taagtctttg ggttttagac aagatacctt gattccttcg 1020
gctggcatag acgagttctt cgaatatatc gctaaccata ccgcaggtac tcctgcctgg 1080
tttgtgaccc ttagtttgga aggaggtgct attaacgacg tcgctgaaga tgctactgct 1140
tacgcacaca gagatgttct attctgggtt caattattta tggttaatcc agtcggtcca 1200
atctctgaca ctacctatga atttactgat ggcttgtacg atgtgctagc tagagctgtt 1260
ccagaatccg tcggtcatgc ttacttgggt tgtccagatc ccaggatgga agacgctcaa 1320
caaaagtact ggagaacaaa tttaccaaga ttgcaagaat taaaagaaga gcttgaccca 1380
aaaaacactt tccatcaccc tcagggagtt atgccagcc 1419
<210> 69
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 69
atgagatctc agttactaca cggacttatt ggtctggttg ccttggtgtc accttccttc 60
gcagtcccca cgaaacgtga agctgtaacc tcttgcttga caaatgctaa ggtcccaata 120
gacgctaagg gttcgcaaac ttggacccaa gatggtacag cctataactt gaggttacaa 180
tttgagccaa tcgctattgc cgttccaact actgttgctc aaatcagcgc agctgtcgcc 240
tgtggttcta agcatggcgt ttccgtcagt ggtaaatctg gtggtcactc ctacacttct 300
ttgggtttgg gcggtgaaga tggtcatctt gttattgaat tggacagact gtactcagtc 360
aagttggcta aggatggaac cgctaagatc caaccaggtg ctagattagg tcacgttgct 420
actgagttgt ataaccaggg taaaagagca cttagtcatg gtacctgtac tggtgtaggt 480
ttgggtggtc acgctctaca cggcggatac ggtatggttt ccagaaagca tggtttaacc 540
ttggactcta taattggtgc tactgtcgtc ttgtacgacg gaaaagttgt tcactgtagt 600
aagacagaac gttccgattt attctgggcc attagaggtg caggcgcttc ttttggtatc 660
gtggctgaat tagaatttaa caccttccca gcccctgaac aaatgaccta cttcgatatt 720
ggtttgaatt gggaccaaaa cactgccgct caaggtttgt gggaatttca agaatttggt 780
aaaaccatgc cttcagaaat cacgatgcaa attgctatac gtaaggatgg atattctatc 840
gatggtgctt acatcggtga cgaagccggt ttaagaaagg cacttcaacc attgttgagc 900
aagttaaatg ttcaagtctc ggcttcgact gtgagctgga tgggtctggt tacacatttc 960
gccggtactg ctgagattaa cccaacttct gcttcctatg atgcacacga cactttctac 1020
gctacttctt tgacaaccag agaattgtca ttagaacaat tcaagtcatt cgtaaactcc 1080
atcagtacca ccggtaagtc aagttctcat tcttggtggg tccagatgga cattcagggt 1140
ggcaaatact ctgccgttgc taagccaaaa ccaacggata tggcttatgt tcatagagat 1200
gctttgcttt tgtttcaatt ctacgattca gtgccccaag gtcaaaccta cccatctgac 1260
ggtttctcct tactaactac tctgagacaa tccatttcta aatctcttag agccggcaca 1320
tggggtatgt atgcaaatta cccagactcc caattgaagg ctgaccgtgc tgctgaaatg 1380
tactggggta gcaacctgcc tagactacag aagattaagg ctgcctatga tcccaagaat 1440
atctttagaa atccacaaag tgttaagcct aaggcc 1476
<210> 70
<211> 1425
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 70
atgggaaaca ccacatcaac ttctgctggt caatgtctat tgtccgccgt gggtggcaat 60
ccagcattgg tcgcttttca gaacgctcct ttataccaag ccgttgatgt aagaccctat 120
aatctggacg ttccagttac tccagtcgct gttaccacgc cagaaactgt cgatcaagtt 180
gctagtatag tcaaatgcgc tgccgacgct ggttacaagg ttcaacctaa gtctggtggt 240
cactcctacg gtaactatgg tttgggaggt gtagacggtg aggttgtcgt cgatttaaaa 300
aatttccaac aattctctat gaacaacgaa acctggaggg ctactattgg tgcaggtaca 360
ttgcttggtg acgtgaccac tcgtttgtac aacgccggtg gcagagctat ggcacatggt 420
acctgtccac aagttggcat cggaggtcac gccactattg gtggtttagg tccaacgtcg 480
agattgtggg gtgctgccct agatcatatc gaagaagtgc aggttgttct tgctaatagc 540
tctattgtta gagcttcaca aactgagaac cctgacttgt tatttgcttt gaagggtgct 600
ggtgcctcct tcggtatcat aacagaattt actgtccgta ccgaaccagc tccaggcgaa 660
gcagttcaat attcatacac cttcaacttt ggtgataatg cttccaaggc taagactttc 720
aaagattggc aagccttcgt gtctacacca aatttgaaca gaaagttcgc cgctaccatg 780
actgtactgg aagacgcaat tgttgcttct ggtaccttct ttggaactaa ggaagaattt 840
gatgctttcg aattggagtc tcactttcct gaaaatcaag gttccaacgt cacggtcgtt 900
caggattggc tgggtttagt cgctgactgg gcagaagatg cagctttgga aggaggtggt 960
ggtgtcccat ccgctttcta tgccaaaagt ttgaatttca gtccagatac tcttatcccc 1020
aacgacacga ttgatgacat gttcgactac ttttctacca cagaaaagga tgctttgttg 1080
tggttcgcca tttttgacct ttcgggtggt gctgtgtctg atgtccccgt tcactcaact 1140
tcttacactc atagagatac tctgttttgg ttacaatcgt acgcaatatc tgttggccca 1200
gtaagcaaca ctactatcca attcttggac ggtttgtcta atttgctaac ctcttcacaa 1260
cccgaagttc actttggtgc ttatccaggt tacgttgacc caaaattgcc agacggacaa 1320
ttagcttatt ggggttccaa cttgccaaag ctagagcaaa tcaaggccga agtagatcct 1380
aacgacgtgt tccataaccc acaatccgtt aaaccagcta agcaa 1425
<210> 71
<211> 2112
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 71
atggctcagc caccttcctc agcattcgcc acctgtctaa atgatgtctg cggaggtcgt 60
agtggctgtg tgggttaccc atcggacatt ttgtatcaaa tcaactgggt agataggtac 120
aacttagaca taaacttgga gccagctgct gttacaaaac cagaaattac ggaagatgtc 180
gccgctttta tcaagtgtgc tagcgaaaat aacgtcaagg tacaagccag atctggtggt 240
cattcttacg ctaatcacgg tctgggtggc gaagacggtg cattggttat cgatttagag 300
aacttccaac acttttccat gaattgggac aactggcaag ctactattgg agccggccat 360
aagcttcacg acgttactga aaaactacat gataacggtg gtagagctat ctcacacggt 420
acctgtcctg gtgttggatt gggtggtcat gctactattg gtggtttggg tccctcttct 480
cgtatgtggg gttcctgttt agatcacgtc gttgaagtcg aagttgttac tgctgacggt 540
aagattcaaa gagcctctga agatgaaaat tcggacttgt tcttcgcact gaagggtgct 600
ggtgcttcat ttggtataat caccgaattt gtgatgagaa caaacgaaga gccaggcgat 660
gttgtcgaat atacgttctc tttgaccttc tccagacaca gagacttgtc cccagttttt 720
gaagcttggc aaaacttgat aagtgatcca gatttagaca gaagattcgg ttccgagttc 780
gttatgcatg aactaggtgc tattatcact ggtacctttt tcggaactga agaagaattt 840
gaagcaactg gtattcctga tcgtattcca accggtaaaa agtctatcgt tgtcaacgac 900
tggttgggtt ctgtcgctca acaggcccaa gatgccgctc tttggctgag cgacttaagc 960
accgccttca ctgctaaatc tttggctttc accaaggatc aattgttatc gtctgaaagt 1020
attatggacc ttatggatta catcgatgac gctaacagag gtacattgat ctggtttttg 1080
atcttcgatg tgactggagg tagaattaat gatgtaccca tgaacgccac cgcctatagg 1140
cacagagaca aggttatgtt ctgccaaggt tacggcatag gtatcccaac tttgaacggt 1200
aggacaagag agtttattga gggtataaat tccttgatca gaagttctgt gcctaccaat 1260
ttgtccactt acgctggtta cgtcgatgca tctttagaat ctccacagga ctcctattgg 1320
ggtccaaacc tagacgcttt gggacaagtt aaagaagact gggacccatc cgatctgttt 1380
tcaaatccac aatctgttag acccggtcaa aagtccgtag ttgattattt cgataacaga 1440
gcttcgtcta atggttcaga agacagctct ggtggcagta atggaggtac ccgtgatgaa 1500
caaggtggtt gttggtcttg gagaagatcc ggtccagcat ttgctgtctt tgttgcttta 1560
ttcgtaggtt tccctactcc acaaacttct tgggtccaaa agcagaactt gcgtgaccca 1620
gctttagatc tgacagacgc cgaatcacct tccagaacac ctgttgttaa cccaaacacg 1680
ttaacaactg acaccatggc caagttgtct cgtggcgctc caggtggtaa attaaagatg 1740
actttgggtt tgcccgtcgg tgccgttatg aactgcgctg acaattcggg tgcaagaaac 1800
ctttacatta tttcggtcaa aggaatcggt gctagattga acagactacc agctggtggt 1860
gttggtgata tggttatggc tactgttaag aagggtaaac cagagttgag aaagaaggtt 1920
catccagccg tcatagtcag acaaagtaag ccatggaaac gttttgatgg tgttttcttg 1980
tacttcgaag acaatgccgg tgttattgtg aacccaaaag gagaaatgaa gggaagcgct 2040
atcactggtc ctgttggtaa ggaagctgcc gaattgtggc caagaattgc ttctaattca 2100
ggtgtcgtca tg 2112
<210> 72
<211> 1458
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 72
atgggaaatt cggccagcgt ggcaggtaga gcttgttttg tcgctgctgt aggtcatgat 60
cccaacttgg ttacattcag gggtgactta ctatatgagt tccgtattca gccatcatac 120
aaccttgcca taccagttca ccctacggtc gtcacctacc caaaaactac cgctcaagtt 180
gctgaaatcg tttcttgcgc cgctgcacaa aattataaga tgcaagccta cagtggcggt 240
cactcttacg gtaactacgg tttgggtgga gaagatggtc atgttgttgt cgacttgaag 300
aacttccaag actttactat ggatccagat actcacgttg ctaccattgg cgctggtact 360
tccttaggtg atctgcaaga cagattgtgg cacgctggtg gtagagcaat ggcccatggt 420
agttgtcctc aagtgggtgt cggtggtcac ttcaccatcg gtggcttggg catgatgtcc 480
agacagtggg gtatgtctct ggaccatgtc gttgaagctc aagtagtctt ggccaattct 540
tctgtggtta cggcttccga tactcaaaac caagatattt tttgggccat caagggtgct 600
gctgcttcgt ttggtattgt tacaaaattc aaggtaagaa cacacggtgt tccaaaggcc 660
gctatccaat atcagtacac cttctctcaa ggtgacgtat tagacaaagt taagttgttt 720
atggcttggc aaaacattgt cgctaagcca aatttgactc gtaacttcag tactgaattg 780
accatattcc aagatggaat catgattatg ggtagctttt tcggtactag agatgaattt 840
cataagttcg agttagaaaa tgatttaccc cttcaaggcc ttggtaatgt tgcatatatc 900
accaactggc tatccttggt tgctcatacc gctgaagact acttgttgag actgacaggt 960
aacgtcttga cttcttttta cgccaaatct ctatcattca cggctgacga attgttcaac 1020
gagcaaggtc ttgttacttt gttcacttat ttagacgcag ctccaaaagg cacacctacc 1080
tggtgggtta tcttcgattt ggaaggaggt gccactaacg atgtcccagt taacgctact 1140
tcttacgccc acagagatgc tataatgtgg atgcaaagtt acgccgtcgc tggttttgaa 1200
ccaccaggtt ttattattaa gagattccta aacagattgc atggtgttgt aatcggtaat 1260
cgtgcacctg gtgctgtccg ttcctatcct ggttatgtcg acccatactt aagaaatgcc 1320
caggaaacct actggggtcc aaacttggct agattacaag atattaagac agctgttgat 1380
ccagatgacg tttttcacaa tccacaatcc gttaaggtga atagtctttc gccaccagac 1440
cctggaagcc atgatgtc 1458
<210> 73
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 73
atgggtcaaa cgccaagctc tcctctagcc gactgtttaa atgcagtttg caacggaaga 60
gataactgtg tggcttttcc atccgctcca ctgtatcaga tctcttgggt cgacaggtac 120
aatttggata tagaagtaga gcccattgct gttaccagac cagaaactgc cgaagacgtt 180
tcaggtttcg tcaaatgtgc tgccgctcac aacattaagg ttcaagcaaa gtccggcggt 240
cattcttacg ctaactatgg tcttggtggt gaagatggtg aattggtcgt tgatttgaga 300
aatttccaag attttagtat cgatacaaac acttggcaag ccaccttcgg cgctggtcac 360
aagttagacg acgtcactga aaaattgcat aagaacggta agcgtgctat ttcacacggt 420
acttgccctg gtgtcggtat cggtggtcac gctaccattg gcggattagg tcctgagtct 480
cgtatgtggg gttcgtgttt ggatcatgtg atcggtgtag aagtcgttac tgctgacgga 540
agcatagttc atgcctcgga caccgaaaat tccgatttgt tctttgctct taaaggcgca 600
ggagcttctt tcggtattgt aacatctttt gttgttaaga ctagaccaga accaggttcc 660
gttgtccaat acagctactc tgtcacgttc gcaaaacacg ctgacctatc cccagttttc 720
agacaatggc aggaattggt aatggatcca ggtttggaca gaagatttgg taccgaattt 780
accatgcacg agctgggtgt cattatctct ggtactttct atggtactga cgaagagttc 840
caagccacag gtattcctga tagaatccca aagggtaaga tttctgttgt tttcgatgat 900
tggatggctg ttatagcaaa acacgccgaa gaagctgctt tgtcgttaag tagtatctcc 960
tctgctttta ccgcccgttc cttggctttc agaagagaag acaagatctc accagaaact 1020
atcaccaacc tgatgaacta cattgattct gctgatagag gtactttggt ctggttccta 1080
atctttgatg ctaccggtgg tgccatttcc gatgtcccaa caaacgccac agcttactca 1140
catagagaca aggttatgta ctgtcaaggc tacggcgtag gtatacccac tttaaatcaa 1200
cagaccaagg acttcttgtc gggtattatt aacactatac aatctggtgc cggtaatact 1260
ttgactactt atcctggtta tgtcgatcca gctttgacca acccacaaga atcctactgg 1320
ggaccaaaca tcgacacttt aagagctatc aagagtcagt gggatccaaa cgatatcttt 1380
cataatccac aatctgttag gccagctgcc gtggctgcc 1419
<210> 74
<211> 1518
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 74
atgcttaaaa ccatcgctgc cgttgtattc atttgctcgc aggctttttt ggtccgtgca 60
gacctaaagt ccgagctgac tgctttgggc gtgggtgccg tcttccctgg agattcagtt 120
tacacgagcg atgctaagcc atataacttg agatttgact tcaaaccagc tgctataact 180
tttcccaata ccccagccga tgtctctcaa attgttcaaa tcgccggtaa gtacgcacac 240
aaggttgcac caagaggtgg tggtcattcc tacatttcta acggtgttgg tggaatggac 300
aatagtatca ttgctgatat gtctcacttc aagtctattg tagtccatac aaacaatgac 360
actgctacca tcgaaactgg taacagatta ggcgatatag ctttagcttt gttccaatat 420
ggtaggggta tgcctcacgg tgcttgtcca tacgtaggta ttggtggcca cgccaacttt 480
ggtggtttcg gtttcatctc aagatcctgg ggtttgaccc tagatgttgt cgaagctatt 540
gacctggttt tagcaaacgg cactatcacg acagtctctg ctactcaaaa cccagacttg 600
tattgggcca tgagaggtag cggtagttct tttggaatca ccaccgctat ccatgttaga 660
accttctccg caccagcttc tggtattatc gctttggaca cttggtactt gaatcttgaa 720
caagctgtta gagccttgag ttcctttcaa gatttcgctc acaatactgt gactttacca 780
tcttattttg gtggtgaatt tgtcgttaac gccggtcctt ccccaggttt gttgtctatt 840
acattcttct cgggattttg gggtcctcca aatcagtaca actctacgct agcaccatgg 900
aaaaattcca tgccattccc cccaaacaca acttcatact cgcaaggtaa ctacatagaa 960
agcttgtccg cccgtttcgg aggtgctccc ttggatacct ctctaggtcc agataatact 1020
gacacttttt acgtcaagtc attaatagtc ccacaagtta ccatttctga tgaaggtgct 1080
caagtaggta ttagcgataa agcttggaga gctctgttcc aatatttgat aaacgagcag 1140
cctaacctgc ctgttgattg gttcatcgaa gttgaattat ggggtggtca aaatagtgcc 1200
attaacgccg tcccacaagc ttctacagct tttgcttata gagacttgtt gtggactttg 1260
caaatgtact cttacacccc aaaccatcaa ccaccttacc cagacgccgg ttttgcattc 1320
aatgacggca tggctaatag tatcattcat aacatgccaa acggttggaa ttatggtgct 1380
tacactaatt acgttgataa ccgtttagac gattggcaga gattgtacta tgctaaccac 1440
taccccgctt tgcaagcctt gaagtctagg tatgacccta gtgatacatt ttcgttccca 1500
acttccattg aactttta 1518
<210> 75
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 75
atgactacca acggtataca acccggccat gtcggtaatt taacacagga ccaagaggct 60
aaacttcaac aattgtggtc gattgtacta acgttgttag atgttaagtc cttgcaaggt 120
ggagatactt ctgcccagac ccaaccagac caacgtccaa gtactagctt gtctagggct 180
gacaccgttg tgtcagcaca cggtcaaact gcttttaccg aagatctatc ccaagttttg 240
agagaaaacg gtatgtctaa tccagatatc aagtccgtca gagaatctct gtccaacact 300
tctatcgacg aattgagatc cggtttattg tacacagcca aacacgattc acctgatgtc 360
ttgcttctaa gattcttaag agctcgtaag tgggacgttg gtaaggcttt cggtatgatg 420
ttgagagcat tggtatggag aaaagatcaa catgttgacg acaaggttat tgctaatcca 480
gagctggccg ctttggtcac ttctcagaac accgtcgata cacacgccgc taaggaatgt 540
aaggattttc tggaccaaat gagaatgggt aaatgctata tgcatggtac cgatagggac 600
ggaagacctg ttttagttgt tagagtcaga ttccaccaac catctaagca aagtgaagcc 660
gtgattaacc gttttatctt gcacacgatc gaaacagcta gattgctatt ggctccacca 720
caagaaactg tcactattat tttcgacata tggaccggtt tcggtttgtc taatatggaa 780
tacgcccctg ttaaatttat tatagaatgt ttccaagaaa actatccaga atcgttaggc 840
tacatgctta ttcataatgc tccctgggtt ttttccggta tctggaagat catcaagggt 900
tggatggatc cagtcatagt gtctaaagtg aacttcacta acaaggtttc ggatttagaa 960
aaattcatcg ctccagagca aattgtaaag gaactaaagg gtaaggagga ctggacctac 1020
gaatatgtcg aacccgtagc aggcgagaac gaattgatgg ctgacactga aaccagagat 1080
aggatttacg cagaaagatt gaagatcggt gaagagttgt tgttgagaac cagcgaatgg 1140
gtttccactt cacagcgtaa ggacgctgct gccacgacta cagctagaga acagcgttct 1200
gaaaccatag aaagtttgag acaaaattat tggcaactag acccttacgt tagaggtaga 1260
acttttttgg atagaactgg tgttgtgaag cctggaggta agattgactt ctacccatct 1320
ccagatttgg agccaagtac tgccaaaatg ttagaagtcg aacactttga aagaacccaa 1380
tttgatccat accttttctt attgccacac ggtgctagaa ttgctgttag gcattgtagc 1440
gtcaccgctt taccaaccta tcttaaggct cacccacgtg gtatgctatc tacaatggcc 1500
ttcagtttcc tacgtgtatt gtcttcccta ttgctggtct tgcaattatc aaccgctgct 1560
agtacttcga cgttgagaca atgtcttttg actgctgttc aaaacgaccc aaccctggtt 1620
gccgttgatg gagatttgct tttccaaacc ttggctgttc aagtctacaa cttgaactgg 1680
ccagtcactc ctgctgctgt agcctttccc aaatccgccc agcaagtttc ttctatcgtt 1740
aattgcgcag catcccttgg ttataaagtt caagctaagt cgggtggtca ttcttacggt 1800
aactatggct taggtggtac aaacggcgca atctctataa accttaaaaa tatgaagtca 1860
ttctcaatga attacactaa ctaccaagct acggttggtg ctggtatgtt gaatggagag 1920
ttagacgatt atctgcacaa tgccggtggt agagcaattg ctcatggcac aagcccacaa 1980
attggtgtcg gtggtcacgc aactatcggt ggtttgggtc ctgctgccag acagtacggt 2040
atggaattag atcacgtctt ggaagctgaa gttgtgttag caaatggtac agtcgtcaga 2100
gcttcctcta cccaaaactc ggacttgttg tttgccatca agggagctgg tgcttctttc 2160
ggtgtggtga ctgaatttgt ttttagaaca gagccagaac ctggatctgc tgttcagtac 2220
tccttcactt ttggtttagg ctccacctct tcacgtgccg acctattcaa gaagtggcaa 2280
tcattcattt ctcaaccaga cttgactaga aaattcgcca gcatctgtac catcttggac 2340
catgttttgg tcatttccgg tactttcttt ggtactaaag ctgaatacga cgctttaggt 2400
ttagaagatc aatttccagg tcacaccaat tctactgtga tcgtatttac cgattggttg 2460
ggactggttg ctcaatgggc tgaacaatct attttggatt tgaccggtgg tattccagcc 2520
gatttctact ccagatgttt atcttttact gaaaagactc caattccatc gactggtgtc 2580
gatcaattgt tcgagtatct ggacagtgca gatacgggag ctctattgtg gtttgttatt 2640
ttcgatttgg agggtggtgc cattaacgat gtcccaatgg atgctacagg ttacgctcat 2700
agagacacct tgttttggtt acagtcttat gccataactt taggttctgt ttcccaaact 2760
acctacgact tcctggatcg tgttaacgaa ataattagaa ataacacacc aggtttggga 2820
aacggtgttt acccaggtta cgtcgaccct agacttcaga atgcaagaga agcttattgg 2880
ggttccaatt tgccaagact tatgcaaatt aaaagccttt atgacccatc ggacctgttc 2940
cacaaccccc aaggtgtttt gcctgct 2967
<210> 76
<211> 1437
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 76
atgggccagg gtcaatcctc tgccggtggt ttgcaagact gcttaacgtc agcagtgggt 60
agcggaaatc tagctgtacc ttctaaaccc ttctaccaac aaactgatgt caagccatat 120
aacttggata tccacgtcca tccagttgct gttacatacc cacaaactaa cgaggacgtt 180
gctgctattg tcagatgtgc taaggaacac gaagccaaag tccagccacg ttccggtggt 240
cattcgtacg gtaattttgc caccggtaac ggaaacgata acatgatagt tgttgacttg 300
aagcacttca agcaattctc tatggatgac aatacctgga tcgcaacttt aggttccggc 360
caccttctgg gtgatgtcac aaagaaattg ttagctaacg gtggtagggc tatggctcat 420
ggtacttgtc ctcaagttgg tattggcggt cacgctacca ttggtggtct aggtccaatg 480
tctaggatgt ggggcagttc cttggaccac gttcaagaaa tcactgtggt cttggccaat 540
tctagcatta tcacggcctc tccaacccaa aataaggatg ttttttgggc tatgaagggt 600
gcaggagcct cattcggtat aattactgaa tttaaagtta ttacccatcc agctccaggt 660
gaggctgtta agtatagttt cggtttttcg ggaggttcac acagagatca agctaagaga 720
ttcaaaaagt ggcaatctat gatcgctgac cctggattga gtagaaaact tgcttctcaa 780
gtagttctga gtgaaatcgg tatgattata tcaggtacct ttttcggtac ccaggctgaa 840
tacaaccaat tgaacttaac ttctgtcttc cctgaaatgt cctcccataa gattatcgta 900
tttaacgatt gggctggtct agtgggtcac tgggccgaag acgtgggttt acaattgggt 960
ggtggaatct cttctccatt ctactccaag agcttggctt tcaccccaaa cgacttgatt 1020
cctgctgaag gtattgacag atttttcgaa tatttggatg aagttgataa gggtactttg 1080
atctggtttg gtatattcga tttggaaggt ggcgccacta acgatattcc agcagacgca 1140
actgcatacg gtcatagaga tgcattgttt tatttccagt catatggtgt caatctagga 1200
ttaaaggtta aggatgagac aagagacttt atcaatggta tgaatagcgt ccttgaaggt 1260
tctttgagca accacaaact gggtgcttac gctggttacg ttgatcccgc tctttctttg 1320
gaagccgccc aggttggtta ctggggtgac aacttaccac gtctgagaca aattaagaga 1380
gctgtagatc cagacgacgt tttccataat ttgcaatccg tcagaccagc tgcttcc 1437
<210> 77
<211> 1416
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 77
atgggtaata agccatccac tcctttagcc cattgcttga gagatgtttg tgcaggaagg 60
ggtaactgtg tcgctttccc aaacgagtat ctttaccagg ctaactgggt aaaaccctac 120
aatttggacg tgccagttaa gccaattgct gtctttagac ctgataatgc cgctgacgtc 180
gctgctgctg ttaagtgtgc cggtcaatca tcggttcacg ttcaagcaaa atctggtggc 240
cactcttatg caaacttcgg tctaggtggt ggtgatggtg gtttgatgat cgacctgcaa 300
catttgaaca agtttagcat gaacaacgaa acctggcaag ctacattcgg atccggtttc 360
ctattgggcg atttagacaa gcaactgcac gctaatggta atcgtgccat ggctcatggt 420
acttgcccag gtgttggcat aggtggtcac gccaccatcg gaggtattgg tccatcttcc 480
agaatgtggg gtacggcttt agatcacgta ttggaagtcg aagttgtgac tgctgatggt 540
aaaattcaaa gagccagtaa gacccagaac tctgacttgt tttggggttt gcaaggtgct 600
ggtgcttcat tcggcatcat aactgaattt gttgtccgta ccgaacctga accaggttct 660
gtcgttgagt acgcctactc tctaaatttc ggcaaacaag cagatatggc tccagtgtat 720
aagaagtggc aagaccttgt gggtgaccct aacttagata gaagattcac cagtttgttt 780
attgccgaac cattgggtgt tttgatcact ggtacattct acggtaccct agacgaatac 840
aaggcttccg gaatcccaga caagttgccc gcttcgggtg cctccattac agtcatggat 900
tggttgggta gcttagctca catcgctgaa aaaactggtt tatatttgtc taacgtatct 960
actaaatttg tttccagatc attagcatta agggaagagg accttttgag cgaacagtcc 1020
attgatgatt tgtttaagta catgggctct gctgacgctg acacaccatt gtggttcgtt 1080
attttcgata acgaaggtgg tgccatcgct gatgtccctg ataattctac tgcttatcca 1140
catagagaca agattatact gtaccaaagt tactccgttg gtttgttggg agtttctgac 1200
aagatgataa atttcgtcga tggtattcaa gatcttgtac aaaagggcgc tcctaacgcc 1260
cacacgactt acgctggtta tatcaacgct aacttagaca gaaatgctgc ccaaaaattt 1320
tattggggtg acaagttgcc acagctgcaa caactaaaga agaagttcga cccaacatcg 1380
ttattcagca atccacaatc tattgatcca gccgat 1416
<210> 78
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 78
atgggtaaca ccacttccat cgcagccggc agagattgtt tggtttcagc tgtcggtcca 60
gctcatgtga catttcaaga cgctctgctt tatcagacga ccgccgttga tccttacaat 120
ttgaacattc ccgtaactcc agctgctgtc acatacccac aatcggccga agagatagct 180
gctgttgtca aatgcgcttc cgactatgat tacaaggttc aagcacgtag tggaggtcac 240
agcttcggta attacggtct aggtggtcaa aacggtgcca tcgtcgttga catgaagcac 300
ttctctcaat tttctatgga tgaatctact ttcgttgcta ccattggtcc aggtactacg 360
ttaggcgact tggataccga actatataat gctggtggta gggccatggc ccatggtatc 420
tgtcctacta ttagaactgg cggtcactta accgtcggtg gattgggtcc aacagccaga 480
cagtggggtc tggctttgga tcatattgaa gaggtagaag ttgttttggc taactcttcc 540
atcgtgagag catcgaacac tcaaaatcaa gacattttat tcgctgtaaa gggtgcagct 600
gcttcttttg gtatagtcac cgaatttaaa gttagaactc aagaagctcc aggtttggct 660
gttcaattct ccttcacctt caacttgggt tctcctgcac aaaaggctaa gctagtcaaa 720
gattggcaag catttattgc tcaggaaaac ttgagctgga agttctactc aaacttggtc 780
atcttcgacg gtcaaataat cttagaaggt attttctttg gatcgaaaga ggaatacgac 840
gaactagatt tggaaaagag atttccaacg tcagagcccg gcactgtttt ggttttaaca 900
gattggctgg gcatgatcgg acacgctttg gaagatacta ttttgaagtt ggtgggtgac 960
accccaacgt ggttttatgc taagtccctg ggtttcactc cagacactct tatcccagat 1020
tctgccattg atgacttctt cgactacatc cacaagacta acgctggtac cttagcttgg 1080
ttcgtaacct tgtcattgga aggtggtgca attaattctg tttcggaaga tgctacagct 1140
tatggtcata gagatgtctt gttttggttt caagttttcg ttgttaatcc tttaggtcct 1200
attagtcaaa ccacgtacga tttcactaac ggcctgtatg acgtccttgc ccaagccgta 1260
ccagaatccg ccggtcacgc ttacctaggt tgtccagacc ctaaaatgcc agacgctcaa 1320
cgtgcctact ggcgtagtaa cttgccaaga cttgaagatt tgaagggtga cttggaccca 1380
aaggatactt tccataatcc acagggtgtt caagttggtc ca 1422
<210> 79
<211> 1488
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 79
atgctgtcaa ccatggcatt cagctttgtc cttagaattt tatctccatt gttcttgatc 60
ctacaattat ctactgccgc tagtacatcc actttgaggc agtgtttgtt aaccgctgtt 120
caaaatgacc ctacgttggt agctgttgat ggtgatttgc tgtaccaaac tcttgccgtg 180
caagtctata acttgaactg gccagttacc cccgctgctg tcgcctttcc aaagtcgact 240
caacaagttg cttctatagt taactgcgct gcatccttgg gatacaaagt gcaagctaag 300
tctggcggtc attcctacgg taattatggt ttgggtggta ccaatggtgc catttcaatc 360
aacttaaaga acatgaaatc gttctctatg aactacacga attaccaagc cacagttggt 420
gctggtatgc ttaacggcga gttagacgaa tatttgcaca acgctggtgg tcgtgctgtc 480
gcacacggaa cttcccctca gattggtgta ggtggtcatg ctactattgg aggactaggt 540
ccatcggcta gacaatacgg tatggaattg gatcacgtct tagaagccga agttgttttg 600
gcaaacggta ccgtagtccg tgcttcttct actcagaata gcgacttgct gttcgccatc 660
aagggtgctg gtgctagttt tggtgtcgtt acagagtttg tgttcagaac agaaccagaa 720
ccaggttctg ctgttcaata taccttcact ttcggcttgg gttccacctc tgccagagcc 780
gatctattta agaaatggca atccttcata tcccaaccag acctgactag aaagtttgca 840
agtatctgta ccttgttaga tcatgttttg gtcatttctg gtactttctt tggtacaaaa 900
gaagaatacg acgctttggg cttggaagat caatttcccg gacacactaa ctctactgtt 960
atcgttttca ccgattggtt gggtttggtg gctcaatggg ctgaacaatc aattttagac 1020
ctgactggtg gtatcccagc tgatttctac gcaagatgtt tgagctttac tgaaaagacc 1080
ctaattcctt ccaatggtgt cgaccaatta ttcgagtacc tagactcagc agatactggt 1140
gctttgttat ggttcgtcat ctttgatctt gaaggtggtg ccattaacga cgtcccaatg 1200
gacgctaccg gctatgctca cagagatacc ttgttttggc tacagtctta cgctattacg 1260
cttggttctg ttagtgagac tacctacgat ttcttggaca atgtaaacga aatcataaga 1320
aacaatacac caggacttgg taacggtgtt taccctggtt atgttgatcc aaggttgcaa 1380
aatgcaagag aagcctattg gggttcaaat cttccacgtt tgatgcaaat taagtctcta 1440
tatgacccaa ccgacttgtt tcataaccca caaggtgttt tgcctgcc 1488
<210> 80
<211> 1404
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 80
atggctccat ccatttcatt ttctttgcta caaatctcgc ttttggccta ttctggtctg 60
gtgagtggag atttctcttt aagacagtgc ttggaatccg ctgttagcag ggtagcattc 120
gagggcgacc ctttttacca attattgtca gtcagaccat acaacttaga tatatccatt 180
gttccagctg ccgtcgcttt ccccgctgac actaatgaag ttgcagctgt cgtaagatgt 240
gctgcccaaa acggttatca agttcaagca aaaagtggtg gtcactcata cgctaatcat 300
ggtttgggtg gtaccaacgg agctgttgtg gttaatctgg aaaacttgca acacttctcc 360
atgaacacga ctacctggga agccacaatc ggtgctggta cattattggg tgatgtcacc 420
aagcgtttgt ctgacgctgg cggtagagca atggcccatg gtacttgtcc tcaggttggt 480
tctggaggtc actttactat tggtggccta ggtccatcta gtagacaatt tggcgccgct 540
ttggatcata tcatagaagc tgaagtcgtt ctagctaact cttctattat cagagcatct 600
gagactgaaa acccagatgt gttcttcgct gtaagaggag ctgcttccgg ttttggtatt 660
gttaccgaat ttaaggttcg taccgaacca gaaccaggtc aagccgtcag atacagttat 720
tctttctcgt tcagcgacac cgctacgcgt gcagacttgt tcaagaaatg gcaagcctac 780
gtcactcaac cagatttgcc tagagaactt gcttctactc tgacaatttt ggaacacggt 840
atgttcatca ctggtacgtt tttcggttca aaggaggagt acaatgctct aaagattgaa 900
accgaatttc ccggtttcgc caagggtgga accttagtct tggatgactg gttgggttta 960
gttagtaatt gggctgaaga cttgcttttg tcggaagaag aaatcgagca aatgttcgaa 1020
tatattgata acgttgacaa aggtacacta ctgtggtttg ccattttcga cctacaaggt 1080
ggtgctgtcg gtgatgtacc agtcgatgcc actgcttacg ctcacagaga taccttgata 1140
tggctacaat cctacgcaat caatctgttt ggtagaataa gcgaaactac tgttgagttt 1200
ttagaacgtt tgaacgaatt gactttgaca tctacagcta agacggttcc atatgcagcc 1260
taccctggtt atgttgaccc aagattgact gatgctcaag ctgcctactg gggatcgaac 1320
ttagctagat tgaacagaat caaagctgaa atcgacccaa acaatgtatt ccacaatccc 1380
caatccgttc gtccagcttc tggt 1404
<210> 81
<211> 1425
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 81
atgggtaata ctacctcgat agccgctggc agagattgcc tggttaacgc tgtcggtggt 60
aaccaggcat tagtagcttt tcaagaccaa ttgctatatc aatccacggc cgtcgaagct 120
tacaacttga atattcctgt tacaccagct gctgtcactt tcccagagtc ttcagaacaa 180
atcgcagccg tggttaaatg tgcttctgaa cacgactaca aggttcaagc tcgtagcggt 240
ggacatagtt tcggtaatta tggtttgggt ggtaccaacg gcgccatcgt ggttgatatg 300
aagaaatttg atcaattctc catggacgaa tcgtcttaca ttgctactat tggtcccggt 360
accactttag gtgatgtcga cacagaattg tacaacgctg gaggtagagc catggctcac 420
ggtatttgtc caaccatcag aactggcggt catcttacga tgggtggttt gggtccaact 480
gccaggcagt ggggcttggc tctggaccac atagaagagg ttgaagtcgt attagctaat 540
tcttccatcg ttagagcatc tcatacccaa aaccaagata ttttgtttgc cgttaagggt 600
gcttccgcat cattcggtat tgtcactgaa tttaaggtta gaactgaacc tgcaccaggt 660
ttggctgtcc aatactctta taccttcaat ttgggtagtg cagcctccaa ggctaaatta 720
gttaaggatt ggcaagagtt catcgctcag gacaacttga catggaaatt ctatagcaat 780
atggtcatta tcgacggaga tataattctg gaaggtatct ttttcggttc taaggaagaa 840
tttgatgctt tagaactaga aaacaggttc ccacccaaga acccaggtaa catacttgtg 900
ttgactgatt ggttgggaat gatttctcac tccttggaag acatcatttt aagagttgct 960
ggtggtgtac caacctactt ttacgctaag tccttaggtt tcacacctca agctttgatc 1020
ccatctagcg ctattgatga cctgttcgat tatatagaaa agactaatcc aggtactcta 1080
gcctggttta tcaccttgtc cttggagggc ggagctatta acaacgttcc agctgacgca 1140
acagcctacg gtcacagaga tgtgcttcat tgggtccaaa tctttgccgc taatcctttg 1200
ggtccaattt ctgaaaccac ttacgacttc actgacggtt tatacaacat ccttgctaaa 1260
gccgttcctg agtctgctga acatgcttat ttaggttgtc ctgatccacg tatgaaagac 1320
gctcaaaagg cttactggag agataacctg ccacgtttgg aagaattaaa ggctgaattg 1380
gatcccaaag atacttttca caatccacaa ggtgtagccg tcgct 1425
<210> 82
<211> 1464
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 82
atgttattga aactattttt cttggccgta gcagcttcag ttgctctggc tgcttccagt 60
gaggccttga agcagtgctt ggaaaacgtc ttcactgacc gtgcaggctt tgctttcgcc 120
ggtgatttat tctatgacag aatagttaat agatacaact tgaatatccc agtcacccct 180
tcggctttgg cttttccaac gagctctcaa caagttgccg atattgtgaa gtgtgcagct 240
gataacggtt accccgttca agctaggtcc ggaggtcatt cttatggtaa ctacggtctt 300
ggtggtgctg acggcgccgt cgctatcgat ttaaaacacc tacaacaatt ctctatggac 360
aagacaactt ggcaggctac cattggtgcc ggatctttgc tatccgatgt tacccaaaga 420
ttgagccacg ctggtggcag agccatgtct catggtattt gtccacaagt cggttcgggt 480
ggtcacttca caatcggtgg tttgggacca acttcaagac aatttggtgc tgccttagac 540
catgttcttg aagtcgaagt cgttttggct aattccagta ttgtccgtgc ttctgatact 600
gaaaacaagg atttgttttg ggctattaag ggtgctgcat ctggatacgg tatcgttacc 660
gaatttaaag tgagaactga acctgaacca ggtaccgctg ttcaatatgc atacagcatg 720
gagttcggta atccaactaa gcaagcaacc cttttcaagt cctggcaggc ttttgtgtct 780
gacccaaaat tgactagaaa gatggcctct acattaacga tgctggaaaa cagtatggct 840
atatccggta ctttcttcgg tactaaggaa gaatacgaca agttgaattt gaccaacaag 900
tttcctggtg ctaatggtga cgctttagtt ttcgaagatt ggctgggcct agtggctcac 960
tgggctgagg atttgatatt gggtttagct gccggtattc caactaactt ctatgccaaa 1020
tcaacgtctt ggactcccca aacattaatc acccccgaaa ccgtagataa aatgtttgac 1080
tacatcgcca ccgttaacaa aggtactctt ggctggttct tattgtttga cttgcaaggt 1140
ggttatacga acgatattcc aaccaacgcc acatcatacg ctcacagaga tgtcttgatt 1200
tggctacaat cttatacagt taactttttg ggtcctatct cccaggctca aattgacttc 1260
ctagatggtt tgaataagat tgtcaccaac aataagttgc catacactgc ttacccaggt 1320
tacgttgatc cattgatgcc aaatgctcca gaagcatact ggggaactaa cttgccaaga 1380
ttacaacaaa tcaaggaatt agtcgaccct aatgatgttt ttcgtaaccc acaatctcca 1440
tccccagcta acaaagagcc actg 1464
<210> 83
<211> 1416
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 83
atgggtaacg gaaatagcac accttttcgt gactgtttag attctatatg cgcaaacaga 60
tccacctgtg tgacgtatcc aggtgaccca ctgttctcgt gttggagtag gcccttcaat 120
ttggagtttc ctgtagtccc agccgctatc attagaccag aaactaccac tgaagttgct 180
gaaactgtta aatgtgctaa gaagtacggt tacaaggttc aggctaaatc aggtggccac 240
tcctacggta accatggttt gggtggtgtc ggaggtgccg tcagtattga tatggtcaac 300
ctaagagatt tctctatgaa caataagacc tggtatgctt ctttcggttc tggtatgaac 360
cttggtgaat tggacgagca cttacatgcc aacggcagaa gagcaatcgc tcacggtaca 420
tgcccaggtg ttggtactgg tggtcatttg accgttggtg gtttgggtcc aatttccaga 480
caatggggct ctgctctgga ccacttgcta gaaatcgaag tcatcactgc tgatggtacg 540
gtgcaaagag cctcatatac taaaaattct ggattatttt gggctttgcg tggtgctggc 600
gcctctttcg gtattgttac aaagtttatg gttaagactc acccagaacc tggtagagta 660
gtgcaatact catacaatat agctttggcc tcccatgctg aaactgctga actatatagg 720
gaatggcaag ccttggttgg agatccaaac atggaccgta gattctcttc cttattcgtc 780
gtccaaccat tgggtgcttt gattaccggt accttctttg gtaccaagtc ccaataccag 840
gcaactggta ttcctgacag actaccaggt gctgataaag gtgctgtctg gcttacagat 900
tgggcaggct tgttattgca cgaagctgag gccgctggtt gtgccttagg tagcatccca 960
accgctttct acggcaagtc gttgtctttg agtgaacaag accttttatc agattctgct 1020
attaccgact tgtttaagta tttagaggat aacagatccg gtttagcccc cgttactatc 1080
ttgtttaata ccgaaggtgg tgctatgatg gatacgcctg ccaacgccac tgcttacccc 1140
cacagaaact ccattatcat gtaccaatct tatggtatag gagttggtaa ggttagtgct 1200
gcaacacgta aactgttgga cggtgttcat gaaagaatcc aaagaagcgc accaggcgct 1260
ctgtctactt acgctggtta tattgacgcc tgggctgacc gtaaggctgc ccaaaagcta 1320
tactgggctg ataatttgcc aagattaaga gaattaaaaa aggtctggga tccagcagat 1380
gttttctcaa acccacagtc tgttgagcca gcagac 1416
<210> 84
<211> 1113
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 84
atggattcta acacttggga ggccacgttc ggctcaggat ttttacttgg tgaactagac 60
aaacatttgc acgctaatgg taacagggct atggcacacg gtacctgtcc aggtgttggt 120
atgggtggtc atgccactat cggaggtatt ggccctagct ccagactgtg gggtacaacc 180
ttagaccacg tattgcaggt cgaagtggtt actgctgatg gtaagataca acgtgcttct 240
aagactcaaa acccagattt gttctgggct ctacaaggtg ctggtgcctc gtttggcatt 300
atcaccgaat ttgtcgttag aaccgaaccc gaaccaggta gtgttgtcga atacacctat 360
tccgtatctt tgggaaagca atctgacatg gctccattgt acaaacaatg gcaagctttg 420
gttggtgatc cttccctgga cagaagattc acaagtttat tcattgccga gccattgggt 480
gttttaatca ctggtacatt ttatggtact atgtacgaat ggcacgcatc aggtatccct 540
gataagttgc caagaggtcc aatttcggtc accgttatgg actctttggg atctttagct 600
catattgccg aaaaaactgg cctgtacttg accaatgtcc caacgtcctt cgctagcaga 660
tctcttgcct tgagacagca agatttgttg tccgagcaat ctatcgatga cttattcgaa 720
tatatgggtt cggctaacgc agacactcca ctttggttcg tgatctttga caacgaaggt 780
ggtgctattg ctgatgtgcc tgataatagc accgcctacc cacatagaga taaggttatt 840
gtttaccaaa gctactccgt cggtttacta ggtgtcactg ataaaatgat aaagttcttg 900
gacggtgttc aagatattgt ccagagggga gctcccaacg cccacacgac ctatgcaggt 960
tacatcaatc cacaattgga ccgtaaggct gctcaacaat tctattgggg tgacaagcta 1020
ccaagattgc aacagattaa gaagcaatat gatcctaaca acgtgttttg caatccacaa 1080
tctatctacc cagctgaaga catgtctgac ggt 1113
<210> 85
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 85
atgggtaaca caacttccat cgcaggcaga gattgcttag tctcagccct tggaggtaat 60
tctgctttgg ctgctttccc aaaccaattg ctgtggaccg ccgacgttca cgagtataat 120
ttgaacctac ctgtaacgcc agctgccata acctaccccg aaactgctga acagattgct 180
ggtatcgtta agtgtgctag tgattacgac tataaagtgc aagctaggtc tggtggtcat 240
tcctttggta attacggttt gggaggtact gatggtgccg ttgtcgtcga catgaagcac 300
ttcaaccaat tctcgatgaa cgatcaaacc tacgaagcag ttattggtcc aggtactacc 360
ttaaacgacg ttgacattga attgtacaac aatggcaaga gagctatggc tcatggtgtt 420
tgtccaacta tcaaaacagg tggtcacttt acaattggcg gtctgggtcc tactgccaga 480
caatggggtt tggctttaga tcacgtcgaa gaagtggaag tagtcttggc caactcttct 540
atcgttcgtg ctagcaatac ccaaaaccag gatgtcttct ttgctgtcaa gggcgcagct 600
gccgacttcg gtatcgttac ggagttcaag gttagaactg agccagcacc tggtttagct 660
gttcaatatt cgtatacctt taatcttggt agtactgctg aaaaagccca atttgtcaag 720
gattggcaaa gcttcatttc cgctaaaaac ttgactcgtc aattctacaa caatatggtt 780
atatttgacg gtgacattat tttagaaggt ttgtttttcg gatcaaagga acaatacgat 840
gccttgggtt tggaagatca ttttgctcca aagaatccag gtaacatcct agtgctgacg 900
gactggttgg gaatggtagg tcatgctttg gaagacacca ttttgaagct agttggaaac 960
acacccactt ggttctacgc taaatctttg ggtttcagac aagataccct aatcccatct 1020
gctggtattg acgaattttt cgaatatata gcaaaccaca ccgctggtac tccagcttgg 1080
ttcgttacct tatctctgga aggcggcgct ataaacgatg tggctgaaga tgccacagca 1140
tacgcacaca gagatgtcct attttgggtt cagttgttca tggtcaatcc actaggtcca 1200
atctcagaaa ctacctacga gttcactgac ggtttatatg acgtcttagc aagagctgtc 1260
cctgaatctg ttggtcatgc ctatttgggt tgtccagacc caagaatgga aaacgctcca 1320
caaaagtact ggcgtactaa tttgcctaga ttacaagaat tgaaagagga attggatcca 1380
aagaacacct tccaccatcc acaaggtgtg attccagct 1419
<210> 86
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 86
atgggtaaca ctacgtcgat tgccgcaggc agagattgcc ttgtcagtgc tgttggtggt 60
gtggctgctc atgttgcttt tcaggactct ttgttatacc aagccacagc cgtagagctg 120
tataatctaa acatacctgt cacccccgct gctgttactt acccacaaag caccgatgaa 180
atcgccgctg tcgttaaatg tgcttcagac tatgactaca aggttcaagc tcgttccggt 240
ggtcactcct tcggaaacta cggtttgggt ggccaaaatg gtgcaattgt aatcgatatg 300
aagcacttct ctcaattttc tttagataag tctactttca ttgccacctt cggtccaggt 360
actacattgg gaaacttgga caccgaacta tatcatgctg gtaacagagc aatggctcac 420
ggtatctgtc caactattag aaccggaggt catttgacaa tgggcggttt gggtccagct 480
gccaggcagt ggggtttggc attagatcac gttgaagaag tcgaagttgt ccttgctaat 540
tccagcgtgg taagagcctc tgacactcaa aatcaagacg ttttctttgc tgttaaaggt 600
gctgctgctt cttttggtat cgtcactgag ttcaaggttc gtactgaaga agcccctggt 660
ttggctgttc aatacagctt tccattcaac ttgggtaccc cagctgaaaa agctaagtta 720
gttaaggatt ggcaagcatt tatagctcaa gaaaatttat cgtggaagtt ctactcaaac 780
atggtcatct ttgatggtca aattattctg gagggcattt tcttcggctc caaaaaggaa 840
tatgacgaat tggacctgga aaacaagttc cccacctcgg aaccaggtac agtcttggtc 900
ttgaccgatt ggcttggtat gatcggtcac ggtttggaag acactatttt aagattggtg 960
ggtaactccc caacatggtt ctacgccaag tctcttggct ttactccttc tactttaatt 1020
agtgatagtg ctatcgatgg tttgttcgat tatatccaca aaaccaaccc aggtacattg 1080
gcctggtttg ttacgctatc tttggagggt ggagctataa atactgtctc cgaagatgcc 1140
actgcttacg gacatagaga tgttttgttc tgggttcaaa tctttgttgc taaccctttg 1200
ggtccaattt cacagactac ctacgacttc gctgacggat tatacaacgt tctggctcaa 1260
gctgtgccag attctgccgg tcatgcttac ctaggttgtc cagaccctaa attgccagat 1320
gctcagagag catactggag gtctaatcta ccaagactgg aggaacttaa gagagacttg 1380
gatccaaaag acatcttcta taatccacaa ggtgtccaaa ttgtttcc 1428
<210> 87
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 87
atgggtaaca ccacatcgat cgctgccgga cgtgactgct tactttccgc agtcggtggc 60
aatcatgctc acgtggcttt ccaagatcag ctgctatacc aagccactgc tgttgaacct 120
tataacttga atataccagt aacgcccgct gccgttactt acccacaatc agctgacgag 180
gttgctgccg tcgttaaatg tgcagctgat tacggttata aggtccaagc tagaagtggt 240
ggtcactctt ttggtaacta cggtttgggt ggcgaagatg gtgctattgt tgtggacatg 300
aagcatttcg atcaattttc tatggacgaa tctacctata cagccactat tggtccaggt 360
atcactttgg gcgatttgga caccgcttta tacaatgcag gtcacagagc catggctcac 420
ggtatttgtc caaccatcag gacgggtggt cacttgacta taggaggttt aggtcctact 480
gctagacagt ggggacttgc cttggatcat gtagaagagg ttgaagtcgt tctggctaac 540
agctccattg tcagagcctc tgacacacaa aaccaagaaa tcttgttcgc cgttaagggt 600
gctgctgctt ccttcggaat cgtcaccgaa tttaaagttc gtactgaaga agctccaggt 660
ttggctgtcc aatactcctt cacctttaat ttgggtactg ctgccgagaa ggcaaagtta 720
gttaaagatt ggcaagcctt cattgctcaa gaagatctta cttggaagtt ctattctaac 780
atgaacataa ttgacggtca aatcattctg gaaggtatct atttcggttc aaaagccgaa 840
tacgacgctt taggtttgga agaaaagttt ccaacttctg agccaggcac cgtgttggta 900
ctaactgact ggttgggtat ggttggtcat ggtttggaag atgtaatttt aagattggtc 960
ggtaatgctc ccacctggtt ctacgctaag tcgctaggtt ttgcaccaag agctctaatt 1020
cctgattccg caatagacga ttttttcgaa tacattcaca aaaacaatcc aggtaccgtt 1080
tcatggtttg ttaccttgtc tttggaaggc ggtgccatca acaaggtccc cgaagatgct 1140
actgcttatg gccatagaga tgttctattc tgggtccaga ttttcatgat caacccattg 1200
ggtccagttt ctcaaacaat ttacgatttc gctgacggtc tgtatgacgt cttagctaag 1260
gcagtgccag aaagcgccgg tcacgcatac ttgggttgtc cagatcctcg tatgcctaac 1320
gctcaacaag cctactggag aaacaacttg ccaagactgg aagagttaaa gggtgatctt 1380
gacccaaaag acattttcca taatccacaa ggtgtcatgg ttgtctcc 1428
<210> 88
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 88
atgggtaacg gacagtccac ccccttgcaa caatgtttaa atactgtttg caacggtaga 60
ctaggttgtg tagctttccc aagtgatgca ttgtatcaag ccgcttgggt caagccttac 120
aacctggacg tgccagttac gcctatcgct gtttttaaac caagctctac agaggatgtc 180
gccggtgcta taaagtgtgc tgttgcctcg aatgtgcacg ttcaagcaaa gtccggtggc 240
cattcttacg ctaacttcgg tttgggtggt caagacggag aattaatgat tgacttggct 300
aaccttcagg attttcacat ggacaaaact tcttggcaag ctactttcgg tgctggttat 360
aggttaggcg atttggataa gaagttgcaa gccaatggta atagagccat tgctcatggt 420
acctgtccag gagtcggtat cggtggtcac gccactattg gtggtctagg tccaatgtca 480
cgtatgtggg gcagtgcttt ggaccatgtc ttatctgttc aagtagtgac cgctgatggt 540
tccatcaaaa acgcatccga atctgaaaac tcagatctgt tttgggcttt gagaggagct 600
ggtgccagct tcggtgtcat aaccaagttc acagttaaaa ctcaccctgc tcccggttct 660
gtcgtacaat acacttacaa gatttcgttg ggttctcagg cccaaatggc tccagtttat 720
gcagcttggc aagctttagc tggtgaccca aagcttgaca gacgtttctc tacattgttt 780
atcgctgaac cattgggcgc cttaatcacc ggcacctttt acggaactaa agctgagtac 840
gaagccacgg gtattgctgc aagattgcca tccggtggta ctcttgacct aaagcttttg 900
gattggttgg gttccttggc ccacattgct gaagttgtcg gtcttactct aggtgacata 960
ccaacctctt tctatggtaa gtcattggcc ttgagagaag aagatatgct agatagaacc 1020
tcaatcgatg gtttgttcag atacatgggt gacgctgatg ccggtacctt gttatggttt 1080
gtcattttta attcggaagg tggtgcaatg gcagatacgc cagctggcgc aactgcatat 1140
cctcatagag acaaactaat catgtaccaa tcttatgtta ttggtatccc aactctgaca 1200
aaggctacca gggacttcgc tgatggtgtt cacgacagag ttagaatggg tgctccagct 1260
gctaacagta cttacgctgg atacattgat agaaccttat ctcgtgaagc cgctcaagaa 1320
ttttactggg gtgcacaatt gcctaggttg cgtgaggtca agaaggcttg ggacccaaag 1380
gatgttttcc ataatcccca atccgtagac ccagctgaa 1419
<210> 89
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 89
atgggcaata ctacgtctat tgctgccggt agagactgtc ttatcagcgc agtcggtgct 60
gctaacgtag cctttcaaga tcagctgcta taccaagcta cagctgtgca accctataac 120
ttaaatatac ctgttactcc agctgccgtt acctacccac aaagtgccga cgagatcgct 180
gccgttgtca aatgcgcttc ggaatatggt tacaaggtcc aagctaggtc aggtggacac 240
tccttcggta actacggttt gggtggccaa gatggtgcaa ttgttattga aatgaagcat 300
ttctctcagt tttctatgga cgaatccacc ttcatcgcta ctattggtcc aggaatcacc 360
ttgggtgatt tggatactga tttatataac gccggtcaca gagctatggc tcatggtata 420
tgtccaacca tcagaacggg tggtcaccta acagttggtg gtttgggccc tactgctcgt 480
caatggggct tagcattgga ccatgtagaa gaagtcgaag ttgttctggc taactcttcc 540
attgtccgtg cttctgacac tcaaaatcag gatttgtttt tcgctatcaa gggtgccgcc 600
gcttccttcg gtattgtaac agaatttaaa gttagaaccg agcaagctcc aggtatggca 660
gtccaataca gttacacctt ccaccttggt acttcagctg aaaaggccaa gttcgtcaaa 720
gactggcaag ccttcattgc tcaagaaaac ttgacttgga agttttatac caacttggtt 780
atattcgatg atcaaatcat cttggaggga atatactttg gtactaaaga agaatacgac 840
agcttaggtc ttgaacaaag attcccacca actgacgcag gtactgtgtt aattttgaca 900
gactggttgg caatgattgg tcatggattg gaggatacga ttttaaagtt ggttggtgat 960
acacccacct ggttttatgc caagtctcta ggtttcaccc caagagctct tattccagat 1020
agcgctatcg acgaattttt tgactacata cacgagaata accctggtac tttggcttgg 1080
ttcgtcacgt tatctttgga aggaggtgct atcaacgctg ttccagaaga tgcaaccgct 1140
tatggtcaca gagatgtctt attctggttc caattgttcg ttattaatcc tttgggtcca 1200
atctcgcaga ctacttacgg tttcgccgac ggtctttacg atgtcctggc tcaagcagtt 1260
cccgaatctg cttcgcatgc atacatgggt tgtccagatc caagaatgcc aaacgctcaa 1320
cgtgcttact ggagatccaa cttgcctaaa ctggaagaac taaagggcta tttggaccca 1380
gaagacattt ttcacaatcc acaaggtgtt gtaccctct 1419
<210> 90
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 90
atgggtaaca ccacatcaat aactgctggc cgtgattgcc tgacttccgc cgtcggtgga 60
gttgctgcac atgtagcttt tcaagacgcc ttactatatc agaccccagc tgtggaccct 120
tacaatttga acattccagt tacgcccgcc gctgttactt acccacaaag cgctgatgaa 180
gtcgccgctg tcgttaagtg tgcttcggat tataattaca aagttcaagc tagatctggt 240
ggtcactcct tcggtaactt cggtttgggt ggacaaaatg gtgcaatcgt cgttgacatg 300
aagcactttt ctcaattctc tatggatgag agtaccttcg tcgccactat tggtccaggc 360
acaacccttg gtaacttgga cactgaaatc tacaacgctg gtaagagggc tatgtctcat 420
ggtatttgtc ctagtatcag aaccggtggt cacttgactg taggcggttt aggtccaaca 480
gctagacaat ggggtttggc tcttgaccac gttgaagaag tcgaagttgt gttggccaac 540
tcatccatta tcagagcttc tgatacccag aaccaagatg tcctatttgc aattaaaggt 600
gctgccgcat ccttcggaat agtaaccgaa tttaaggtta gaactgaaga ggctccaggc 660
ttagctgttc aatactcctt cactttcaat ctgggtacgc cagctgaaaa ggcaaagttg 720
gtgaaagact ggcaagccta tatcgcacag gaaaatttga cctggaagtt ttattctaac 780
cttattatct ttgacggtca aattatcttg gagggtattt tctttggtag caaggaagaa 840
tacgatcaat taaacttaga taagaaattc cctacttccg aaccaggtac agttttggta 900
ttgactgact ggttaggcat gattggtcat ggtttggagg acaccattct gcgtttagtt 960
ggtgattctc caacatggtt ttacgctaag tctttgggtt tcacaccttc taccttgata 1020
tcaggcagtg ctatcgacgg tttgttcgat tacattcaca aaactaatgc aggaactcta 1080
gcttggtttg ttacgttgag tttagaaggt ggtgccataa acgctgtccc aaaggacgct 1140
actgcatatg gtcatagaga tgtcttgttc tgggttcaaa tcttcgtcgc caacccactt 1200
ggtccaattt cgcaaaccac ttacgatttc accgatggtc tttacgacat cctggctcag 1260
gctgttcccg aatctgccgg tcacgcttat ttgggttgtc ccgatccaaa gatgccagac 1320
gctcaaagag cttattggag atccaatctg cctcgtttgg aagaattgaa gggtgatctg 1380
gaccccaagg atattttcca taatccacaa ggagttcaag tagcatca 1428
<210> 91
<211> 1449
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 91
atgaatcctt caattccatc ttcctctatg ggcaacacca cttccatcgc tggtagggat 60
tgtctggtca gcgccttagg aggtaacgct ggtttggtag cattccagaa tcaaccacta 120
taccaaacaa ctgctgtgca cgaatataac ttgaacatac cagtcacccc cgccgctatt 180
acgtacccag agactgctga acaaatcgca gctgttgtta aatgcgccag tcaatatgac 240
tacaaggttc aagctagatc gggtggtcat tcttttggta attacggttt gggcggtaca 300
gacggtgccg ttgtcgttga tatgaagtat ttcaaccaat tttctatgga cgatcagact 360
tacgaagctg tcattggtcc tggtaccact ttaggtgacg tcgatgtaga attgtacaat 420
aacggaaaga gagctatggc ccacggcgtt tgtccaacca tctccactgg tggtcatttc 480
acgatgggtg gtcttggtcc aactgctcgt caatggggtt tggctttgga tcacgtggag 540
gaagttgaag ttgtcttagc aaattcatct attgttagag caagcaacac acagaaccaa 600
gaagtcttct ttgctgtgaa aggcgctgcc gcctcgttcg gtatcgttac tgaatttaag 660
gtaagaaccc aacccgctcc aggaatagct gttcaatatt cttacacctt caacttaggt 720
tcttccgccg aaaaagccca attcattaag gactggcaat ctttcgtatc cgctaagaat 780
ttgaccagac aattttacac aaatatggtt atctttgacg gtgatattat tttggaaggt 840
cttttcttcg gttccaaaga acaatatgag gctctgggtt tggaagaaag atttgtccct 900
aagaacccag gcaacatcct ggtcctgact gattggctag gtatggttgg tcatgcattg 960
gaagacacca tactaagatt agtcggcaac accccaacct ggttttatgc taagtccttg 1020
ggttttactc ctgacacttt gattccaagt agcggtatcg atgaattttt cgaatacata 1080
gaaaataaca aggctggtac ttccacctgg ttcgttactt tgagtcttga aggtggtgct 1140
attaacgacg tcccagccga tgctactgct tacggacacc gtgatgttct attctgggta 1200
cagatcttca tggtttctcc tacaggtcca gttagttcta cgacgtatga ttttgctgat 1260
ggtttgtaca atgtgttgac caaagctgtt ccagaatcag aaggtcacgc ttatttagga 1320
tgtccagacc caaagatggc caacgcccaa caaaagtatt ggagacaaaa cttgccaaga 1380
ttggaggagt taaaggagac attggatcct aaagacactt tccataatcc ccaaggaatc 1440
ctaccagcc 1449
<210> 92
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 92
atgggtaaca caaccagtat agccggacgt gattgcttga tttcagcact tggtggcaat 60
tccgctctag ctgttttccc aaacgagttg ctgtggacgg ctgacgtgca cgaatataac 120
ttaaatttgc ccgtaactcc agccgctatt acctaccctg aaactgctgc acaaatcgct 180
ggtgttgtca aatgtgcttc tgactacgat tataaggttc aggccagatc tggtggtcat 240
tcgtttggta actacggttt gggaggtgca gatggcgctg tcgttgtgga catgaagcac 300
ttcactcaat tctcaatgga tgacgaaacc tacgaagctg ttattggtcc aggtactaca 360
ttaaatgacg tcgatatcga attatataac aacggtaaga gagccatggc tcatggtgtc 420
tgtccaacca tcaaaactgg tggtcacttt accatcggtg gtttgggtcc tactgctagg 480
caatggggcc tagccttgga tcatgtcgaa gaagttgaag ttgttttggc taattcttcc 540
attgttagag cttctaacac tcaaaatcaa gacgtattct ttgccgtcaa gggtgccgct 600
gctaattttg gaattgtaac agagttcaag gtcagaactg aaccagcacc aggtttagct 660
gttcaataca gctacacctt caacttggga tccaccgcag aaaaagctca gttcgtgaag 720
gactggcaat cttttatctc cgctaaaaac cttacgcgtc aattctataa caacatggtc 780
atattcgatg gtgatattat attggagggt ctgttttttg gtagtaaaga acaatacgac 840
gctttgggtt tggaagatca cttcgcacca aagaaccccg gcaatatctt ggttttaact 900
gactggcttg gcatggttgg tcacgcttta gaagacacaa ttttgaagtt ggtcggtaat 960
actccaacct ggttctatgc caagtcttta ggttttagac aagatactct aattcctagt 1020
gccggaatcg atgaattttt cgaatacatt gctaatcata ctgctggtac tccagcatgg 1080
ttcgttacgt tgtccttaga aggtggtgct ataaacgatg tcgccgaaga tgctactgcc 1140
tacgctcaca gggacgtttt gttctgggta caattgttta tggtcaatcc attgggtccc 1200
atctctgaca ccacgtatga gtttaccgac ggtctgtacg atgttctagc tagagctgtg 1260
ccagaatctg ttggtcatgc ctatttgggt tgtccagacc ctagaatgga agatgcccaa 1320
cagaagtact ggagaaccaa ccttccaaga ttacaagaat tgaaggaaga actagatcca 1380
aagaatacat ttcatcaccc tcaaggtgta atgcctgct 1419
<210> 93
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 93
atgggaaaca caacgtccat agctgccggt agagactgcc tattatcggc agtaggcggt 60
aatcacgctc atgtcgcttt ccaagatcag cttttgtatc aagtgaccgc tgttgagcct 120
tacaacttga atattccagt tacccccgcc gctgttactt acccacaatc agccgacgaa 180
atcgctgccg tcgtcaaatg tgcttctgaa tatggttaca aggttcaagc taggtctggt 240
ggtcactcct ttggtaacta cggtctgggt ggtgaagatg gcgctattgt tgtggaaatg 300
aagcatttca atcaatttag tatggatgaa tctacttata ctgcaactat cggtccagga 360
attaccttgg gtgacttgga caccgcttta tacaacgctg gtcacagagc catggcacat 420
ggtatctgtc caaccatacg tactggtggc cacttgacca tgggtggtct gggtcctaca 480
gctagacaat ggggtttagc attagatcat gtcgaagagg tcgaagttgt tttggctaac 540
agctctattg tcagagccag taacacacag aatcaagata ttttgttcgc tatcaagggt 600
gccgctgctt ccttcggtat tgttactgag tttaaagtaa gaactgaagc cgctccaggt 660
gttgcagtcc aatactcctt cacttttaac ctaggaacgc cagctgaaaa ggcaaagctt 720
gttaaagact ggcaagcctt catcgctcaa gaagatttga cttggaagtt ctattctaac 780
atgaatatat ttgacggcca aatcattttg gaaggtatct acttcggtag taaggaagag 840
tacgatgctt taggtttaga aaagagattt ccctcatctg aagctggtac cgtgttggtt 900
ttgaccgatt ggttgggtat ggtcggccac ggtctggaag atgtgattct aagattggtt 960
ggtaacaccc caacttggtt ctacgcaaaa tcattgggat tcactccaag agctttgata 1020
cctgactcag ctattgacga atttcttaat tacatccacg aaaacacgcc tggtacagta 1080
tcctggttcg tcactctatc tttggaaggt ggtgccatta acaaggtccc aggcgatgct 1140
actgcctatg gccaccgtga tgtgttattc tgggttcaga tttttatgat caacccattg 1200
ggtccagttt ctcaaaccac ttatggtttc gctgacggat tatatgacgt tttggcaaag 1260
gctgtaccaa actcggctgg acacgcctac ttaggttgtc ccgatccaag aatgccaaat 1320
gctcaacaag cttattggag gtctaatttg cccagattgg aggaattgaa gggtgaactg 1380
gatccaaaag acatttttca taacccacaa ggtgttatgg ttgtctcc 1428
<210> 94
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 94
atgggcaata cgacatccat tgcaggtaga gattgtctta taagcgccct aggtggaaac 60
tcggctttgg ctgctttccc taacgagtta ctgtggactg ctgacgtcca tgaatacaat 120
ttgaacttgc ccgttactcc agccgctatc acctatccag aaaccgctga acaaatcgct 180
ggtattgtga aatgcgcctc tgattacgac tataaggttc aggcacgttc tggtggtcac 240
tcatttggta attacggttt gggtggtgcc gatggagctg ttgtagtcga catgaagcac 300
ttcactcaat ttagtatgga tgacgaaacc tacgaagctg tcatcggtcc aggtacaact 360
ttaaacgacg ttgatattga attatataac aatggcaaaa gagccatggc acatggtgtt 420
tgtccaacta tcaagaccgg aggtcacttc accattggtg gtttgggtcc tacagctaga 480
caatggggtt tggctctgga ccacgtcgag gaagtagaag ttgtcttggc aaactcttcc 540
attgtgaggg cctctaacac tcaaaatcaa gatgttttct ttgcagttaa gggtgctgct 600
gctaacttcg gtatagtgac cgagtttaaa gttagaacgg aaccagctcc aggcttagct 660
gtccagtact cctatacttt caacttgggt tcaactgctg aaaaggctca attcgttaag 720
gattggcaat cattcatctc tgctaagaat cttactagac aattttacaa caacatggtc 780
atttttgacg gtgatatcat tttagaaggt ttatttttcg gcagtaagga acaatacgac 840
gccttgggtt tggaagatca ttttgcacca aagaaccctg gtaacatttt ggtactaacc 900
gactggttgg gaatggttgg tcacgcccta gaagatacaa tattgaaatt ggttggcaat 960
actccaacct ggttctacgc taaatctttg ggtttcagac aggatacctt gattccatcc 1020
gctggtatcg acgaattttt cgaatatatt gctaatcata ctgctggtac cccagcttgg 1080
ttcgtcacct taagcctaga gggtggtgcc atcaatgata tcgctgaaga cgctactgcc 1140
tacgcacata gagatgtctt attctgggtc caactgttta tggttaaccc tttgggtccc 1200
atatctgata caacttacga atttacagac ggtctgtatg acgttctagc acgtgctgta 1260
ccagagtctg tcggccacgc ttacttaggc tgtcccgacc caagaatgga agacgcacaa 1320
caaaagtatt ggagaaccaa cctaccaaga ttgcaagaat tgaaggaaga gttggaccca 1380
aagaacacgt ttcaccatcc acagggtgtt atgcctgca 1419
<210> 95
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 95
atgggtaata cgacttccat agccggaagg gactgcctaa tctctgcttt gggtggtaac 60
tcggctctgg cagtcttccc taacgagtta ttgtggaccg ctgatgttca cgaatacaat 120
ttgaacttgc cagttactcc agccgctatt acctatcccg aaacagctgc acagattgct 180
ggcgtagtca aatgtgcctc agattacgac tacaaggtgc aagctagatc tggtggtcat 240
agctttggta actatggttt aggaggtgct gatggcgcag ttgttgtcga catgaagcac 300
ttcactcaat ttagtatgga tgacgaaact tacgaagctg ttatcggtcc aggtaccacc 360
ctaaatgatg ttgatatcga attgtataac aatggtaaga gagctatggc acatggtgtt 420
tgtccaacaa ttaaaactgg aggtcacttc accattggcg gtttaggtcc tactgccaga 480
caatggggtc ttgctttgga ccatgtcgaa gaagtagagg tcgttcttgc taactcttct 540
atcgttcgtg cttccaacac tcaaaaccaa gatgtgttct ttgccgtcaa gggtgctgct 600
gccaacttcg gtattgtaac agaatttaaa gttagaactg aaccagctcc aggtttagcc 660
gtccagtact cttatacctt caatttgggt tccacggctg aaaaggctca attcgttaag 720
gactggcaat ccttcatatc tgccaagaat ttgaccagac aattttacaa taacatggtt 780
atctttgacg gagatattat attggagggt ctatttttcg gtagtaagga acaatacgac 840
gctctgggct tagaagatca ctttgctcca aaaaacccag gtaatatctt ggtattgacc 900
gattggttgg gtatggtcgg tcatgccctt gaagatacaa ttttgaagct ggttggtaac 960
actccaactt ggttctacgc aaagtcctta ggtttccgtc aagacacgtt aattccttca 1020
gccggcatcg atgaattttt cgaatacatc gctaaccaca ccgctggtac tcctgcttgg 1080
ttcgtcacct tgagcttgga aggcggtgcc attaacgatg tcgccgagga cgcaacggct 1140
tacgctcaca gagatgtttt gttctgggtc caattattca tggtgaatcc agtgggtcct 1200
atatctgaca ctacttatga atttactgat ggtttgtacg acgttctagc tagagcagtc 1260
cctgagagcg tgggtcatgc ttatttgggt tgtccagacc caagaatgga agatgcccaa 1320
cagaaatatt ggaggacaaa tttacccaga ttgcaagaat taaaagagga attggatcca 1380
aagaacacat tccaccatcc acagggtgtt atgcccgct 1419
<210> 96
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 96
atgggcaata caacgtccat tgccgctggt cgtgactgct tgatcagcgc tgttggaggt 60
aacgcagctc acgtggcctt tcaggatcaa cttttatatc aagctaccgc agtcgatgtt 120
tacaacttga acatacccgt cactccagct gccgtaactt accctcaatc agctgacgag 180
gttgctgctg ttgtcaagtg tgcctcggaa tacgattata aagtccaagc tagatctggt 240
ggtcattctt tcggtaatta cggtctaggt ggtcaaaatg gagctattgt tgtcgacatg 300
aagcacttca gtcaatttag tatggacgaa tcaacctata ctgcaaccat cggcccaggt 360
atcactctgg gtgatttaga taccgaattg tacaacgctg gtcatagagc aatggctcac 420
ggtatttgtc caacaataag aactggtggt cacttgacta tcggtggttt gggtccaaca 480
gccaggcagt ggggtctggc tttagaccat gttgaagagg tagaagttgt gttggctaac 540
tcttccattg ttagagcctc tgaaacgcaa aaccaagatg tcttgttcgc agtaaagggc 600
gctgctgctt cctttggtat tgttaccgaa tttaaagtta gaactgaaca agctcctggc 660
ctagctgtcc agtattccta caccttcaat ttgggtaccc cagctgagaa ggccaagtta 720
ttaaaagact ggcaagcttt catcgcccaa gaagacttga cctggaagtt ctactccaat 780
atggttattt tcgatggtca aatcattttg gaaggaattt tctttggttc taaggaagaa 840
tatgatgccc tggatcttga gaagagattt ccaacttctg aacctggtac tttgttggtt 900
ttaacggact ggcttggtat ggtaggtcat agcctggaag acgtcatatt aaggctagtt 960
ggtaacaccc caacttggtt ttacgctaag tctttgggct tcactccaag aaccttgatc 1020
cctgacagcg ctatagatag attcttcgac tatattcacg aaactaacgc tggtaccttg 1080
gcatggtttg tgacgctttc attggaaggt ggtgctatta atgccgtgcc agaagatgca 1140
accgcctacg gtcatcgtga tgttttgttt tgggttcaaa tcttcatggt caaccccttg 1200
ggaccaattt ctcaaactat ctacgatttc gctgacggac tatacgacgt gttggcacaa 1260
gccgtaccag aatcggctga acacgcttac ttaggatgtc cagatcctaa aatgccagac 1320
gcccaacgtg cttattggag aggtaactta ccaagactgg aggaattgaa aggagagttt 1380
gatcccaagg acacatttca caacccacag ggtgtttctg tcgccgtc 1428
<210> 97
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 97
atgggcaaca ccacgagcat cgctgccggt agagattgtt taatatctgc tgttggaggt 60
aatgcagctc acgtcgcctt tcaggaccaa ctgctttacc aagctactgc tgtggaacct 120
tataacctaa atattccaat caccccagcc gctattacat acccccaatc ggctgatgag 180
atcgcagcag ttgtaaagtg cgcttcagaa tatggttaca aagtccaagc tcgttccggt 240
ggtcattctt tcggtaacta cggtttaggt ggtgaagacg gtgctattgt tgtcgaaatg 300
aagcacttca gtcaattttc catggatgaa tctacttata ttgccactat cggcccaggt 360
attacattgg gagacttgga taccgaatta tacaatgttg gtcatagagc tatggcccac 420
ggtatctgtc caactattag aaccggtggt catttgactg ttggaggttt gggtcctacc 480
gctaggcaat ggggcctggc cttggatcac gttgaggaag tcgaagtcgt attggctaac 540
tcttccatag ttagagcatc agacactcag aaccaagaca tcttcttcgc tattaaaggt 600
gctgctgcta gctttggtat agtgacagaa tttaaggtta gaaccgagca agccccaggt 660
ctagccgtgc aatactctta cactttcaac ttgggtacac cagctgaaaa ggccaagttg 720
gttaaggact ggcaggcttt cattgctcaa gaaaatctgt catggaaatt ctactctaat 780
atggtcgtat tcgatggcca aatcatctta gaaggtttgt actttggctc caaggaagaa 840
tatgatgctc ttggtcttga acaacgtttc cccccatctg aagctggtaa cgttctagtc 900
ttgactgatt ggttgggtat ggttggtcat gagttagaag atactatttt gagattggta 960
ggtaacaccc ctacttggtt ctacgctaaa agcttgggat ttaccccaag agccctgatt 1020
ccagactccg caatagatga cttattcaac tatattcacg agaataaccc aggtaccttg 1080
gcatggttcg tcacactttc tttagaaggt ggtgcaatca acaccgttcc tgaacacgct 1140
actgcctatg gacatagaga tgttttgttt tgggtccaaa tttttgttat caatccattg 1200
ggtcccgtca gccaaacgac ttacggtttt gctgatggta tgtatgacgt gcttgcccaa 1260
gctgttccag aaagtgctgg tcatgcttac ttgggttgtc cagatccacg tatgccaaac 1320
gcccaacaag cttactggag atctaatttg cctagattag aagaattgaa gggcgaccta 1380
gacccaaaag gtatcttcca caatccacaa ggtgttatgg tagtctcc 1428
<210> 98
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 98
atgggtaaca ctacgtcgat cgcagctgga cgtgattgcc tattgtccgc tgttggtggc 60
aatcatgccc acgtagcttt ccaggaccaa cttttgtatc aagccacagc tgtcgaacca 120
tacaacttaa acatacctgt gactccagct gccgttacct acccccaatc tgctgatgag 180
gtcgcagctg ttgttaagtg tgctgccgac tatggttaca aagtccaagc tagatcaggt 240
ggtcacagtt ttggtaatta cggtttgggt ggtgaagacg gtgctattgt tgtagatatg 300
aagcatttcg atcaatttag catggatgaa tctacctaca ctgccaccat cggcccaggt 360
attactctgg gcgacttgga taccgcttta tataatgccg gtcacagagc tatggcacat 420
ggtatctgtc caactattag aacaggcggt cacttgacca ttggtggttt gggtcctacg 480
gctaggcaat ggggattggc actagaccac gtcgaagaag ttgaggttgt cctggctaac 540
tcctctatag tcagagcctc tgacactcag aaccaagaaa ttttattcgc tgttaagggt 600
gctgccgctt ccttcggtat cgtcactgaa tttaaagtta gaaccgaaga agctccagga 660
ttggcagtcc aatacagctt caccttcaac cttggtactg ccgctgaaaa ggctaagttg 720
gtgaaagatt ggcaagcttt tatcgcccag gaagacttaa cgtggaagtt ttattctaac 780
atgaacatta tcgatggtca aattattctg gagggtatct acttcggttc gaaagctgaa 840
tacgacgcat tgggattgga agagaagttt ccaacatcag aacccggtac tgtgcttgta 900
ttaactgact ggttgggtat ggttggtcac ggtttagaag atgttatttt gcgtttggtt 960
ggaaatgctc caacttggtt ttatgcaaag tcactaggtt tcgctccaag agctttaata 1020
cctgatagtg caattgatga cttcttcgaa tatatccata agaataaccc aggtacagtc 1080
tcttggttcg tcaccttgtc cttggagggt ggtgccatca ataaagtacc agaagatgcc 1140
actgcttacg gtcatagaga tgttctattc tgggttcaaa tttttatgat caatccatta 1200
ggtccagttt ctcaaacgat ctacgatttc gctgacggct tgtatgacgt tctggctaag 1260
gccgtacctg aatccgctgg tcacgcatac ctaggttgtc ccgacccaag aatgcctaac 1320
gctcaacagg cctactggag gaacaacttg ccaagattgg aagaattgaa gggtgactta 1380
gatccaaaag atattttcca taatcctcaa ggagtgatgg tcgtgagc 1428
<210> 99
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 99
atgggtaata cgacttccat cgccggccgt gactgcttgg ttagtgcact aggtggaaac 60
gctggtttag tggctttcca agatcagctt ttgtatcaaa ccacagctgt acacgagtac 120
aacttgaaca ttccagtcac ccctgccgca gttacttacc cagaaactgc tgaacaaata 180
gctgccgtcg tgaaatgtgc ttctgaatat gattacaagg tccaagctag atctggtgga 240
cattcgtttg gtaattacgg tctaggtggt gctgacggtg ctgtagttgt tgatatgaag 300
cacttctcac aattttccat ggacgatcag acatatgaag cagttatcgg tcccggtacc 360
actttaggtg acgtcgacac cgaattgtac aacaacggca agagagctat ggcccatggt 420
atttgtccaa caattagtac tggtggacac ttcactatgg gtggtctggg tccaaccgcc 480
agacaatggg gtttggcttt ggatcacgtt gaagaggttg aagtcgtttt ggcaaattct 540
tctatcgtta gggcttccaa cacccaaaat caagaagtct tctttgctgt caaaggtgcc 600
gctgcctcat ttggtatcgt tacagagttc aaggtcagaa ctcaacctgc tccaggctta 660
gcagtacagt acagctatac gtttaatatt ggttcgtctg ctgaaaaggc ccaattcgtt 720
aaagattggc aatcattcat tagtgctaag aaccttacta gacaattcta caccaacatg 780
gtaatcttcg atggtgacat aattttggaa ggattatttt tcggttccca agaacaatat 840
gaagctttgg gtctggaaga cagatttgtt ccaaagaacc ctggaaatat tttggtgttg 900
acggattggc tgggtatggt tggtcatgcc cttgaagaca ctatcttaag attggtcggt 960
aacactccaa cttggtttta cgctaaatct ttgggattca ccccagacac tttaattcca 1020
gcttccggta tcgatgaatt tttcgattac atagaaaacc ataaggcagg caccttgacg 1080
tggttcgtca ctttgtctct ggaaggtggt gctatcaatg atgtcccaga ggacgctaca 1140
gcctacggtc atagagatgt tttgttctgg gttcaaattt ttatggcttc tcccaccggt 1200
cctgtctcct ctaccaccta tgacttcgcc gatggtctat ataatgtttt aactaaggct 1260
gtaccagaga gcgaaggtca cgcttactta ggttgtccag accctaagat ggccgatgct 1320
cagcaaaaat actggcgtca aaacttgcca agattggaag aattgaaggc aactttagac 1380
ccaaaagata ccttccacaa tccccaaggt atcttgccag ct 1422
<210> 100
<211> 2082
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 100
atgtggttgt ctacaatgaa tggttcagcc agtagacgta gcgatcccgt cagcagaaaa 60
atcgtttgcg acggccatgc ttctgcacac gaggtgagga ctgacaacga agctgctaga 120
gatgtacctt cgagaaccgc tgtcaacaag gaaagaaagc agggttccgg tccaccagga 180
gccatgcaaa gaggttttca cgctgcccat aagccaaatg aaatggttcc acaagacggt 240
cctcttggta gaactgctca attattccgt ctggcaccag cttgtcaatc agaaccaacg 300
agagctccag gtcaaccatc tgatctaaga ttgcgtcaaa ttcccttggc aaccgagcaa 360
gctgccagaa ctttggctag gatgcgtcca gcaagattca catttcctta tggaagagcc 420
gctgaagatg attgttactt aaaaaaggaa gacgaaggtc acgaccagtc tcatccaacc 480
tccgtcttgg ttggtgttcc ccctttcact agacgttgtg ctgctgctga aaccttcaaa 540
gatactagag ctagagctcc aggtacacaa ccaactgata ccacttctac aggtgcctcc 600
ccatcatgga ccttatctcc actattgtcc ttgtctgcta ctgacgacag tgttccttcc 660
aagatgggca acggtcaatc taccccactt caacaatgtt tgaatactgt ttgcaacggt 720
aggctgggtt gtgtcgcctt tccatcggat gccttatacc aggctgcttg ggtcaagcca 780
tataacttgg acgtacctgt taccccaata gctgtgttta agcctagttc cacggaggat 840
gttgctggtg ccattaagtg tgctgtcgct tctaacgttc acgtgcaagc caagtctggt 900
ggtcattcgt acgctaactt cggattgggt ggacaagatg gtgaactaat gattgatttg 960
gcaaatttac aggacttcca catggacaaa acatcctggc aagctacttt cggtgccggt 1020
tacagattgg gtgatttaga taaaaagtta caagcaaatg gcaacagagc tatcgcacac 1080
ggcacatgtc caggtgttgg tattggaggt catgccacta tcggcggtct aggcccaatg 1140
agccgtatgt ggggttccgc tttggaccac gtcttgtctg tccaagttgt caccgctgac 1200
ggtagtatca aaaacgcctc tgaatcagaa aactctgatc tgttttgggc cttgagaggt 1260
gctggtgctt catttggagt tattactaag ttcactgtta agacccatcc agctccaggt 1320
tccgttgtac aatatacata caaaatctct ttgggtagcc aggcacaaat ggcccctgtt 1380
tacgctgcct ggcaagcttt agctggtgac cccaagctgg acagaagatt ttccacattg 1440
ttcatcgcag aacctcttgg tgctctgatt accggaactt tctatggtac taaagctgag 1500
tacgaagcta ctggtatagc tgctagattg ccttctggtg gtaccttgga tttgaagctt 1560
ttagattggt tgggtagttt ggctcacata gctgaagtag ttggtttgac cttgggtgac 1620
attccaacgt ccttttacgg taagtcgcta gctttgagag aagaagacat gttagaccgt 1680
acttctattg atggtttgtt caggtatatg ggtgacgccg atgcaggcac cctattatgg 1740
ttcgtcatct tcaattccga gggtggtgcc atggctgata ctccagctgg tgccaccgcc 1800
tacccacata gagataaatt aatcatgtat caatcatacg ttattggtat accaaccctg 1860
actaaggcca ccagagattt tgctgatggt gtccacgacc gtgtgagaat gggtgctcca 1920
tctgctaaca gtacgtatgc aggttacatc gatagaacct tgtccagaga agctgctcaa 1980
gaattttact ggggcgctca actgcctaga ttgagagaag tcaagaaagc atgggaccca 2040
aaggacgtct ttcacaaccc acaatccgtt gatccagcag ag 2082
<210> 101
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 101
atgggcaata caacttccat tggtgtagtg agggattgtt tgacgtctgc tgtcggtggt 60
gttgcagccc atgtcgcttt ccaggacacc ctattatacc aaacctcagc tgttaaacca 120
tataacctta acgtccctgt tactcccgcc gctgttactt acccacaaag tgctaatgaa 180
gtcgctgcta tcgttaagtg cgcatcggat tatgactaca aggtacaagc tcgttccggt 240
ggacacagct ttggtaactt cggtttaggt ggacaaaacg gtgccatagt tattgacatg 300
aaacactttt ctcaattctc catggatgag tctaccttca tcgccactat tggcccaggc 360
accactttgg gtaatctgga tacagaattg tacaacgctg gtaatagagc tatggctcat 420
ggtatatgtc catcgatcag aactggtggt cacttgaccg ttggaggttt gggtcctacc 480
tctcgtcaat ggggtctagc tctggaccac gtcgaagagg tggaagttgt acttgctaac 540
tcttcagtcg tcagagcctc tgacacgcag aaccaagatg ttttatttgc tatcaagggt 600
gcagccgcat ccttcggtat cgttactgaa tttaaggtca gaacagaaga agctccaggt 660
ttggccgtta gatattccta cagcttcaac ttgggtactc cagctgaaaa agcaaagttg 720
gctaaggatt ggcaagccta cattgcccaa gaaaacttaa cgtggaaatt ctctagtaac 780
ttgattattt tcgacggtca aattatcctt gagggaatat ttttcggtag caaggaagaa 840
tacgacaagt taaatttgga aaagaagttt ccaacttcag aacctggtac cgtcttggtc 900
attacgaatt ggttgggtat gatcggacat gctttggaag ataccatcct aagacttatc 960
ggtgattcac ccacttggtt ctatgctaaa tctttgggtt ttactccaaa cacactaatc 1020
tttgactcta ccattgacga atttttcgat tacatacaca aggctaacgc tggtacatta 1080
gcttggtccg ttatgttgtc tttggaaggt ggtgccataa atgctgttcc aaaaaatgct 1140
actgcatacg gtcatagaga tgtattattc tgggttcaaa ttttcgttgt gaatcctctt 1200
ggaccaattt cccaaaccac ttatggtttt accgatggtt tgtataacat cttggccaga 1260
ggtgttccag agtccgcagg tcatgcttac ttaggttgtc cagatcccaa gatgccagac 1320
gctcaaagag catactggag aaataactat ccacgtctgg aggaattgaa aagagacttg 1380
gatcctaagg acatttttca caacccacag ggcgtcagag tcgcttct 1428
<210> 102
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 102
atgggcaaca ctacatcaat tgctgccggt agagattgcc tagtaagcgc agtcggtcca 60
gctcatgtta ccttccagga cgcccttctg taccaaacta cggctgtcga tccttataat 120
ttaaacatcc cagtgacccc cgctgctgtt acttacccac aatcggctga agagatagcc 180
gctgttgtca aatgtgcttc tgactatgat tacaaggttc aagctaggtc tggtggacac 240
tcctttggta actacggttt gggtggtcaa aatggagcca ttgtagttga catgaagcac 300
ttctctcaat ttagtatgga tgaatctacc ttcgtcgcaa ctattggtcc aggtacaacc 360
ttgggcgact tggatactga attgtataac gcaggcggta gagctatggc ccatggtatc 420
tgtcctacaa tccgtactgg tggtcactta actgtcggtg gtttgggtcc aaccgctaga 480
caatggggtc tggccttaga tcacattgaa gaagttgaag tggttttggc taattcctcg 540
atagtgagag ctagcaacac tcagaaccaa gacatcttgt tcgccgttaa gggtgctgct 600
gcttcatttg gtattgtcac cgagtttaaa gttagaaccc aagaagcacc aggactagct 660
gttcaataca gtttcacctt caatttgggt tccccagctc agaaagccaa gttggtcaag 720
gactggcaag cattcattgc ccaagaaaac ttatcttgga agttctactc taatttagtc 780
atctttgacg gtcaaattat tttagaaggt atctttttcg gatccaagga ggaatatgat 840
gaattggact tggaaaaaag atttcccact tctgaaccag gtacagttct ggttttaacg 900
gattggttgg gaatgatcgg ccatgcactt gaggatacta ttttgaagtt ggtcggtgac 960
acacctacgt ggttttacgc taagtccctt ggcttcactc cagatacctt gatcccagat 1020
tcggctattg atgatttctt cgactatatt cataagacta acgctggtac tctggcctgg 1080
tttgtgacct tatctttgga aggtggcgct ataaactccg tttcagaaga tgctaccgct 1140
tatggtcaca gagatgtctt gttttggttc caagttttcg ttgtcaatcc tcttggtcca 1200
atctctcaaa caacatacga cttcactaat ggtttgtacg acgtattggc tcaggccgtg 1260
cctgaaagcg ctggtcatgc ttaccttggt tgtccagatc caaaaatgcc agacgctcag 1320
cgtgcttact ggagaagtaa cttacccaga ttggaggatc tgaagggtga tcttgaccca 1380
aaggacacct ttcacaaccc tcaaggtgtt caagtcggtc ca 1422
<210> 103
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 103
atgggcaata ccacatctat cgctgccggt agagactgtc tggtcagtgc tgttggtcct 60
gcacacgtga cgtttcagga tgctttgctt taccaaacta ctgctgttga tccctataac 120
ttaaacatac cagtaacccc agccgctgtc acttacccac aatccgctga ggaaattgcc 180
gctgttgtga agtgcgcttc agactacgat tataaagtcc aagctaggtc tggaggtcat 240
agcttcggta actacggtct aggtggtcaa aatggtgcaa tcgttgttga aatgaagcac 300
ttctctcaat tttccatgga cgaatcgacc ttcgtcgcca ctattggccc aggtacaaca 360
ttgggtgatt tagataccga attgtataat actggtggcc gtgctatggc ccatggtatt 420
tgtccaacta tcagaaccgg tggtcacttg accgttggtg gattgggtcc tactgcaaga 480
caatggggtt tagctcttga tcatatcgaa gaagttgagg tcgtcttggc taactcttcc 540
attgttagag ctagcaacac tcagaaccaa gacattctat ttgctgttaa aggagccgct 600
gccagcttcg gtatagtcac cgaatttaag gttagaacac aggaagctcc aggtttggct 660
gtacaataca gtttcacctt caatttgggc tcagcagctc aaaaggcaaa gttggtcaaa 720
gactggcaag ccttcatcgc tcaagaaaat ttatcttgga aattttactc taacctagtt 780
atttttgacg gacaaattat cttggaaggt atcttcttcg gttccaagga ggaatacgat 840
gaactagact tagaaaagag attcccaact tctgaaccag gtaccgtgtt ggttttaact 900
gattggttgg gtatgatcgg tcacggtctg gaagacacta tattgaagtt agttggtgat 960
acccctactt ggttctatgc aaagtccttg ggttttacgc cagatacttt gatacccgat 1020
tctgccattg acgatttttt cgattatatt cataagacaa atgctggaac cttggcttgg 1080
tttgtaacgc tatctttgga aggtggtgct ataaactctg tctcggaaga cgcaacagct 1140
tacggtcaca gagatgtcct gttttggttc caagtgtttg tagtcaaccc tttgggtcca 1200
atttcccaga ccacttacga cttcaccaat ggtttatacg atgttcttgc tcaagccgtt 1260
ccagaatcgg ccggccacgc ttatttgggt tgtccagacc ctaaaatgcc cgacgcacaa 1320
cgtgcttact ggaggtccaa cctaccaaga ttggaggact taaagggtga cctagaccca 1380
aaggatactt ttcataaccc acaaggtgtc caagttggac ca 1422
<210> 104
<211> 473
<212> PRT
<213> Purpureocillium lilacinum
<400> 104
Met Gly Asn Gly Gln Ser Thr Pro Leu Gln Gln Cys Leu Asn Thr Val
1 5 10 15
Cys Asn Gly Arg Leu Gly Cys Val Ala Phe Pro Ser Asp Ala Leu Tyr
20 25 30
Gln Ala Ala Trp Val Lys Pro Tyr Asn Leu Asp Val Pro Val Thr Pro
35 40 45
Ile Ala Val Phe Lys Pro Ser Ser Thr Glu Asp Val Ala Gly Ala Ile
50 55 60
Lys Cys Ala Val Ala Ser Asn Val His Val Gln Ala Lys Ser Gly Gly
65 70 75 80
His Ser Tyr Ala Asn Phe Gly Leu Gly Gly Gln Asp Gly Glu Leu Met
85 90 95
Ile Asp Leu Ala Asn Leu Gln Asp Phe His Met Asp Lys Thr Ser Trp
100 105 110
Gln Ala Thr Phe Gly Ala Gly Tyr Arg Leu Gly Asp Leu Asp Lys Lys
115 120 125
Leu Gln Ala Asn Gly Asn Arg Ala Ile Ala His Gly Thr Cys Pro Gly
130 135 140
Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met Ser
145 150 155 160
Arg Met Trp Gly Ser Ala Leu Asp His Val Leu Ser Val Gln Val Val
165 170 175
Thr Ala Asp Gly Ser Ile Lys Asn Ala Ser Glu Ser Glu Asn Ser Asp
180 185 190
Leu Phe Trp Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Val Ile Thr
195 200 205
Lys Phe Thr Val Lys Thr His Pro Ala Pro Gly Ser Val Val Gln Tyr
210 215 220
Thr Tyr Lys Ile Ser Leu Gly Ser Gln Ala Gln Met Ala Pro Val Tyr
225 230 235 240
Ala Ala Trp Gln Ala Leu Ala Gly Asp Ala Lys Leu Asp Arg Arg Phe
245 250 255
Ser Thr Leu Phe Ile Ala Glu Pro Leu Gly Ala Leu Ile Thr Gly Thr
260 265 270
Phe Tyr Gly Thr Lys Ala Glu Tyr Glu Ala Thr Gly Ile Ala Ala Arg
275 280 285
Leu Pro Ser Gly Gly Thr Leu Asp Leu Lys Leu Leu Asp Trp Leu Gly
290 295 300
Ser Leu Ala His Ile Ala Glu Val Val Gly Leu Thr Leu Gly Asp Ile
305 310 315 320
Pro Thr Ser Phe Tyr Gly Lys Ser Leu Ala Leu Arg Glu Glu Asp Met
325 330 335
Leu Asp Arg Thr Ser Ile Asp Gly Leu Phe Arg Tyr Met Gly Asp Ala
340 345 350
Asp Ala Gly Thr Leu Leu Trp Phe Val Ile Phe Asn Ser Glu Gly Gly
355 360 365
Ala Met Ala Asp Thr Pro Ala Gly Ala Thr Ala Tyr Pro His Arg Asp
370 375 380
Lys Leu Ile Met Tyr Gln Ser Tyr Val Ile Gly Ile Pro Thr Leu Thr
385 390 395 400
Lys Ala Thr Arg Asp Phe Ala Asp Gly Val His Asp Arg Val Arg Met
405 410 415
Gly Ala Pro Ala Ala Asn Ser Thr Tyr Ala Gly Tyr Ile Asp Arg Thr
420 425 430
Leu Ser Arg Glu Ala Ala Gln Glu Phe Tyr Trp Gly Ala Gln Leu Pro
435 440 445
Arg Leu Arg Glu Val Lys Lys Ala Trp Asp Pro Lys Asp Val Phe His
450 455 460
Asn Pro Gln Ser Val Asp Pro Ala Glu
465 470
<210> 105
<211> 473
<212> PRT
<213> Aspergillus tubingensis
<400> 105
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Gln Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Gln Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Ile Pro Ala
465 470
<210> 106
<211> 473
<212> PRT
<213> Aspergillus niger
<400> 106
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Gln Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Tyr Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Ile Pro Ala
465 470
<210> 107
<211> 513
<212> PRT
<213> Phaseolus vulgaris
<400> 107
Met Asp Pro Ile Glu Asp Ala Ile Leu Gln Cys Leu Ser Leu His Ser
1 5 10 15
Asp Pro Ser His Pro Ile Ser Gly Val Thr Tyr Phe Pro Asn Thr Pro
20 25 30
Ser Tyr Ile Pro Ile Leu His Ser Tyr Ile Arg Asn Leu Arg Phe Thr
35 40 45
Ser Pro Ser Thr Arg Lys Pro Leu Phe Ile Val Ala Pro Thr His Ile
50 55 60
Ser His Ile Gln Ala Ser Ile Ile Cys Cys Lys Ser Phe Gln Leu Gln
65 70 75 80
Ile Arg Ile Arg Ser Gly Gly His Asp Tyr Asp Gly Leu Ser Tyr Val
85 90 95
Ser Gln Ser Pro Phe Ala Ile Met Asp Met Phe Ala Met Arg Ser Val
100 105 110
Glu Val Asn Leu Glu Asp Glu Thr Val Trp Val Asp Ser Gly Ser Thr
115 120 125
Ile Gly Glu Leu Tyr His Gly Ile Ala Glu Arg Ser Lys Val His Gly
130 135 140
Phe Pro Ala Gly Val Cys His Ser Val Gly Val Gly Gly His Phe Ser
145 150 155 160
Gly Gly Gly Tyr Gly Asn Met Met Arg Lys Phe Gly Leu Ser Val Asp
165 170 175
His Val Leu Asp Ala Val Ile Val Asp Ala Glu Gly Arg Val Leu Asp
180 185 190
Arg Lys Lys Met Gly Glu Asp Leu Phe Trp Gly Ile Arg Gly Gly Gly
195 200 205
Gly Ala Ser Phe Gly Val Ile Val Ser Trp Arg Ile Lys Leu Val Pro
210 215 220
Val Pro Glu Val Val Thr Val Phe Arg Val Leu Lys Thr Leu Glu Gln
225 230 235 240
Gly Ala Thr Asp Val Val His Arg Trp Gln Tyr Val Ala Asp Asn Ile
245 250 255
His Asp Asp Leu Phe Ile Arg Val Val Leu Ser Pro Val Lys Arg Lys
260 265 270
Gly Gln Lys Thr Ile Arg Ala Lys Phe Asn Ala Leu Phe Leu Gly Asn
275 280 285
Ala Gln Glu Leu Leu Arg Val Met Ser Asp Ser Phe Pro Glu Leu Gly
290 295 300
Leu Val Gly Glu Asp Cys Ile Glu Met Ser Trp Ile Asp Ser Val Leu
305 310 315 320
Phe Trp Asp Asn Phe Pro Val Gly Thr Ser Val Asp Val Leu Leu Gln
325 330 335
Arg His Asp Thr Pro Glu Lys Phe Leu Lys Lys Lys Ser Asp Tyr Val
340 345 350
Gln Gln Pro Ile Ser Lys Thr Gly Leu Glu Gly Val Trp Asn Lys Met
355 360 365
Met Glu Leu Glu Lys Pro Val Leu Thr Leu Asn Pro Tyr Gly Gly Arg
370 375 380
Met Gly Glu Ile Ser Glu Met Glu Ile Pro Phe Pro His Arg Ala Gly
385 390 395 400
Asn Leu Tyr Lys Ile Gln Tyr Ser Val Asn Trp Lys Glu Glu Gly Glu
405 410 415
Asp Val Ala Asn Arg Tyr Leu Asp Leu Ile Arg Met Leu Tyr Asp Tyr
420 425 430
Met Thr Pro Tyr Val Ser Lys Ser Pro Arg Ser Ser Tyr Leu Asn Tyr
435 440 445
Arg Asp Val Asp Ile Gly Val Asn Gly Pro Gly Asn Ala Thr Tyr Ala
450 455 460
Glu Ala Arg Val Trp Gly Glu Lys Tyr Phe Lys Arg Asn Phe Asp Arg
465 470 475 480
Leu Val Glu Val Lys Thr Arg Val Asp Pro Ser Asn Phe Phe Arg Tyr
485 490 495
Glu Gln Ser Ile Pro Ser Leu Ala Ala Ser Ser Leu Gly Ile Met Ser
500 505 510
Glu
<210> 108
<211> 506
<212> PRT
<213> Dactylellina haptotyla
<400> 108
Met Val His Asn Ile Leu Leu Leu Gly Leu Met Pro Leu Leu Val Arg
1 5 10 15
Ala Ser Pro Leu Pro Ile Tyr His Asn Tyr Pro Pro Gln Ser Thr Ile
20 25 30
Asn Asp Cys Leu Gln Ala Ala Asp Val Pro Ala Ile Leu Gln Ser Ser
35 40 45
Ala Ser Phe Asp Ala Leu Ser Gln Pro Leu Asn Ser Arg Leu Lys Ser
50 55 60
Lys Pro Ala Val Ile Thr Ile Pro Thr Thr Ala Leu His Val Ser Ser
65 70 75 80
Ala Val Lys Cys Ala Ala Gln Phe Lys Leu Lys Val Thr Pro Arg Gly
85 90 95
Gly Gly His Ser Tyr Asn Ala Gln Ser Leu Gly Asp Gly Ala Val Val
100 105 110
Ile Asp Met Gln Gln Phe His Asp Val Val Tyr Asp Ser Lys Thr Gln
115 120 125
Leu Ala Arg Ile Gly Gly Gly Ala Arg Leu Gly Asn Val Ala Gln Lys
130 135 140
Leu Tyr Asp Gln Gly Lys Arg Ala Met Pro His Gly Thr Cys Pro Asp
145 150 155 160
Val Gly Ile Gly Gly His Ser Ala Gly Gly Phe Gly Trp Thr Ser Arg
165 170 175
Gln Trp Gly Ile Thr Val Asp His Ile Asp Glu Val Glu Val Val Thr
180 185 190
Ala Asp Gly Ser Ile Arg Arg Ala Asn Lys Asp Gln Asn Ser Asp Leu
195 200 205
Phe Trp Ala Leu Arg Gly Ala Ala Pro Ser Phe Gly Val Ile Thr Asn
210 215 220
Phe Trp Phe Ser Thr Leu Glu Ala Pro Asp Ser Asn Val Ile Tyr Ser
225 230 235 240
Tyr Lys Phe Thr Gly Leu Ser Leu Asp Glu Ile Ser Thr Ala Leu Leu
245 250 255
Glu Val Gln Lys Phe Gly Gln Thr Ala Pro Lys Glu Val Gly Met Leu
260 265 270
Ile Gln Ile Leu Asp Asn Gly Ser Gly Phe Arg Leu Tyr Gly Thr Tyr
275 280 285
Tyr Asn Thr Thr Arg Gln Gln Phe Asp Asn Leu Phe Gly Gln Leu Leu
290 295 300
Gln Arg Leu Pro Ser Pro Gly Asn Ser Ala Glu Val Ser Val Lys Gly
305 310 315 320
Trp Ile Asp Ser Leu Ile Phe Ala Ser Gly Gly Ser Lys Gly Leu Thr
325 330 335
Val Pro Glu Leu Gly Gly Thr Asn Gln His Ser Ser Phe Tyr Thr Lys
340 345 350
Ser Leu Met Thr Ala Gln Asp Tyr Pro Leu Thr Leu Asp Ser Ile Lys
355 360 365
Ser Val Phe Lys Tyr Ala Met Asn Gln Gly Arg Ala Ala Thr Glu Arg
370 375 380
Gly Leu Pro Trp Met Val Phe Ile Ser Leu Leu Gly Gly Arg Tyr Ser
385 390 395 400
Thr Leu Pro Thr Pro Ser Ala Ala Ser Asp Asn Ser Phe Tyr Gly Arg
405 410 415
Asn Thr Leu Trp Ala Phe Ser Phe Thr Ala Tyr Leu Gly Asn Val Thr
420 425 430
Glu Gln Ser Asn Arg Asp Ser Ile Tyr Phe Leu Asn Gly Phe Asp Thr
435 440 445
Ser Val Arg Arg Ser Val Asp Thr Ala Tyr Ile Asn Gly His Asp Thr
450 455 460
Glu Tyr Ser Arg Glu Glu Ala His Arg Leu Tyr Tyr Gly Asp Lys Tyr
465 470 475 480
Gln Arg Leu Ser Val Leu Lys Lys Gln Trp Asp Pro Glu Gln Val Phe
485 490 495
Trp Tyr Pro Gln Ser Ile Asp Pro Ala Asn
500 505
<210> 109
<211> 476
<212> PRT
<213> Aspergillus fumigatus
<400> 109
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser
1 5 10 15
Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val
50 55 60
Val Lys Cys Ala Ala Asp Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile
85 90 95
Val Val Asp Met Lys His Phe Asp Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Glu Ile Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Asn Ile Ile Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Glu
275 280 285
Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Ala Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro
325 330 335
Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Glu Tyr Ile
340 345 350
His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu
385 390 395 400
Gly Pro Val Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp
405 410 415
Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Asn
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp
450 455 460
Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser
465 470 475
<210> 110
<211> 474
<212> PRT
<213> Aspergillus arachidicola
<400> 110
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala
1 5 10 15
Leu Gly Gly Asn Ala Gly Leu Val Ala Phe Gln Ser Gln Pro Leu Tyr
20 25 30
Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro
35 40 45
Ala Ala Ile Ala Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val
50 55 60
Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly
65 70 75 80
His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val
85 90 95
Val Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr
100 105 110
Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr Glu
115 120 125
Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Ile Cys Pro Thr
130 135 140
Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala
145 150 155 160
Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val
165 170 175
Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu
180 185 190
Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr
195 200 205
Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr
210 215 220
Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Glu Lys Ala Gln Phe Val
225 230 235 240
Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe
245 250 255
Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu
260 265 270
Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Gly Leu Glu Glu Arg
275 280 285
Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu
290 295 300
Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly
305 310 315 320
Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp
325 330 335
Thr Leu Ile Pro Ser Ser Gly Ile Asp Glu Phe Phe Glu Tyr Ile Glu
340 345 350
Asn Asn Lys Ala Gly Thr Ser Thr Trp Phe Val Thr Leu Ser Leu Glu
355 360 365
Gly Gly Ala Ile Asn Asp Val Pro Ala Asp Thr Thr Ala Tyr Gly His
370 375 380
Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Ser Pro Thr Gly
385 390 395 400
Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val
405 410 415
Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys
420 425 430
Pro Asp Pro Lys Met Ala Asn Ala Gln Gln Lys Tyr Trp Arg Gln Asn
435 440 445
Leu Pro Arg Leu Glu Glu Leu Lys Ala Thr Leu Asp Pro Lys Asp Thr
450 455 460
Phe His Asn Pro Gln Gly Ile Leu Pro Val
465 470
<210> 111
<211> 483
<212> PRT
<213> Aspergillus flavus
<400> 111
Met Asn Pro Ser Ile Pro Ser Ser Ser Met Gly Asn Thr Thr Ser Ile
1 5 10 15
Ala Gly Arg Asp Cys Leu Val Ser Ala Leu Gly Gly Asn Ala Gly Leu
20 25 30
Val Ala Phe Gln Asn Gln Pro Leu Tyr Gln Thr Thr Ala Val His Glu
35 40 45
Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala Ala Ile Thr Tyr Pro Glu
50 55 60
Thr Ala Glu Gln Ile Ala Ala Val Val Lys Cys Ala Ser Gln Tyr Asp
65 70 75 80
Tyr Lys Val Gln Ala Arg Ser Gly Gly His Ser Phe Gly Asn Tyr Gly
85 90 95
Leu Gly Gly Thr Asp Gly Ala Val Val Val Asp Met Lys Tyr Phe Asn
100 105 110
Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu Ala Val Ile Gly Pro Gly
115 120 125
Thr Thr Leu Gly Asp Val Asp Val Glu Leu Tyr Asn Asn Gly Lys Arg
130 135 140
Ala Met Ala His Gly Val Cys Pro Thr Ile Ser Thr Gly Gly His Phe
145 150 155 160
Thr Met Gly Gly Leu Gly Pro Thr Ala Arg Gln Trp Gly Leu Ala Leu
165 170 175
Asp His Val Glu Glu Val Glu Val Val Leu Ala Asn Ser Ser Ile Val
180 185 190
Arg Ala Ser Asn Thr Gln Asn Gln Glu Val Phe Phe Ala Val Lys Gly
195 200 205
Ala Ala Ala Ser Phe Gly Ile Val Thr Glu Phe Lys Val Arg Thr Gln
210 215 220
Pro Ala Pro Gly Ile Ala Val Gln Tyr Ser Tyr Thr Phe Asn Leu Gly
225 230 235 240
Ser Ser Ala Glu Lys Ala Gln Phe Ile Lys Asp Trp Gln Ser Phe Val
245 250 255
Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Thr Asn Met Val Ile Phe
260 265 270
Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe Phe Gly Ser Lys Glu Gln
275 280 285
Tyr Glu Ala Leu Gly Leu Glu Glu Arg Phe Val Pro Lys Asn Pro Gly
290 295 300
Asn Ile Met Val Leu Thr Asp Trp Leu Gly Met Val Gly His Ala Leu
305 310 315 320
Glu Asp Thr Ile Leu Arg Leu Val Gly Asn Thr Pro Thr Trp Phe Tyr
325 330 335
Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr Leu Ile Pro Ser Ser Gly
340 345 350
Ile Asp Glu Phe Phe Glu Tyr Ile Glu Asn Asn Lys Ala Gly Thr Ser
355 360 365
Thr Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val
370 375 380
Pro Ala Asp Ala Thr Ala Tyr Gly His Arg Asp Val Leu Phe Trp Val
385 390 395 400
Gln Ile Phe Met Val Ser Pro Thr Gly Pro Val Ser Ser Thr Thr Tyr
405 410 415
Asp Phe Ala Asp Gly Leu Tyr Asn Val Leu Thr Lys Ala Val Pro Glu
420 425 430
Ser Glu Gly His Ala Tyr Leu Gly Cys Pro Asp Pro Lys Met Ala Asn
435 440 445
Ala Gln Gln Lys Tyr Trp Arg Gln Asn Leu Pro Arg Leu Glu Glu Leu
450 455 460
Lys Glu Thr Leu Asp Pro Lys Asp Thr Phe His Asn Pro Gln Gly Ile
465 470 475 480
Leu Pro Ala
<210> 112
<211> 506
<212> PRT
<213> Aspergillus nomiae
<400> 112
Met Ala Arg Val Pro Ala Leu Phe Leu Gly Leu Ser Ser Val Cys Leu
1 5 10 15
Leu Val Phe Phe Cys Ser Leu Ile Asn Pro Thr Thr Pro Leu His Gln
20 25 30
His Gly Lys Gln Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala
35 40 45
Leu Gly Gly Asn Thr Gly Leu Val Ala Phe Gln Asp Gln Leu Leu Tyr
50 55 60
Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro
65 70 75 80
Ala Ala Ile Thr Tyr Pro Glu Thr Ser Glu Gln Ile Ala Ala Val Val
85 90 95
Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly
100 105 110
His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val
115 120 125
Val Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Glu Gln Thr Tyr
130 135 140
Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr Glu
145 150 155 160
Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Ile Cys Pro Thr
165 170 175
Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala
180 185 190
Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val
195 200 205
Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu
210 215 220
Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr
225 230 235 240
Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr
245 250 255
Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Glu Lys Ala Gln Phe Val
260 265 270
Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe
275 280 285
Tyr Thr Asn Met Val Ile Phe Asp Gly Asn Ile Ile Leu Glu Gly Leu
290 295 300
Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Gly Leu Glu Asp Arg
305 310 315 320
Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu
325 330 335
Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly
340 345 350
Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp
355 360 365
Thr Leu Ile Pro Ser Ser Gly Ile Asp Glu Phe Phe Asp Tyr Ile Glu
370 375 380
Asn Asn Lys Ala Gly Thr Leu Thr Trp Phe Val Thr Leu Ser Leu Glu
385 390 395 400
Gly Gly Ala Ile Asn Asp Val Pro Lys Asp Ala Thr Ala Tyr Gly His
405 410 415
Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ala Ser Pro Thr Gly
420 425 430
Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val
435 440 445
Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys
450 455 460
Pro Asp Pro Lys Met Ala Asp Ala Gln Gln Lys Tyr Trp Arg Gln Asn
465 470 475 480
Leu Pro Arg Leu Glu Glu Leu Lys Ala Thr Leu Asp Pro Lys Asp Thr
485 490 495
Phe His Asn Pro Gln Gly Ile Leu Pro Ala
500 505
<210> 113
<211> 427
<212> PRT
<213> Aspergillus niger
<400> 113
Met Thr Thr Lys Cys Arg His Ala Val Glu Ala Thr Ala Leu Gly Thr
1 5 10 15
Met Val Ala Tyr Leu Ile Arg Asn Asn Pro Arg Arg Pro Ser Ser Thr
20 25 30
Asn Ala Asn Val Leu Asp Thr Gly Leu Gly Gly Ala Asp Gly Ala Val
35 40 45
Val Val Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr
50 55 60
Tyr Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile
65 70 75 80
Glu Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro
85 90 95
Thr Ile Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr
100 105 110
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
115 120 125
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln
130 135 140
Asp Val Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val
145 150 155 160
Thr Glu Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln
165 170 175
Tyr Ser Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe
180 185 190
Val Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln
195 200 205
Phe Tyr Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly
210 215 220
Leu Phe Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp
225 230 235 240
His Phe Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp
245 250 255
Leu Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val
260 265 270
Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln
275 280 285
Asp Thr Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile
290 295 300
Ala Asn His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu
305 310 315 320
Glu Gly Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala
325 330 335
His Arg Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu
340 345 350
Gly Pro Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp
355 360 365
Val Leu Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly
370 375 380
Cys Pro Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr
385 390 395 400
Asn Leu Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn
405 410 415
Thr Phe His His Pro Gln Gly Val Met Pro Ala
420 425
<210> 114
<211> 475
<212> PRT
<213> Neonectria ditissima
<400> 114
Met Gly His Gly Gln Ser Thr Pro Gly Glu Asn Cys Leu Asn Ala Ile
1 5 10 15
Cys Gly Asn Arg Thr Asp Cys Val Ser Tyr Pro Leu Asp Pro Leu Phe
20 25 30
His Ile Ala Trp Ala Arg Pro Tyr Asn Leu Gln Val Pro Val Thr Pro
35 40 45
Ala Ala Val Leu Arg Pro Asp Asn Ala Gln Asp Val Ala Asp Ala Val
50 55 60
Lys Cys Ala Asn Glu Asn Gly Ile Lys Val Gln Ala Arg Ser Gly Gly
65 70 75 80
His Ser Tyr Gly Asn Phe Gly Leu Gly Gly Asp Asp Gly Ala Leu Val
85 90 95
Leu Asp Leu Val Asn Leu Gln Gly Phe Thr Met Asp Glu Glu Asn Trp
100 105 110
His Ala Ala Val Gly Ala Gly Ile Arg Leu Gly Lys Leu Asp Glu His
115 120 125
Leu His Lys Asn Gly Gly Arg Ala Met Ala His Gly Thr Cys Pro Gly
130 135 140
Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met Ser
145 150 155 160
Arg Met Trp Gly Ser Ala Leu Asp His Val Val Glu Val Glu Val Val
165 170 175
Thr Ala Asp Gly Ser Ile Gln Arg Ala Asn Glu Thr Glu Asn Ser Asp
180 185 190
Leu Phe Trp Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Ile Ile Thr
195 200 205
Glu Phe Val Val Arg Thr His Pro Glu Pro Gly Asp Val Ile Glu Tyr
210 215 220
Thr Tyr Ser Leu Thr Phe Gly Ser Gln Ala Glu Met Ala Pro Ile Tyr
225 230 235 240
Gln Glu Trp Gln Glu Phe Ile Gly Asp Pro Asp Leu Asp Arg Arg Phe
245 250 255
Ser Ser Gln Phe Ile Ala Gln Pro Leu Gly Ala Ile Ile Thr Gly Thr
260 265 270
Phe Tyr Gly Thr Glu Asp Glu Tyr Arg Glu Ser Gly Ile Pro Asp Lys
275 280 285
Ile Pro Gly Gly Gly Ser Asp Gly Val Gly Ile Leu Val Thr Asp Trp
290 295 300
Leu Gly Ser Leu Gly His Gln Ala Glu Arg Ser Gly Leu Ala Ile Ser
305 310 315 320
Asp Leu Pro Ser Pro Phe Tyr Ser Lys Ser Leu Ala Phe Arg Lys Glu
325 330 335
Asp Leu Leu Pro Lys Glu Gly Ile Thr Glu Leu Phe Gln Tyr Leu Asn
340 345 350
Asp Ala Asp His Gly Thr Leu Ile Trp Val Val Ile Phe Asn Ser Glu
355 360 365
Gly Gly Ala Met Gly Asp Thr Ala Ala Asn Ala Thr Ala Tyr Pro His
370 375 380
Arg Asp Lys Thr Met Met Tyr Gln Ser Tyr Val Ile Gly Ile Pro Glu
385 390 395 400
Val Ser Gly Thr Ala Arg Arg Phe Leu Glu Gly Val His Ala Lys Ile
405 410 415
Gln Asp Ala Ala Pro Gly Ala Asn Ser Thr Tyr Ala Gly Tyr Ile Asp
420 425 430
Thr Glu Leu Gly Arg Ala Glu Ala Gln Glu Val Tyr Trp Gly Ser Gln
435 440 445
Leu Pro Gln Leu Arg Lys Ile Lys Lys Asp Trp Asp Pro Lys Asp Arg
450 455 460
Phe Ser Asn Pro Gln Ser Val Gln Ala Ala Arg
465 470 475
<210> 115
<211> 516
<212> PRT
<213> Unknown
<220>
<223> Pseudogymnoascus sp. VKM F-4518
<400> 115
Met Arg Val Val Gly Lys Met Gly Ala Leu Gln Ser Thr Leu Glu Lys
1 5 10 15
Ser Ile Lys Ala Ala Leu Ala Gly Asp Asp Asp Leu Tyr Ala Val Pro
20 25 30
Gly Lys Pro Phe Tyr Gln Ile Gln His Val Lys Pro Tyr Asn Leu Ser
35 40 45
Ile Pro Ile Glu Pro Ala Ala Ile Thr Tyr Pro Lys Thr Thr Ala Gln
50 55 60
Val Ala Ala Ile Ile Lys Cys Ala Val Ala Ala Asn Leu Lys Val Gln
65 70 75 80
Ala Arg Ser Gly Gly His Ser Tyr Ala Asn Tyr Cys Ile Gly Gly Val
85 90 95
Ser Gly Ala Val Val Ile Asp Leu Lys His Phe Gln Arg Phe Ser Met
100 105 110
Asp Arg Thr Thr Trp Gln Ala Ala Val Gly Ala Gly Thr Leu Leu Gly
115 120 125
Asn Leu Thr Lys Arg Met His Glu Ala Gly Asn Arg Ala Met Ala His
130 135 140
Gly Thr Cys Pro Gln Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly
145 150 155 160
Leu Gly Pro Ser Ser Arg Leu Trp Gly Thr Ala Leu Asp His Val Glu
165 170 175
Glu Val Glu Ile Val Leu Ala Asp Ser Thr Ile Lys Arg Cys Ser Ala
180 185 190
Thr Gln Asn Pro Asp Ile Phe Trp Ala Val Lys Gly Ala Gly Ala Ser
195 200 205
Phe Gly Val Val Thr Glu Phe Lys Leu Arg Thr Glu Pro Glu Pro Ser
210 215 220
Glu Ala Val His Phe Ser Tyr Ser Phe Thr Val Gly Ser Tyr Ala Ser
225 230 235 240
Leu Ala Ala Val Phe Lys Ser Trp Gln Ser Phe Val Ala Asp Pro Gly
245 250 255
Leu Thr Arg Lys Phe Ser Ser Glu Val Ile Ile Thr Glu Ile Gly Met
260 265 270
Ile Ile Ser Gly Thr Tyr Phe Gly Ser Gln Ala Glu Tyr Asp Ala Leu
275 280 285
Asp Met Lys Ser Gln Leu Arg Gly Asp Ser Val Ala Lys Ile Ile Val
290 295 300
Phe Lys Asp Trp Leu Gly Leu Leu Gly His Trp Ala Glu Asp Val Gly
305 310 315 320
Leu Arg Ile Ala Gly Gly Leu Pro Ala Pro Leu Tyr Ala Lys Thr Leu
325 330 335
Thr Phe Asn Gly Ala Asn Leu Ile Pro Asp Glu Val Ile Asp Lys Leu
340 345 350
Phe Ala Tyr Leu Asp Lys Val Glu Lys Gly Ala Leu Val Trp Phe Val
355 360 365
Ile Phe Asp Leu Ala Gly Gly Ala Val Asn Asp Ile Ala Gln Asp Ala
370 375 380
Thr Ser Tyr Ala His Arg Asp Ala Leu Phe Tyr Leu Gln Ser Tyr Ala
385 390 395 400
Val Gly Leu Gly Asn Val Ser Gln Thr Thr Lys Asp Phe Leu Thr Gly
405 410 415
Ile Asn Thr Thr Ile Thr Asn Gly Met Pro Glu Gly Gly Asp Phe Gly
420 425 430
Ala Tyr Pro Gly Tyr Val Asp Leu Glu Leu Pro Asn Gly Pro His Ala
435 440 445
Tyr Trp Arg Thr Asn Leu Pro Arg Leu Glu Gln Ile Lys Ala Leu Val
450 455 460
Asp Pro Asn Asp Val Phe His Asn Pro Gln Ser Tyr Leu Cys Ile Leu
465 470 475 480
Phe Leu Leu Asn Leu Leu Asn Arg Ala Leu Ala Trp Ala Pro Val Gly
485 490 495
Thr Val Gln Pro Phe Gln Val Leu Arg Tyr Ser Ile Asp Thr Gly Pro
500 505 510
Leu Val Leu Leu
515
<210> 116
<211> 478
<212> PRT
<213> Pyrenophora tritici-repentis
<400> 116
Met Gly Gln Gly Ser Ser Gly Val Gln Ser Asn Pro Leu Glu Asp Cys
1 5 10 15
Leu Lys Val Ala Thr Ser Pro Leu Gly Ser Tyr Ala Phe His Asp Lys
20 25 30
Leu Leu Phe Gln Leu Thr Asp Val Lys Pro Tyr Asn Leu Asp Tyr Pro
35 40 45
Val Asn Pro Ile Ala Val Thr Tyr Pro Gly Ser Thr Lys Glu Val Ala
50 55 60
Gln Ile Ile Lys Cys Ala Thr Thr Tyr Asp Lys Lys Val Gln Ala Arg
65 70 75 80
Ser Gly Gly His Ser Tyr Ala Asn Phe Ala Leu Gly Asp Gly Asp Gly
85 90 95
Ala Ile Val Ile Asp Met Gln Lys Phe Lys Gln Phe Ser Met Asp Thr
100 105 110
Ser Thr Trp Gln Ala Thr Ile Gly Pro Gly Thr Leu Leu Gly Asp Val
115 120 125
Ser Lys Arg Leu His Glu Asn Gly Asn Arg Val Ile Pro His Gly Thr
130 135 140
Ser Pro Gln Ile Gly Phe Gly Gly His Gly Thr Ile Gly Gly Leu Gly
145 150 155 160
Pro Leu Ser Arg Met Tyr Gly Leu Thr Leu Asp Ser Ile Glu Glu Val
165 170 175
Glu Ala Val Leu Ala Asn Gly Gln Ile Val Arg Ala Ser Lys Thr Gln
180 185 190
Asn Glu Asp Leu Phe Phe Ala Ile Arg Gly Ala Ala Ala Ser Val Ala
195 200 205
Val Val Thr Glu Phe Lys Val Arg Thr Tyr Pro Glu Pro Ser Ser Ser
210 215 220
Val Leu Tyr Ser Tyr Thr Leu Gln Gly Gly Ser Val Ala Ser Arg Ala
225 230 235 240
Asn Ala Phe Lys Gln Trp Gln Lys Leu Thr Thr Asp Pro Ser Val Ser
245 250 255
Arg Lys Phe Ala Ser Thr Phe Val Leu Ser Glu Ala Ile Thr Val Val
260 265 270
Thr Gly Thr Phe Phe Gly Thr Gln Ala Glu Phe Asp Ser Leu Asp Ile
275 280 285
Thr Ser Arg Leu Pro Ala Asp Met Ile Ser Asn Asn Thr Glu Val Lys
290 295 300
Asn Trp Leu Gly Val Val Gly His Trp Gly Glu Ser Leu Ala Leu Arg
305 310 315 320
Ala Gly Gly Gly Ile Pro Ala His Phe Tyr Ser Lys Ser Leu Gly Phe
325 330 335
Lys Lys Asp Glu Ile Met Asp Asp Ala Thr Val Asp Lys Leu Phe Asn
340 345 350
Tyr Ile Asp Lys Ala Asp Lys Gly Gly Ala Val Trp Phe Val Ile Trp
355 360 365
Asp Leu Glu Gly Gly Ala Ile Ser Asp Val Pro Thr Thr Glu Thr Ser
370 375 380
Tyr Gly His Arg Asp Ala Ile Phe Phe Gln Gln Ser Tyr Ala Ile Asn
385 390 395 400
Leu Leu Gly Arg Val Lys Asp Asp Thr His Glu Phe Leu Asn Arg Val
405 410 415
Asn Ser Val Ile Met Glu Ser Asn Pro Gly Gly Tyr Trp Gly Ala Tyr
420 425 430
Pro Gly Tyr Val Asp Thr Ala Leu Gly Asn Ser Ser Ala Lys Ala Tyr
435 440 445
Trp Gly Ile Asn Ser Glu Arg Leu Gln Thr Ile Lys Ser Trp Val Asp
450 455 460
Ala Gly Asp Val Phe His Asn Pro Gln Ser Val Arg Pro Lys
465 470 475
<210> 117
<211> 526
<212> PRT
<213> Colletotrichum orchidophilum
<400> 117
Met Gln Pro Phe Thr Ser Leu Thr Arg Ser Pro Phe Arg Ser Ala His
1 5 10 15
Val Ile Ser Cys Pro Val Ala Leu Asp Asn Pro Pro Ser Val Pro Ile
20 25 30
Ile Met Gly Gln Lys Pro Ser Ser Pro Leu Ala Thr Cys Leu Asp Lys
35 40 45
Val Cys Asn Gly Arg Ser Ser Cys Val Gly Tyr Pro Asn Asp Pro Leu
50 55 60
Phe Gln Ile Asn Trp Val Lys Pro Tyr Asn Leu Asp Ile Pro Val Gln
65 70 75 80
Pro Ile Ala Val Thr Arg Pro Ser Thr Ala Glu Asp Val Ala Gly Phe
85 90 95
Val Lys Cys Ala Ala Glu Asn Asn Val Lys Val Gln Ala Lys Ser Gly
100 105 110
Gly His Ser Tyr Gly Asn Phe Ala Ile Gly Gly Thr Asp Gly Ala Leu
115 120 125
Val Ile Asp Leu Val Asn Phe Gln Asn Phe Ser Met Asp Thr Asn Thr
130 135 140
Trp Gln Ala Thr Phe Gly Gly Gly His Lys Leu His Glu Val Thr Gln
145 150 155 160
Lys Leu His Asp Asn Gly Lys Arg Ala Ile Ala His Gly Thr Cys Pro
165 170 175
Gly Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Ser
180 185 190
Ser Arg Met Trp Gly Ser Cys Leu Asp His Val Val Glu Val Glu Val
195 200 205
Val Thr Ala Asp Gly Lys Ile Gln Arg Ala Asn Asp Lys Gln Asn Ser
210 215 220
Asp Leu Phe Phe Ala Leu Lys Gly Ala Gly Ala Gly Phe Gly Val Ile
225 230 235 240
Thr Glu Phe Val Met Arg Thr His Pro Glu Pro Gly Asp Val Val Gln
245 250 255
Tyr Ser Tyr Ala Ile Thr Phe Ala Lys His Arg Asp Leu Val Pro Val
260 265 270
Phe Lys Gln Trp Gln Glu Leu Ile Phe Asp Pro Thr Leu Asp Arg Arg
275 280 285
Phe Ser Ser Glu Phe Val Met Gln Glu Leu Gly Val Ala Ile Thr Ala
290 295 300
Thr Phe Tyr Gly Thr Glu Asp Glu Phe Lys Lys Thr Gly Ile Pro Asp
305 310 315 320
Arg Ile Pro Lys Gly Lys Val Ser Val Val Ile Asn Asn Trp Leu Gly
325 330 335
Asp Val Ala Gln Lys Ala Gln Asp Ala Ala Leu Trp Leu Ser Asp Ile
340 345 350
Gln Ser Ala Phe Thr Ser Lys Ser Leu Ala Phe Thr His Asn Asp Leu
355 360 365
Ile Ser Glu Asp Gly Ile Gln Thr Met Met Asp Tyr Val Asp Ser Val
370 375 380
Asp Arg Gly Thr Leu Ile Trp Phe Leu Ile Leu Asp Ser Thr Gly Gly
385 390 395 400
Ala Ile Asn Asp Val Pro Met Asn Ala Thr Ala Tyr Arg His Arg Asp
405 410 415
Lys Val Met Phe Phe Gln Gly Tyr Gly Val Gly Ile Pro Thr Leu Ser
420 425 430
Gly Lys Thr Lys Asp Phe Met Ser Gly Val Ala Asp Lys Ile Arg Lys
435 440 445
Ala Ser Pro Asn Glu Leu Ser Thr Tyr Ala Gly Tyr Val Asp Pro Thr
450 455 460
Leu Asp Asn Ala Gln Glu Arg Tyr Trp Gly Pro Asn Leu Pro Ala Leu
465 470 475 480
Glu Arg Ile Lys Ala Thr Trp Asp Pro Lys Asp Leu Phe Ser Asn Pro
485 490 495
Gln Ser Val Arg Pro Asn Ala Ser Ala Lys Asp Val Glu Pro Ala Ala
500 505 510
Ser Gly Gly Ser Asn Asn Ser Gly Ser Lys Gly Gly Asp Ser
515 520 525
<210> 118
<211> 472
<212> PRT
<213> Unknown
<220>
<223> Cordyceps sp. RAO-2017
<400> 118
Met Gly Ser Gly His Ser Ser Gly Leu Ala Thr Cys Leu Asp Ala Val
1 5 10 15
Cys Asn Gly Arg His Ala Cys Val Ala Tyr Pro Asp His Leu Leu Tyr
20 25 30
Gln Ala Ser Trp Val Asp Arg Tyr Asn Leu Asp Ile Pro Val His Pro
35 40 45
Ile Ala Val Thr Arg Pro Ser Asn Ala Asp Asp Val Ser Gly Phe Val
50 55 60
Lys Cys Ala Ala Ala Asn Asn Val Arg Val Gln Ala Lys Ser Gly Gly
65 70 75 80
His Ser Tyr Ala Asn Tyr Gly Leu Gly Gly Glu Asp Gly Glu Leu Val
85 90 95
Ile Asp Leu Arg His Leu Gln His Phe Ser Met Asp Thr Asn Thr Trp
100 105 110
Gln Ala Thr Ile Gly Ala Gly His Arg Leu Trp Asp Val Thr His Lys
115 120 125
Leu His Glu Asn Gly Lys Arg Ala Val Ser His Gly Thr Cys Pro Gly
130 135 140
Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Ser Ser
145 150 155 160
Arg Met Trp Gly Ser Cys Leu Asp His Val Val Glu Val Glu Val Val
165 170 175
Thr Ala Asp Gly Ser Ile Arg Arg Ala Ser Glu Arg Glu Asn Ala Asp
180 185 190
Leu Phe Phe Ala Leu Lys Gly Ala Gly Ala Gly Phe Gly Val Ile Thr
195 200 205
Glu Phe Val Met Lys Thr His Pro Glu Pro Gly Ser Val Val Arg Tyr
210 215 220
Thr Tyr Ser Val Asn Phe Gly Arg His Ala Asp Met Val Asp Val Phe
225 230 235 240
Asp Gln Trp Gln Ala Leu Ile Ser Asp Pro Gly Leu Asp Arg Arg Phe
245 250 255
Gly Ser Glu Ile Ile Met His Ala Phe Gly Leu Val Ile Ser Ala Thr
260 265 270
Phe His Gly Thr Arg Asp Glu Tyr Glu Ala Ser Gly Ile Pro Asp Arg
275 280 285
Ile Pro Arg Gly Asn Val Ser Val Leu Leu Asp Asn Trp Leu Gly Val
290 295 300
Val Gly Asn Gln Ala Gln Asp Ala Gly Leu Trp Val Ser Glu Val Arg
305 310 315 320
Ser Ser Phe Thr Ser Arg Ser Leu Ala Phe Arg Arg Asp Gln Leu Leu
325 330 335
Ser Arg Asp Asp Ile Val Arg Met Met Asp Phe Leu Asp Arg Thr Asp
340 345 350
Lys Gly Thr Leu Val Trp Phe Leu Ile Phe Asp Val Thr Gly Gly Ala
355 360 365
Ile Gly Asp Val Arg Thr Asp Ala Thr Ala Tyr Ala His Arg Asp Lys
370 375 380
Ile Met Phe Cys Gln Gly Tyr Ala Val Gly Ile Pro Ala Leu Thr Arg
385 390 395 400
Lys Thr Arg Val Phe Met Asp Gly Leu Ile Ser Thr Ile Arg Glu Thr
405 410 415
Ala Asn Ser Thr Leu Thr Thr Tyr Pro Gly Tyr Val Asp Pro Ser Leu
420 425 430
His Asp Ala Gln Ala Ser Tyr Trp Gly Pro Asn Leu Pro Arg Leu Thr
435 440 445
Glu Val Lys Thr Lys Trp Asp Pro Gln Asp Val Phe His Asn Pro Gln
450 455 460
Ser Val Arg Pro Ser Gly Lys Asp
465 470
<210> 119
<400> 119
000
<210> 120
<211> 476
<212> PRT
<213> Aspergillus fumigatus
<400> 120
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser
1 5 10 15
Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val
50 55 60
Val Lys Cys Ala Ala Asp Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile
85 90 95
Val Val Asp Met Lys His Phe Asp Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Glu Ile Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Asn Ile Ile Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Glu
275 280 285
Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Ala Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro
325 330 335
Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Glu Tyr Ile
340 345 350
His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu
385 390 395 400
Gly Pro Val Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp
405 410 415
Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Asn
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp
450 455 460
Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser
465 470 475
<210> 121
<211> 477
<212> PRT
<213> Xylaria hypoxylon
<400> 121
Met Gly Gln Ser Pro Ser Ser Leu Leu Ala Thr Cys Leu Asn Thr Val
1 5 10 15
Cys Asp Gly Arg Thr Asp Cys Val Ala Tyr Pro Asn Asn Pro Leu Tyr
20 25 30
Gln Ile Ser Trp Val Asn Arg Tyr Asn Leu Asp Leu Pro Val Thr Pro
35 40 45
Ile Ala Val Thr Arg Pro Gln Thr Val Gln Asp Val Ser Ala Phe Val
50 55 60
Lys Cys Ala Ala Thr Asn Asn Ile Lys Val Gln Pro Lys Ser Gly Gly
65 70 75 80
His Ser Tyr Ala Asn Tyr Gly Gly Glu Asp Gly Ala Leu Val Ile Asp
85 90 95
Leu Leu Lys Leu Gln Asp Phe Ser Met Asp Ala Lys Thr Trp Gln Ala
100 105 110
Thr Ile Gly Gly Gly Thr Lys Leu Ala Asp Val Thr Lys Arg Leu His
115 120 125
Asp Asn Gly Lys Arg Ala Ile Ser His Gly Thr Cys Pro Gly Val Gly
130 135 140
Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Thr Ser Arg Met
145 150 155 160
Trp Gly Ser Cys Leu Asp His Val Val Glu Ala Glu Val Val Thr Ala
165 170 175
Asp Gly Ser Ile Lys Arg Ala Ser Glu Thr Glu Asn Arg Asp Leu Phe
180 185 190
Phe Ala Leu Lys Gly Ala Gly Ala Gly Phe Gly Val Val Thr Lys Phe
195 200 205
Val Met Lys Thr His Pro Glu Pro Gly Ser Met Val Gln Tyr Ser Tyr
210 215 220
Ser Leu Ser Phe Gly Lys His Thr Asp Met Val Pro Val Phe Lys Gln
225 230 235 240
Trp Gln Asp Leu Val Ser Asp Pro Asn Leu Asp Arg Arg Phe Gly Thr
245 250 255
Glu Phe Val Ala His Glu Leu Gly Ala Ile Ile Thr Ala Thr Phe Tyr
260 265 270
Gly Thr Glu Ala Glu Trp Asp Ala Ser Gly Ile Pro Gln Arg Ile Pro
275 280 285
Lys Gly Lys Ile Ser Val Ile Ile Asp Asp Trp Leu Ala Val Ile Ser
290 295 300
Gln Gln Ala Glu Asp Ala Ala Leu Tyr Leu Ser Asp Ile His Ser Ala
305 310 315 320
Phe Thr Val Arg Ser Leu Ala Phe Thr Ala Glu Glu Thr Leu Ser Glu
325 330 335
Gln Thr Ile Thr Arg Val Met Lys Tyr Ile Asp Asp Thr Asn Arg Gly
340 345 350
Thr Leu Leu Trp Phe Leu Ile Phe Asp Ala Thr Gly Gly Ala Ile Ser
355 360 365
Asp Ile Pro Met Asn Ala Thr Ala Tyr Ser His Arg Asp Lys Ile Met
370 375 380
Tyr Cys Gln Gly Tyr Gly Ile Gly Leu Pro Val Leu Asn Gln His Thr
385 390 395 400
Lys Asp Phe Leu Thr Gly Leu Thr Asp Thr Ile Gln Ala Ser Met Arg
405 410 415
Gln Asn Leu Thr Thr Tyr Pro Gly Tyr Val Asp Pro Ser Leu Ala Asn
420 425 430
Pro Gln Gln Ser Tyr Trp Gly Pro Asn Leu Ala Met Leu Glu Ser Ile
435 440 445
Lys Thr Thr Tyr Asp Pro Asn Asp Leu Phe His Asn Pro Gln Ser Val
450 455 460
Arg Pro Gly Asn Lys Lys Ala Ser Met Thr Gln Glu Phe
465 470 475
<210> 122
<211> 473
<212> PRT
<213> Aspergillus ruber
<400> 122
Met Ser Asn Asn Thr Leu Ile Gln Ala Cys Leu Leu Ala Ala Leu Gly
1 5 10 15
Phe Asn Ser Thr Arg Val Lys Phe Pro Glu Ala Gly Thr Ile Asp Ala
20 25 30
Asp Pro Tyr Asn Leu Asp Leu Pro Ile Val Pro Ala Ala Ile Thr Val
35 40 45
Pro Arg Ser Thr Ala Gln Val Ala Asn Val Val Lys Cys Ala Ala Ser
50 55 60
Asn Gly Tyr Lys Val Gln Ser Arg Ser Gly Gly His Ser Tyr Gly Asn
65 70 75 80
His Gly Leu Gly Gly Thr Asp Gly Ala Ile Val Val Asp Leu Lys Asp
85 90 95
Leu Lys Gln Phe Ser Met Asp Glu Ser Thr Tyr Ile Ala Ser Ile Gly
100 105 110
Ser Gly Met Leu Leu Asp Glu Val Thr His Lys Leu Tyr Asp Asn Gly
115 120 125
Lys Arg Ala Met Ala His Gly Val Cys Pro Gln Val Gly Val Gly Gly
130 135 140
His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg Gln Trp Gly Ser
145 150 155 160
Ser Leu Asp His Val Glu Glu Val Glu Val Val Leu Ala Asn Ser Ser
165 170 175
Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val Leu Phe Ala Ile
180 185 190
Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu Phe Lys Val Arg
195 200 205
Thr Glu Pro Ala Pro Asp Val Ala Val Gln Tyr Thr Tyr Glu Leu Ile
210 215 220
Leu Gly Asn Ile Thr Glu Arg Ala Arg Ile Met Val Asp Trp Gln Asp
225 230 235 240
Phe Ile Ser Asp Pro Asp Leu Ser Arg Lys Phe Ala Ser Ile Met Ile
245 250 255
Val Phe Glu His Gly Met Leu Leu Ser Gly Asp Phe Tyr Gly Ser Lys
260 265 270
Lys Glu Phe Asp Asp Leu Gly Leu Ala Asp Arg Phe Pro Ile Arg Lys
275 280 285
Pro Gly Asn Val Ala Ile Leu Thr Asp Trp Leu Gly Met Thr Gly His
290 295 300
Ala Val Glu Glu Leu Ala Leu Gly Ile Val Gly Gly Ile Pro Leu His
305 310 315 320
Phe Tyr Ala Lys Ser Met Ala Phe Thr Arg Asp Ser Leu Met Ser Pro
325 330 335
Ser Thr Phe Glu Lys Leu Phe Asp Tyr Leu Asp Asn Thr Asp Lys Gly
340 345 350
Thr Leu Leu Trp Leu Ile Tyr Phe Asp Leu Gln Ser Gly Ala Thr Ser
355 360 365
Asp Val Pro Asn Asn Ser Thr Ala Tyr Ala His Arg Asp Thr Leu Tyr
370 375 380
Trp Leu Gln Ser Tyr Val Val Asn Leu Val Gly Pro Val Ser Asn Thr
385 390 395 400
Thr Thr Ala Phe Leu Glu Gly Ile Asn Asn Leu Ile Ala Gln Asp Val
405 410 415
Pro Ser Ala Asn Thr Arg Ala Tyr Pro Gly Tyr Val Asp Pro Leu Met
420 425 430
Pro Asn Pro Gln Trp Arg Tyr Trp Gly Ser Asn Leu Pro Lys Leu Glu
435 440 445
Lys Ile Lys Ala Ala Ile Asp Pro Asn Asp Val Phe His Asn Pro Gln
450 455 460
Ser Val Lys Pro Arg Lys Gln Ala Pro
465 470
<210> 123
<211> 504
<212> PRT
<213> Verruconis gallopava
<400> 123
Met Gly Gln Ser Gln Ala Leu Ser Ala Phe Lys Lys Asp Leu Ala Ala
1 5 10 15
Ala Leu Asn Asn Asp Asp Glu Leu Phe Ala Leu Pro Asp Glu Pro Phe
20 25 30
Tyr Ile Lys Asp His Val Lys Arg Tyr Asn Leu Asp Ile Glu Thr Thr
35 40 45
Pro Leu Ala Val Thr Tyr Pro Lys Thr Thr Ala Gln Val Ser Ser Ile
50 55 60
Val Lys Leu Ala Lys Asp Asn Asn Leu Lys Val Gln Ala Lys Cys Gly
65 70 75 80
Gly His Ser Tyr Ala Asn Phe Cys Asp Pro Asn Gly Gly Ile Ile Val
85 90 95
Asp Leu Lys His Phe Gln Lys Phe Glu Ile Asp Glu Asn Thr Trp Arg
100 105 110
Cys Arg Val Gly Gly Gly Thr Leu Leu Gly Asp Leu Thr Lys Arg Met
115 120 125
Phe Glu Pro His Lys Arg Ala Met Ala His Gly Thr Cys Pro Thr Val
130 135 140
Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Ser Ser Arg
145 150 155 160
Leu Trp Gly Ala Ala Leu Asp His Val Glu Glu Val Glu Met Val Val
165 170 175
Ala Asn Gly Asp Val Ile Arg Ala Asn Glu Asn Glu Asn Ser Asp Ile
180 185 190
Phe Trp Ala Val Lys Gly Ala Gly Ala Ser Phe Gly Val Ile Thr Glu
195 200 205
Phe Val Val Arg Thr Glu Pro Ala Pro Gly Arg Leu Val Gln Tyr Ser
210 215 220
Tyr Ser Phe Thr Thr Gly Ser Trp Lys Asp Met Ala Lys Thr Phe Lys
225 230 235 240
Ala Trp Gln Thr Tyr Val Ser Gln Pro Asp Leu Thr Arg Ser Phe Ala
245 250 255
Ser Thr Ala Thr Ile Thr Glu Leu Gly Leu Thr Ile Ser Val Thr Tyr
260 265 270
Phe Gly Thr Asp Glu Glu Phe Asp Lys Ile Asn Phe Ala Lys Asn Phe
275 280 285
Pro Gly Asn Gln Thr Pro Lys Thr Ile Val Phe Asp Asp Tyr Leu Gly
290 295 300
Ala Val Gly His Trp Ala Glu Asp Val Ala Leu Glu Ile Ile Ser Pro
305 310 315 320
Leu Pro Ala His Ser Tyr Thr Lys Thr Leu Thr Phe Asn His Cys Asn
325 330 335
Gln Ile Pro Asp Ser Val Ile Asp Arg Met Phe Lys Tyr Phe Glu Glu
340 345 350
Val Ser Lys Gly Thr Leu Val Trp Phe Ala Ile Phe Asp Leu Ala Gly
355 360 365
Gly Arg Val Asn Asp Ile Pro Gln Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Ala Leu Phe Tyr Leu Gln Ser Tyr Ala Val Asn Pro Phe Gly Pro
385 390 395 400
Val Ser Asn Lys Ser Lys Gln Phe Leu Gln Gly Leu Asn Lys Val Ile
405 410 415
Arg Asp Gly Met Ala Glu Ala Gly Glu Asn Thr Asp Leu Gly Ala Tyr
420 425 430
Ala Gly Tyr Val Asp Leu Glu Leu Gly Ala Gly Ala Gln Lys Ala Tyr
435 440 445
Trp Arg Thr Asn Leu Pro Arg Leu Glu Ser Ile Lys Leu Lys Trp Asp
450 455 460
Pro Glu Asp Val Phe His Asn Pro Gln Ser Val Arg Pro Gly Gly Asn
465 470 475 480
Asp Val Ile Ser Thr Pro Lys Val Val Tyr Lys Lys Ala Gly Phe Leu
485 490 495
Ala Arg Leu Lys Gly Cys Phe Arg
500
<210> 124
<211> 474
<212> PRT
<213> Aspergillus parasiticus
<400> 124
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala
1 5 10 15
Leu Gly Gly Asn Ala Asp Leu Val Ala Phe Gln Asn Gln Leu Leu Tyr
20 25 30
Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro
35 40 45
Ala Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val
50 55 60
Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly
65 70 75 80
His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val
85 90 95
Val Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr
100 105 110
Glu Ala Val Leu Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr Glu
115 120 125
Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Ile Cys Pro Thr
130 135 140
Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala
145 150 155 160
Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Ile
165 170 175
Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu
180 185 190
Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr
195 200 205
Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr
210 215 220
Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Lys Lys Ala Gln Phe Val
225 230 235 240
Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe
245 250 255
Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu
260 265 270
Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Gly Leu Glu Glu Arg
275 280 285
Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu
290 295 300
Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly
305 310 315 320
Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp
325 330 335
Thr Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Glu
340 345 350
Asn Asn Lys Ala Gly Thr Ser Thr Trp Phe Val Thr Leu Ser Leu Glu
355 360 365
Gly Gly Ala Ile Asn Asp Val Pro Ala Asp Ala Thr Ala Tyr Gly His
370 375 380
Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Ser Pro Thr Gly
385 390 395 400
Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val
405 410 415
Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys
420 425 430
Pro Asp Pro Lys Met Ala Asn Ala Gln Gln Lys Tyr Trp Arg Gln Asn
435 440 445
Leu Pro Arg Leu Glu Glu Leu Lys Ala Ile Leu Asp Pro Lys Asp Thr
450 455 460
Phe His Asn Pro Gln Gly Ile Leu Pro Ala
465 470
<210> 125
<211> 476
<212> PRT
<213> Aspergillus fischerianus
<400> 125
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser
1 5 10 15
Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val
50 55 60
Val Lys Cys Ala Ala Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile
85 90 95
Val Val Glu Met Lys His Phe Asn Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Gly Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Asp Ile Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Asn Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Tyr Phe Gly Ser Lys Glu Glu Tyr Asp Ala Leu Gly Leu Glu Glu
275 280 285
Arg Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro
325 330 335
Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Ser Tyr Ile
340 345 350
His Glu Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu
385 390 395 400
Gly Pro Val Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp
405 410 415
Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Ser
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Glu Leu Asp Pro Lys Asp
450 455 460
Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser
465 470 475
<210> 126
<211> 473
<212> PRT
<213> Aspergillus neoniger
<400> 126
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Gln Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Leu Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Asp Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Ile Pro Ala
465 470
<210> 127
<211> 473
<212> PRT
<213> Aspergillus eucalypticola
<400> 127
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asp Ser Ala Leu Ala Val Phe Pro Asn Gln Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Thr Gly Thr Pro Val Trp Leu Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asp Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Ile Pro Ala
465 470
<210> 128
<211> 482
<212> PRT
<213> Aspergillus ruber
<400> 128
Met Gly Asn Lys Ala Ser Thr Thr Thr Ile Ile Thr Thr Ala Val His
1 5 10 15
Lys Cys Leu Leu Ser Ala Val Asn Gly Asn Ser Ala Gln Val Ser Val
20 25 30
Gln Asn Asp Leu Leu Tyr Gly Val Thr Ala Val His Glu Tyr Asn Leu
35 40 45
Asn Phe Pro Met Thr Pro Ala Ala Val Thr Phe Pro Glu Thr Ser Glu
50 55 60
Gln Val Ala Ala Leu Val Lys Cys Ala Ala Glu Tyr Lys Tyr Lys Val
65 70 75 80
Gln Ala Arg Ser Gly Gly His Ser Phe Gly Asn His Gly Leu Gly Gly
85 90 95
Ala Asp Gly Ala Ile Val Val Asp Met Lys His Phe Gln Gln Phe Ser
100 105 110
Met Asp Asn Glu Thr His Val Ala Thr Ile Gly Pro Gly Leu Ser Leu
115 120 125
Gly Asp Ile Asp Thr Leu Leu Tyr Asn Ala Gly Gly Arg Ala Met Ser
130 135 140
His Gly Ile Cys Pro Glu Ile Arg Ala Gly Gly His Leu Thr Ile Gly
145 150 155 160
Gly Leu Gly Leu Thr Ser Arg Gln Trp Gly Met Ser Leu Asp His Ile
165 170 175
Glu Glu Val Glu Val Val Leu Pro Asn Ser Ser Ile Val Arg Ala Ser
180 185 190
Glu Thr Glu Asn Ala Asp Leu Leu Phe Ala Val Lys Gly Ala Ala Ala
195 200 205
Ser Phe Gly Val Val Thr Glu Phe Lys Val Arg Thr Gln Leu Ala Pro
210 215 220
Lys Glu Ala Ile Gln Tyr Ser Tyr Ser Phe Lys Leu Gly Ser Ala Ala
225 230 235 240
Gln Arg Ala Arg Leu Phe Ala Asp Trp Gln Asp Leu Ala Leu Arg Arg
245 250 255
Asp Leu Ser Arg Lys Phe Thr Ser Asp Phe Ile Cys Leu Gln Asp Ser
260 265 270
Val Ile Val Lys Gly Val Phe Phe Gly Ser Lys Lys Glu Tyr Asn Ala
275 280 285
Leu Arg Ile Glu His His Leu Pro Gly Ser Asp Ser Ser Lys Val Leu
290 295 300
Val Leu Asp Asp Trp Leu Gly Ile Val Thr His Val Val Asp Asp Leu
305 310 315 320
Ala Val Arg Leu Gly Gly Ser Met Ser Thr Tyr Phe Tyr Ala Lys Ser
325 330 335
Leu Gly Phe Thr Arg Asp Thr Leu Met Pro Pro Ser Thr Ile Thr Ser
340 345 350
Leu Phe Thr Tyr Leu Asp Lys Ala Lys Lys Gly Thr Ile Thr Trp Phe
355 360 365
Val Thr Phe Ser Leu Val Gly Gly Ala Ile Asn Asp Tyr Pro Lys Asn
370 375 380
Ala Thr Ala Tyr Pro His Arg Asp Val Ile Tyr Trp Met Gln Ser Phe
385 390 395 400
Ala Ile Asn Ala Leu Gly Pro Val Leu Asn Ser Thr Tyr Asp Phe Leu
405 410 415
Asp Gly Ile Asn Glu Leu Val Ala Arg Asp Leu Pro Gly Cys Ala Gly
420 425 430
His Ala Tyr Leu Gly Cys Pro Asp Pro Arg Met Glu Gly Ala Glu Arg
435 440 445
Ala Tyr Trp Gly Ser Asn Leu Gly Arg Leu Glu Asp Met Lys Gly Val
450 455 460
Phe Asp Pro Val Asp Val Phe Trp Asn Pro Gln Gly Val Gly Val Pro
465 470 475 480
Val Ala
<210> 129
<211> 473
<212> PRT
<213> Aspergillus kawachii
<400> 129
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Gln Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Asp Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Ile Pro Ala
465 470
<210> 130
<211> 474
<212> PRT
<213> Aspergillus oryzae
<400> 130
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala
1 5 10 15
Leu Gly Gly Asn Ala Gly Leu Val Ala Phe Gln Asn Gln Pro Leu Tyr
20 25 30
Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro
35 40 45
Ala Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val
50 55 60
Lys Cys Ala Ser Gln Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly
65 70 75 80
His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val
85 90 95
Val Asp Met Lys Tyr Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr
100 105 110
Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Val Glu
115 120 125
Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr
130 135 140
Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala
145 150 155 160
Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val
165 170 175
Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu
180 185 190
Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr
195 200 205
Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Ile Ala Val Gln Tyr
210 215 220
Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Glu Lys Ala Gln Phe Ile
225 230 235 240
Lys Asp Trp Gln Ser Phe Val Ser Ala Lys Asn Leu Thr Arg Gln Phe
245 250 255
Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu
260 265 270
Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Arg Leu Glu Glu Arg
275 280 285
Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu
290 295 300
Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly
305 310 315 320
Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp
325 330 335
Thr Leu Ile Pro Ser Ser Gly Ile Asp Glu Phe Phe Lys Tyr Ile Glu
340 345 350
Asn Asn Lys Ala Gly Thr Ser Thr Trp Phe Val Thr Leu Ser Leu Glu
355 360 365
Gly Gly Ala Ile Asn Asp Val Pro Ala Asp Ala Thr Ala Tyr Gly His
370 375 380
Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Ser Pro Thr Gly
385 390 395 400
Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val
405 410 415
Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys
420 425 430
Pro Asp Pro Lys Met Ala Asn Ala Gln Gln Lys Tyr Trp Arg Gln Asn
435 440 445
Leu Pro Arg Leu Glu Glu Leu Lys Glu Thr Leu Asp Pro Lys Asp Thr
450 455 460
Phe His Asn Pro Gln Gly Ile Leu Pro Ala
465 470
<210> 131
<211> 483
<212> PRT
<213> Aspergillus flavus
<400> 131
Met Asn Pro Ser Ile Pro Ser Ser Ser Met Gly Asn Thr Thr Ser Ile
1 5 10 15
Ala Gly Arg Asp Cys Leu Val Ser Ala Leu Gly Gly Asn Ala Gly Leu
20 25 30
Val Ala Phe Gln Asn Gln Pro Leu Tyr Gln Thr Thr Ala Val His Glu
35 40 45
Tyr Asn Leu Asn Thr Pro Val Thr Pro Ala Ala Ile Thr Tyr Pro Glu
50 55 60
Thr Ala Glu His Ile Ala Ala Val Val Lys Cys Ala Ser Gln Tyr Asp
65 70 75 80
Tyr Lys Val Gln Ala Arg Ser Gly Gly His Ser Phe Gly Asn Tyr Gly
85 90 95
Leu Gly Gly Thr Asp Gly Ala Val Val Val Asp Met Lys Tyr Phe Asn
100 105 110
Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu Ala Val Ile Gly Pro Gly
115 120 125
Thr Thr Leu Gly Asp Val Asp Val Glu Leu Tyr Asn Asn Gly Lys Arg
130 135 140
Ala Met Ala His Gly Val Cys Pro Thr Ile Ser Thr Gly Gly His Phe
145 150 155 160
Thr Met Gly Gly Leu Gly Pro Thr Ala Arg Gln Trp Gly Leu Ala Leu
165 170 175
Asp His Val Glu Glu Val Glu Val Val Leu Ala Asn Ser Ser Ile Val
180 185 190
Arg Ala Ser Asn Thr Gln Asn Gln Glu Val Phe Phe Ala Val Lys Gly
195 200 205
Ala Ala Ala Ser Phe Gly Ile Val Thr Glu Phe Lys Val Arg Thr Gln
210 215 220
Pro Ala Pro Gly Ile Ala Val Gln Tyr Ser Tyr Thr Phe Asn Leu Gly
225 230 235 240
Ser Ser Ala Glu Lys Ala Gln Phe Ile Lys Asp Trp Gln Ser Phe Val
245 250 255
Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Thr Asn Met Val Ile Phe
260 265 270
Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe Phe Gly Ser Lys Glu Gln
275 280 285
Tyr Glu Ala Leu Gly Leu Glu Glu Arg Phe Val Pro Lys Asn Pro Gly
290 295 300
Asn Ile Leu Val Leu Thr Asp Trp Leu Gly Met Val Gly His Ala Leu
305 310 315 320
Glu Asp Thr Ile Leu Arg Leu Val Gly Asn Thr Pro Thr Trp Phe Tyr
325 330 335
Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr Leu Ile Pro Ser Ser Gly
340 345 350
Ile Asp Glu Phe Phe Glu Tyr Ile Glu Asn Asn Lys Ala Gly Thr Ser
355 360 365
Thr Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val
370 375 380
Pro Ala Asp Ala Thr Ala Tyr Gly His Arg Asp Val Leu Phe Trp Val
385 390 395 400
Gln Ile Phe Met Val Ser Pro Thr Gly Pro Val Ser Ser Thr Thr Tyr
405 410 415
Asp Phe Ala Asp Gly Leu Tyr Asn Val Leu Thr Lys Ala Val Pro Glu
420 425 430
Ser Glu Gly His Ala Tyr Leu Gly Cys Pro Asp Pro Lys Met Ala Asn
435 440 445
Ala Gln Gln Lys Tyr Trp Arg Gln Asn Leu Pro Arg Leu Glu Glu Leu
450 455 460
Lys Glu Thr Leu Asp Pro Lys Asp Thr Phe His Asn Pro Gln Gly Ile
465 470 475 480
Leu Pro Ala
<210> 132
<211> 616
<212> PRT
<213> Aspergillus oryzae
<400> 132
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala
1 5 10 15
Leu Gly Gly Asn Ala Gly Leu Val Ala Phe Gln Asn Gln Pro Leu Tyr
20 25 30
Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro
35 40 45
Ala Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val
50 55 60
Lys Cys Ala Ser Gln Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly
65 70 75 80
His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val
85 90 95
Val Asp Leu Lys Tyr Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr
100 105 110
Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Val Glu
115 120 125
Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr
130 135 140
Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala
145 150 155 160
Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val
165 170 175
Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu
180 185 190
Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr
195 200 205
Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Ile Ala Val Gln Tyr
210 215 220
Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Glu Lys Ala Gln Phe Ile
225 230 235 240
Lys Asp Trp Gln Ser Phe Val Ser Ala Lys Asn Leu Thr Arg Gln Phe
245 250 255
Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu
260 265 270
Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Arg Leu Glu Glu Arg
275 280 285
Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu
290 295 300
Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly
305 310 315 320
Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp
325 330 335
Thr Leu Ile Pro Ser Ser Gly Ile Asp Glu Phe Phe Glu Tyr Ile Glu
340 345 350
Asn Asn Lys Ala Gly Thr Ser Thr Trp Phe Val Thr Leu Ser Leu Glu
355 360 365
Gly Gly Ala Ile Asn Asp Val Pro Ala Asp Ala Thr Ala Tyr Gly His
370 375 380
Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Ser Pro Thr Gly
385 390 395 400
Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val
405 410 415
Leu Thr Lys Val Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys
420 425 430
Pro Asp Pro Lys Met Ala Asn Ala Gln Gln Lys Tyr Trp Arg Gln Asn
435 440 445
Leu Pro Arg Leu Glu Glu Leu Lys Glu Thr Leu Asp Pro Lys Asp Thr
450 455 460
Phe His Asn Pro Gln Gly Val Leu Ile Thr Glu Val Gly Ser Ala Thr
465 470 475 480
Asp Phe Trp Asn Leu Val Glu Ala Ile Ile Leu Ile Ser Gln Leu His
485 490 495
Glu Ser Val Gly Gln Thr Tyr Asn Met Val Pro Glu Met Gly Glu Gln
500 505 510
Pro Val Arg Glu Met Thr Lys Met Phe Arg Met Leu Glu Lys Thr Ile
515 520 525
Gln Val Ser Leu Glu Gly Leu Pro Tyr Glu Glu Trp Leu Asn Arg Leu
530 535 540
Gln Val Glu Asn Asp Asp Asp Pro Leu Arg Pro Leu Leu Pro Met Phe
545 550 555 560
Glu Glu Lys Val Tyr Asp Gly Arg Cys Gln Trp Glu Met Tyr Glu Asn
565 570 575
Met Pro Ile Ser Asp Thr Glu Asn Leu Arg Gln Tyr Leu Gln Asp Val
580 585 590
Pro Glu Leu Ala Thr Cys Pro Phe Leu Asp Gln Asp Ile Phe Lys Lys
595 600 605
Phe Leu Ser Ser Leu Gly Leu Ala
610 615
<210> 133
<400> 133
000
<210> 134
<211> 473
<212> PRT
<213> Aspergillus awamori
<400> 134
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Glu Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Val Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Ile Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Met Pro Ala
465 470
<210> 135
<211> 476
<212> PRT
<213> Aspergillus lentulus
<400> 135
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser
1 5 10 15
Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Glu Glu Ile Ala Ala Val
50 55 60
Val Gln Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile
85 90 95
Val Val Glu Met Lys His Phe Asn Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Asn Ile Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Ala Leu Tyr Asn Ala Gly Tyr Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Asp Ile Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Phe Thr Phe Asn Leu Gln Thr Pro Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Asn Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Lys
275 280 285
Arg Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro
325 330 335
Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Asn Tyr Ile
340 345 350
His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu
385 390 395 400
Gly Pro Val Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp
405 410 415
Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Ser
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Glu Leu Asp Pro Lys Asp
450 455 460
Val Phe His Asn Pro Gln Gly Val Met Val Val Ser
465 470 475
<210> 136
<211> 473
<212> PRT
<213> Aspergillus turcosus
<400> 136
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Ile Ser
1 5 10 15
Ala Val Gly Ala Ala Asn Val Ala Phe Gln Asp Gln Leu Leu Tyr Gln
20 25 30
Ala Thr Ala Val Gln Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala
35 40 45
Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val Val Lys
50 55 60
Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asp Gly Ala Ile Val Ile
85 90 95
Glu Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Ile
100 105 110
Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr Asp Leu
115 120 125
Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile
130 135 140
Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln Asp Leu
180 185 190
Phe Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Met Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe His Leu Gly Thr Ser Ala Glu Lys Ala Lys Phe Val Lys
225 230 235 240
Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Thr Trp Lys Phe Tyr
245 250 255
Thr Asn Leu Val Ile Phe Asp Asp Gln Ile Ile Leu Glu Gly Ile Tyr
260 265 270
Phe Gly Thr Lys Glu Glu Tyr Asp Ser Leu Gly Leu Glu Gln Arg Phe
275 280 285
Pro Pro Thr Asp Ala Gly Thr Val Leu Ile Leu Thr Asp Trp Leu Ala
290 295 300
Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Arg Ala
325 330 335
Leu Ile Pro Asp Ser Ala Ile Asp Glu Phe Phe Asp Tyr Ile His Glu
340 345 350
Asn Asn Pro Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Ala Val Pro Glu Asp Ala Thr Ala Tyr Gly His Arg
370 375 380
Asp Val Leu Phe Trp Phe Gln Leu Phe Val Ile Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Gln Ala Val Pro Glu Ser Val Ser His Ala Tyr Met Gly Cys Pro
420 425 430
Asp Pro Arg Leu Pro Asn Ala Gln Tyr Ala Tyr Trp Arg Ser Asn Leu
435 440 445
Pro Lys Leu Glu Glu Leu Lys Gly Ile Leu Asp Pro Glu Asp Ile Phe
450 455 460
His Asn Pro Gln Gly Val Val Pro Ser
465 470
<210> 137
<211> 496
<212> PRT
<213> Aspergillus welwitschiae
<400> 137
Met Leu Ser Thr Met Ala Phe Ser Phe Val Leu Arg Ile Leu Ser Pro
1 5 10 15
Leu Phe Leu Ile Leu Gln Leu Ser Thr Ala Ala Ser Thr Ser Thr Leu
20 25 30
Arg Gln Cys Leu Leu Thr Ala Val Gln Asn Asp Pro Thr Leu Val Ala
35 40 45
Val Asp Gly Asp Leu Leu Tyr Gln Thr Leu Ala Val Gln Val Tyr Asn
50 55 60
Leu Asn Trp Pro Val Thr Pro Ala Ala Val Ala Phe Pro Lys Ser Thr
65 70 75 80
Gln Gln Val Ala Ser Ile Val Asn Cys Ala Ala Ser Leu Gly Tyr Lys
85 90 95
Val Gln Ala Lys Ser Gly Gly His Ser Tyr Gly Asn Tyr Gly Leu Gly
100 105 110
Gly Thr Asn Gly Ala Ile Ser Ile Asn Leu Lys Asn Met Lys Ser Phe
115 120 125
Ser Met Asn Tyr Thr Asn Tyr Gln Ala Thr Val Gly Ala Gly Met Leu
130 135 140
Asn Gly Glu Leu Asp Glu Tyr Leu His Asn Ala Gly Gly Arg Ala Val
145 150 155 160
Ala His Gly Thr Ser Pro Gln Ile Gly Val Gly Gly His Ala Thr Ile
165 170 175
Gly Gly Leu Gly Pro Ser Ala Arg Gln Tyr Gly Met Glu Leu Asp His
180 185 190
Val Leu Glu Ala Glu Val Val Leu Ala Asn Gly Thr Val Val Arg Ala
195 200 205
Ser Ser Thr Gln Asn Ser Asp Leu Leu Phe Ala Ile Lys Gly Ala Gly
210 215 220
Ala Ser Phe Gly Val Val Thr Glu Phe Val Phe Arg Thr Glu Pro Glu
225 230 235 240
Pro Gly Ser Ala Val Gln Tyr Thr Phe Thr Phe Gly Leu Gly Ser Thr
245 250 255
Ser Ala Arg Ala Asp Leu Phe Lys Lys Trp Gln Ser Phe Ile Ser Gln
260 265 270
Pro Asp Leu Thr Arg Lys Phe Ala Ser Ile Cys Thr Leu Leu Asp His
275 280 285
Val Leu Val Ile Ser Gly Thr Phe Phe Gly Thr Lys Glu Glu Tyr Asp
290 295 300
Ala Leu Gly Leu Glu Asp Gln Phe Pro Gly His Thr Asn Ser Thr Val
305 310 315 320
Ile Val Phe Thr Asp Trp Leu Gly Leu Val Ala Gln Trp Ala Glu Gln
325 330 335
Ser Ile Leu Asp Leu Thr Gly Asp Ile Pro Ala Asp Phe Tyr Ala Arg
340 345 350
Cys Leu Ser Phe Thr Glu Lys Thr Leu Ile Pro Ser Asn Gly Val Asp
355 360 365
Gln Leu Phe Glu Tyr Leu Asp Ser Ala Asp Thr Gly Ala Leu Leu Trp
370 375 380
Phe Val Ile Phe Asp Leu Glu Gly Gly Ala Ile Asn Asp Val Pro Met
385 390 395 400
Asp Ala Thr Gly Tyr Ala His Arg Asp Thr Leu Phe Trp Leu Gln Ser
405 410 415
Tyr Ala Ile Thr Leu Gly Ser Val Ser Glu Thr Thr Tyr Asp Phe Leu
420 425 430
Asp Ser Val Asn Glu Ile Ile Arg Asn Asn Thr Pro Gly Leu Gly Asn
435 440 445
Gly Val Tyr Pro Gly Tyr Val Asp Pro Arg Leu Glu Asn Ala Arg Glu
450 455 460
Ala Tyr Trp Gly Ser Asn Leu Pro Arg Leu Met Gln Ile Lys Ser Leu
465 470 475 480
Tyr Asp Pro Thr Asp Leu Phe His Asn Pro Gln Gly Val Leu Pro Ala
485 490 495
<210> 138
<211> 473
<212> PRT
<213> Aspergillus niger
<400> 138
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val Gly Pro
385 390 395 400
Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Met Pro Ala
465 470
<210> 139
<211> 492
<212> PRT
<213> Fusarium floridanum
<400> 139
Met Arg Ser Gln Leu Leu His Gly Leu Ile Gly Leu Val Ala Leu Val
1 5 10 15
Ser Pro Ser Phe Ala Val Pro Thr Lys Arg Glu Ala Val Thr Ser Cys
20 25 30
Leu Thr Asn Ala Lys Val Pro Ile Asp Ala Lys Gly Ser Gln Thr Trp
35 40 45
Thr Gln Asp Gly Thr Ala Tyr Asn Leu Arg Leu Gln Phe Glu Pro Ile
50 55 60
Ala Ile Ala Val Pro Thr Thr Val Ala Gln Ile Ser Ala Ala Val Ala
65 70 75 80
Cys Gly Ser Lys His Gly Val Ser Val Ser Gly Lys Ser Gly Gly His
85 90 95
Ser Tyr Thr Ser Leu Gly Leu Gly Gly Glu Asp Gly His Leu Val Ile
100 105 110
Glu Leu Asp Arg Leu Tyr Ser Val Lys Leu Ala Lys Asp Gly Thr Ala
115 120 125
Lys Ile Gln Pro Gly Ala Arg Leu Gly His Val Ala Thr Glu Leu Tyr
130 135 140
Asn Gln Gly Lys Arg Ala Leu Ser His Gly Thr Cys Thr Gly Val Gly
145 150 155 160
Leu Gly Gly His Ala Leu His Gly Gly Tyr Gly Met Val Ser Arg Lys
165 170 175
His Gly Leu Thr Leu Asp Ser Ile Ile Gly Ala Thr Val Val Leu Tyr
180 185 190
Asp Gly Lys Val Val His Cys Ser Lys Thr Glu Arg Ser Asp Leu Phe
195 200 205
Trp Ala Ile Arg Gly Ala Gly Ala Ser Phe Gly Ile Val Ala Glu Leu
210 215 220
Glu Phe Asn Thr Phe Pro Ala Pro Glu Gln Met Thr Tyr Phe Asp Ile
225 230 235 240
Gly Leu Asn Trp Asp Gln Asn Thr Ala Ala Gln Gly Leu Trp Glu Phe
245 250 255
Gln Glu Phe Gly Lys Thr Met Pro Ser Glu Ile Thr Met Gln Ile Ala
260 265 270
Ile Arg Lys Asp Gly Tyr Ser Ile Asp Gly Ala Tyr Ile Gly Asp Glu
275 280 285
Ala Gly Leu Arg Lys Ala Leu Gln Pro Leu Leu Ser Lys Leu Asn Val
290 295 300
Gln Val Ser Ala Ser Thr Val Ser Trp Met Gly Leu Val Thr His Phe
305 310 315 320
Ala Gly Thr Ala Glu Ile Asn Pro Thr Ser Ala Ser Tyr Asp Ala His
325 330 335
Asp Thr Phe Tyr Ala Thr Ser Leu Thr Thr Arg Glu Leu Ser Leu Glu
340 345 350
Gln Phe Lys Ser Phe Val Asn Ser Ile Ser Thr Thr Gly Lys Ser Ser
355 360 365
Ser His Ser Trp Trp Val Gln Met Asp Ile Gln Gly Gly Lys Tyr Ser
370 375 380
Ala Val Ala Lys Pro Lys Pro Thr Asp Met Ala Tyr Val His Arg Asp
385 390 395 400
Ala Leu Leu Leu Phe Gln Phe Tyr Asp Ser Val Pro Gln Gly Gln Thr
405 410 415
Tyr Pro Ser Asp Gly Phe Ser Leu Leu Thr Thr Leu Arg Gln Ser Ile
420 425 430
Ser Lys Ser Leu Arg Ala Gly Thr Trp Gly Met Tyr Ala Asn Tyr Pro
435 440 445
Asp Ser Gln Leu Lys Ala Asp Arg Ala Ala Glu Met Tyr Trp Gly Ser
450 455 460
Asn Leu Pro Arg Leu Gln Lys Ile Lys Ala Ala Tyr Asp Pro Lys Asn
465 470 475 480
Ile Phe Arg Asn Pro Gln Ser Val Lys Pro Lys Ala
485 490
<210> 140
<211> 475
<212> PRT
<213> Paecilomyces variotii
<400> 140
Met Gly Asn Thr Thr Ser Thr Ser Ala Gly Gln Cys Leu Leu Ser Ala
1 5 10 15
Val Gly Gly Asn Pro Ala Leu Val Ala Phe Gln Asn Ala Pro Leu Tyr
20 25 30
Gln Ala Val Asp Val Arg Pro Tyr Asn Leu Asp Val Pro Val Thr Pro
35 40 45
Val Ala Val Thr Thr Pro Glu Thr Val Asp Gln Val Ala Ser Ile Val
50 55 60
Lys Cys Ala Ala Asp Ala Gly Tyr Lys Val Gln Pro Lys Ser Gly Gly
65 70 75 80
His Ser Tyr Gly Asn Tyr Gly Leu Gly Gly Val Asp Gly Glu Val Val
85 90 95
Val Asp Leu Lys Asn Phe Gln Gln Phe Ser Met Asn Asn Glu Thr Trp
100 105 110
Arg Ala Thr Ile Gly Ala Gly Thr Leu Leu Gly Asp Val Thr Thr Arg
115 120 125
Leu Tyr Asn Ala Gly Gly Arg Ala Met Ala His Gly Thr Cys Pro Gln
130 135 140
Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Thr Ser
145 150 155 160
Arg Leu Trp Gly Ala Ala Leu Asp His Ile Glu Glu Val Gln Val Val
165 170 175
Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Gln Thr Glu Asn Pro Asp
180 185 190
Leu Leu Phe Ala Leu Lys Gly Ala Gly Ala Ser Phe Gly Ile Ile Thr
195 200 205
Glu Phe Thr Val Arg Thr Glu Pro Ala Pro Gly Glu Ala Val Gln Tyr
210 215 220
Ser Tyr Thr Phe Asn Phe Gly Asp Asn Ala Ser Lys Ala Lys Thr Phe
225 230 235 240
Lys Asp Trp Gln Ala Phe Val Ser Thr Pro Asn Leu Asn Arg Lys Phe
245 250 255
Ala Ala Thr Met Thr Val Leu Glu Asp Ala Ile Val Ala Ser Gly Thr
260 265 270
Phe Phe Gly Thr Lys Glu Glu Phe Asp Ala Phe Glu Leu Glu Ser His
275 280 285
Phe Pro Glu Asn Gln Gly Ser Asn Val Thr Val Val Gln Asp Trp Leu
290 295 300
Gly Leu Val Ala Asp Trp Ala Glu Asp Ala Ala Leu Glu Gly Gly Gly
305 310 315 320
Gly Val Pro Ser Ala Phe Tyr Ala Lys Ser Leu Asn Phe Ser Pro Asp
325 330 335
Thr Leu Ile Pro Asn Asp Thr Ile Asp Asp Met Phe Asp Tyr Phe Ser
340 345 350
Thr Thr Glu Lys Asp Ala Leu Leu Trp Phe Ala Ile Phe Asp Leu Ser
355 360 365
Gly Gly Ala Val Ser Asp Val Pro Val His Ser Thr Ser Tyr Thr His
370 375 380
Arg Asp Thr Leu Phe Trp Leu Gln Ser Tyr Ala Ile Ser Val Gly Pro
385 390 395 400
Val Ser Asn Thr Thr Ile Gln Phe Leu Asp Gly Leu Ser Asn Leu Leu
405 410 415
Thr Ser Ser Gln Pro Glu Val His Phe Gly Ala Tyr Pro Gly Tyr Val
420 425 430
Asp Pro Lys Leu Pro Asp Gly Gln Leu Ala Tyr Trp Gly Ser Asn Leu
435 440 445
Pro Lys Leu Glu Gln Ile Lys Ala Glu Val Asp Pro Asn Asp Val Phe
450 455 460
His Asn Pro Gln Ser Val Lys Pro Ala Lys Gln
465 470 475
<210> 141
<211> 704
<212> PRT
<213> Verticillium longisporum
<400> 141
Met Ala Gln Pro Pro Ser Ser Ala Phe Ala Thr Cys Leu Asn Asp Val
1 5 10 15
Cys Gly Gly Arg Ser Gly Cys Val Gly Tyr Pro Ser Asp Ile Leu Tyr
20 25 30
Gln Ile Asn Trp Val Asp Arg Tyr Asn Leu Asp Ile Asn Leu Glu Pro
35 40 45
Ala Ala Val Thr Lys Pro Glu Ile Thr Glu Asp Val Ala Ala Phe Ile
50 55 60
Lys Cys Ala Ser Glu Asn Asn Val Lys Val Gln Ala Arg Ser Gly Gly
65 70 75 80
His Ser Tyr Ala Asn His Gly Leu Gly Gly Glu Asp Gly Ala Leu Val
85 90 95
Ile Asp Leu Glu Asn Phe Gln His Phe Ser Met Asn Trp Asp Asn Trp
100 105 110
Gln Ala Thr Ile Gly Ala Gly His Lys Leu His Asp Val Thr Glu Lys
115 120 125
Leu His Asp Asn Gly Gly Arg Ala Ile Ser His Gly Thr Cys Pro Gly
130 135 140
Val Gly Leu Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Ser Ser
145 150 155 160
Arg Met Trp Gly Ser Cys Leu Asp His Val Val Glu Val Glu Val Val
165 170 175
Thr Ala Asp Gly Lys Ile Gln Arg Ala Ser Glu Asp Glu Asn Ser Asp
180 185 190
Leu Phe Phe Ala Leu Lys Gly Ala Gly Ala Ser Phe Gly Ile Ile Thr
195 200 205
Glu Phe Val Met Arg Thr Asn Glu Glu Pro Gly Asp Val Val Glu Tyr
210 215 220
Thr Phe Ser Leu Thr Phe Ser Arg His Arg Asp Leu Ser Pro Val Phe
225 230 235 240
Glu Ala Trp Gln Asn Leu Ile Ser Asp Pro Asp Leu Asp Arg Arg Phe
245 250 255
Gly Ser Glu Phe Val Met His Glu Leu Gly Ala Ile Ile Thr Gly Thr
260 265 270
Phe Phe Gly Thr Glu Glu Glu Phe Glu Ala Thr Gly Ile Pro Asp Arg
275 280 285
Ile Pro Thr Gly Lys Lys Ser Ile Val Val Asn Asp Trp Leu Gly Ser
290 295 300
Val Ala Gln Gln Ala Gln Asp Ala Ala Leu Trp Leu Ser Asp Leu Ser
305 310 315 320
Thr Ala Phe Thr Ala Lys Ser Leu Ala Phe Thr Lys Asp Gln Leu Leu
325 330 335
Ser Ser Glu Ser Ile Met Asp Leu Met Asp Tyr Ile Asp Asp Ala Asn
340 345 350
Arg Gly Thr Leu Ile Trp Phe Leu Ile Phe Asp Val Thr Gly Gly Arg
355 360 365
Ile Asn Asp Val Pro Met Asn Ala Thr Ala Tyr Arg His Arg Asp Lys
370 375 380
Val Met Phe Cys Gln Gly Tyr Gly Ile Gly Ile Pro Thr Leu Asn Gly
385 390 395 400
Arg Thr Arg Glu Phe Ile Glu Gly Ile Asn Ser Leu Ile Arg Ser Ser
405 410 415
Val Pro Thr Asn Leu Ser Thr Tyr Ala Gly Tyr Val Asp Ala Ser Leu
420 425 430
Glu Ser Pro Gln Asp Ser Tyr Trp Gly Pro Asn Leu Asp Ala Leu Gly
435 440 445
Gln Val Lys Glu Asp Trp Asp Pro Ser Asp Leu Phe Ser Asn Pro Gln
450 455 460
Ser Val Arg Pro Gly Gln Lys Ser Val Val Asp Tyr Phe Asp Asn Arg
465 470 475 480
Ala Ser Ser Asn Gly Ser Glu Asp Ser Ser Gly Gly Ser Asn Gly Gly
485 490 495
Thr Arg Asp Glu Gln Gly Gly Cys Trp Ser Trp Arg Arg Ser Gly Pro
500 505 510
Ala Phe Ala Val Phe Val Ala Leu Phe Val Gly Phe Pro Thr Pro Gln
515 520 525
Thr Ser Trp Val Gln Lys Gln Asn Leu Arg Asp Pro Ala Leu Asp Leu
530 535 540
Thr Asp Ala Glu Ser Pro Ser Arg Thr Pro Val Val Asn Pro Asn Thr
545 550 555 560
Leu Thr Thr Asp Thr Met Ala Lys Leu Ser Arg Gly Ala Pro Gly Gly
565 570 575
Lys Leu Lys Met Thr Leu Gly Leu Pro Val Gly Ala Val Met Asn Cys
580 585 590
Ala Asp Asn Ser Gly Ala Arg Asn Leu Tyr Ile Ile Ser Val Lys Gly
595 600 605
Ile Gly Ala Arg Leu Asn Arg Leu Pro Ala Gly Gly Val Gly Asp Met
610 615 620
Val Met Ala Thr Val Lys Lys Gly Lys Pro Glu Leu Arg Lys Lys Val
625 630 635 640
His Pro Ala Val Ile Val Arg Gln Ser Lys Pro Trp Lys Arg Phe Asp
645 650 655
Gly Val Phe Leu Tyr Phe Glu Asp Asn Ala Gly Val Ile Val Asn Pro
660 665 670
Lys Gly Glu Met Lys Gly Ser Ala Ile Thr Gly Pro Val Gly Lys Glu
675 680 685
Ala Ala Glu Leu Trp Pro Arg Ile Ala Ser Asn Ser Gly Val Val Met
690 695 700
<210> 142
<211> 486
<212> PRT
<213> Penicillium antarcticum
<400> 142
Met Gly Asn Ser Ala Ser Val Ala Gly Arg Ala Cys Phe Val Ala Ala
1 5 10 15
Val Gly His Asp Pro Asn Leu Val Thr Phe Arg Gly Asp Leu Leu Tyr
20 25 30
Glu Phe Arg Ile Gln Pro Ser Tyr Asn Leu Ala Ile Pro Val His Pro
35 40 45
Thr Val Val Thr Tyr Pro Lys Thr Thr Ala Gln Val Ala Glu Ile Val
50 55 60
Ser Cys Ala Ala Ala Gln Asn Tyr Lys Met Gln Ala Tyr Ser Gly Gly
65 70 75 80
His Ser Tyr Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly His Val Val
85 90 95
Val Asp Leu Lys Asn Phe Gln Asp Phe Thr Met Asp Pro Asp Thr His
100 105 110
Val Ala Thr Ile Gly Ala Gly Thr Ser Leu Gly Asp Leu Gln Asp Arg
115 120 125
Leu Trp His Ala Gly Gly Arg Ala Met Ala His Gly Ser Cys Pro Gln
130 135 140
Val Gly Val Gly Gly His Phe Thr Ile Gly Gly Leu Gly Met Met Ser
145 150 155 160
Arg Gln Trp Gly Met Ser Leu Asp His Val Val Glu Ala Gln Val Val
165 170 175
Leu Ala Asn Ser Ser Val Val Thr Ala Ser Asp Thr Gln Asn Gln Asp
180 185 190
Ile Phe Trp Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr
195 200 205
Lys Phe Lys Val Arg Thr His Gly Val Pro Lys Ala Ala Ile Gln Tyr
210 215 220
Gln Tyr Thr Phe Ser Gln Gly Asp Val Leu Asp Lys Val Lys Leu Phe
225 230 235 240
Met Ala Trp Gln Asn Ile Val Ala Lys Pro Asn Leu Thr Arg Asn Phe
245 250 255
Ser Thr Glu Leu Thr Ile Phe Gln Asp Gly Ile Met Ile Met Gly Ser
260 265 270
Phe Phe Gly Thr Arg Asp Glu Phe His Lys Phe Glu Leu Glu Asn Asp
275 280 285
Leu Pro Leu Gln Gly Leu Gly Asn Val Ala Tyr Ile Thr Asn Trp Leu
290 295 300
Ser Leu Val Ala His Thr Ala Glu Asp Tyr Leu Leu Arg Leu Thr Gly
305 310 315 320
Asn Val Leu Thr Ser Phe Tyr Ala Lys Ser Leu Ser Phe Thr Ala Asp
325 330 335
Glu Leu Phe Asn Glu Gln Gly Leu Val Thr Leu Phe Thr Tyr Leu Asp
340 345 350
Ala Ala Pro Lys Gly Thr Pro Thr Trp Trp Val Ile Phe Asp Leu Glu
355 360 365
Gly Gly Ala Thr Asn Asp Val Pro Val Asn Ala Thr Ser Tyr Ala His
370 375 380
Arg Asp Ala Ile Met Trp Met Gln Ser Tyr Ala Val Ala Gly Phe Glu
385 390 395 400
Pro Pro Gly Phe Ile Ile Lys Arg Phe Leu Asn Arg Leu His Gly Val
405 410 415
Val Ile Gly Asn Arg Ala Pro Gly Ala Val Arg Ser Tyr Pro Gly Tyr
420 425 430
Val Asp Pro Tyr Leu Arg Asn Ala Gln Glu Thr Tyr Trp Gly Pro Asn
435 440 445
Leu Ala Arg Leu Gln Asp Ile Lys Thr Ala Val Asp Pro Asp Asp Val
450 455 460
Phe His Asn Pro Gln Ser Val Lys Val Asn Ser Leu Ser Pro Pro Asp
465 470 475 480
Pro Gly Ser His Asp Val
485
<210> 143
<211> 473
<212> PRT
<213> Unknown
<220>
<223> Monosporascus sp. mg162
<400> 143
Met Gly Gln Thr Pro Ser Ser Pro Leu Ala Asp Cys Leu Asn Ala Val
1 5 10 15
Cys Asn Gly Arg Asp Asn Cys Val Ala Phe Pro Ser Ala Pro Leu Tyr
20 25 30
Gln Ile Ser Trp Val Asp Arg Tyr Asn Leu Asp Ile Glu Val Glu Pro
35 40 45
Ile Ala Val Thr Arg Pro Glu Thr Ala Glu Asp Val Ser Gly Phe Val
50 55 60
Lys Cys Ala Ala Ala His Asn Ile Lys Val Gln Ala Lys Ser Gly Gly
65 70 75 80
His Ser Tyr Ala Asn Tyr Gly Leu Gly Gly Glu Asp Gly Glu Leu Val
85 90 95
Val Asp Leu Arg Asn Phe Gln Asp Phe Ser Ile Asp Thr Asn Thr Trp
100 105 110
Gln Ala Thr Phe Gly Ala Gly His Lys Leu Asp Asp Val Thr Glu Lys
115 120 125
Leu His Lys Asn Gly Lys Arg Ala Ile Ser His Gly Thr Cys Pro Gly
130 135 140
Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Glu Ser
145 150 155 160
Arg Met Trp Gly Ser Cys Leu Asp His Val Ile Gly Val Glu Val Val
165 170 175
Thr Ala Asp Gly Ser Ile Val His Ala Ser Asp Thr Glu Asn Ser Asp
180 185 190
Leu Phe Phe Ala Leu Lys Gly Ala Gly Ala Ser Phe Gly Ile Val Thr
195 200 205
Ser Phe Val Val Lys Thr Arg Pro Glu Pro Gly Ser Val Val Gln Tyr
210 215 220
Ser Tyr Ser Val Thr Phe Ala Lys His Ala Asp Leu Ser Pro Val Phe
225 230 235 240
Arg Gln Trp Gln Glu Leu Val Met Asp Pro Gly Leu Asp Arg Arg Phe
245 250 255
Gly Thr Glu Phe Thr Met His Glu Leu Gly Val Ile Ile Ser Gly Thr
260 265 270
Phe Tyr Gly Thr Asp Glu Glu Phe Gln Ala Thr Gly Ile Pro Asp Arg
275 280 285
Ile Pro Lys Gly Lys Ile Ser Val Val Phe Asp Asp Trp Met Ala Val
290 295 300
Ile Ala Lys His Ala Glu Glu Ala Ala Leu Ser Leu Ser Ser Ile Ser
305 310 315 320
Ser Ala Phe Thr Ala Arg Ser Leu Ala Phe Arg Arg Glu Asp Lys Ile
325 330 335
Ser Pro Glu Thr Ile Thr Asn Leu Met Asn Tyr Ile Asp Ser Ala Asp
340 345 350
Arg Gly Thr Leu Val Trp Phe Leu Ile Phe Asp Ala Thr Gly Gly Ala
355 360 365
Ile Ser Asp Val Pro Thr Asn Ala Thr Ala Tyr Ser His Arg Asp Lys
370 375 380
Val Met Tyr Cys Gln Gly Tyr Gly Val Gly Ile Pro Thr Leu Asn Gln
385 390 395 400
Gln Thr Lys Asp Phe Leu Ser Gly Ile Ile Asn Thr Ile Gln Ser Gly
405 410 415
Ala Gly Asn Thr Leu Thr Thr Tyr Pro Gly Tyr Val Asp Pro Ala Leu
420 425 430
Thr Asn Pro Gln Glu Ser Tyr Trp Gly Pro Asn Ile Asp Thr Leu Arg
435 440 445
Ala Ile Lys Ser Gln Trp Asp Pro Asn Asp Ile Phe His Asn Pro Gln
450 455 460
Ser Val Arg Pro Ala Ala Val Ala Ala
465 470
<210> 144
<211> 506
<212> PRT
<213> Amanita muscaria
<400> 144
Met Leu Lys Thr Ile Ala Ala Val Val Phe Ile Cys Ser Gln Ala Phe
1 5 10 15
Leu Val Arg Ala Asp Leu Lys Ser Glu Leu Thr Ala Leu Gly Val Gly
20 25 30
Ala Val Phe Pro Gly Asp Ser Val Tyr Thr Ser Asp Ala Lys Pro Tyr
35 40 45
Asn Leu Arg Phe Asp Phe Lys Pro Ala Ala Ile Thr Phe Pro Asn Thr
50 55 60
Pro Ala Asp Val Ser Gln Ile Val Gln Ile Ala Gly Lys Tyr Ala His
65 70 75 80
Lys Val Ala Pro Arg Gly Gly Gly His Ser Tyr Ile Ser Asn Gly Val
85 90 95
Gly Gly Met Asp Asn Ser Ile Ile Ala Asp Met Ser His Phe Lys Ser
100 105 110
Ile Val Val His Thr Asn Asn Asp Thr Ala Thr Ile Glu Thr Gly Asn
115 120 125
Arg Leu Gly Asp Ile Ala Leu Ala Leu Phe Gln Tyr Gly Arg Gly Met
130 135 140
Pro His Gly Ala Cys Pro Tyr Val Gly Ile Gly Gly His Ala Asn Phe
145 150 155 160
Gly Gly Phe Gly Phe Ile Ser Arg Ser Trp Gly Leu Thr Leu Asp Val
165 170 175
Val Glu Ala Ile Asp Leu Val Leu Ala Asn Gly Thr Ile Thr Thr Val
180 185 190
Ser Ala Thr Gln Asn Pro Asp Leu Tyr Trp Ala Met Arg Gly Ser Gly
195 200 205
Ser Ser Phe Gly Ile Thr Thr Ala Ile His Val Arg Thr Phe Ser Ala
210 215 220
Pro Ala Ser Gly Ile Ile Ala Leu Asp Thr Trp Tyr Leu Asn Leu Glu
225 230 235 240
Gln Ala Val Arg Ala Leu Ser Ser Phe Gln Asp Phe Ala His Asn Thr
245 250 255
Val Thr Leu Pro Ser Tyr Phe Gly Gly Glu Phe Val Val Asn Ala Gly
260 265 270
Pro Ser Pro Gly Leu Leu Ser Ile Thr Phe Phe Ser Gly Phe Trp Gly
275 280 285
Pro Pro Asn Gln Tyr Asn Ser Thr Leu Ala Pro Trp Lys Asn Ser Met
290 295 300
Pro Phe Pro Pro Asn Thr Thr Ser Tyr Ser Gln Gly Asn Tyr Ile Glu
305 310 315 320
Ser Leu Ser Ala Arg Phe Gly Gly Ala Pro Leu Asp Thr Ser Leu Gly
325 330 335
Pro Asp Asn Thr Asp Thr Phe Tyr Val Lys Ser Leu Ile Val Pro Gln
340 345 350
Val Thr Ile Ser Asp Glu Gly Ala Gln Val Gly Ile Ser Asp Lys Ala
355 360 365
Trp Arg Ala Leu Phe Gln Tyr Leu Ile Asn Glu Gln Pro Asn Leu Pro
370 375 380
Val Asp Trp Phe Ile Glu Val Glu Leu Trp Gly Gly Gln Asn Ser Ala
385 390 395 400
Ile Asn Ala Val Pro Gln Ala Ser Thr Ala Phe Ala Tyr Arg Asp Leu
405 410 415
Leu Trp Thr Leu Gln Met Tyr Ser Tyr Thr Pro Asn His Gln Pro Pro
420 425 430
Tyr Pro Asp Ala Gly Phe Ala Phe Asn Asp Gly Met Ala Asn Ser Ile
435 440 445
Ile His Asn Met Pro Asn Gly Trp Asn Tyr Gly Ala Tyr Thr Asn Tyr
450 455 460
Val Asp Asn Arg Leu Asp Asp Trp Gln Arg Leu Tyr Tyr Ala Asn His
465 470 475 480
Tyr Pro Ala Leu Gln Ala Leu Lys Ser Arg Tyr Asp Pro Ser Asp Thr
485 490 495
Phe Ser Phe Pro Thr Ser Ile Glu Leu Leu
500 505
<210> 145
<211> 988
<212> PRT
<213> Aspergillus niger
<400> 145
Met Thr Thr Asn Gly Ile Gln Pro Gly His Val Gly Asn Leu Thr Gln
1 5 10 15
Asp Gln Glu Ala Lys Leu Gln Gln Leu Trp Ser Ile Val Leu Thr Leu
20 25 30
Leu Asp Val Lys Ser Leu Gln Gly Gly Asp Thr Ser Ala Gln Thr Gln
35 40 45
Pro Asp Gln Arg Pro Ser Thr Ser Leu Ser Arg Ala Asp Thr Val Val
50 55 60
Ser Ala His Gly Gln Thr Ala Phe Thr Glu Asp Leu Ser Gln Val Leu
65 70 75 80
Arg Glu Asn Gly Met Ser Asn Pro Asp Ile Lys Ser Val Arg Glu Ser
85 90 95
Leu Ser Asn Thr Ser Ile Asp Glu Leu Arg Ser Gly Leu Leu Tyr Thr
100 105 110
Ala Lys His Asp Ser Pro Asp Val Leu Leu Leu Arg Phe Leu Arg Ala
115 120 125
Arg Lys Trp Asp Val Gly Lys Ala Phe Gly Met Met Leu Arg Ala Leu
130 135 140
Val Trp Arg Lys Asp Gln His Val Asp Asp Lys Val Ile Ala Asn Pro
145 150 155 160
Glu Leu Ala Ala Leu Val Thr Ser Gln Asn Thr Val Asp Thr His Ala
165 170 175
Ala Lys Glu Cys Lys Asp Phe Leu Asp Gln Met Arg Met Gly Lys Cys
180 185 190
Tyr Met His Gly Thr Asp Arg Asp Gly Arg Pro Val Leu Val Val Arg
195 200 205
Val Arg Phe His Gln Pro Ser Lys Gln Ser Glu Ala Val Ile Asn Arg
210 215 220
Phe Ile Leu His Thr Ile Glu Thr Ala Arg Leu Leu Leu Ala Pro Pro
225 230 235 240
Gln Glu Thr Val Thr Ile Ile Phe Asp Met Thr Gly Phe Gly Leu Ser
245 250 255
Asn Met Glu Tyr Ala Pro Val Lys Phe Ile Ile Glu Cys Phe Gln Glu
260 265 270
Asn Tyr Pro Glu Ser Leu Gly Tyr Met Leu Ile His Asn Ala Pro Trp
275 280 285
Val Phe Ser Gly Ile Trp Lys Ile Ile Lys Gly Trp Met Asp Pro Val
290 295 300
Ile Val Ser Lys Val Asn Phe Thr Asn Lys Val Ser Asp Leu Glu Lys
305 310 315 320
Phe Ile Ala Pro Glu Gln Ile Val Lys Glu Leu Lys Gly Lys Glu Asp
325 330 335
Trp Thr Tyr Glu Tyr Val Glu Pro Val Ala Gly Glu Asn Glu Leu Met
340 345 350
Ala Asp Thr Glu Thr Arg Asp Arg Ile Tyr Ala Glu Arg Leu Lys Ile
355 360 365
Gly Glu Glu Leu Leu Leu Arg Thr Ser Glu Trp Val Ser Thr Ser Gln
370 375 380
Arg Lys Asp Ala Ala Ala Thr Thr Thr Ala Arg Glu Gln Arg Ser Glu
385 390 395 400
Thr Ile Glu Ser Leu Arg Gln Asn Tyr Trp Gln Leu Asp Pro Tyr Val
405 410 415
Arg Gly Arg Thr Phe Leu Asp Arg Thr Gly Val Val Lys Pro Gly Gly
420 425 430
Lys Ile Asp Phe Tyr Pro Ser Pro Asp Leu Glu Pro Ser Thr Ala Lys
435 440 445
Met Leu Glu Val Glu His Phe Glu Arg Thr Gln Phe Asp Pro Tyr Leu
450 455 460
Phe Leu Leu Pro His Gly Ala Arg Ile Ala Val Arg His Cys Ser Val
465 470 475 480
Thr Ala Leu Pro Thr Tyr Leu Lys Ala His Pro Arg Gly Met Leu Ser
485 490 495
Thr Met Ala Phe Ser Phe Leu Arg Val Leu Ser Ser Leu Leu Leu Val
500 505 510
Leu Gln Leu Ser Thr Ala Ala Ser Thr Ser Thr Leu Arg Gln Cys Leu
515 520 525
Leu Thr Ala Val Gln Asn Asp Pro Thr Leu Val Ala Val Asp Gly Asp
530 535 540
Leu Leu Phe Gln Thr Leu Ala Val Gln Val Tyr Asn Leu Asn Trp Pro
545 550 555 560
Val Thr Pro Ala Ala Val Ala Phe Pro Lys Ser Ala Gln Gln Val Ser
565 570 575
Ser Ile Val Asn Cys Ala Ala Ser Leu Gly Tyr Lys Val Gln Ala Lys
580 585 590
Ser Gly Gly His Ser Tyr Gly Asn Tyr Gly Leu Gly Gly Thr Asn Gly
595 600 605
Ala Ile Ser Ile Asn Leu Lys Asn Met Lys Ser Phe Ser Met Asn Tyr
610 615 620
Thr Asn Tyr Gln Ala Thr Val Gly Ala Gly Met Leu Asn Gly Glu Leu
625 630 635 640
Asp Asp Tyr Leu His Asn Ala Gly Gly Arg Ala Ile Ala His Gly Thr
645 650 655
Ser Pro Gln Ile Gly Val Gly Gly His Ala Thr Ile Gly Gly Leu Gly
660 665 670
Pro Ala Ala Arg Gln Tyr Gly Met Glu Leu Asp His Val Leu Glu Ala
675 680 685
Glu Val Val Leu Ala Asn Gly Thr Val Val Arg Ala Ser Ser Thr Gln
690 695 700
Asn Ser Asp Leu Leu Phe Ala Ile Lys Gly Ala Gly Ala Ser Phe Gly
705 710 715 720
Val Val Thr Glu Phe Val Phe Arg Thr Glu Pro Glu Pro Gly Ser Ala
725 730 735
Val Gln Tyr Ser Phe Thr Phe Gly Leu Gly Ser Thr Ser Ser Arg Ala
740 745 750
Asp Leu Phe Lys Lys Trp Gln Ser Phe Ile Ser Gln Pro Asp Leu Thr
755 760 765
Arg Lys Phe Ala Ser Ile Cys Thr Ile Leu Asp His Val Leu Val Ile
770 775 780
Ser Gly Thr Phe Phe Gly Thr Lys Ala Glu Tyr Asp Ala Leu Gly Leu
785 790 795 800
Glu Asp Gln Phe Pro Gly His Thr Asn Ser Thr Val Ile Val Phe Thr
805 810 815
Asp Trp Leu Gly Leu Val Ala Gln Trp Ala Glu Gln Ser Ile Leu Asp
820 825 830
Leu Thr Gly Gly Ile Pro Ala Asp Phe Tyr Ser Arg Cys Leu Ser Phe
835 840 845
Thr Glu Lys Thr Pro Ile Pro Ser Thr Gly Val Asp Gln Leu Phe Glu
850 855 860
Tyr Leu Asp Ser Ala Asp Thr Gly Ala Leu Leu Trp Phe Val Ile Phe
865 870 875 880
Asp Leu Glu Gly Gly Ala Ile Asn Asp Val Pro Met Asp Ala Thr Gly
885 890 895
Tyr Ala His Arg Asp Thr Leu Phe Trp Leu Gln Ser Tyr Ala Ile Thr
900 905 910
Leu Gly Ser Val Ser Gln Thr Thr Tyr Asp Phe Leu Asp Arg Val Asn
915 920 925
Glu Ile Ile Arg Asn Asn Thr Pro Gly Leu Gly Asn Gly Val Tyr Pro
930 935 940
Gly Tyr Val Asp Pro Arg Leu Gln Asn Ala Arg Glu Ala Tyr Trp Gly
945 950 955 960
Ser Asn Leu Pro Arg Leu Met Gln Ile Lys Ser Leu Tyr Asp Pro Ser
965 970 975
Asp Leu Phe His Asn Pro Gln Gly Val Leu Pro Ala
980 985
<210> 146
<211> 479
<212> PRT
<213> Venturia effusa
<400> 146
Met Gly Gln Gly Gln Ser Ser Ala Gly Gly Leu Gln Asp Cys Leu Thr
1 5 10 15
Ser Ala Val Gly Ser Gly Asn Leu Ala Val Pro Ser Lys Pro Phe Tyr
20 25 30
Gln Gln Thr Asp Val Lys Pro Tyr Asn Leu Asp Ile His Val His Pro
35 40 45
Val Ala Val Thr Tyr Pro Gln Thr Asn Glu Asp Val Ala Ala Ile Val
50 55 60
Arg Cys Ala Lys Glu His Glu Ala Lys Val Gln Pro Arg Ser Gly Gly
65 70 75 80
His Ser Tyr Gly Asn Phe Ala Thr Gly Asn Gly Asn Asp Asn Met Ile
85 90 95
Val Val Asp Leu Lys His Phe Lys Gln Phe Ser Met Asp Asp Asn Thr
100 105 110
Trp Ile Ala Thr Leu Gly Ser Gly His Leu Leu Gly Asp Val Thr Lys
115 120 125
Lys Leu Leu Ala Asn Gly Gly Arg Ala Met Ala His Gly Thr Cys Pro
130 135 140
Gln Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met
145 150 155 160
Ser Arg Met Trp Gly Ser Ser Leu Asp His Val Gln Glu Ile Thr Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Ile Thr Ala Ser Pro Thr Gln Asn Lys
180 185 190
Asp Val Phe Trp Ala Met Lys Gly Ala Gly Ala Ser Phe Gly Ile Ile
195 200 205
Thr Glu Phe Lys Val Ile Thr His Pro Ala Pro Gly Glu Ala Val Lys
210 215 220
Tyr Ser Phe Gly Phe Ser Gly Gly Ser His Arg Asp Gln Ala Lys Arg
225 230 235 240
Phe Lys Lys Trp Gln Ser Met Ile Ala Asp Pro Gly Leu Ser Arg Lys
245 250 255
Leu Ala Ser Gln Val Val Leu Ser Glu Ile Gly Met Ile Ile Ser Gly
260 265 270
Thr Phe Phe Gly Thr Gln Ala Glu Tyr Asn Gln Leu Asn Leu Thr Ser
275 280 285
Val Phe Pro Glu Met Ser Ser His Lys Ile Ile Val Phe Asn Asp Trp
290 295 300
Ala Gly Leu Val Gly His Trp Ala Glu Asp Val Gly Leu Gln Leu Gly
305 310 315 320
Gly Gly Ile Ser Ser Pro Phe Tyr Ser Lys Ser Leu Ala Phe Thr Pro
325 330 335
Asn Asp Leu Ile Pro Ala Glu Gly Ile Asp Arg Phe Phe Glu Tyr Leu
340 345 350
Asp Glu Val Asp Lys Gly Thr Leu Ile Trp Phe Gly Ile Phe Asp Leu
355 360 365
Glu Gly Gly Ala Thr Asn Asp Ile Pro Ala Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Ala Leu Phe Tyr Phe Gln Ser Tyr Gly Val Asn Leu Gly
385 390 395 400
Leu Lys Val Lys Asp Glu Thr Arg Asp Phe Ile Asn Gly Met Asn Ser
405 410 415
Val Leu Glu Gly Ser Leu Ser Asn His Lys Leu Gly Ala Tyr Ala Gly
420 425 430
Tyr Val Asp Pro Ala Leu Ser Leu Glu Ala Ala Gln Val Gly Tyr Trp
435 440 445
Gly Asp Asn Leu Pro Arg Leu Arg Gln Ile Lys Arg Ala Val Asp Pro
450 455 460
Asp Asp Val Phe His Asn Leu Gln Ser Val Arg Pro Ala Ala Ser
465 470 475
<210> 147
<211> 472
<212> PRT
<213> Lecanicillium lecanii
<400> 147
Met Gly Asn Lys Pro Ser Thr Pro Leu Ala His Cys Leu Arg Asp Val
1 5 10 15
Cys Ala Gly Arg Gly Asn Cys Val Ala Phe Pro Asn Glu Tyr Leu Tyr
20 25 30
Gln Ala Asn Trp Val Lys Pro Tyr Asn Leu Asp Val Pro Val Lys Pro
35 40 45
Ile Ala Val Phe Arg Pro Asp Asn Ala Ala Asp Val Ala Ala Ala Val
50 55 60
Lys Cys Ala Gly Gln Ser Ser Val His Val Gln Ala Lys Ser Gly Gly
65 70 75 80
His Ser Tyr Ala Asn Phe Gly Leu Gly Gly Gly Asp Gly Gly Leu Met
85 90 95
Ile Asp Leu Gln His Leu Asn Lys Phe Ser Met Asn Asn Glu Thr Trp
100 105 110
Gln Ala Thr Phe Gly Ser Gly Phe Leu Leu Gly Asp Leu Asp Lys Gln
115 120 125
Leu His Ala Asn Gly Asn Arg Ala Met Ala His Gly Thr Cys Pro Gly
130 135 140
Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Ile Gly Pro Ser Ser
145 150 155 160
Arg Met Trp Gly Thr Ala Leu Asp His Val Leu Glu Val Glu Val Val
165 170 175
Thr Ala Asp Gly Lys Ile Gln Arg Ala Ser Lys Thr Gln Asn Ser Asp
180 185 190
Leu Phe Trp Gly Leu Gln Gly Ala Gly Ala Ser Phe Gly Ile Ile Thr
195 200 205
Glu Phe Val Val Arg Thr Glu Pro Glu Pro Gly Ser Val Val Glu Tyr
210 215 220
Ala Tyr Ser Leu Asn Phe Gly Lys Gln Ala Asp Met Ala Pro Val Tyr
225 230 235 240
Lys Lys Trp Gln Asp Leu Val Gly Asp Pro Asn Leu Asp Arg Arg Phe
245 250 255
Thr Ser Leu Phe Ile Ala Glu Pro Leu Gly Val Leu Ile Thr Gly Thr
260 265 270
Phe Tyr Gly Thr Leu Asp Glu Tyr Lys Ala Ser Gly Ile Pro Asp Lys
275 280 285
Leu Pro Ala Ser Gly Ala Ser Ile Thr Val Met Asp Trp Leu Gly Ser
290 295 300
Leu Ala His Ile Ala Glu Lys Thr Gly Leu Tyr Leu Ser Asn Val Ser
305 310 315 320
Thr Lys Phe Val Ser Arg Ser Leu Ala Leu Arg Glu Glu Asp Leu Leu
325 330 335
Ser Glu Gln Ser Ile Asp Asp Leu Phe Lys Tyr Met Gly Ser Ala Asp
340 345 350
Ala Asp Thr Pro Leu Trp Phe Val Ile Phe Asp Asn Glu Gly Gly Ala
355 360 365
Ile Ala Asp Val Pro Asp Asn Ser Thr Ala Tyr Pro His Arg Asp Lys
370 375 380
Ile Ile Leu Tyr Gln Ser Tyr Ser Val Gly Leu Leu Gly Val Ser Asp
385 390 395 400
Lys Met Ile Asn Phe Val Asp Gly Ile Gln Asp Leu Val Gln Lys Gly
405 410 415
Ala Pro Asn Ala His Thr Thr Tyr Ala Gly Tyr Ile Asn Ala Asn Leu
420 425 430
Asp Arg Asn Ala Ala Gln Lys Phe Tyr Trp Gly Asp Lys Leu Pro Gln
435 440 445
Leu Gln Gln Leu Lys Lys Lys Phe Asp Pro Thr Ser Leu Phe Ser Asn
450 455 460
Pro Gln Ser Ile Asp Pro Ala Asp
465 470
<210> 148
<211> 474
<212> PRT
<213> Penicillium chrysogenum
<400> 148
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Ser
1 5 10 15
Ala Val Gly Pro Ala His Val Thr Phe Gln Asp Ala Leu Leu Tyr Gln
20 25 30
Thr Thr Ala Val Asp Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala
35 40 45
Ala Val Thr Tyr Pro Gln Ser Ala Glu Glu Ile Ala Ala Val Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile Val Val
85 90 95
Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Val
100 105 110
Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asp Leu Asp Thr Glu Leu
115 120 125
Tyr Asn Ala Gly Gly Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile
130 135 140
Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Ile Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile
180 185 190
Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Gln Glu Ala Pro Gly Leu Ala Val Gln Phe Ser
210 215 220
Phe Thr Phe Asn Leu Gly Ser Pro Ala Gln Lys Ala Lys Leu Val Lys
225 230 235 240
Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys Phe Tyr
245 250 255
Ser Asn Leu Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly Ile Phe
260 265 270
Phe Gly Ser Lys Glu Glu Tyr Asp Glu Leu Asp Leu Glu Lys Arg Phe
275 280 285
Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Ile Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr
325 330 335
Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Asp Tyr Ile His Lys
340 345 350
Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Ser Val Ser Glu Asp Ala Thr Ala Tyr Gly His Arg
370 375 380
Asp Val Leu Phe Trp Phe Gln Val Phe Val Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Gln Thr Thr Tyr Asp Phe Thr Asn Gly Leu Tyr Asp Val Leu
405 410 415
Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser Asn Leu
435 440 445
Pro Arg Leu Glu Asp Leu Lys Gly Asp Leu Asp Pro Lys Asp Thr Phe
450 455 460
His Asn Pro Gln Gly Val Gln Val Gly Pro
465 470
<210> 149
<211> 496
<212> PRT
<213> Aspergillus lacticoffeatus
<400> 149
Met Leu Ser Thr Met Ala Phe Ser Phe Val Leu Arg Ile Leu Ser Pro
1 5 10 15
Leu Phe Leu Ile Leu Gln Leu Ser Thr Ala Ala Ser Thr Ser Thr Leu
20 25 30
Arg Gln Cys Leu Leu Thr Ala Val Gln Asn Asp Pro Thr Leu Val Ala
35 40 45
Val Asp Gly Asp Leu Leu Tyr Gln Thr Leu Ala Val Gln Val Tyr Asn
50 55 60
Leu Asn Trp Pro Val Thr Pro Ala Ala Val Ala Phe Pro Lys Ser Thr
65 70 75 80
Gln Gln Val Ala Ser Ile Val Asn Cys Ala Ala Ser Leu Gly Tyr Lys
85 90 95
Val Gln Ala Lys Ser Gly Gly His Ser Tyr Gly Asn Tyr Gly Leu Gly
100 105 110
Gly Thr Asn Gly Ala Ile Ser Ile Asn Leu Lys Asn Met Lys Ser Phe
115 120 125
Ser Met Asn Tyr Thr Asn Tyr Gln Ala Thr Val Gly Ala Gly Met Leu
130 135 140
Asn Gly Glu Leu Asp Glu Tyr Leu His Asn Ala Gly Gly Arg Ala Val
145 150 155 160
Ala His Gly Thr Ser Pro Gln Ile Gly Val Gly Gly His Ala Thr Ile
165 170 175
Gly Gly Leu Gly Pro Ser Ala Arg Gln Tyr Gly Met Glu Leu Asp His
180 185 190
Val Leu Glu Ala Glu Val Val Leu Ala Asn Gly Thr Val Val Arg Ala
195 200 205
Ser Ser Thr Gln Asn Ser Asp Leu Leu Phe Ala Ile Lys Gly Ala Gly
210 215 220
Ala Ser Phe Gly Val Val Thr Glu Phe Val Phe Arg Thr Glu Pro Glu
225 230 235 240
Pro Gly Ser Ala Val Gln Tyr Thr Phe Thr Phe Gly Leu Gly Ser Thr
245 250 255
Ser Ala Arg Ala Asp Leu Phe Lys Lys Trp Gln Ser Phe Ile Ser Gln
260 265 270
Pro Asp Leu Thr Arg Lys Phe Ala Ser Ile Cys Thr Leu Leu Asp His
275 280 285
Val Leu Val Ile Ser Gly Thr Phe Phe Gly Thr Lys Glu Glu Tyr Asp
290 295 300
Ala Leu Gly Leu Glu Asp Gln Phe Pro Gly His Thr Asn Ser Thr Val
305 310 315 320
Ile Val Phe Thr Asp Trp Leu Gly Leu Val Ala Gln Trp Ala Glu Gln
325 330 335
Ser Ile Leu Asp Leu Thr Gly Gly Ile Pro Ala Asp Phe Tyr Ala Arg
340 345 350
Cys Leu Ser Phe Thr Glu Lys Thr Leu Ile Pro Ser Asn Gly Val Asp
355 360 365
Gln Leu Phe Glu Tyr Leu Asp Ser Ala Asp Thr Gly Ala Leu Leu Trp
370 375 380
Phe Val Ile Phe Asp Leu Glu Gly Gly Ala Ile Asn Asp Val Pro Met
385 390 395 400
Asp Ala Thr Gly Tyr Ala His Arg Asp Thr Leu Phe Trp Leu Gln Ser
405 410 415
Tyr Ala Ile Thr Leu Gly Ser Val Ser Glu Thr Thr Tyr Asp Phe Leu
420 425 430
Asp Asn Val Asn Glu Ile Ile Arg Asn Asn Thr Pro Gly Leu Gly Asn
435 440 445
Gly Val Tyr Pro Gly Tyr Val Asp Pro Arg Leu Gln Asn Ala Arg Glu
450 455 460
Ala Tyr Trp Gly Ser Asn Leu Pro Arg Leu Met Gln Ile Lys Ser Leu
465 470 475 480
Tyr Asp Pro Thr Asp Leu Phe His Asn Pro Gln Gly Val Leu Pro Ala
485 490 495
<210> 150
<211> 468
<212> PRT
<213> Aspergillus ochraceoroseus
<400> 150
Met Ala Pro Ser Ile Ser Phe Ser Leu Leu Gln Ile Ser Leu Leu Ala
1 5 10 15
Tyr Ser Gly Leu Val Ser Gly Asp Phe Ser Leu Arg Gln Cys Leu Glu
20 25 30
Ser Ala Val Ser Arg Val Ala Phe Glu Gly Asp Pro Phe Tyr Gln Leu
35 40 45
Leu Ser Val Arg Pro Tyr Asn Leu Asp Ile Ser Ile Val Pro Ala Ala
50 55 60
Val Ala Phe Pro Ala Asp Thr Asn Glu Val Ala Ala Val Val Arg Cys
65 70 75 80
Ala Ala Gln Asn Gly Tyr Gln Val Gln Ala Lys Ser Gly Gly His Ser
85 90 95
Tyr Ala Asn His Gly Leu Gly Gly Thr Asn Gly Ala Val Val Val Asn
100 105 110
Leu Glu Asn Leu Gln His Phe Ser Met Asn Thr Thr Thr Trp Glu Ala
115 120 125
Thr Ile Gly Ala Gly Thr Leu Leu Gly Asp Val Thr Lys Arg Leu Ser
130 135 140
Asp Ala Gly Gly Arg Ala Met Ala His Gly Thr Cys Pro Gln Val Gly
145 150 155 160
Ser Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Ser Ser Arg Gln
165 170 175
Phe Gly Ala Ala Leu Asp His Ile Ile Glu Ala Glu Val Val Leu Ala
180 185 190
Asn Ser Ser Ile Ile Arg Ala Ser Glu Thr Glu Asn Pro Asp Val Phe
195 200 205
Phe Ala Val Arg Gly Ala Ala Ser Gly Phe Gly Ile Val Thr Glu Phe
210 215 220
Lys Val Arg Thr Glu Pro Glu Pro Gly Gln Ala Val Arg Tyr Ser Tyr
225 230 235 240
Ser Phe Ser Phe Ser Asp Thr Ala Thr Arg Ala Asp Leu Phe Lys Lys
245 250 255
Trp Gln Ala Tyr Val Thr Gln Pro Asp Leu Pro Arg Glu Leu Ala Ser
260 265 270
Thr Leu Thr Ile Leu Glu His Gly Met Phe Ile Thr Gly Thr Phe Phe
275 280 285
Gly Ser Lys Glu Glu Tyr Asn Ala Leu Lys Ile Glu Thr Glu Phe Pro
290 295 300
Gly Phe Ala Lys Gly Gly Thr Leu Val Leu Asp Asp Trp Leu Gly Leu
305 310 315 320
Val Ser Asn Trp Ala Glu Asp Leu Leu Leu Ser Glu Glu Glu Ile Glu
325 330 335
Gln Met Phe Glu Tyr Ile Asp Asn Val Asp Lys Gly Thr Leu Leu Trp
340 345 350
Phe Ala Ile Phe Asp Leu Gln Gly Gly Ala Val Gly Asp Val Pro Val
355 360 365
Asp Ala Thr Ala Tyr Ala His Arg Asp Thr Leu Ile Trp Leu Gln Ser
370 375 380
Tyr Ala Ile Asn Leu Phe Gly Arg Ile Ser Glu Thr Thr Val Glu Phe
385 390 395 400
Leu Glu Arg Leu Asn Glu Leu Thr Leu Thr Ser Thr Ala Lys Thr Val
405 410 415
Pro Tyr Ala Ala Tyr Pro Gly Tyr Val Asp Pro Arg Leu Thr Asp Ala
420 425 430
Gln Ala Ala Tyr Trp Gly Ser Asn Leu Ala Arg Leu Asn Arg Ile Lys
435 440 445
Ala Glu Ile Asp Pro Asn Asn Val Phe His Asn Pro Gln Ser Val Arg
450 455 460
Pro Ala Ser Gly
465
<210> 151
<211> 475
<212> PRT
<213> Aspergillus cristatus
<400> 151
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Asn
1 5 10 15
Ala Val Gly Gly Asn Gln Ala Leu Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ser Thr Ala Val Glu Ala Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Phe Pro Glu Ser Ser Glu Gln Ile Ala Ala Val
50 55 60
Val Lys Cys Ala Ser Glu His Asp Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asn Gly Ala Ile
85 90 95
Val Val Asp Met Lys Lys Phe Asp Gln Phe Ser Met Asp Glu Ser Ser
100 105 110
Tyr Ile Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr
115 120 125
Glu Leu Tyr Asn Ala Gly Gly Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Ile Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser His Thr Gln Asn Gln
180 185 190
Asp Ile Leu Phe Ala Val Lys Gly Ala Ser Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Tyr Thr Phe Asn Leu Gly Ser Ala Ala Ser Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Glu Phe Ile Ala Gln Asp Asn Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Val Ile Ile Asp Gly Asp Ile Ile Leu Glu Gly
260 265 270
Ile Phe Phe Gly Ser Lys Glu Glu Phe Asp Ala Leu Glu Leu Glu Asn
275 280 285
Arg Phe Pro Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Ile Ser His Ser Leu Glu Asp Ile Ile Leu Arg Val Ala
305 310 315 320
Gly Gly Val Pro Thr Tyr Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro
325 330 335
Gln Ala Leu Ile Pro Ser Ser Ala Ile Asp Asp Leu Phe Asp Tyr Ile
340 345 350
Glu Lys Thr Asn Pro Gly Thr Leu Ala Trp Phe Ile Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Asn Val Pro Ala Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu His Trp Val Gln Ile Phe Ala Ala Asn Pro Leu
385 390 395 400
Gly Pro Ile Ser Glu Thr Thr Tyr Asp Phe Thr Asp Gly Leu Tyr Asn
405 410 415
Ile Leu Ala Lys Ala Val Pro Glu Ser Ala Glu His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Lys Asp Ala Gln Lys Ala Tyr Trp Arg Asp
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Ala Glu Leu Asp Pro Lys Asp
450 455 460
Thr Phe His Asn Pro Gln Gly Val Ala Val Ala
465 470 475
<210> 152
<211> 488
<212> PRT
<213> Penicillium roqueforti
<400> 152
Met Leu Leu Lys Leu Phe Phe Leu Ala Val Ala Ala Ser Val Ala Leu
1 5 10 15
Ala Ala Ser Ser Glu Ala Leu Lys Gln Cys Leu Glu Asn Val Phe Thr
20 25 30
Asp Arg Ala Gly Phe Ala Phe Ala Gly Asp Leu Phe Tyr Asp Arg Ile
35 40 45
Val Asn Arg Tyr Asn Leu Asn Ile Pro Val Thr Pro Ser Ala Leu Ala
50 55 60
Phe Pro Thr Ser Ser Gln Gln Val Ala Asp Ile Val Lys Cys Ala Ala
65 70 75 80
Asp Asn Gly Tyr Pro Val Gln Ala Arg Ser Gly Gly His Ser Tyr Gly
85 90 95
Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Ala Ile Asp Leu Lys
100 105 110
His Leu Gln Gln Phe Ser Met Asp Lys Thr Thr Trp Gln Ala Thr Ile
115 120 125
Gly Ala Gly Ser Leu Leu Ser Asp Val Thr Gln Arg Leu Ser His Ala
130 135 140
Gly Gly Arg Ala Met Ser His Gly Ile Cys Pro Gln Val Gly Ser Gly
145 150 155 160
Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ser Arg Gln Phe Gly
165 170 175
Ala Ala Leu Asp His Val Leu Glu Val Glu Val Val Leu Ala Asn Ser
180 185 190
Ser Ile Val Arg Ala Ser Asp Thr Glu Asn Lys Asp Leu Phe Trp Ala
195 200 205
Ile Lys Gly Ala Ala Ser Gly Tyr Gly Ile Val Thr Glu Phe Lys Val
210 215 220
Arg Thr Glu Pro Glu Pro Gly Thr Ala Val Gln Tyr Ala Tyr Ser Met
225 230 235 240
Glu Phe Gly Asn Pro Thr Lys Gln Ala Thr Leu Phe Lys Ser Trp Gln
245 250 255
Ala Phe Val Ser Asp Pro Lys Leu Thr Arg Lys Met Ala Ser Thr Leu
260 265 270
Thr Met Leu Glu Asn Ser Met Ala Ile Ser Gly Thr Phe Phe Gly Thr
275 280 285
Lys Glu Glu Tyr Asp Lys Leu Asn Leu Thr Asn Lys Phe Pro Gly Ala
290 295 300
Asn Gly Asp Ala Leu Val Phe Glu Asp Trp Leu Gly Leu Val Ala His
305 310 315 320
Trp Ala Glu Asp Leu Ile Leu Gly Leu Ala Ala Gly Ile Pro Thr Asn
325 330 335
Phe Tyr Ala Lys Ser Thr Ser Trp Thr Pro Gln Thr Leu Ile Thr Pro
340 345 350
Glu Thr Val Asp Lys Met Phe Asp Tyr Ile Ala Thr Val Asn Lys Gly
355 360 365
Thr Leu Gly Trp Phe Leu Leu Phe Asp Leu Gln Gly Gly Tyr Thr Asn
370 375 380
Asp Ile Pro Thr Asn Ala Thr Ser Tyr Ala His Arg Asp Val Leu Ile
385 390 395 400
Trp Leu Gln Ser Tyr Thr Val Asn Phe Leu Gly Pro Ile Ser Gln Ala
405 410 415
Gln Ile Asp Phe Leu Asp Gly Leu Asn Lys Ile Val Thr Asn Asn Lys
420 425 430
Leu Pro Tyr Thr Ala Tyr Pro Gly Tyr Val Asp Pro Leu Met Pro Asn
435 440 445
Ala Pro Glu Ala Tyr Trp Gly Thr Asn Leu Pro Arg Leu Gln Gln Ile
450 455 460
Lys Glu Leu Val Asp Pro Asn Asp Val Phe Arg Asn Pro Gln Ser Pro
465 470 475 480
Ser Pro Ala Asn Lys Glu Pro Leu
485
<210> 153
<211> 472
<212> PRT
<213> Fusarium sporotrichioides
<400> 153
Met Gly Asn Gly Asn Ser Thr Pro Phe Arg Asp Cys Leu Asp Ser Ile
1 5 10 15
Cys Ala Asn Arg Ser Thr Cys Val Thr Tyr Pro Gly Asp Pro Leu Phe
20 25 30
Ser Cys Trp Ser Arg Pro Phe Asn Leu Glu Phe Pro Val Val Pro Ala
35 40 45
Ala Ile Ile Arg Pro Glu Thr Thr Thr Glu Val Ala Glu Thr Val Lys
50 55 60
Cys Ala Lys Lys Tyr Gly Tyr Lys Val Gln Ala Lys Ser Gly Gly His
65 70 75 80
Ser Tyr Gly Asn His Gly Leu Gly Gly Val Gly Gly Ala Val Ser Ile
85 90 95
Asp Met Val Asn Leu Arg Asp Phe Ser Met Asn Asn Lys Thr Trp Tyr
100 105 110
Ala Ser Phe Gly Ser Gly Met Asn Leu Gly Glu Leu Asp Glu His Leu
115 120 125
His Ala Asn Gly Arg Arg Ala Ile Ala His Gly Thr Cys Pro Gly Val
130 135 140
Gly Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Ile Ser Arg
145 150 155 160
Gln Trp Gly Ser Ala Leu Asp His Leu Leu Glu Ile Glu Val Ile Thr
165 170 175
Ala Asp Gly Thr Val Gln Arg Ala Ser Tyr Thr Lys Asn Ser Gly Leu
180 185 190
Phe Trp Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Ile Val Thr Lys
195 200 205
Phe Met Val Lys Thr His Pro Glu Pro Gly Arg Val Val Gln Tyr Ser
210 215 220
Tyr Asn Ile Ala Leu Ala Ser His Ala Glu Thr Ala Glu Leu Tyr Arg
225 230 235 240
Glu Trp Gln Ala Leu Val Gly Asp Pro Asn Met Asp Arg Arg Phe Ser
245 250 255
Ser Leu Phe Val Val Gln Pro Leu Gly Ala Leu Ile Thr Gly Thr Phe
260 265 270
Phe Gly Thr Lys Ser Gln Tyr Gln Ala Thr Gly Ile Pro Asp Arg Leu
275 280 285
Pro Gly Ala Asp Lys Gly Ala Val Trp Leu Thr Asp Trp Ala Gly Leu
290 295 300
Leu Leu His Glu Ala Glu Ala Ala Gly Cys Ala Leu Gly Ser Ile Pro
305 310 315 320
Thr Ala Phe Tyr Gly Lys Ser Leu Ser Leu Ser Glu Gln Asp Leu Leu
325 330 335
Ser Asp Ser Ala Ile Thr Asp Leu Phe Lys Tyr Leu Glu Asp Asn Arg
340 345 350
Ser Gly Leu Ala Pro Val Thr Ile Leu Phe Asn Thr Glu Gly Gly Ala
355 360 365
Met Met Asp Thr Pro Ala Asn Ala Thr Ala Tyr Pro His Arg Asn Ser
370 375 380
Ile Ile Met Tyr Gln Ser Tyr Gly Ile Gly Val Gly Lys Val Ser Ala
385 390 395 400
Ala Thr Arg Lys Leu Leu Asp Gly Val His Glu Arg Ile Gln Arg Ser
405 410 415
Ala Pro Gly Ala Leu Ser Thr Tyr Ala Gly Tyr Ile Asp Ala Trp Ala
420 425 430
Asp Arg Lys Ala Ala Gln Lys Leu Tyr Trp Ala Asp Asn Leu Pro Arg
435 440 445
Leu Arg Glu Leu Lys Lys Val Trp Asp Pro Ala Asp Val Phe Ser Asn
450 455 460
Pro Gln Ser Val Glu Pro Ala Asp
465 470
<210> 154
<211> 371
<212> PRT
<213> Beauveria bassiana
<400> 154
Met Asp Ser Asn Thr Trp Glu Ala Thr Phe Gly Ser Gly Phe Leu Leu
1 5 10 15
Gly Glu Leu Asp Lys His Leu His Ala Asn Gly Asn Arg Ala Met Ala
20 25 30
His Gly Thr Cys Pro Gly Val Gly Met Gly Gly His Ala Thr Ile Gly
35 40 45
Gly Ile Gly Pro Ser Ser Arg Leu Trp Gly Thr Thr Leu Asp His Val
50 55 60
Leu Gln Val Glu Val Val Thr Ala Asp Gly Lys Ile Gln Arg Ala Ser
65 70 75 80
Lys Thr Gln Asn Pro Asp Leu Phe Trp Ala Leu Gln Gly Ala Gly Ala
85 90 95
Ser Phe Gly Ile Ile Thr Glu Phe Val Val Arg Thr Glu Pro Glu Pro
100 105 110
Gly Ser Val Val Glu Tyr Thr Tyr Ser Val Ser Leu Gly Lys Gln Ser
115 120 125
Asp Met Ala Pro Leu Tyr Lys Gln Trp Gln Ala Leu Val Gly Asp Pro
130 135 140
Ser Leu Asp Arg Arg Phe Thr Ser Leu Phe Ile Ala Glu Pro Leu Gly
145 150 155 160
Val Leu Ile Thr Gly Thr Phe Tyr Gly Thr Met Tyr Glu Trp His Ala
165 170 175
Ser Gly Ile Pro Asp Lys Leu Pro Arg Gly Pro Ile Ser Val Thr Val
180 185 190
Met Asp Ser Leu Gly Ser Leu Ala His Ile Ala Glu Lys Thr Gly Leu
195 200 205
Tyr Leu Thr Asn Val Pro Thr Ser Phe Ala Ser Arg Ser Leu Ala Leu
210 215 220
Arg Gln Gln Asp Leu Leu Ser Glu Gln Ser Ile Asp Asp Leu Phe Glu
225 230 235 240
Tyr Met Gly Ser Ala Asn Ala Asp Thr Pro Leu Trp Phe Val Ile Phe
245 250 255
Asp Asn Glu Gly Gly Ala Ile Ala Asp Val Pro Asp Asn Ser Thr Ala
260 265 270
Tyr Pro His Arg Asp Lys Val Ile Val Tyr Gln Ser Tyr Ser Val Gly
275 280 285
Leu Leu Gly Val Thr Asp Lys Met Ile Lys Phe Leu Asp Gly Val Gln
290 295 300
Asp Ile Val Gln Arg Gly Ala Pro Asn Ala His Thr Thr Tyr Ala Gly
305 310 315 320
Tyr Ile Asn Pro Gln Leu Asp Arg Lys Ala Ala Gln Gln Phe Tyr Trp
325 330 335
Gly Asp Lys Leu Pro Arg Leu Gln Gln Ile Lys Lys Gln Tyr Asp Pro
340 345 350
Asn Asn Val Phe Cys Asn Pro Gln Ser Ile Tyr Pro Ala Glu Asp Met
355 360 365
Ser Asp Gly
370
<210> 155
<211> 473
<212> PRT
<213> Aspergillus vadensis
<400> 155
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Gln Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Asn Gln Phe Ser Met Asn Asp Gln Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Ile Pro Ala
465 470
<210> 156
<211> 476
<212> PRT
<213> Penicillium arizonense
<400> 156
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Ser
1 5 10 15
Ala Val Gly Gly Val Ala Ala His Val Ala Phe Gln Asp Ser Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Glu Leu Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Thr Asp Glu Ile Ala Ala Val
50 55 60
Val Lys Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile
85 90 95
Val Ile Asp Met Lys His Phe Ser Gln Phe Ser Leu Asp Lys Ser Thr
100 105 110
Phe Ile Ala Thr Phe Gly Pro Gly Thr Thr Leu Gly Asn Leu Asp Thr
115 120 125
Glu Leu Tyr His Ala Gly Asn Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Ala
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Val Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Asp Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Phe Pro Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys
245 250 255
Phe Tyr Ser Asn Met Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Phe Phe Gly Ser Lys Lys Glu Tyr Asp Glu Leu Asp Leu Glu Asn
275 280 285
Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Ser Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro
325 330 335
Ser Thr Leu Ile Ser Asp Ser Ala Ile Asp Gly Leu Phe Asp Tyr Ile
340 345 350
His Lys Thr Asn Pro Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Thr Val Ser Glu Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Val Ala Asn Pro Leu
385 390 395 400
Gly Pro Ile Ser Gln Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn
405 410 415
Val Leu Ala Gln Ala Val Pro Asp Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Lys Leu Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Arg Asp Leu Asp Pro Lys Asp
450 455 460
Ile Phe Tyr Asn Pro Gln Gly Val Gln Ile Val Ser
465 470 475
<210> 157
<211> 476
<212> PRT
<213> Aspergillus fumigatus
<400> 157
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser
1 5 10 15
Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val
50 55 60
Val Lys Cys Ala Ala Asp Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile
85 90 95
Val Val Asp Met Lys His Phe Asp Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Glu Ile Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Asn Ile Ile Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Glu
275 280 285
Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Ala Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro
325 330 335
Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Glu Tyr Ile
340 345 350
His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu
385 390 395 400
Gly Pro Val Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp
405 410 415
Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Asn
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp
450 455 460
Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser
465 470 475
<210> 158
<211> 473
<212> PRT
<213> Purpureocillium lilacinum
<400> 158
Met Gly Asn Gly Gln Ser Thr Pro Leu Gln Gln Cys Leu Asn Thr Val
1 5 10 15
Cys Asn Gly Arg Leu Gly Cys Val Ala Phe Pro Ser Asp Ala Leu Tyr
20 25 30
Gln Ala Ala Trp Val Lys Pro Tyr Asn Leu Asp Val Pro Val Thr Pro
35 40 45
Ile Ala Val Phe Lys Pro Ser Ser Thr Glu Asp Val Ala Gly Ala Ile
50 55 60
Lys Cys Ala Val Ala Ser Asn Val His Val Gln Ala Lys Ser Gly Gly
65 70 75 80
His Ser Tyr Ala Asn Phe Gly Leu Gly Gly Gln Asp Gly Glu Leu Met
85 90 95
Ile Asp Leu Ala Asn Leu Gln Asp Phe His Met Asp Lys Thr Ser Trp
100 105 110
Gln Ala Thr Phe Gly Ala Gly Tyr Arg Leu Gly Asp Leu Asp Lys Lys
115 120 125
Leu Gln Ala Asn Gly Asn Arg Ala Ile Ala His Gly Thr Cys Pro Gly
130 135 140
Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met Ser
145 150 155 160
Arg Met Trp Gly Ser Ala Leu Asp His Val Leu Ser Val Gln Val Val
165 170 175
Thr Ala Asp Gly Ser Ile Lys Asn Ala Ser Glu Ser Glu Asn Ser Asp
180 185 190
Leu Phe Trp Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Val Ile Thr
195 200 205
Lys Phe Thr Val Lys Thr His Pro Ala Pro Gly Ser Val Val Gln Tyr
210 215 220
Thr Tyr Lys Ile Ser Leu Gly Ser Gln Ala Gln Met Ala Pro Val Tyr
225 230 235 240
Ala Ala Trp Gln Ala Leu Ala Gly Asp Pro Lys Leu Asp Arg Arg Phe
245 250 255
Ser Thr Leu Phe Ile Ala Glu Pro Leu Gly Ala Leu Ile Thr Gly Thr
260 265 270
Phe Tyr Gly Thr Lys Ala Glu Tyr Glu Ala Thr Gly Ile Ala Ala Arg
275 280 285
Leu Pro Ser Gly Gly Thr Leu Asp Leu Lys Leu Leu Asp Trp Leu Gly
290 295 300
Ser Leu Ala His Ile Ala Glu Val Val Gly Leu Thr Leu Gly Asp Ile
305 310 315 320
Pro Thr Ser Phe Tyr Gly Lys Ser Leu Ala Leu Arg Glu Glu Asp Met
325 330 335
Leu Asp Arg Thr Ser Ile Asp Gly Leu Phe Arg Tyr Met Gly Asp Ala
340 345 350
Asp Ala Gly Thr Leu Leu Trp Phe Val Ile Phe Asn Ser Glu Gly Gly
355 360 365
Ala Met Ala Asp Thr Pro Ala Gly Ala Thr Ala Tyr Pro His Arg Asp
370 375 380
Lys Leu Ile Met Tyr Gln Ser Tyr Val Ile Gly Ile Pro Thr Leu Thr
385 390 395 400
Lys Ala Thr Arg Asp Phe Ala Asp Gly Val His Asp Arg Val Arg Met
405 410 415
Gly Ala Pro Ala Ala Asn Ser Thr Tyr Ala Gly Tyr Ile Asp Arg Thr
420 425 430
Leu Ser Arg Glu Ala Ala Gln Glu Phe Tyr Trp Gly Ala Gln Leu Pro
435 440 445
Arg Leu Arg Glu Val Lys Lys Ala Trp Asp Pro Lys Asp Val Phe His
450 455 460
Asn Pro Gln Ser Val Asp Pro Ala Glu
465 470
<210> 159
<211> 473
<212> PRT
<213> Aspergillus turcosus
<400> 159
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Ile Ser
1 5 10 15
Ala Val Gly Ala Ala Asn Val Ala Phe Gln Asp Gln Leu Leu Tyr Gln
20 25 30
Ala Thr Ala Val Gln Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala
35 40 45
Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val Val Lys
50 55 60
Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asp Gly Ala Ile Val Ile
85 90 95
Glu Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Ile
100 105 110
Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr Asp Leu
115 120 125
Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile
130 135 140
Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln Asp Leu
180 185 190
Phe Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Met Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe His Leu Gly Thr Ser Ala Glu Lys Ala Lys Phe Val Lys
225 230 235 240
Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Thr Trp Lys Phe Tyr
245 250 255
Thr Asn Leu Val Ile Phe Asp Asp Gln Ile Ile Leu Glu Gly Ile Tyr
260 265 270
Phe Gly Thr Lys Glu Glu Tyr Asp Ser Leu Gly Leu Glu Gln Arg Phe
275 280 285
Pro Pro Thr Asp Ala Gly Thr Val Leu Ile Leu Thr Asp Trp Leu Ala
290 295 300
Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Arg Ala
325 330 335
Leu Ile Pro Asp Ser Ala Ile Asp Glu Phe Phe Asp Tyr Ile His Glu
340 345 350
Asn Asn Pro Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Ala Val Pro Glu Asp Ala Thr Ala Tyr Gly His Arg
370 375 380
Asp Val Leu Phe Trp Phe Gln Leu Phe Val Ile Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Gln Ala Val Pro Glu Ser Ala Ser His Ala Tyr Met Gly Cys Pro
420 425 430
Asp Pro Arg Met Pro Asn Ala Gln Arg Ala Tyr Trp Arg Ser Asn Leu
435 440 445
Pro Lys Leu Glu Glu Leu Lys Gly Tyr Leu Asp Pro Glu Asp Ile Phe
450 455 460
His Asn Pro Gln Gly Val Val Pro Ser
465 470
<210> 160
<211> 476
<212> PRT
<213> Penicillium solitum
<400> 160
Met Gly Asn Thr Thr Ser Ile Thr Ala Gly Arg Asp Cys Leu Thr Ser
1 5 10 15
Ala Val Gly Gly Val Ala Ala His Val Ala Phe Gln Asp Ala Leu Leu
20 25 30
Tyr Gln Thr Pro Ala Val Asp Pro Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val
50 55 60
Val Lys Cys Ala Ser Asp Tyr Asn Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Phe Gly Leu Gly Gly Gln Asn Gly Ala Ile
85 90 95
Val Val Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Phe Val Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asn Leu Asp Thr
115 120 125
Glu Ile Tyr Asn Ala Gly Lys Arg Ala Met Ser His Gly Ile Cys Pro
130 135 140
Ser Ile Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Ile Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Asp Val Leu Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Phe Thr Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Tyr Ile Ala Gln Glu Asn Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Leu Ile Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Phe Phe Gly Ser Lys Glu Glu Tyr Asp Gln Leu Asn Leu Asp Lys
275 280 285
Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Arg Leu Val
305 310 315 320
Gly Asp Ser Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro
325 330 335
Ser Thr Leu Ile Ser Gly Ser Ala Ile Asp Gly Leu Phe Asp Tyr Ile
340 345 350
His Lys Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Ala Val Pro Lys Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Val Ala Asn Pro Leu
385 390 395 400
Gly Pro Ile Ser Gln Thr Thr Tyr Asp Phe Thr Asp Gly Leu Tyr Asp
405 410 415
Ile Leu Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp
450 455 460
Ile Phe His Asn Pro Gln Gly Val Gln Val Ala Ser
465 470 475
<210> 161
<211> 483
<212> PRT
<213> Aspergillus flavus
<400> 161
Met Asn Pro Ser Ile Pro Ser Ser Ser Met Gly Asn Thr Thr Ser Ile
1 5 10 15
Ala Gly Arg Asp Cys Leu Val Ser Ala Leu Gly Gly Asn Ala Gly Leu
20 25 30
Val Ala Phe Gln Asn Gln Pro Leu Tyr Gln Thr Thr Ala Val His Glu
35 40 45
Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala Ala Ile Thr Tyr Pro Glu
50 55 60
Thr Ala Glu Gln Ile Ala Ala Val Val Lys Cys Ala Ser Gln Tyr Asp
65 70 75 80
Tyr Lys Val Gln Ala Arg Ser Gly Gly His Ser Phe Gly Asn Tyr Gly
85 90 95
Leu Gly Gly Thr Asp Gly Ala Val Val Val Asp Met Lys Tyr Phe Asn
100 105 110
Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu Ala Val Ile Gly Pro Gly
115 120 125
Thr Thr Leu Gly Asp Val Asp Val Glu Leu Tyr Asn Asn Gly Lys Arg
130 135 140
Ala Met Ala His Gly Val Cys Pro Thr Ile Ser Thr Gly Gly His Phe
145 150 155 160
Thr Met Gly Gly Leu Gly Pro Thr Ala Arg Gln Trp Gly Leu Ala Leu
165 170 175
Asp His Val Glu Glu Val Glu Val Val Leu Ala Asn Ser Ser Ile Val
180 185 190
Arg Ala Ser Asn Thr Gln Asn Gln Glu Val Phe Phe Ala Val Lys Gly
195 200 205
Ala Ala Ala Ser Phe Gly Ile Val Thr Glu Phe Lys Val Arg Thr Gln
210 215 220
Pro Ala Pro Gly Ile Ala Val Gln Tyr Ser Tyr Thr Phe Asn Leu Gly
225 230 235 240
Ser Ser Ala Glu Lys Ala Gln Phe Ile Lys Asp Trp Gln Ser Phe Val
245 250 255
Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Thr Asn Met Val Ile Phe
260 265 270
Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe Phe Gly Ser Lys Glu Gln
275 280 285
Tyr Glu Ala Leu Gly Leu Glu Glu Arg Phe Val Pro Lys Asn Pro Gly
290 295 300
Asn Ile Leu Val Leu Thr Asp Trp Leu Gly Met Val Gly His Ala Leu
305 310 315 320
Glu Asp Thr Ile Leu Arg Leu Val Gly Asn Thr Pro Thr Trp Phe Tyr
325 330 335
Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr Leu Ile Pro Ser Ser Gly
340 345 350
Ile Asp Glu Phe Phe Glu Tyr Ile Glu Asn Asn Lys Ala Gly Thr Ser
355 360 365
Thr Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val
370 375 380
Pro Ala Asp Ala Thr Ala Tyr Gly His Arg Asp Val Leu Phe Trp Val
385 390 395 400
Gln Ile Phe Met Val Ser Pro Thr Gly Pro Val Ser Ser Thr Thr Tyr
405 410 415
Asp Phe Ala Asp Gly Leu Tyr Asn Val Leu Thr Lys Ala Val Pro Glu
420 425 430
Ser Glu Gly His Ala Tyr Leu Gly Cys Pro Asp Pro Lys Met Ala Asn
435 440 445
Ala Gln Gln Lys Tyr Trp Arg Gln Asn Leu Pro Arg Leu Glu Glu Leu
450 455 460
Lys Glu Thr Leu Asp Pro Lys Asp Thr Phe His Asn Pro Gln Gly Ile
465 470 475 480
Leu Pro Ala
<210> 162
<211> 473
<212> PRT
<213> Aspergillus lacticoffeatus
<400> 162
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Met Pro Ala
465 470
<210> 163
<211> 476
<212> PRT
<213> Aspergillus novofumigatus
<400> 163
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser
1 5 10 15
Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Val Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val
50 55 60
Val Lys Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile
85 90 95
Val Val Glu Met Lys His Phe Asn Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln
180 185 190
Asp Ile Leu Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Ala Ala Pro Gly Val Ala Val Gln
210 215 220
Tyr Ser Phe Thr Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Asn Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Tyr Phe Gly Ser Lys Glu Glu Tyr Asp Ala Leu Gly Leu Glu Lys
275 280 285
Arg Phe Pro Ser Ser Glu Ala Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro
325 330 335
Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Glu Phe Leu Asn Tyr Ile
340 345 350
His Glu Asn Thr Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Lys Val Pro Gly Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu
385 390 395 400
Gly Pro Val Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp
405 410 415
Val Leu Ala Lys Ala Val Pro Asn Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Ser
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Glu Leu Asp Pro Lys Asp
450 455 460
Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser
465 470 475
<210> 164
<211> 473
<212> PRT
<213> Aspergillus welwitschiae
<400> 164
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Glu Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Ile Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Met Pro Ala
465 470
<210> 165
<211> 473
<212> PRT
<213> Aspergillus niger
<400> 165
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala
1 5 10 15
Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp
20 25 30
Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala
35 40 45
Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val
85 90 95
Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu
100 105 110
Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu
115 120 125
Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile
130 135 140
Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val
180 185 190
Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys
225 230 235 240
Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr
245 250 255
Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe
260 265 270
Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe
275 280 285
Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr
325 330 335
Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn
340 345 350
His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg
370 375 380
Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val Gly Pro
385 390 395 400
Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu
405 410 415
Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu
435 440 445
Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe
450 455 460
His His Pro Gln Gly Val Met Pro Ala
465 470
<210> 166
<211> 476
<212> PRT
<213> Aspergillus terreus
<400> 166
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Ile Ser
1 5 10 15
Ala Val Gly Gly Asn Ala Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Asp Val Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val
50 55 60
Val Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile
85 90 95
Val Val Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Glu Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Glu Thr Gln Asn Gln
180 185 190
Asp Val Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Tyr Thr Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu
225 230 235 240
Leu Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Phe Phe Gly Ser Lys Glu Glu Tyr Asp Ala Leu Asp Leu Glu Lys
275 280 285
Arg Phe Pro Thr Ser Glu Pro Gly Thr Leu Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Ser Leu Glu Asp Val Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro
325 330 335
Arg Thr Leu Ile Pro Asp Ser Ala Ile Asp Arg Phe Phe Asp Tyr Ile
340 345 350
His Glu Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Ala Val Pro Glu Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Asn Pro Leu
385 390 395 400
Gly Pro Ile Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp
405 410 415
Val Leu Ala Gln Ala Val Pro Glu Ser Ala Glu His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Gly
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Glu Phe Asp Pro Lys Asp
450 455 460
Thr Phe His Asn Pro Gln Gly Val Ser Val Ala Val
465 470 475
<210> 167
<211> 476
<212> PRT
<213> Aspergillus udagawae
<400> 167
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Ile Ser
1 5 10 15
Ala Val Gly Gly Asn Ala Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Ile Thr
35 40 45
Pro Ala Ala Ile Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val
50 55 60
Val Lys Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile
85 90 95
Val Val Glu Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Tyr Ile Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Glu Leu Tyr Asn Val Gly His Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Asp Ile Phe Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Tyr Thr Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys
245 250 255
Phe Tyr Ser Asn Met Val Val Phe Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Leu Tyr Phe Gly Ser Lys Glu Glu Tyr Asp Ala Leu Gly Leu Glu Gln
275 280 285
Arg Phe Pro Pro Ser Glu Ala Gly Asn Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Glu Leu Glu Asp Thr Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro
325 330 335
Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Leu Phe Asn Tyr Ile
340 345 350
His Glu Asn Asn Pro Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Thr Val Pro Glu His Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Val Ile Asn Pro Leu
385 390 395 400
Gly Pro Val Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Met Tyr Asp
405 410 415
Val Leu Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Ser
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Gly
450 455 460
Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser
465 470 475
<210> 168
<211> 476
<212> PRT
<213> Aspergillus fumigatus
<400> 168
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser
1 5 10 15
Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu
20 25 30
Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val
50 55 60
Val Lys Cys Ala Ala Asp Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile
85 90 95
Val Val Asp Met Lys His Phe Asp Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr
115 120 125
Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr
145 150 155 160
Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Glu Ile Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln
210 215 220
Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu
225 230 235 240
Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys
245 250 255
Phe Tyr Ser Asn Met Asn Ile Ile Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Glu
275 280 285
Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp
290 295 300
Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val
305 310 315 320
Gly Asn Ala Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro
325 330 335
Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Glu Tyr Ile
340 345 350
His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu
385 390 395 400
Gly Pro Val Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp
405 410 415
Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Asn
435 440 445
Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp
450 455 460
Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser
465 470 475
<210> 169
<211> 474
<212> PRT
<213> Aspergillus bombycis
<400> 169
Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala
1 5 10 15
Leu Gly Gly Asn Ala Gly Leu Val Ala Phe Gln Asp Gln Leu Leu Tyr
20 25 30
Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro
35 40 45
Ala Ala Val Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val
50 55 60
Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly
65 70 75 80
His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val
85 90 95
Val Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Asp Gln Thr Tyr
100 105 110
Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr Glu
115 120 125
Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Ile Cys Pro Thr
130 135 140
Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala
145 150 155 160
Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val
165 170 175
Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu
180 185 190
Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr
195 200 205
Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr
210 215 220
Ser Tyr Thr Phe Asn Ile Gly Ser Ser Ala Glu Lys Ala Gln Phe Val
225 230 235 240
Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe
245 250 255
Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu
260 265 270
Phe Phe Gly Ser Gln Glu Gln Tyr Glu Ala Leu Gly Leu Glu Asp Arg
275 280 285
Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu
290 295 300
Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly
305 310 315 320
Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp
325 330 335
Thr Leu Ile Pro Ala Ser Gly Ile Asp Glu Phe Phe Asp Tyr Ile Glu
340 345 350
Asn His Lys Ala Gly Thr Leu Thr Trp Phe Val Thr Leu Ser Leu Glu
355 360 365
Gly Gly Ala Ile Asn Asp Val Pro Glu Asp Ala Thr Ala Tyr Gly His
370 375 380
Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ala Ser Pro Thr Gly
385 390 395 400
Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val
405 410 415
Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys
420 425 430
Pro Asp Pro Lys Met Ala Asp Ala Gln Gln Lys Tyr Trp Arg Gln Asn
435 440 445
Leu Pro Arg Leu Glu Glu Leu Lys Ala Thr Leu Asp Pro Lys Asp Thr
450 455 460
Phe His Asn Pro Gln Gly Ile Leu Pro Ala
465 470
<210> 170
<211> 694
<212> PRT
<213> Purpureocillium lilacinum
<400> 170
Met Trp Leu Ser Thr Met Asn Gly Ser Ala Ser Arg Arg Ser Asp Pro
1 5 10 15
Val Ser Arg Lys Ile Val Cys Asp Gly His Ala Ser Ala His Glu Val
20 25 30
Arg Thr Asp Asn Glu Ala Ala Arg Asp Val Pro Ser Arg Thr Ala Val
35 40 45
Asn Lys Glu Arg Lys Gln Gly Ser Gly Pro Pro Gly Ala Met Gln Arg
50 55 60
Gly Phe His Ala Ala His Lys Pro Asn Glu Met Val Pro Gln Asp Gly
65 70 75 80
Pro Leu Gly Arg Thr Ala Gln Leu Phe Arg Leu Ala Pro Ala Cys Gln
85 90 95
Ser Glu Pro Thr Arg Ala Pro Gly Gln Pro Ser Asp Leu Arg Leu Arg
100 105 110
Gln Ile Pro Leu Ala Thr Glu Gln Ala Ala Arg Thr Leu Ala Arg Met
115 120 125
Arg Pro Ala Arg Phe Thr Phe Pro Tyr Gly Arg Ala Ala Glu Asp Asp
130 135 140
Cys Tyr Leu Lys Lys Glu Asp Glu Gly His Asp Gln Ser His Pro Thr
145 150 155 160
Ser Val Leu Val Gly Val Pro Pro Phe Thr Arg Arg Cys Ala Ala Ala
165 170 175
Glu Thr Phe Lys Asp Thr Arg Ala Arg Ala Pro Gly Thr Gln Pro Thr
180 185 190
Asp Thr Thr Ser Thr Gly Ala Ser Pro Ser Trp Thr Leu Ser Pro Leu
195 200 205
Leu Ser Leu Ser Ala Thr Asp Asp Ser Val Pro Ser Lys Met Gly Asn
210 215 220
Gly Gln Ser Thr Pro Leu Gln Gln Cys Leu Asn Thr Val Cys Asn Gly
225 230 235 240
Arg Leu Gly Cys Val Ala Phe Pro Ser Asp Ala Leu Tyr Gln Ala Ala
245 250 255
Trp Val Lys Pro Tyr Asn Leu Asp Val Pro Val Thr Pro Ile Ala Val
260 265 270
Phe Lys Pro Ser Ser Thr Glu Asp Val Ala Gly Ala Ile Lys Cys Ala
275 280 285
Val Ala Ser Asn Val His Val Gln Ala Lys Ser Gly Gly His Ser Tyr
290 295 300
Ala Asn Phe Gly Leu Gly Gly Gln Asp Gly Glu Leu Met Ile Asp Leu
305 310 315 320
Ala Asn Leu Gln Asp Phe His Met Asp Lys Thr Ser Trp Gln Ala Thr
325 330 335
Phe Gly Ala Gly Tyr Arg Leu Gly Asp Leu Asp Lys Lys Leu Gln Ala
340 345 350
Asn Gly Asn Arg Ala Ile Ala His Gly Thr Cys Pro Gly Val Gly Ile
355 360 365
Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met Ser Arg Met Trp
370 375 380
Gly Ser Ala Leu Asp His Val Leu Ser Val Gln Val Val Thr Ala Asp
385 390 395 400
Gly Ser Ile Lys Asn Ala Ser Glu Ser Glu Asn Ser Asp Leu Phe Trp
405 410 415
Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Val Ile Thr Lys Phe Thr
420 425 430
Val Lys Thr His Pro Ala Pro Gly Ser Val Val Gln Tyr Thr Tyr Lys
435 440 445
Ile Ser Leu Gly Ser Gln Ala Gln Met Ala Pro Val Tyr Ala Ala Trp
450 455 460
Gln Ala Leu Ala Gly Asp Pro Lys Leu Asp Arg Arg Phe Ser Thr Leu
465 470 475 480
Phe Ile Ala Glu Pro Leu Gly Ala Leu Ile Thr Gly Thr Phe Tyr Gly
485 490 495
Thr Lys Ala Glu Tyr Glu Ala Thr Gly Ile Ala Ala Arg Leu Pro Ser
500 505 510
Gly Gly Thr Leu Asp Leu Lys Leu Leu Asp Trp Leu Gly Ser Leu Ala
515 520 525
His Ile Ala Glu Val Val Gly Leu Thr Leu Gly Asp Ile Pro Thr Ser
530 535 540
Phe Tyr Gly Lys Ser Leu Ala Leu Arg Glu Glu Asp Met Leu Asp Arg
545 550 555 560
Thr Ser Ile Asp Gly Leu Phe Arg Tyr Met Gly Asp Ala Asp Ala Gly
565 570 575
Thr Leu Leu Trp Phe Val Ile Phe Asn Ser Glu Gly Gly Ala Met Ala
580 585 590
Asp Thr Pro Ala Gly Ala Thr Ala Tyr Pro His Arg Asp Lys Leu Ile
595 600 605
Met Tyr Gln Ser Tyr Val Ile Gly Ile Pro Thr Leu Thr Lys Ala Thr
610 615 620
Arg Asp Phe Ala Asp Gly Val His Asp Arg Val Arg Met Gly Ala Pro
625 630 635 640
Ser Ala Asn Ser Thr Tyr Ala Gly Tyr Ile Asp Arg Thr Leu Ser Arg
645 650 655
Glu Ala Ala Gln Glu Phe Tyr Trp Gly Ala Gln Leu Pro Arg Leu Arg
660 665 670
Glu Val Lys Lys Ala Trp Asp Pro Lys Asp Val Phe His Asn Pro Gln
675 680 685
Ser Val Asp Pro Ala Glu
690
<210> 171
<211> 476
<212> PRT
<213> Penicillium expansum
<400> 171
Met Gly Asn Thr Thr Ser Ile Gly Val Val Arg Asp Cys Leu Thr Ser
1 5 10 15
Ala Val Gly Gly Val Ala Ala His Val Ala Phe Gln Asp Thr Leu Leu
20 25 30
Tyr Gln Thr Ser Ala Val Lys Pro Tyr Asn Leu Asn Val Pro Val Thr
35 40 45
Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asn Glu Val Ala Ala Ile
50 55 60
Val Lys Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly
65 70 75 80
Gly His Ser Phe Gly Asn Phe Gly Leu Gly Gly Gln Asn Gly Ala Ile
85 90 95
Val Ile Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr
100 105 110
Phe Ile Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asn Leu Asp Thr
115 120 125
Glu Leu Tyr Asn Ala Gly Asn Arg Ala Met Ala His Gly Ile Cys Pro
130 135 140
Ser Ile Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr
145 150 155 160
Ser Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val
165 170 175
Val Leu Ala Asn Ser Ser Val Val Arg Ala Ser Asp Thr Gln Asn Gln
180 185 190
Asp Val Leu Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val
195 200 205
Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Arg
210 215 220
Tyr Ser Tyr Ser Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu
225 230 235 240
Ala Lys Asp Trp Gln Ala Tyr Ile Ala Gln Glu Asn Leu Thr Trp Lys
245 250 255
Phe Ser Ser Asn Leu Ile Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly
260 265 270
Ile Phe Phe Gly Ser Lys Glu Glu Tyr Asp Lys Leu Asn Leu Glu Lys
275 280 285
Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Ile Thr Asn Trp
290 295 300
Leu Gly Met Ile Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Ile
305 310 315 320
Gly Asp Ser Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro
325 330 335
Asn Thr Leu Ile Phe Asp Ser Thr Ile Asp Glu Phe Phe Asp Tyr Ile
340 345 350
His Lys Ala Asn Ala Gly Thr Leu Ala Trp Ser Val Met Leu Ser Leu
355 360 365
Glu Gly Gly Ala Ile Asn Ala Val Pro Lys Asn Ala Thr Ala Tyr Gly
370 375 380
His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Val Val Asn Pro Leu
385 390 395 400
Gly Pro Ile Ser Gln Thr Thr Tyr Gly Phe Thr Asp Gly Leu Tyr Asn
405 410 415
Ile Leu Ala Arg Gly Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly
420 425 430
Cys Pro Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Asn
435 440 445
Asn Tyr Pro Arg Leu Glu Glu Leu Lys Arg Asp Leu Asp Pro Lys Asp
450 455 460
Ile Phe His Asn Pro Gln Gly Val Arg Val Ala Ser
465 470 475
<210> 172
<211> 474
<212> PRT
<213> Penicillium rubens
<400> 172
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Ser
1 5 10 15
Ala Val Gly Pro Ala His Val Thr Phe Gln Asp Ala Leu Leu Tyr Gln
20 25 30
Thr Thr Ala Val Asp Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala
35 40 45
Ala Val Thr Tyr Pro Gln Ser Ala Glu Glu Ile Ala Ala Val Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile Val Val
85 90 95
Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Val
100 105 110
Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asp Leu Asp Thr Glu Leu
115 120 125
Tyr Asn Ala Gly Gly Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile
130 135 140
Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Ile Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile
180 185 190
Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Gln Glu Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Phe Thr Phe Asn Leu Gly Ser Pro Ala Gln Lys Ala Lys Leu Val Lys
225 230 235 240
Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys Phe Tyr
245 250 255
Ser Asn Leu Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly Ile Phe
260 265 270
Phe Gly Ser Lys Glu Glu Tyr Asp Glu Leu Asp Leu Glu Lys Arg Phe
275 280 285
Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Ile Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr
325 330 335
Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Asp Tyr Ile His Lys
340 345 350
Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Ser Val Ser Glu Asp Ala Thr Ala Tyr Gly His Arg
370 375 380
Asp Val Leu Phe Trp Phe Gln Val Phe Val Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Gln Thr Thr Tyr Asp Phe Thr Asn Gly Leu Tyr Asp Val Leu
405 410 415
Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser Asn Leu
435 440 445
Pro Arg Leu Glu Asp Leu Lys Gly Asp Leu Asp Pro Lys Asp Thr Phe
450 455 460
His Asn Pro Gln Gly Val Gln Val Gly Pro
465 470
<210> 173
<211> 474
<212> PRT
<213> Penicillium flavigenum
<400> 173
Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Ser
1 5 10 15
Ala Val Gly Pro Ala His Val Thr Phe Gln Asp Ala Leu Leu Tyr Gln
20 25 30
Thr Thr Ala Val Asp Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala
35 40 45
Ala Val Thr Tyr Pro Gln Ser Ala Glu Glu Ile Ala Ala Val Val Lys
50 55 60
Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His
65 70 75 80
Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile Val Val
85 90 95
Glu Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Val
100 105 110
Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asp Leu Asp Thr Glu Leu
115 120 125
Tyr Asn Thr Gly Gly Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile
130 135 140
Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg
145 150 155 160
Gln Trp Gly Leu Ala Leu Asp His Ile Glu Glu Val Glu Val Val Leu
165 170 175
Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile
180 185 190
Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu
195 200 205
Phe Lys Val Arg Thr Gln Glu Ala Pro Gly Leu Ala Val Gln Tyr Ser
210 215 220
Phe Thr Phe Asn Leu Gly Ser Ala Ala Gln Lys Ala Lys Leu Val Lys
225 230 235 240
Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys Phe Tyr
245 250 255
Ser Asn Leu Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly Ile Phe
260 265 270
Phe Gly Ser Lys Glu Glu Tyr Asp Glu Leu Asp Leu Glu Lys Arg Phe
275 280 285
Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp Leu Gly
290 295 300
Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp
305 310 315 320
Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr
325 330 335
Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Asp Tyr Ile His Lys
340 345 350
Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly
355 360 365
Gly Ala Ile Asn Ser Val Ser Glu Asp Ala Thr Ala Tyr Gly His Arg
370 375 380
Asp Val Leu Phe Trp Phe Gln Val Phe Val Val Asn Pro Leu Gly Pro
385 390 395 400
Ile Ser Gln Thr Thr Tyr Asp Phe Thr Asn Gly Leu Tyr Asp Val Leu
405 410 415
Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly Cys Pro
420 425 430
Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser Asn Leu
435 440 445
Pro Arg Leu Glu Asp Leu Lys Gly Asp Leu Asp Pro Lys Asp Thr Phe
450 455 460
His Asn Pro Gln Gly Val Gln Val Gly Pro
465 470
<210> 174
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 174
Lys Val Gln Ala Arg Ser Gly Gly His
1 5
<210> 175
<400> 175
000
<210> 176
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa is Val or Ile
<220>
<221> misc_feature
<222> (11)..(11)
<223> Xaa is Phe or Leu
<220>
<221> misc_feature
<222> (14)..(14)
<223> Xaa is Val or Ile
<400> 176
Arg Ala Ser Asn Thr Gln Asn Gln Asp Xaa Xaa Phe Ala Xaa Lys
1 5 10 15
<210> 177
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 177
Arg Ala Ser Asn Thr Gln Asn Gln Asp Val Phe Phe Ala Val Lys
1 5 10 15
<210> 178
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 178
Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile Leu Phe Ala Val Lys
1 5 10 15
<210> 179
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 179
Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile Leu Phe Ala Ile Lys
1 5 10 15
<210> 180
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 180
Arg Ala Ser Asn Thr Gln Asn Gln Asp Val Leu Phe Ala Val Lys
1 5 10 15
<210> 181
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa is Lys or Arg
<400> 181
Cys Pro Thr Ile Xaa Thr Gly Gly His
1 5
<210> 182
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 182
Cys Pro Thr Ile Lys Thr Gly Gly His
1 5
<210> 183
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 183
Cys Pro Thr Ile Arg Thr Gly Gly His
1 5
<210> 184
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (16)..(16)
<223> Xaa is Ala or Pro
<220>
<221> misc_feature
<222> (23)..(23)
<223> Xaa is Ala or Gly
<400> 184
Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val Xaa
1 5 10 15
Glu Asp Ala Thr Ala Tyr Xaa His
20
<210> 185
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 185
Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val Ala
1 5 10 15
Glu Asp Ala Thr Ala Tyr Ala His
20
<210> 186
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa is Ile or Val
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa is Asp, Gln, or Glu
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa is Glu, Asp, or Gly
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa is Thr or Ala
<220>
<221> misc_feature
<222> (19)..(19)
<223> Xaa is Arg, Gln, or Lys
<220>
<221> misc_feature
<222> (25)..(25)
<223> Xaa is Val or Ala
<220>
<221> misc_feature
<222> (36)..(36)
<223> Xaa is Arg or Lys
<400> 186
Pro Xaa Ser Xaa Thr Thr Tyr Xaa Phe Xaa Asp Gly Leu Tyr Asp Val
1 5 10 15
Leu Ala Xaa Ala Val Pro Glu Ser Xaa Gly His Ala Tyr Leu Gly Cys
20 25 30
Pro Asp Pro Xaa Met
35
<210> 187
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 187
Pro Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val
1 5 10 15
Leu Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys
20 25 30
Pro Asp Pro Arg Met
35
<210> 188
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 188
Pro Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val
1 5 10 15
Leu Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys
20 25 30
Pro Asp Pro Arg Met
35
<210> 189
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa is Thr, Asn, or Ser
<400> 189
Met Lys His Phe Xaa Gln Phe Ser Met
1 5
<210> 190
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 190
Met Lys His Phe Thr Gln Phe Ser Met
1 5
<210> 191
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 191
Met Lys His Phe Ser Gln Phe Ser Met
1 5
<210> 192
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 192
Met Lys His Phe Asn Gln Phe Ser Met
1 5
<210> 193
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa is Glu or Gln
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa is Thr or Ser
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa is Glu, Ala, or Asp
<220>
<221> misc_feature
<222> (6)..(6)
<223> Xaa is Gln or Glu
<220>
<221> misc_feature
<222> (9)..(9)
<223> Xaa is Gly or Ala
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa is Val or Ile
<400> 193
Pro Xaa Xaa Ala Xaa Xaa Ile Ala Xaa Xaa Val Lys Cys
1 5 10
<210> 194
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 194
Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys Cys
1 5 10
<210> 195
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 195
Pro Gln Ser Ala Asp Glu Ile Ala Ala Val Val Lys Cys
1 5 10
<210> 196
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 196
Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys Cys
1 5 10
<210> 197
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 197
Pro Gln Ser Ala Glu Glu Ile Ala Ala Val Val Lys Cys
1 5 10
<210> 198
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 198
Pro Glu Thr Ala Glu Gln Ile Ala Gly Val Val Lys Cys
1 5 10
<210> 199
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 199
Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val Lys Cys
1 5 10
<210> 200
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa is Ile or Val
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa is Leu or Val
<220>
<221> misc_feature
<222> (12)..(12)
<223> Xaa is Ser or Ala
<220>
<221> misc_feature
<222> (14)..(14)
<223> Xaa is Leu or His
<220>
<221> misc_feature
<222> (15)..(15)
<223> Xaa is Ala or Val
<220>
<221> misc_feature
<222> (16)..(16)
<223> Xaa is Ala or Val
<220>
<221> misc_feature
<222> (18)..(18)
<223> Xaa is Pro or Gln
<220>
<221> misc_feature
<222> (19)..(19)
<223> Xaa is Asn or Asp
<220>
<221> misc_feature
<222> (20)..(20)
<223> Xaa is Gln or Glu
<220>
<221> misc_feature
<222> (23)..(23)
<223> Xaa is Trp or Tyr
<400> 200
Arg Asp Cys Leu Xaa Ser Ala Xaa Gly Gly Asn Xaa Ala Xaa Xaa Xaa
1 5 10 15
Phe Xaa Xaa Xaa Leu Leu Xaa
20
<210> 201
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 201
Arg Asp Cys Leu Ile Ser Ala Val Gly Gly Asn Ala Ala His Val Ala
1 5 10 15
Phe Gln Asp Gln Leu Leu Tyr
20
<210> 202
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 202
Arg Asp Cys Leu Ile Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Val
1 5 10 15
Phe Pro Asn Glu Leu Leu Trp
20
<210> 203
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 203
Arg Asp Cys Leu Ile Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Ala
1 5 10 15
Phe Pro Asn Glu Leu Leu Trp
20
<210> 204
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 204
Arg Asp Cys Leu Ile Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Val
1 5 10 15
Phe Pro Asn Gln Leu Leu Trp
20
<210> 205
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 205
Arg Asp Cys Leu Ile Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Ala
1 5 10 15
Phe Pro Asn Gln Leu Leu Trp
20
<210> 206
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 206
Arg Asp Cys Leu Val Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Ala
1 5 10 15
Phe Pro Asn Gln Leu Leu Trp
20
<210> 207
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa is Glu or Gln
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa is Pro or Gln
<400> 207
Arg Thr Xaa Xaa Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr
1 5 10
<210> 208
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 208
Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr
1 5 10
<210> 209
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 209
Arg Thr Glu Gln Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr
1 5 10
<210> 210
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 210
Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr
1 5 10
<210> 211
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa is Ser or Ala
<220>
<221> misc_feature
<222> (6)..(6)
<223> Xaa is Ser or Ala
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa is Ala or Gln
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa is Lys or Glu
<220>
<221> misc_feature
<222> (12)..(12)
<223> Xaa is Arg or Trp
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa is Gln or Lys
<220>
<221> misc_feature
<222> (16)..(16)
<223> Xaa is Asn, Ser, or Thr
<400> 211
Trp Gln Xaa Phe Ile Xaa Xaa Xaa Asn Leu Thr Xaa Xaa Phe Tyr Xaa
1 5 10 15
Asn Met
<210> 212
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 212
Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Asn
1 5 10 15
Asn Met
<210> 213
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 213
Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Thr
1 5 10 15
Asn Met
<210> 214
<211> 517
<212> PRT
<213> C. sativa
<400> 214
Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Lys His Ile Pro Asn
1 5 10 15
Asn Val Ala Asn Pro Lys Leu Val Tyr Thr Gln His Asp Gln Leu Tyr
20 25 30
Met Ser Ile Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Ile Ser Asp
35 40 45
Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn Asn Ser His
50 55 60
Ile Gln Ala Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg
65 70 75 80
Thr Arg Ser Gly Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln
85 90 95
Val Pro Phe Val Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile
100 105 110
Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly
115 120 125
Glu Val Tyr Tyr Trp Ile Asn Glu Lys Asn Glu Asn Leu Ser Phe Pro
130 135 140
Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly
145 150 155 160
Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile
165 170 175
Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys
180 185 190
Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu
195 200 205
Asn Phe Gly Ile Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro
210 215 220
Ser Lys Ser Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly
225 230 235 240
Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp
245 250 255
Lys Asp Leu Val Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp
260 265 270
Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile
275 280 285
Phe His Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe
290 295 300
Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile
305 310 315 320
Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn
325 330 335
Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala
340 345 350
Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala
355 360 365
Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Ala Gly
370 375 380
Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu
385 390 395 400
Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp
405 410 415
Tyr Thr Ala Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn
420 425 430
Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn
435 440 445
Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr
450 455 460
Asn His Ala Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu
465 470 475 480
Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys
485 490 495
Val Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu
500 505 510
Pro Pro His His His
515
<210> 215
<211> 516
<212> PRT
<213> C. sativa
<400> 215
Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Gln Tyr Ile Pro Asn
1 5 10 15
Asn Ala Thr Asn Leu Lys Leu Val Tyr Thr Gln Asn Asn Pro Leu Tyr
20 25 30
Met Ser Val Leu Asn Ser Thr Ile His Asn Leu Arg Phe Thr Ser Asp
35 40 45
Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser His Val Ser His
50 55 60
Ile Gln Gly Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg
65 70 75 80
Thr Arg Ser Gly Gly His Asp Ser Glu Gly Met Ser Tyr Ile Ser Gln
85 90 95
Val Pro Phe Val Ile Val Asp Leu Arg Asn Met Arg Ser Ile Lys Ile
100 105 110
Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly
115 120 125
Glu Val Tyr Tyr Trp Val Asn Glu Lys Asn Glu Asn Leu Ser Leu Ala
130 135 140
Ala Gly Tyr Cys Pro Thr Val Cys Ala Gly Gly His Phe Gly Gly Gly
145 150 155 160
Gly Tyr Gly Pro Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile
165 170 175
Ile Asp Ala His Leu Val Asn Val His Gly Lys Val Leu Asp Arg Lys
180 185 190
Ser Met Gly Glu Asp Leu Phe Trp Ala Leu Arg Gly Gly Gly Ala Glu
195 200 205
Ser Phe Gly Ile Ile Val Ala Trp Lys Ile Arg Leu Val Ala Val Pro
210 215 220
Lys Ser Thr Met Phe Ser Val Lys Lys Ile Met Glu Ile His Glu Leu
225 230 235 240
Val Lys Leu Val Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys
245 250 255
Asp Leu Leu Leu Met Thr His Phe Ile Thr Arg Asn Ile Thr Asp Asn
260 265 270
Gln Gly Lys Asn Lys Thr Ala Ile His Thr Tyr Phe Ser Ser Val Phe
275 280 285
Leu Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro
290 295 300
Glu Leu Gly Ile Lys Lys Thr Asp Cys Arg Gln Leu Ser Trp Ile Asp
305 310 315 320
Thr Ile Ile Phe Tyr Ser Gly Val Val Asn Tyr Asp Thr Asp Asn Phe
325 330 335
Asn Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Gln Asn Gly Ala Phe
340 345 350
Lys Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Ser Val Phe
355 360 365
Val Gln Ile Leu Glu Lys Leu Tyr Glu Glu Asp Ile Gly Ala Gly Met
370 375 380
Tyr Ala Leu Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu Ser
385 390 395 400
Ala Ile Pro Phe Pro His Arg Ala Gly Ile Leu Tyr Glu Leu Trp Tyr
405 410 415
Ile Cys Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Leu Asn Trp
420 425 430
Ile Arg Asn Ile Tyr Asn Phe Met Thr Pro Tyr Val Ser Lys Asn Pro
435 440 445
Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Asp
450 455 460
Pro Lys Asn Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys
465 470 475 480
Tyr Phe Gly Lys Asn Phe Asp Arg Leu Val Lys Val Lys Thr Leu Val
485 490 495
Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro
500 505 510
Arg His Arg His
515
Claims (74)
- 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포로서, TS는 서열번호 27 또는 25와 적어도 90% 동일한 서열을 포함하고, 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있는 것인 숙주 세포.
- 제1항에 있어서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함하는 것인 숙주 세포.
- 제2항에 있어서, TS는 다음을 포함하는 것인 숙주 세포:
(i) 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D;
(ii) 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F;
(iii) 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S;
(iv) 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E;
(v) 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A;
(vi) 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I;
(vii) 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I;
(viii) 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I;
(ix) 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T;
(x) 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E;
(xi) 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D;
(xii) 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W;
(xiii) 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S;
(xiv) 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T;
(xv) 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T;
(xvi) 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G;
(xvii) 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M;
(xviii) 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S;
(xix) 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F;
(xx) 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R;
(xxi) 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S;
(xxii) 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S;
(xxiii) 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A;
(xxiv) 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H;
(xxv) 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T;
(xxvi) 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L;
(xxvii) 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N;
(xxviii) 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A;
(xxix) 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y;
(xxx) 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는
(xxxi) 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A. - 제1항 내지 제3항 중 어느 한 항에 있어서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함하는 것인 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 칸나비노이드는 CBC 유형 칸나비노이드인 숙주 세포.
- 제5항에 있어서, 칸나비노이드는 칸나비크로멘산(CBCA) 및/또는 칸나비크로메바린산(CBCVA)인 숙주 세포.
- 제6항에 있어서, 숙주 세포는 테트라하이드로칸나비놀산(THCA), 칸나비디올산(CBDA) 및/또는 테트라하이드로칸나비바린산(THCVA) 중 하나 이상을 추가로 생성하는 것인 숙주 세포.
- 제2항 내지 제7항 중 어느 한 항에 있어서, TS는 대조군 TS보다 더 높은 비율의 CBCA:CBDA, CBCA:THCA, 및/또는 CBCVA:THCVA를 생성하는 것인 숙주 세포.
- 제8항에 있어서, 대조군 TS는 서열번호 20, 23, 25 또는 27의 서열을 포함하는 TS인 숙주 세포.
- 제2항 내지 제9항 중 어느 한 항에 있어서, TS는 서열번호 27에 비해 하기 아미노산 치환: A57Q 및 G61A; Y71I; 및/또는 V260F 중 하나 이상을 포함하는 것인 숙주 세포.
- 제2항 내지 제10항 중 어느 한 항에 있어서, TS는 대조군 TS보다 CBC 유형 칸나비노이드에 대해 더 높은 생성물 특이성을 갖는 것인 숙주 세포.
- 제11항에 있어서, 대조군 TS는 서열번호 20, 23, 25 또는 27의 서열을 포함하는 TS인 숙주 세포.
- 제1항 내지 제7항 중 어느 한 항에 있어서, TS는 서열번호 27의 서열에 비해 Y39F 및/또는 V63I를 포함하는 것인 숙주 세포.
- 제1항 및 제5항 내지 제7항 중 어느 한 항에 있어서, TS는 서열번호 25, 27, 105, 126, 134, 155, 162, 164, 또는 165 중 어느 하나의 서열을 포함하고, 임의로 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함하는 것인 숙주 세포.
- 제1항 내지 제14항 중 어느 한 항에 있어서, TS의 서열은 하기 모티프 중 하나 이상을 포함하는 것인 숙주 세포:
(i) KVQARSGGH(서열번호 174);
(ii) RASNTQNQD[VI][FL]FA[VI]K(서열번호 176);
(iii) CPTI[KR]TGGH(서열번호 181);
(iv) WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184);
(v) P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186);
(vi) MKHF[TNS]QFSM(서열번호 189);
(vii) P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193);
(viii) RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200);
(ix) RT[EQ][PQ]APGLAVQYSY(서열번호 207); 및/또는
(x) WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211). - 칸나비노이드를 생성하기 위한 숙주 세포로서, 숙주 세포는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하고, TS의 서열은 하기 모티프 중 하나 이상을 포함하고:
(i) KVQARSGGH(서열번호 174);
(ii) RASNTQNQD[VI][FL]FA[VI]K(서열번호 176);
(iii) CPTI[KR]TGGH(서열번호 181);
(iv) WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184);
(v) P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186);
(vi) MKHF[TNS]QFSM(서열번호 189);
(vii) P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193);
(viii) RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200);
(ix) RT[EQ][PQ]APGLAVQYSY(서열번호 207); 및/또는
(x) WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211);
숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있는 것인 숙주 세포. - 제16항에 있어서,
(i) 모티프 KVQARSGGH(서열번호 174)는 서열번호 27의 잔기 72-80에 상응하는 TS의 잔기에 위치하고;
(ii) 모티프 RASNTQNQD[VI][FL]FA[VI]K(서열번호 176)는 서열번호 27의 잔기 183-197에 상응하는 TS의 잔기에 위치하고;
(iii) 모티프 CPTI[KR]TGGH(서열번호 181)는 서열번호 27의 잔기 141-149에 상응하는 TS의 잔기에 위치하고;
(iv) 모티프 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)는 서열번호 27의 잔기 360-383에 상응하는 TS의 잔기에 위치하고;
(v) 모티프 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 서열번호 27의 잔기 400-436에 상응하는 TS의 잔기에 위치하고;
(vi) 모티프 MKHF[TNS]QFSM(서열번호 189)은 서열번호 27의 잔기 98-106에 상응하는 TS의 잔기에 위치하고;
(vii) 모티프 P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193)는 서열번호 27의 잔기 53-65에 상응하는 TS의 잔기에 위치하고;
(viii) 모티프 RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200)는 서열번호 27의 잔기 10-32에 상응하는 TS의 잔기에 위치하고;
(ix) 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)는 서열번호 27의 잔기 212-225에 상응하는 TS의 잔기에 위치하고/하거나;
(x) 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 서열번호 27의 잔기 242-259에 상응하는 TS의 잔기에 위치하는 것인 숙주 세포. - 제16항 또는 제17항에 있어서, TS는 진균 TS 또는 이의 보존적으로 치환된 버전인 숙주 세포.
- 제18항에 있어서, TS는 아스페르길루스 TS 또는 이의 보존적으로 치환된 버전인 숙주 세포.
- 제16항 내지 제19항 중 어느 한 항에 있어서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하는 것인 숙주 세포.
- 제20항에 있어서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함하는 것인 숙주 세포.
- 제21항에 있어서, TS는 하기를 포함하는 것인 숙주 세포:
(i) 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D;
(ii) 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F;
(iii) 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S;
(iv) 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E;
(v) 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A;
(vi) 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I;
(vii) 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I;
(viii) 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I;
(ix) 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T;
(x) 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E;
(xi) 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D;
(xii) 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W;
(xiii) 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S;
(xiv) 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T;
(xv) 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T;
(xvi) 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G;
(xvii) 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M;
(xviii) 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S;
(xix) 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F;
(xx) 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R;
(xxi) 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S;
(xxii) 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S;
(xxiii) 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A;
(xxiv) 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H;
(xxv) 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T;
(xxvi) 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L;
(xxvii) 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N;
(xxviii) 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A;
(xxix) 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y;
(xxx) 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는
(xxxi) 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A. - 제20항 내지 제22항 중 어느 한 항에 있어서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함하는 것인 숙주 세포.
- 제20항에 있어서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 143, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 서열 또는 이의 보존적으로 치환된 버전을 포함하는 것인 숙주 세포.
- 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포로서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하고, 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있는 것인 숙주 세포.
- 제25항에 있어서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 하나 이상의 신호 펩티드에 연결된 것인 숙주 세포.
- 제26항에 있어서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가 또는 결실을 갖는 서열을 포함하는 신호 펩티드에 연결된 것인 숙주 세포.
- 제26항 또는 제27항에 있어서, 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열의 N-말단에 연결된 것인 숙주 세포.
- 제28항에 있어서, N-말단 메티오닌이 서열번호 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172로부터 제거되고, 메티오닌 잔기가 신호 펩티드의 N-말단에 부가된 것인 숙주 세포.
- 제25항 내지 제29항 중 어느 한 항에 있어서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드에 연결된 것인 숙주 세포.
- 제30항에 있어서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열의 C-말단에 연결된 것인 숙주 세포.
- 제25항 내지 제31항 중 어느 한 항에 있어서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함하는 것인 숙주 세포.
- 제32항에 있어서, TS는 다음을 포함하는 것인 숙주 세포:
(i) 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D;
(ii) 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F;
(iii) 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S;
(iv) 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E;
(v) 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A;
(vi) 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I;
(vii) 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I;
(viii) 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I;
(ix) 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T;
(x) 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E;
(xi) 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D;
(xii) 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W;
(xiii) 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S;
(xiv) 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T;
(xv) 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T;
(xvi) 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G;
(xvii) 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M;
(xviii) 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S;
(xix) 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F;
(xx) 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R;
(xxi) 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S;
(xxii) 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S;
(xxiii) 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A;
(xxiv) 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H;
(xxv) 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T;
(xxvi) 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L;
(xxvii) 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N;
(xxviii) 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A;
(xxix) 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y;
(xxx) 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는
(xxxi) 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A. - 제25항 내지 제33항 중 어느 한 항에 있어서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함하는 것인 숙주 세포.
- 제25항 내지 제34항 중 어느 한 항에 있어서, 이종 폴리뉴클레오티드는 서열번호 26, 28, 35, 42, 56, 60, 64, 74, 85, 89, 92, 93, 94, 95, 96, 97, 및 102 중 어느 하나와 적어도 90% 동일한 서열을 포함하는 것인 숙주 세포.
- 제25항 내지 제31항 및 제35항 중 어느 한 항에 있어서, TS 서열은 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167 및 172 중 어느 하나를 포함하는 것인 숙주 세포.
- 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포로서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하거나, 숙주 세포는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 보존적으로 치환된 버전을 포함하는 것인 숙주 세포.
- 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포로서, 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있고, TS는 진균 TS 또는 이의 보존적으로 치환된 버전인 숙주 세포.
- 제38항에 있어서, 진균 TS는 아스페르길루스 TS 또는 이의 보존적으로 치환된 버전인 숙주 세포.
- 제16항 내지 제39항 중 어느 한 항에 있어서, 칸나비노이드는 CBC 유형 칸나비노이드인 숙주 세포.
- 제40항에 있어서, 칸나비노이드는 칸나비크로멘산(CBCA) 및/또는 칸나비크로메바린산(CBCVA)인 숙주 세포.
- 제41항에 있어서, 숙주 세포는 테트라하이드로칸나비놀산(THCA), 칸나비디올산(CBDA) 및/또는 테트라하이드로칸나비바린산(THCVA) 중 하나 이상을 추가로 생성하는 것인 숙주 세포.
- 제1항 내지 제42항 중 어느 한 항에 있어서, 숙주 세포는 식물 세포, 조류 세포, 효모 세포, 박테리아 세포, 또는 동물 세포인 숙주 세포.
- 제43항에 있어서, 숙주 세포는 효모 세포인 숙주 세포.
- 제44항에 있어서, 효모 세포는 사카로마이세스(Saccharomyces) 세포, 야로위아(Yarrowia) 세포, 코마가타엘라(Komagataella) 세포, 또는 피키아(Pichia) 세포인 숙주 세포.
- 제45항에 있어서, 사카로마이세스 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 세포인 숙주 세포.
- 제43항에 있어서, 숙주 세포는 박테리아 세포인 숙주 세포.
- 제47항에 있어서, 박테리아 세포는 이. 콜라이(E. coli) 세포인 숙주 세포.
- 제1항 내지 제48항 중 어느 한 항에 있어서, 숙주 세포는 아실 활성화 효소(AAE), 폴리케타이드 신타제(PKS), 폴리케타이드 사이클라제(PKC), 프레닐트랜스퍼라제(PT), 및/또는 추가 말단 신타제(TS) 중 하나 이상을 코딩하는 하나 이상의 이종 폴리뉴클레오티드를 추가로 포함하는 것인 숙주 세포.
- 제49항에 있어서, PKS는 올리베톨 신타제(OLS) 또는 디바리놀 신타제인 숙주 세포.
- 제1항 내지 제50항 중 어느 한 항의 숙주 세포를 배양하는 단계를 포함하는 방법.
- CBG 유형 칸나비노이드를 말단 신타제(TS)와 접촉시키는 단계를 포함하는 칸나비노이드의 생성 방법으로서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하는 것인 방법.
- 제52항에 있어서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 시험관내에서 발생하는 것인 방법.
- 제52항 또는 제53항에 있어서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 생체내에서 발생하는 것인 방법.
- 제54항에 있어서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 숙주 세포에서 발생하는 것인 방법.
- 칸나비노이드의 생성 방법으로서, CBD 유형 칸나비노이드, THC 유형 칸나비노이드 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환하도록 적응된 산화적 고리화 촉매와 CBG 유형 칸나비노이드를 생체내에서 접촉시키는 단계를 포함하는 방법.
- 제52항 내지 제56항 중 어느 한 항에 있어서, 칸나비노이드는 CBG 유형 칸나비노이드의 고리화된 생성물인 방법.
- 제57항에 있어서, 칸나비노이드는 고리화된 프레닐 모이어티를 갖는 칸나비노이드인 방법.
- 제58항에 있어서, 칸나비노이드는 CBC 유형 칸나비노이드, CBD 유형 칸나비노이드, 또는 THC 유형 칸나비노이드인 방법.
- 제59항에 있어서, 칸나비노이드는 CBC 유형 칸나비노이드인 방법.
- 제52항 내지 제60항 중 어느 한 항에 있어서, CBG 유형 칸나비노이드는 칸나비게롤산인 방법.
- 제60항에 있어서, CBC 유형 칸나비노이드는 CBCA인 방법.
- 제52항 내지 제62항 중 어느 한 항에 있어서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 서열 또는 이의 보존적으로 치환된 버전을 포함하는 것인 방법.
- CBG 유형 칸나비노이드, 및 CBG 유형 칸나비노이드, THC 유형 칸나비노이드, 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환시키기 위해 CBG 유형 칸나비노이드의 산화적 고리화를 촉매하는 수단을 포함하는 숙주 세포.
- CBG 유형 칸나비노이드, 및 CBG 유형 칸나비노이드, THC 유형 칸나비노이드, 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환되도록 적응된 산화적 고리화 촉매를 포함하는 숙주 세포.
- 제65항에 있어서, CBC 유형 칸나비노이드를 생성하기 위해 CBG 유형 칸나비노이드의 산화적 고리화를 촉매하는 수단은 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드이며, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열 또는 이의 보존적으로 치환된 버전을 포함하는 것인 숙주 세포.
- 제66항에 있어서, TS는 또한 THCA, THCVA 또는 CBDA를 생성할 수 있는 것인 숙주 세포.
- 말단 신타제(TS)를 코딩하는 비-자연 발생 핵산으로서, 비-자연 발생 핵산은 서열번호 26, 28, 35, 42, 56, 60, 64, 74, 85, 89, 92, 93, 94, 95, 96, 97, 및 102 중 어느 하나와 적어도 90% 동일성을 갖는 서열을 포함하는 것인 비-자연 발생 핵산.
- 제68항의 비-자연 발생 핵산을 포함하는 벡터.
- 제68항의 비-자연 발생 핵산을 포함하는 발현 카세트.
- 제68항의 비-자연 발생 핵산, 제69항의 벡터, 또는 제70항의 발현 카세트로 형질전환된 숙주 세포.
- 칸나비노이드를 생성하기 위한 생물반응기로서, 생물반응기는 CBG 유형 칸나비노이드 및 말단 신타제(TS)를 포함하고, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하거나, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 보존적으로 치환된 버전을 포함하는 것인 생물반응기.
- 비-자연 발생 말단 신타제(TS)로서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하는 것인 비-자연 발생 말단 신타제(TS).
- THC 유형 화합물 또는 CBD 유형 화합물과 비교하여 생체내에서 CBG 유형 칸나비노이드를 CBC 유형 화합물로 우선적으로 전환하도록 적응된 산화적 고리화 촉매.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063000419P | 2020-03-26 | 2020-03-26 | |
US63/000,419 | 2020-03-26 | ||
PCT/US2021/024398 WO2021195520A1 (en) | 2020-03-26 | 2021-03-26 | Biosynthesis of cannabinoids and cannabinoid precursors |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220158770A true KR20220158770A (ko) | 2022-12-01 |
Family
ID=77890617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227036684A KR20220158770A (ko) | 2020-03-26 | 2021-03-26 | 칸나비노이드 및 칸나비노이드 전구체의 생합성 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230137139A1 (ko) |
EP (1) | EP4127149A4 (ko) |
JP (1) | JP2023518826A (ko) |
KR (1) | KR20220158770A (ko) |
AU (1) | AU2021244264A1 (ko) |
CA (1) | CA3176621A1 (ko) |
IL (1) | IL296717A (ko) |
WO (1) | WO2021195520A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4409015A1 (en) * | 2021-09-29 | 2024-08-07 | Ginkgo Bioworks, Inc. | Biosynthesis of cannabinoids and cannabinoid precursors |
AU2022363796A1 (en) * | 2021-10-15 | 2024-05-16 | Cellibre, Inc. | Optimized biosynthesis pathway for cannabinoid biosynthesis |
AU2023204836A1 (en) * | 2022-01-07 | 2024-08-01 | Invizyne Technologies, Inc. | Recombinant polypeptides with berberine bridge enzyme activity useful for the biosynthesis of cannabinoids |
WO2023168277A2 (en) * | 2022-03-02 | 2023-09-07 | Genomatica, Inc. | Method of producing cannabinoids |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019209885A2 (en) * | 2018-04-23 | 2019-10-31 | Renew Biopharma, Inc. | Enzyme engineering to alter the functional repertoire of cannabinoid synthases |
-
2021
- 2021-03-26 JP JP2022557154A patent/JP2023518826A/ja active Pending
- 2021-03-26 AU AU2021244264A patent/AU2021244264A1/en active Pending
- 2021-03-26 KR KR1020227036684A patent/KR20220158770A/ko unknown
- 2021-03-26 IL IL296717A patent/IL296717A/en unknown
- 2021-03-26 EP EP21776515.5A patent/EP4127149A4/en active Pending
- 2021-03-26 US US17/914,060 patent/US20230137139A1/en active Pending
- 2021-03-26 WO PCT/US2021/024398 patent/WO2021195520A1/en unknown
- 2021-03-26 CA CA3176621A patent/CA3176621A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4127149A4 (en) | 2024-04-24 |
IL296717A (en) | 2022-11-01 |
EP4127149A1 (en) | 2023-02-08 |
US20230137139A1 (en) | 2023-05-04 |
CA3176621A1 (en) | 2021-09-30 |
AU2021244264A1 (en) | 2022-10-13 |
WO2021195520A1 (en) | 2021-09-30 |
JP2023518826A (ja) | 2023-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220158770A (ko) | 칸나비노이드 및 칸나비노이드 전구체의 생합성 | |
US20220306999A1 (en) | Biosynthesis of cannabinoids and cannabinoid precursors | |
US11274320B2 (en) | Biosynthesis of cannabinoids and cannabinoid precursors | |
JP7213167B2 (ja) | 酵素およびその適用 | |
CN107099516A (zh) | 7β‑羟基甾醇脱氢酶突变体及其在熊脱氧胆酸合成中的应用 | |
US20220112526A1 (en) | Biosynthesis of vanillin from isoeugenol | |
US20240026392A1 (en) | Biosynthesis of cannabinoids and cannabinoid precursors | |
WO2023056350A9 (en) | Biosynthesis of cannabinoids and cannabinoid precursors | |
CN103898178A (zh) | 酶法制备高手性纯(s)-3-哌啶醇及其衍生物的方法 | |
CN116574706A (zh) | 羰基还原酶突变体及在依鲁替尼关键中间体合成中的应用 | |
CN107828752B (zh) | 一种蔗糖淀粉酶、制备方法及在生产α-熊果苷中的应用 | |
US20230340446A1 (en) | Biosynthesis of cannabinoids and cannabinoid precursors | |
US20240110206A1 (en) | Biosynthesis of cannabinoids and cannabinoid precursors | |
WO2023212519A1 (en) | Biosynthesis of cannabinoids and cannabinoid precursors | |
WO2023183857A1 (en) | Biosynthesis of cannabinoids and cannabinoid precursors | |
US20240218409A1 (en) | Carbonyl reductase mutant, preparation method and use thereof, and preparation method of ethyl (R)-6-hydroxy-8-chlorooctanoate | |
CN103911406B (zh) | 酶法还原合成(s)-3-羟基吡咯烷及其衍生物的方法 | |
KR20230150337A (ko) | 하이드록시티로솔을 제조하는 방법 | |
CN117625506A (zh) | 一种生产n-乙酰基-反式-4-羟基脯氨酸的工程菌及应用 |