PL202457B1 - Polinukleotyd przyspieszający biosyntezę ML-236B, wektor, komórka gospodarza transformowana tym wektorem, polipeptyd, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny - Google Patents
Polinukleotyd przyspieszający biosyntezę ML-236B, wektor, komórka gospodarza transformowana tym wektorem, polipeptyd, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatynyInfo
- Publication number
- PL202457B1 PL202457B1 PL347118A PL34711801A PL202457B1 PL 202457 B1 PL202457 B1 PL 202457B1 PL 347118 A PL347118 A PL 347118A PL 34711801 A PL34711801 A PL 34711801A PL 202457 B1 PL202457 B1 PL 202457B1
- Authority
- PL
- Poland
- Prior art keywords
- seq
- polynucleotide
- dna
- sequence
- vector
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 130
- 238000005054 agglomeration Methods 0.000 title 1
- 230000002776 aggregation Effects 0.000 title 1
- AJLFOPYRIVGYMJ-INTXDZFKSA-N mevastatin Chemical compound C([C@H]1[C@@H](C)C=CC2=CCC[C@@H]([C@H]12)OC(=O)[C@@H](C)CC)C[C@@H]1C[C@@H](O)CC(=O)O1 AJLFOPYRIVGYMJ-INTXDZFKSA-N 0.000 claims abstract description 176
- 244000005700 microbiome Species 0.000 claims abstract description 88
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 61
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 61
- 239000002157 polynucleotide Substances 0.000 claims abstract description 61
- TUZYXOIXSAXUGO-PZAWKZKUSA-N pravastatin Chemical compound C1=C[C@H](C)[C@H](CC[C@@H](O)C[C@@H](O)CC(O)=O)[C@H]2[C@@H](OC(=O)[C@@H](C)CC)C[C@H](O)C=C21 TUZYXOIXSAXUGO-PZAWKZKUSA-N 0.000 claims abstract description 16
- TUZYXOIXSAXUGO-UHFFFAOYSA-N Pravastatin Natural products C1=CC(C)C(CCC(O)CC(O)CC(O)=O)C2C(OC(=O)C(C)CC)CC(O)C=C21 TUZYXOIXSAXUGO-UHFFFAOYSA-N 0.000 claims abstract description 15
- 229960002965 pravastatin Drugs 0.000 claims abstract description 15
- 108020004414 DNA Proteins 0.000 claims description 245
- 239000002773 nucleotide Substances 0.000 claims description 131
- 125000003729 nucleotide group Chemical group 0.000 claims description 131
- 239000002299 complementary DNA Substances 0.000 claims description 117
- 241000228153 Penicillium citrinum Species 0.000 claims description 100
- 238000000034 method Methods 0.000 claims description 96
- 239000013598 vector Substances 0.000 claims description 84
- 230000015572 biosynthetic process Effects 0.000 claims description 81
- 241000588724 Escherichia coli Species 0.000 claims description 51
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 37
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 35
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 35
- 229920001184 polypeptide Polymers 0.000 claims description 34
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 29
- 238000004519 manufacturing process Methods 0.000 claims description 20
- 108020004999 messenger RNA Proteins 0.000 claims description 19
- 239000013604 expression vector Substances 0.000 claims description 14
- 102000004169 proteins and genes Human genes 0.000 claims description 13
- 238000012258 culturing Methods 0.000 claims description 10
- 108020004635 Complementary DNA Proteins 0.000 claims description 9
- BOZILQFLQYBIIY-UHFFFAOYSA-N mevastatin hydroxy acid Natural products C1=CC(C)C(CCC(O)CC(O)CC(O)=O)C2C(OC(=O)C(C)CC)CCC=C21 BOZILQFLQYBIIY-UHFFFAOYSA-N 0.000 claims description 6
- 241000228143 Penicillium Species 0.000 claims description 4
- 230000001965 increasing effect Effects 0.000 claims description 4
- 230000001737 promoting effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 abstract description 17
- 108010030975 Polyketide Synthases Proteins 0.000 abstract description 5
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 abstract description 3
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 abstract description 3
- 239000003112 inhibitor Substances 0.000 abstract description 3
- 235000013351 cheese Nutrition 0.000 description 664
- 239000013615 primer Substances 0.000 description 119
- 241000282326 Felis catus Species 0.000 description 93
- 210000004027 cell Anatomy 0.000 description 77
- 239000012634 fragment Substances 0.000 description 59
- 239000013612 plasmid Substances 0.000 description 58
- 241001122767 Theaceae Species 0.000 description 52
- 238000003757 reverse transcription PCR Methods 0.000 description 51
- 101150021784 mlcE gene Proteins 0.000 description 42
- 108091034117 Oligonucleotide Proteins 0.000 description 39
- 239000002609 medium Substances 0.000 description 34
- 101150105241 mlcR gene Proteins 0.000 description 32
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 31
- 108010050848 glycylleucine Proteins 0.000 description 31
- 239000000047 product Substances 0.000 description 30
- 101100457370 Dictyostelium discoideum mlcR gene Proteins 0.000 description 29
- 239000000243 solution Substances 0.000 description 29
- 101100513514 Penicillium citrinum mlcA gene Proteins 0.000 description 28
- 108010047495 alanylglycine Proteins 0.000 description 27
- 239000000203 mixture Substances 0.000 description 27
- 108091008146 restriction endonucleases Proteins 0.000 description 27
- 230000000295 complement effect Effects 0.000 description 26
- 108010037850 glycylvaline Proteins 0.000 description 26
- 101150059740 mlcB gene Proteins 0.000 description 26
- 101150069354 mlcD gene Proteins 0.000 description 26
- 108010049041 glutamylalanine Proteins 0.000 description 25
- 238000009396 hybridization Methods 0.000 description 25
- 108010061238 threonyl-glycine Proteins 0.000 description 25
- 101100401740 Dictyostelium discoideum mlcE gene Proteins 0.000 description 24
- 230000000692 anti-sense effect Effects 0.000 description 23
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 21
- 108010005233 alanylglutamic acid Proteins 0.000 description 21
- 239000000523 sample Substances 0.000 description 21
- 238000013519 translation Methods 0.000 description 21
- 238000010367 cloning Methods 0.000 description 20
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 20
- 239000000499 gel Substances 0.000 description 19
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 18
- 108010034529 leucyl-lysine Proteins 0.000 description 18
- 210000001938 protoplast Anatomy 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 16
- 238000011534 incubation Methods 0.000 description 16
- 108010057821 leucylproline Proteins 0.000 description 16
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 15
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 15
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 15
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 15
- 108010038633 aspartylglutamate Proteins 0.000 description 15
- 108010003700 lysyl aspartic acid Proteins 0.000 description 15
- 239000012528 membrane Substances 0.000 description 15
- 108010073969 valyllysine Proteins 0.000 description 15
- 229920001817 Agar Polymers 0.000 description 14
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 14
- 108010079364 N-glycylalanine Proteins 0.000 description 14
- 108020005038 Terminator Codon Proteins 0.000 description 14
- 239000008272 agar Substances 0.000 description 14
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 14
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 13
- 108010093581 aspartyl-proline Proteins 0.000 description 13
- 239000002585 base Substances 0.000 description 13
- 108010077515 glycylproline Proteins 0.000 description 13
- 108010029020 prolylglycine Proteins 0.000 description 13
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 12
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 12
- PCZOHLXUXFIOCF-UHFFFAOYSA-N Monacolin X Natural products C12C(OC(=O)C(C)CC)CC(C)C=C2C=CC(C)C1CCC1CC(O)CC(=O)O1 PCZOHLXUXFIOCF-UHFFFAOYSA-N 0.000 description 12
- 108020004511 Recombinant DNA Proteins 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 238000000246 agarose gel electrophoresis Methods 0.000 description 12
- 108010013835 arginine glutamate Proteins 0.000 description 12
- PCZOHLXUXFIOCF-BXMDZJJMSA-N lovastatin Chemical compound C([C@H]1[C@@H](C)C=CC2=C[C@H](C)C[C@@H]([C@H]12)OC(=O)[C@@H](C)CC)C[C@@H]1C[C@@H](O)CC(=O)O1 PCZOHLXUXFIOCF-BXMDZJJMSA-N 0.000 description 12
- 229960004844 lovastatin Drugs 0.000 description 12
- QLJODMDSTUBWDW-UHFFFAOYSA-N lovastatin hydroxy acid Natural products C1=CC(C)C(CCC(O)CC(O)CC(O)=O)C2C(OC(=O)C(C)CC)CC(C)C=C21 QLJODMDSTUBWDW-UHFFFAOYSA-N 0.000 description 12
- 230000014621 translational initiation Effects 0.000 description 12
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 11
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 11
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 11
- 108010047857 aspartylglycine Proteins 0.000 description 11
- 108010089804 glycyl-threonine Proteins 0.000 description 11
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 11
- -1 mlcC Proteins 0.000 description 11
- 235000018102 proteins Nutrition 0.000 description 11
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 10
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 10
- 241000233866 Fungi Species 0.000 description 10
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- 108010015792 glycyllysine Proteins 0.000 description 10
- 108010040030 histidinoalanine Proteins 0.000 description 10
- 108010064235 lysylglycine Proteins 0.000 description 10
- 239000013605 shuttle vector Substances 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 9
- 108091026890 Coding region Proteins 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 9
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 9
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 9
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 9
- 238000002105 Southern blotting Methods 0.000 description 9
- 108091081024 Start codon Proteins 0.000 description 9
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 9
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 9
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 9
- 150000001261 hydroxy acids Chemical class 0.000 description 9
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 9
- 108010000761 leucylarginine Proteins 0.000 description 9
- 239000002853 nucleic acid probe Substances 0.000 description 9
- 239000011541 reaction mixture Substances 0.000 description 9
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 8
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 8
- 201000005569 Gout Diseases 0.000 description 8
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 8
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 8
- 108010087924 alanylproline Proteins 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 238000012869 ethanol precipitation Methods 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- 108010025306 histidylleucine Proteins 0.000 description 8
- 108010085325 histidylproline Proteins 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 108010009298 lysylglutamic acid Proteins 0.000 description 8
- 229930001119 polyketide Natural products 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 230000007017 scission Effects 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 7
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 7
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 7
- 102100034343 Integrase Human genes 0.000 description 7
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 7
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 7
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 7
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 7
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 7
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 description 7
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 7
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 7
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 7
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 7
- 229960000723 ampicillin Drugs 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 108010060035 arginylproline Proteins 0.000 description 7
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 7
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 7
- 238000002372 labelling Methods 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 108010004914 prolylarginine Proteins 0.000 description 7
- 108010090894 prolylleucine Proteins 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 108010020532 tyrosyl-proline Proteins 0.000 description 7
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 6
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 6
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 6
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 6
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 6
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 6
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 6
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 6
- 241000228197 Aspergillus flavus Species 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 6
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 6
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 6
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 6
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 6
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 6
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 6
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 6
- 108091081021 Sense strand Proteins 0.000 description 6
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 6
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 6
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 6
- 108010041407 alanylaspartic acid Proteins 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 230000001851 biosynthetic effect Effects 0.000 description 6
- 210000002421 cell wall Anatomy 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 230000008021 deposition Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 6
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 6
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 229910001629 magnesium chloride Inorganic materials 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 150000007523 nucleic acids Chemical class 0.000 description 6
- 239000008188 pellet Substances 0.000 description 6
- 238000002205 phenol-chloroform extraction Methods 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 6
- 239000002244 precipitate Substances 0.000 description 6
- 108010070643 prolylglutamic acid Proteins 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 6
- QYUKEUAGMBNKFN-ACUXCFJPSA-N (2s,3r)-2-amino-3-hydroxybutanoic acid;(2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid Chemical compound C[C@@H](O)[C@H](N)C(O)=O.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QYUKEUAGMBNKFN-ACUXCFJPSA-N 0.000 description 5
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 5
- 229920000936 Agarose Polymers 0.000 description 5
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 5
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 5
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 5
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 5
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 5
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 5
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 5
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 5
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 5
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 5
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 5
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 5
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 5
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 5
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 5
- 101000711673 Homo sapiens E3 ubiquitin-protein ligase RNF128 Proteins 0.000 description 5
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 5
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 5
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 5
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 5
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 5
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 5
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 5
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 5
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 5
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 5
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 5
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 5
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 5
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 5
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 5
- 108010070944 alanylhistidine Proteins 0.000 description 5
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 5
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 239000013601 cosmid vector Substances 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000001962 electrophoresis Methods 0.000 description 5
- 239000008103 glucose Substances 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 5
- 229940097277 hygromycin b Drugs 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 150000002596 lactones Chemical class 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 108010077112 prolyl-proline Proteins 0.000 description 5
- 238000004007 reversed phase HPLC Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 229930195730 Aflatoxin Natural products 0.000 description 4
- XWIYFDMXXLINPU-UHFFFAOYSA-N Aflatoxin G Chemical compound O=C1OCCC2=C1C(=O)OC1=C2C(OC)=CC2=C1C1C=COC1O2 XWIYFDMXXLINPU-UHFFFAOYSA-N 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 4
- JQDFGZKKXBEANU-IMJSIDKUSA-N Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(O)=O JQDFGZKKXBEANU-IMJSIDKUSA-N 0.000 description 4
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 4
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 4
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 4
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 4
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 4
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 4
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 4
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 4
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 4
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 4
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 4
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 4
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 4
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 4
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 4
- 241000351920 Aspergillus nidulans Species 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 102100034214 E3 ubiquitin-protein ligase RNF128 Human genes 0.000 description 4
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 4
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 4
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 4
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 4
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 4
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 4
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 4
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 4
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 4
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 4
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 4
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 4
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 4
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 4
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 4
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 4
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 4
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 4
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 4
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 4
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 4
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 4
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 4
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 4
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 4
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 4
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 4
- 239000007993 MOPS buffer Substances 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 108010047562 NGR peptide Proteins 0.000 description 4
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 4
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 4
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 4
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 4
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 4
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 4
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 4
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 4
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 4
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 4
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 4
- 238000010240 RT-PCR analysis Methods 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 4
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 4
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 4
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 4
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 4
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 4
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 4
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 4
- 239000005409 aflatoxin Substances 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010036533 arginylvaline Proteins 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 4
- 235000011187 glycerol Nutrition 0.000 description 4
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 4
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 239000002471 hydroxymethylglutaryl coenzyme A reductase inhibitor Substances 0.000 description 4
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 4
- 108010009932 leucyl-alanyl-glycyl-valine Proteins 0.000 description 4
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 239000003960 organic solvent Substances 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 150000003881 polyketide derivatives Chemical class 0.000 description 4
- 125000000830 polyketide group Chemical group 0.000 description 4
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 108010009962 valyltyrosine Proteins 0.000 description 4
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 3
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 3
- QVOBNSFUVPLVPE-ROUUACIJSA-N 2-[[(2s)-2-[[2-[[(2s)-2-amino-3-phenylpropanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 QVOBNSFUVPLVPE-ROUUACIJSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 3
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 3
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 3
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 3
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 3
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 3
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 3
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 3
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 3
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 3
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 3
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 3
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 3
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 3
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 3
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 3
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 3
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 3
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 3
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 3
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 3
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 3
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 3
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 3
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 3
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 3
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 3
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 3
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 3
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 3
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 3
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 3
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 3
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 3
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 3
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 3
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 3
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 3
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 3
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 3
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 3
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 3
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 3
- 241000228230 Aspergillus parasiticus Species 0.000 description 3
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 3
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 3
- NXTYATMDWQYLGJ-BQBZGAKWSA-N Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CS NXTYATMDWQYLGJ-BQBZGAKWSA-N 0.000 description 3
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 3
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 3
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 3
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 3
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 3
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 3
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 3
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 3
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 3
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 3
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 3
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 3
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 3
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 3
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 3
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 3
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 3
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 3
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 3
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 3
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 3
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 3
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 3
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 3
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 3
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 3
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 3
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 3
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 3
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 3
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 3
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 3
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 3
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 3
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 3
- JLYUZRKPDKHUTC-WDSOQIARSA-N Leu-Pro-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JLYUZRKPDKHUTC-WDSOQIARSA-N 0.000 description 3
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 3
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 3
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 3
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 3
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 3
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 3
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 3
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 3
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 3
- 238000000636 Northern blotting Methods 0.000 description 3
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 3
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 3
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 3
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 3
- OHUXOEXBXPZKPT-STQMWFEESA-N Phe-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 OHUXOEXBXPZKPT-STQMWFEESA-N 0.000 description 3
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 3
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 3
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 3
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 3
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 3
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 3
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 3
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 3
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 3
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 3
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 3
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 3
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 3
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 3
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- KYGRCGGBECLWMH-UHFFFAOYSA-N Sterigmatocystin Natural products COc1cc2OC3C=COC3c2c4Oc5cccc(O)c5C(=O)c14 KYGRCGGBECLWMH-UHFFFAOYSA-N 0.000 description 3
- UTSVPXMQSFGQTM-UHFFFAOYSA-N Sterigmatrocystin Natural products O1C2=CC=CC(O)=C2C(=O)C2=C1C(C1C=COC1O1)=C1C=C2OC UTSVPXMQSFGQTM-UHFFFAOYSA-N 0.000 description 3
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 3
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 3
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 3
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 3
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 3
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 3
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 3
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 3
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 3
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 3
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 3
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 3
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 3
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 3
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 3
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 3
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 3
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 3
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 3
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 3
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 3
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 3
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 3
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 3
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 3
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 3
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 3
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 3
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 3
- 238000002835 absorbance Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 108010011559 alanylphenylalanine Proteins 0.000 description 3
- 108010070783 alanyltyrosine Proteins 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- YTRQFSDWAXHJCC-UHFFFAOYSA-N chloroform;phenol Chemical compound ClC(Cl)Cl.OC1=CC=CC=C1 YTRQFSDWAXHJCC-UHFFFAOYSA-N 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- RHGQIWVTIHZRLI-UHFFFAOYSA-N dihydrosterigmatocystin Natural products O1C2=CC=CC(O)=C2C(=O)C2=C1C(C1CCOC1O1)=C1C=C2OC RHGQIWVTIHZRLI-UHFFFAOYSA-N 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 3
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 239000004570 mortar (masonry) Substances 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 239000008194 pharmaceutical composition Substances 0.000 description 3
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 3
- 229910052697 platinum Inorganic materials 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- KCXFHTAICRTXLI-UHFFFAOYSA-N propane-1-sulfonic acid Chemical compound CCCS(O)(=O)=O KCXFHTAICRTXLI-UHFFFAOYSA-N 0.000 description 3
- 238000000163 radioactive labelling Methods 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 108010005652 splenotritin Proteins 0.000 description 3
- UTSVPXMQSFGQTM-DCXZOGHSSA-N sterigmatocystin Chemical compound O1C2=CC=CC(O)=C2C(=O)C2=C1C([C@@H]1C=CO[C@@H]1O1)=C1C=C2OC UTSVPXMQSFGQTM-DCXZOGHSSA-N 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010021889 valylvaline Proteins 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- RUUNLLXEBIVUAQ-YTORKDELSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-aminopropanoyl]amino]propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]propanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 RUUNLLXEBIVUAQ-YTORKDELSA-N 0.000 description 2
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 2
- VWWKKDNCCLAGRM-GVXVVHGQSA-N (2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetyl]amino]-3-methylbutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VWWKKDNCCLAGRM-GVXVVHGQSA-N 0.000 description 2
- UZGKAASZIMOAMU-UHFFFAOYSA-N 124177-85-1 Chemical compound NP(=O)=O UZGKAASZIMOAMU-UHFFFAOYSA-N 0.000 description 2
- PPINMSZPTPRQQB-NHCYSSNCSA-N 2-[[(2s)-1-[(2s)-2-[[(2s)-2-amino-3-methylbutanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]acetic acid Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PPINMSZPTPRQQB-NHCYSSNCSA-N 0.000 description 2
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- SITWEMZOJNKJCH-WDSKDSINSA-N Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SITWEMZOJNKJCH-WDSKDSINSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 2
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 2
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 2
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 2
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 2
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 2
- GRIFPSOFWFIICX-GOPGUHFVSA-N Ala-His-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GRIFPSOFWFIICX-GOPGUHFVSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 2
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 2
- 108020004491 Antisense DNA Proteins 0.000 description 2
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 2
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 2
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 2
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 2
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 2
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 2
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 2
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- OSASDIVHOSJVII-WDSKDSINSA-N Arg-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N OSASDIVHOSJVII-WDSKDSINSA-N 0.000 description 2
- RWDVGVPHEWOZMO-GUBZILKMSA-N Arg-Cys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCNC(N)=N)C(O)=O RWDVGVPHEWOZMO-GUBZILKMSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 2
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 2
- WYBVBIHNJWOLCJ-IUCAKERBSA-N Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N WYBVBIHNJWOLCJ-IUCAKERBSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- RTDZQOFEGPWSJD-AVGNSLFASA-N Arg-Leu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O RTDZQOFEGPWSJD-AVGNSLFASA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 2
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 2
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 2
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 2
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 2
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 2
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 2
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 2
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 2
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 2
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 2
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 2
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 2
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 2
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 2
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 2
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 2
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 2
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 2
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 2
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 2
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 2
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 2
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 2
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 2
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 2
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 2
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 2
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 2
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 2
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 2
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 2
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 2
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 2
- ZARXTZFGQZBYFO-JQWIXIFHSA-N Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(O)=O)=CNC2=C1 ZARXTZFGQZBYFO-JQWIXIFHSA-N 0.000 description 2
- FIRWLDUOFOULCA-XIRDDKMYSA-N Asp-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N FIRWLDUOFOULCA-XIRDDKMYSA-N 0.000 description 2
- ZVYYMCXVPZEAPU-CWRNSKLLSA-N Asp-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZVYYMCXVPZEAPU-CWRNSKLLSA-N 0.000 description 2
- GHAHOJDCBRXAKC-IHPCNDPISA-N Asp-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N GHAHOJDCBRXAKC-IHPCNDPISA-N 0.000 description 2
- KNOGLZBISUBTFW-QRTARXTBSA-N Asp-Trp-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O KNOGLZBISUBTFW-QRTARXTBSA-N 0.000 description 2
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 2
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 2
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 2
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- NOCCABSVTRONIN-CIUDSAMLSA-N Cys-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N NOCCABSVTRONIN-CIUDSAMLSA-N 0.000 description 2
- JTNKVWLMDHIUOG-IHRRRGAJSA-N Cys-Arg-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JTNKVWLMDHIUOG-IHRRRGAJSA-N 0.000 description 2
- AYKQJQVWUYEZNU-IMJSIDKUSA-N Cys-Asn Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O AYKQJQVWUYEZNU-IMJSIDKUSA-N 0.000 description 2
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 2
- OLIYIKRCOZBFCW-ZLUOBGJFSA-N Cys-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)C(=O)O OLIYIKRCOZBFCW-ZLUOBGJFSA-N 0.000 description 2
- BUXAPSQPMALTOY-WHFBIAKZSA-N Cys-Glu Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BUXAPSQPMALTOY-WHFBIAKZSA-N 0.000 description 2
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 2
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 2
- XVLMKWWVBNESPX-XVYDVKMFSA-N Cys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N XVLMKWWVBNESPX-XVYDVKMFSA-N 0.000 description 2
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 2
- XZFYRXDAULDNFX-UWVGGRQHSA-N Cys-Phe Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UWVGGRQHSA-N 0.000 description 2
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 2
- JEKIARHEWURQRJ-BZSNNMDCSA-N Cys-Phe-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CS)N JEKIARHEWURQRJ-BZSNNMDCSA-N 0.000 description 2
- YYLBXQJGWOQZOU-IHRRRGAJSA-N Cys-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N YYLBXQJGWOQZOU-IHRRRGAJSA-N 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 241000768015 Gliocladium sp. Species 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 2
- RSUVOPBMWMTVDI-XEGUGMAKSA-N Glu-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(O)=O)C)C(O)=O)=CNC2=C1 RSUVOPBMWMTVDI-XEGUGMAKSA-N 0.000 description 2
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 2
- IYAUFWMUCGBFMQ-CIUDSAMLSA-N Glu-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N IYAUFWMUCGBFMQ-CIUDSAMLSA-N 0.000 description 2
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 2
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 2
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 2
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 2
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 2
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 2
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 2
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 2
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 2
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 2
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 2
- GWKBAXRZPLSWJS-QEJZJMRPSA-N Glu-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GWKBAXRZPLSWJS-QEJZJMRPSA-N 0.000 description 2
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 2
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 2
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 2
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 2
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 2
- YZACQYVWLCQWBT-BQBZGAKWSA-N Gly-Cys-Arg Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YZACQYVWLCQWBT-BQBZGAKWSA-N 0.000 description 2
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 2
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 2
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 2
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 2
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 2
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 2
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 2
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 2
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 2
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 2
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 2
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 2
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 2
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 2
- RXVOMIADLXPJGW-GUBZILKMSA-N His-Asp-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RXVOMIADLXPJGW-GUBZILKMSA-N 0.000 description 2
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 2
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 2
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 2
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 2
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 2
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 2
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 2
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 2
- HBGKOLSGLYMWSW-DCAQKATOSA-N His-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CS)C(=O)O HBGKOLSGLYMWSW-DCAQKATOSA-N 0.000 description 2
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 2
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 2
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 2
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 2
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 241000221930 Hypomyces chrysospermus Species 0.000 description 2
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 2
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 2
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 2
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 2
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 2
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 2
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 2
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 2
- OPJRECCCQSDDCZ-TUSQITKMSA-N Lys-Trp-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OPJRECCCQSDDCZ-TUSQITKMSA-N 0.000 description 2
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 2
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 2
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 2
- 241001342874 Metarhizium viride Species 0.000 description 2
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 2
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 2
- 101100205189 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-5 gene Proteins 0.000 description 2
- 238000009004 PCR Kit Methods 0.000 description 2
- 241000684698 Paecilomyces sp. (in: Hypocreales) Species 0.000 description 2
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 2
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 2
- 241001507683 Penicillium aurantiogriseum Species 0.000 description 2
- 241000228145 Penicillium brevicompactum Species 0.000 description 2
- 241000306295 Penicillium reticulisporum Species 0.000 description 2
- 241000228168 Penicillium sp. Species 0.000 description 2
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 2
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 2
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 2
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 2
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 2
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 2
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 2
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 2
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 2
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 2
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 2
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 2
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 2
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 2
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 2
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 2
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 2
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 2
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 2
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 2
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 2
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 2
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 2
- HXNYBZQLBWIADP-WDSKDSINSA-N Pro-Cys Chemical compound OC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 HXNYBZQLBWIADP-WDSKDSINSA-N 0.000 description 2
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 2
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 2
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 2
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 2
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 2
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 2
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 2
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 2
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- 239000013614 RNA sample Substances 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- 241000178285 Streptomyces carbophilus Species 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 2
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 2
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 2
- NCGUQWSJUKYCIT-SZZJOZGLSA-N Thr-His-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NCGUQWSJUKYCIT-SZZJOZGLSA-N 0.000 description 2
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 2
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 2
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 2
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 2
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 2
- CDPXXGFRDZVVGF-OYDLWJJNSA-N Trp-Arg-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CDPXXGFRDZVVGF-OYDLWJJNSA-N 0.000 description 2
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 2
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 2
- OWSRIUBVJOQHNY-IHPCNDPISA-N Trp-Lys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N OWSRIUBVJOQHNY-IHPCNDPISA-N 0.000 description 2
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 2
- TYYLDKGBCJGJGW-WMZOPIPTSA-N Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 TYYLDKGBCJGJGW-WMZOPIPTSA-N 0.000 description 2
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 2
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 2
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 2
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 2
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 2
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- VNYDHJARLHNEGA-RYUDHWBXSA-N Tyr-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 2
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 2
- QFHRUCJIRVILCK-YJRXYDGGSA-N Tyr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O QFHRUCJIRVILCK-YJRXYDGGSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- ZYVAAYAOTVJBSS-GMVOTWDCSA-N Tyr-Trp-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZYVAAYAOTVJBSS-GMVOTWDCSA-N 0.000 description 2
- LVILBTSHPTWDGE-PMVMPFDFSA-N Tyr-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=C(O)C=C1 LVILBTSHPTWDGE-PMVMPFDFSA-N 0.000 description 2
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 2
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 2
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 2
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 2
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 2
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 2
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 2
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 2
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 2
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 2
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 2
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 2
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 2
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 2
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 2
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- RSEIVHMDTNNEOW-JYJNAYRXSA-N Val-Trp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N RSEIVHMDTNNEOW-JYJNAYRXSA-N 0.000 description 2
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 2
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 2
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 2
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 2
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 2
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 2
- 235000010724 Wisteria floribunda Nutrition 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 2
- 238000005904 alkaline hydrolysis reaction Methods 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 239000003816 antisense DNA Substances 0.000 description 2
- 239000000074 antisense oligonucleotide Substances 0.000 description 2
- 238000012230 antisense oligonucleotides Methods 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 201000005577 familial hyperlipidemia Diseases 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 238000010230 functional analysis Methods 0.000 description 2
- 108091008053 gene clusters Proteins 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 2
- 101150089730 gly-10 gene Proteins 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 2
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 229940098377 penicillium brevicompactum Drugs 0.000 description 2
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 239000001632 sodium acetate Substances 0.000 description 2
- 235000017281 sodium acetate Nutrition 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 2
- VWDWKYIASSYTQR-UHFFFAOYSA-N sodium nitrate Chemical compound [Na+].[O-][N+]([O-])=O VWDWKYIASSYTQR-UHFFFAOYSA-N 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108010072644 valyl-alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010082737 zymolyase Proteins 0.000 description 2
- LSLXWOCIIFUZCQ-SRVKXCTJSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-3-methyl-1-oxobutyl]amino]-3-methyl-1-oxobutyl]amino]-3-methylbutanoic acid Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O LSLXWOCIIFUZCQ-SRVKXCTJSA-N 0.000 description 1
- 229910018994 (KOHYO) No Inorganic materials 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 101000748061 Acholeplasma phage L2 Uncharacterized 16.1 kDa protein Proteins 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- XAEWTDMGFGHWFK-IMJSIDKUSA-N Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O XAEWTDMGFGHWFK-IMJSIDKUSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 1
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 1
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 1
- LIWMQSWFLXEGMA-WDSKDSINSA-N Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)N LIWMQSWFLXEGMA-WDSKDSINSA-N 0.000 description 1
- SOTXLXCVCZAKFI-FXQIFTODSA-N Ala-Val-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O SOTXLXCVCZAKFI-FXQIFTODSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- BJFKXBOBGVWFCT-GUBZILKMSA-N Ala-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)C(C)C)C(O)=O BJFKXBOBGVWFCT-GUBZILKMSA-N 0.000 description 1
- 241000288283 Allata Species 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 1
- OLDOLPWZEMHNIA-PJODQICGSA-N Arg-Ala-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OLDOLPWZEMHNIA-PJODQICGSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 1
- RCAUJZASOAFTAJ-FXQIFTODSA-N Arg-Asp-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N RCAUJZASOAFTAJ-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- VSPLYCLMFAUZRF-GUBZILKMSA-N Arg-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N VSPLYCLMFAUZRF-GUBZILKMSA-N 0.000 description 1
- DGFGDPVSDQPANQ-XGEHTFHBSA-N Arg-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)O DGFGDPVSDQPANQ-XGEHTFHBSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- QYLJIYOGHRGUIH-CIUDSAMLSA-N Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N QYLJIYOGHRGUIH-CIUDSAMLSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- DIIGDGJKTMLQQW-IHRRRGAJSA-N Arg-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N DIIGDGJKTMLQQW-IHRRRGAJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 1
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 1
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- JKRPBTQDPJSQIT-RCWTZXSCSA-N Arg-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O JKRPBTQDPJSQIT-RCWTZXSCSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- AZHXYLJRGVMQKW-UMPQAUOISA-N Arg-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N)O AZHXYLJRGVMQKW-UMPQAUOISA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 1
- DAQIJMOLTMGJLO-YUMQZZPRSA-N Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N DAQIJMOLTMGJLO-YUMQZZPRSA-N 0.000 description 1
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 1
- NXVGBGZQQFDUTM-XVYDVKMFSA-N Asn-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N NXVGBGZQQFDUTM-XVYDVKMFSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- UYXXMIZGHYKYAT-NHCYSSNCSA-N Asn-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N UYXXMIZGHYKYAT-NHCYSSNCSA-N 0.000 description 1
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 1
- JPSODRNUDXONAS-XIRDDKMYSA-N Asn-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC(=O)N)N JPSODRNUDXONAS-XIRDDKMYSA-N 0.000 description 1
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 1
- ICAYWNTWHRRAQP-FXQIFTODSA-N Asp-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N ICAYWNTWHRRAQP-FXQIFTODSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 1
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- FKBFDTRILNZGAI-IMJSIDKUSA-N Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O FKBFDTRILNZGAI-IMJSIDKUSA-N 0.000 description 1
- WXASLRQUSYWVNE-FXQIFTODSA-N Asp-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N WXASLRQUSYWVNE-FXQIFTODSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- RWHHSFSWKFBTCF-KKUMJFAQSA-N Asp-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N RWHHSFSWKFBTCF-KKUMJFAQSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- WNGZKSVJFDZICU-XIRDDKMYSA-N Asp-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N WNGZKSVJFDZICU-XIRDDKMYSA-N 0.000 description 1
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 1
- IMGLJMRIAFKUPZ-FXQIFTODSA-N Asp-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N IMGLJMRIAFKUPZ-FXQIFTODSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- NBKLEMWHDLAUEM-CIUDSAMLSA-N Asp-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N NBKLEMWHDLAUEM-CIUDSAMLSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- KCOPOPKJRHVGPE-AQZXSJQPSA-N Asp-Thr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O KCOPOPKJRHVGPE-AQZXSJQPSA-N 0.000 description 1
- IHZFGJLKDYINPV-XIRDDKMYSA-N Asp-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(O)=O)N)C(O)=O)C1=CN=CN1 IHZFGJLKDYINPV-XIRDDKMYSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- GWOVSEVNXNVMMY-BPUTZDHNSA-N Asp-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N GWOVSEVNXNVMMY-BPUTZDHNSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- GYNUXDMCDILYIQ-QRTARXTBSA-N Asp-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N GYNUXDMCDILYIQ-QRTARXTBSA-N 0.000 description 1
- GZYDPEJSZYZWEF-MXAVVETBSA-N Asp-Val-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O GZYDPEJSZYZWEF-MXAVVETBSA-N 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101100015199 Caenorhabditis elegans gly-11 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 101000947615 Clostridium perfringens Uncharacterized 38.4 kDa protein Proteins 0.000 description 1
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 1
- ZOLXQKZHYOHHMD-DLOVCJGASA-N Cys-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N ZOLXQKZHYOHHMD-DLOVCJGASA-N 0.000 description 1
- VZKXOWRNJDEGLZ-WHFBIAKZSA-N Cys-Asp-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O VZKXOWRNJDEGLZ-WHFBIAKZSA-N 0.000 description 1
- VBPGTULCFGKGTF-ACZMJKKPSA-N Cys-Glu-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VBPGTULCFGKGTF-ACZMJKKPSA-N 0.000 description 1
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 1
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 1
- VIRYODQIWJNWNU-NRPADANISA-N Cys-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N VIRYODQIWJNWNU-NRPADANISA-N 0.000 description 1
- VNXXMHTZQGGDSG-CIUDSAMLSA-N Cys-His-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O VNXXMHTZQGGDSG-CIUDSAMLSA-N 0.000 description 1
- DIHCYBRLTVEPBW-SRVKXCTJSA-N Cys-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N DIHCYBRLTVEPBW-SRVKXCTJSA-N 0.000 description 1
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 1
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 1
- IRKLTAKLAFUTLA-KATARQTJSA-N Cys-Thr-Lys Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCCCN)C(O)=O IRKLTAKLAFUTLA-KATARQTJSA-N 0.000 description 1
- JTEGHEWKBCTIAL-IXOXFDKPSA-N Cys-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N)O JTEGHEWKBCTIAL-IXOXFDKPSA-N 0.000 description 1
- NGOIQDYZMIKCOK-NAKRPEOUSA-N Cys-Val-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NGOIQDYZMIKCOK-NAKRPEOUSA-N 0.000 description 1
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 101000573535 Dictyostelium discoideum Myosin-IB light chain Proteins 0.000 description 1
- 101000573538 Dictyostelium discoideum Myosin-ID light chain Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 101000964391 Enterococcus faecalis UPF0145 protein Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- SAEBUDRWKUXLOM-ACZMJKKPSA-N Glu-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O SAEBUDRWKUXLOM-ACZMJKKPSA-N 0.000 description 1
- FKGNJUCQKXQNRA-NRPADANISA-N Glu-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O FKGNJUCQKXQNRA-NRPADANISA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- HKTRDWYCAUTRRL-YUMQZZPRSA-N Glu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-YUMQZZPRSA-N 0.000 description 1
- COSBSYQVPSODFX-GUBZILKMSA-N Glu-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N COSBSYQVPSODFX-GUBZILKMSA-N 0.000 description 1
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- YVYVMJNUENBOOL-KBIXCLLPSA-N Glu-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YVYVMJNUENBOOL-KBIXCLLPSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- OLTHVCNYJAALPL-BHYGNILZSA-N Glu-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OLTHVCNYJAALPL-BHYGNILZSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- ZZJVYSAQQMDIRD-UWVGGRQHSA-N Gly-Pro-His Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ZZJVYSAQQMDIRD-UWVGGRQHSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 1
- PASHZZBXZYEXFE-LSDHHAIUSA-N Gly-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN)C(=O)O PASHZZBXZYEXFE-LSDHHAIUSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 101000748063 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 11.1 kDa protein in rep-hol intergenic region Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 1
- UJWYPUUXIAKEES-CUJWVEQBSA-N His-Cys-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UJWYPUUXIAKEES-CUJWVEQBSA-N 0.000 description 1
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 1
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 1
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 1
- WPUAVVXYEJAWIV-KKUMJFAQSA-N His-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WPUAVVXYEJAWIV-KKUMJFAQSA-N 0.000 description 1
- WHKLDLQHSYAVGU-ACRUOGEOSA-N His-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WHKLDLQHSYAVGU-ACRUOGEOSA-N 0.000 description 1
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 1
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 1
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- PDLQNLSEJXOQNQ-IHPCNDPISA-N His-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CN=CN1 PDLQNLSEJXOQNQ-IHPCNDPISA-N 0.000 description 1
- KECFCPNPPYCGBL-PMVMPFDFSA-N His-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CN=CN4)N KECFCPNPPYCGBL-PMVMPFDFSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- CCHSQWLCOOZREA-GMOBBJLQSA-N Ile-Asp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N CCHSQWLCOOZREA-GMOBBJLQSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- WMDZARSFSMZOQO-DRZSPHRISA-N Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WMDZARSFSMZOQO-DRZSPHRISA-N 0.000 description 1
- KTTMFLSBTNBAHL-MXAVVETBSA-N Ile-Phe-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N KTTMFLSBTNBAHL-MXAVVETBSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 1
- JJQQGCMKLOEGAV-OSUNSFLBSA-N Ile-Thr-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)O)N JJQQGCMKLOEGAV-OSUNSFLBSA-N 0.000 description 1
- KWHFUMYCSPJCFQ-NGTWOADLSA-N Ile-Thr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N KWHFUMYCSPJCFQ-NGTWOADLSA-N 0.000 description 1
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 101000790840 Klebsiella pneumoniae Uncharacterized 49.5 kDa protein in cps region Proteins 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- KWURTLAFFDOTEQ-GUBZILKMSA-N Leu-Cys-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KWURTLAFFDOTEQ-GUBZILKMSA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- VUZMPNMNJBGOKE-IHRRRGAJSA-N Leu-Leu-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VUZMPNMNJBGOKE-IHRRRGAJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- XOEDPXDZJHBQIX-ULQDDVLXSA-N Leu-Val-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOEDPXDZJHBQIX-ULQDDVLXSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 101500021084 Locusta migratoria 5 kDa peptide Proteins 0.000 description 1
- 101710091785 Lovastatin diketide synthase lovF Proteins 0.000 description 1
- 101710180036 Lovastatin nonaketide synthase, polyketide synthase component Proteins 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- JBRWKVANRYPCAF-XIRDDKMYSA-N Lys-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N JBRWKVANRYPCAF-XIRDDKMYSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- IGRMTQMIDNDFAA-UWVGGRQHSA-N Lys-His Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UWVGGRQHSA-N 0.000 description 1
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- AHFOKDZWPPGJAZ-SRVKXCTJSA-N Lys-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N AHFOKDZWPPGJAZ-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 1
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 1
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 1
- CAEZLMGDJMEBKP-AVGNSLFASA-N Met-Pro-His Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC=N1 CAEZLMGDJMEBKP-AVGNSLFASA-N 0.000 description 1
- KZKVVWBOGDKHKE-QTKMDUPCSA-N Met-Thr-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 KZKVVWBOGDKHKE-QTKMDUPCSA-N 0.000 description 1
- YIGCDRZMZNDENK-UNQGMJICSA-N Met-Thr-Phe Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YIGCDRZMZNDENK-UNQGMJICSA-N 0.000 description 1
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 1
- ANCPZNHGZUCSSC-ULQDDVLXSA-N Met-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 ANCPZNHGZUCSSC-ULQDDVLXSA-N 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- MDSUKZSLOATHMH-UHFFFAOYSA-N N-L-leucyl-L-valine Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(O)=O MDSUKZSLOATHMH-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- LNIIRLODKOWQIY-IHRRRGAJSA-N Phe-Asn-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LNIIRLODKOWQIY-IHRRRGAJSA-N 0.000 description 1
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- KNPVDQMEHSCAGX-UWVGGRQHSA-N Phe-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KNPVDQMEHSCAGX-UWVGGRQHSA-N 0.000 description 1
- PDUVELWDJZOUEI-IHRRRGAJSA-N Phe-Cys-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PDUVELWDJZOUEI-IHRRRGAJSA-N 0.000 description 1
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 1
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 1
- HGNGAMWHGGANAU-WHOFXGATSA-N Phe-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HGNGAMWHGGANAU-WHOFXGATSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- RFCVXVPWSPOMFJ-STQMWFEESA-N Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-STQMWFEESA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- KLXQWABNAWDRAY-ACRUOGEOSA-N Phe-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 KLXQWABNAWDRAY-ACRUOGEOSA-N 0.000 description 1
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 1
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 1
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- ZTVSVSFBHUVYIN-UFYCRDLUSA-N Phe-Tyr-Met Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=C(O)C=C1 ZTVSVSFBHUVYIN-UFYCRDLUSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 239000004353 Polyethylene glycol 8000 Substances 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- FFSLAIOXRMOFIZ-GJZGRUSLSA-N Pro-Gly-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)CNC(=O)[C@@H]1CCCN1 FFSLAIOXRMOFIZ-GJZGRUSLSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 1
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- WDVSHHCDHLJJJR-UHFFFAOYSA-N Proflavine Chemical compound C1=CC(N)=CC2=NC3=CC(N)=CC=C3C=C21 WDVSHHCDHLJJJR-UHFFFAOYSA-N 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 108010046983 Ribonuclease T1 Proteins 0.000 description 1
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- UQGAAZXSCGWMFU-UBHSHLNASA-N Ser-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N UQGAAZXSCGWMFU-UBHSHLNASA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- CUTPSEKWUPZFLV-WISUUJSJSA-N Thr-Cys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(O)=O CUTPSEKWUPZFLV-WISUUJSJSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- WPSDXXQRIVKBAY-NKIYYHGXSA-N Thr-His-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O WPSDXXQRIVKBAY-NKIYYHGXSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- OHDXOXIZXSFCDN-RCWTZXSCSA-N Thr-Met-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OHDXOXIZXSFCDN-RCWTZXSCSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- KAFKKRJQHOECGW-JCOFBHIZSA-N Thr-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(O)=O)=CNC2=C1 KAFKKRJQHOECGW-JCOFBHIZSA-N 0.000 description 1
- ZOCJFNXUVSGBQI-HSHDSVGOSA-N Thr-Trp-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ZOCJFNXUVSGBQI-HSHDSVGOSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- XSTXAVWGXDQKEL-UHFFFAOYSA-N Trichloroethylene Chemical compound ClC=C(Cl)Cl XSTXAVWGXDQKEL-UHFFFAOYSA-N 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 1
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 1
- XKGZEDNYGPNJAR-XIRDDKMYSA-N Trp-Asn-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N XKGZEDNYGPNJAR-XIRDDKMYSA-N 0.000 description 1
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- PXQPYPMSLBQHJJ-WFBYXXMGSA-N Trp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PXQPYPMSLBQHJJ-WFBYXXMGSA-N 0.000 description 1
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 1
- MWHOLXNKRKRQQH-XIRDDKMYSA-N Trp-Asp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N MWHOLXNKRKRQQH-XIRDDKMYSA-N 0.000 description 1
- XEHGAHOCTDKOKP-XIRDDKMYSA-N Trp-Cys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XEHGAHOCTDKOKP-XIRDDKMYSA-N 0.000 description 1
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 1
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 1
- XLVRTKPAIXJYOH-HOCLYGCPSA-N Trp-His-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)NCC(=O)O)N XLVRTKPAIXJYOH-HOCLYGCPSA-N 0.000 description 1
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 1
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 1
- DZHDVYLBNKMLMB-ZFWWWQNUSA-N Trp-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 DZHDVYLBNKMLMB-ZFWWWQNUSA-N 0.000 description 1
- LFGHEUIUSIRJAE-TUSQITKMSA-N Trp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N LFGHEUIUSIRJAE-TUSQITKMSA-N 0.000 description 1
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 1
- YTVJTXJTNRWJCR-JBACZVJFSA-N Trp-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N YTVJTXJTNRWJCR-JBACZVJFSA-N 0.000 description 1
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 1
- DXYQIGZZWYBXSD-JSGCOSHPSA-N Trp-Pro Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(O)=O DXYQIGZZWYBXSD-JSGCOSHPSA-N 0.000 description 1
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 1
- FBHHJGOJWXHGDO-TUSQITKMSA-N Trp-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC=3C4=CC=CC=C4NC=3)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 FBHHJGOJWXHGDO-TUSQITKMSA-N 0.000 description 1
- FHHYVSCGOMPLLO-IHPCNDPISA-N Trp-Tyr-Asp Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 FHHYVSCGOMPLLO-IHPCNDPISA-N 0.000 description 1
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 1
- VNRTXOUAOUZCFW-WDSOQIARSA-N Trp-Val-His Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O VNRTXOUAOUZCFW-WDSOQIARSA-N 0.000 description 1
- BABINGWMZBWXIX-BPUTZDHNSA-N Trp-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BABINGWMZBWXIX-BPUTZDHNSA-N 0.000 description 1
- NLKUJNGEGZDXGO-XVKPBYJWSA-N Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLKUJNGEGZDXGO-XVKPBYJWSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- LQGDFDYGDQEMGA-PXDAIIFMSA-N Tyr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N LQGDFDYGDQEMGA-PXDAIIFMSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 1
- XYNFFTNEQDWZNY-ULQDDVLXSA-N Tyr-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N XYNFFTNEQDWZNY-ULQDDVLXSA-N 0.000 description 1
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 1
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 1
- ZMKDQRJLMRZHRI-ACRUOGEOSA-N Tyr-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N ZMKDQRJLMRZHRI-ACRUOGEOSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- FRMFMFNMGQGMNB-BVSLBCMMSA-N Tyr-Pro-Trp Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 FRMFMFNMGQGMNB-BVSLBCMMSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 1
- CLEGSEJVGBYZBJ-MEYUZBJRSA-N Tyr-Thr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CLEGSEJVGBYZBJ-MEYUZBJRSA-N 0.000 description 1
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 1
- GPLTZEMVOCZVAV-UFYCRDLUSA-N Tyr-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 GPLTZEMVOCZVAV-UFYCRDLUSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- 101710198378 Uncharacterized 10.8 kDa protein in cox-rep intergenic region Proteins 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- IJBTVYLICXHDRI-UHFFFAOYSA-N Val-Ala-Ala Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(O)=O IJBTVYLICXHDRI-UHFFFAOYSA-N 0.000 description 1
- WOCYUGQDXPTQPY-FXQIFTODSA-N Val-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N WOCYUGQDXPTQPY-FXQIFTODSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- WKWJJQZZZBBWKV-JYJNAYRXSA-N Val-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WKWJJQZZZBBWKV-JYJNAYRXSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- ZQGPWORGSNRQLN-NHCYSSNCSA-N Val-Asp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZQGPWORGSNRQLN-NHCYSSNCSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- WPSXZFTVLIAPCN-WDSKDSINSA-N Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O WPSXZFTVLIAPCN-WDSKDSINSA-N 0.000 description 1
- YLHLNFUXDBOAGX-DCAQKATOSA-N Val-Cys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YLHLNFUXDBOAGX-DCAQKATOSA-N 0.000 description 1
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- XCTHZFGSVQBHBW-IUCAKERBSA-N Val-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C XCTHZFGSVQBHBW-IUCAKERBSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 1
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 1
- LMVWCLDJNSBOEA-FKBYEOEOSA-N Val-Tyr-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N LMVWCLDJNSBOEA-FKBYEOEOSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- MOJFVLVTLZDQGW-AVGNSLFASA-N Val-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C MOJFVLVTLZDQGW-AVGNSLFASA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 238000010306 acid treatment Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 101150049313 alaS gene Proteins 0.000 description 1
- 150000001338 aliphatic hydrocarbons Chemical class 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 150000004945 aromatic hydrocarbons Chemical class 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010031045 aspartyl-glycyl-aspartyl-alanine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 229940047586 chemet Drugs 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical group [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 1
- FFYPMLJYZAEMQB-UHFFFAOYSA-N diethyl pyrocarbonate Chemical compound CCOC(=O)OC(=O)OCC FFYPMLJYZAEMQB-UHFFFAOYSA-N 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- WBJINCZRORDGAQ-UHFFFAOYSA-N formic acid ethyl ester Natural products CCOC=O WBJINCZRORDGAQ-UHFFFAOYSA-N 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229960004198 guanidine Drugs 0.000 description 1
- HDPXTJVPIVNQEC-UHFFFAOYSA-N guanidine;hydrochloride Chemical compound Cl.NC(N)=N.NC(N)=N HDPXTJVPIVNQEC-UHFFFAOYSA-N 0.000 description 1
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 1
- 150000008282 halocarbons Chemical class 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 239000005457 ice water Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 101150034772 lovA gene Proteins 0.000 description 1
- 101150097172 lovB gene Proteins 0.000 description 1
- 101150075429 lovE gene Proteins 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 238000002803 maceration Methods 0.000 description 1
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 1
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010090114 methionyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- XELZGAJCZANUQH-UHFFFAOYSA-N methyl 1-acetylthieno[3,2-c]pyrazole-5-carboxylate Chemical compound CC(=O)N1N=CC2=C1C=C(C(=O)OC)S2 XELZGAJCZANUQH-UHFFFAOYSA-N 0.000 description 1
- KXKVLQRXCPHEJC-UHFFFAOYSA-N methyl acetate Chemical compound COC(C)=O KXKVLQRXCPHEJC-UHFFFAOYSA-N 0.000 description 1
- 239000006151 minimal media Substances 0.000 description 1
- 101150002855 mlcA gene Proteins 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 150000003833 nucleoside derivatives Chemical group 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 235000019446 polyethylene glycol 8000 Nutrition 0.000 description 1
- 229940085678 polyethylene glycol 8000 Drugs 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 229960001495 pravastatin sodium Drugs 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 235000019260 propionic acid Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 238000006798 ring closing metathesis reaction Methods 0.000 description 1
- 101150116497 sacm1l gene Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N serine Chemical compound OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000004317 sodium nitrate Substances 0.000 description 1
- 235000010344 sodium nitrate Nutrition 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- ACTRVOBWPAIOHC-XIXRPRMCSA-N succimer Chemical compound OC(=O)[C@@H](S)[C@@H](S)C(O)=O ACTRVOBWPAIOHC-XIXRPRMCSA-N 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
- 108010021199 valyl-valyl-valine Proteins 0.000 description 1
- 108010036320 valylleucine Proteins 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/385—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Penicillium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/06—Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/181—Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
Przedmiotem wynalazku jest polinukleotyd odpowiedni do stosowania w przyspieszaniu biosyn- tezy ML-236B oraz polipeptyd kodowany przez ten polinukleotyd, wektor z w laczonym takim polinu- kleotydem, komórka gospodarza transformowana tym wektorem oraz sposób wytwarzania ML-236B przy zastosowaniu tego polinukleotydu i sposób wytwarzania prawastatyny. Wynalazek ma na celu przeprowadzenie pe lnej analizy molekularno-biologicznej biosyntezy ML-236B i reguluj acych j a czyn- ników oraz dostarczenie polinukleotydu, który przy spiesza biosyntez e inhibitora reduktazy HMG-CoA, ML-236B. PL PL PL PL
Description
Przedmiotem wynalazku jest polinukleotyd przyspieszający biosyntezę ML-236B i polipeptyd kodowany przez ten polinukleotyd, wektor zawierający ten polinukleotyd, komórka gospodarza transformowana tym wektorem, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny.
Bardziej szczegółowo wynalazek dotyczy polinukleotydu takiego jak DNA, który przyspiesza biosyntezę inhibitora reduktazy HMG-CoA, ML-236B, w mikroorganizmie produkującym ML-236B gdy jest on wprowadzony do organizmu produkującego ML-236B.
Prawastatyna jest inhibitorem reduktazy HMG-CoA. Prawastatyna sodowa jest stosowana do leczenia hiperlipemii lub hiperlipidemii i ma korzystne działanie farmakologiczne polegające na obniżaniu cholesterolu w surowicy. Prawastatyna może być uzyskana stosując Streptomyces carbophilus poprzez konwersję przez mikroorganizmy ML-236B produkowanego przez Penicillium citrinum [opisane w Endo, A. i wsp., J. Antibiot.,29 1346(1976): Matsuoka, T. i wsp., Eur. J. Biochem., 184, 707 (1989), i w Publikacji Japońskiego Zgłoszenia Patentowego Nr 57-2240].
Wykazano, że zarówno ML-236B, prekursor prawastatyny oraz lowastatyna, inhibitor reduktazy HMG-CoA, mają wspólną strukturę częściową. Są one syntetyzowane biologicznie poprzez poliketydy [opisane w Moore, R.N. i wsp., J.Am.Chem.Soc,107, 3694(1985); Shiao, M.i Don, H.S., Proc. Natl. Sci. Counc. Repub. China B, 11, 223(1987)].
Poliketydy są związkami pochodzącymi z łańcuchów węgla β-keto, które są wynikiem ciągłej reakcji kondensacji kwasów karboksylowych o niskiej masie cząsteczkowej takich jak kwas octowy, kwas propionowy, kwas masłowy lub podobne. Można wywieść różne struktury w zależności od szlaku kondensacji lub redukcji każdej z grup węgla β-keto karbonylowych [opisane w Hopwood, D.A. i Sherman, D.H., Annu. Rev.Genet., 24, 37-66 (1990); Hutchinson, C. R. i Fujii, I., Annu. Rev. Microbiol., 49, 201-238(1995)].
Syntazy poliketydów (dalej określane jako PKS), które biorą udział w syntezie poliketydów są enzymami o których wiadomo, że są obecne w grzybach nitkowatych i bakteriach. Enzymy grzybów nitkowatych badano stosując techniki biologii molekularnej [jak opisano w Feng, G.H. i Leonard, T. J., J. Bacteriol., 177, 6246 (1995); Takano, Y. i wsp. Mol. Gen. Genet. 249, 162 (1995)]. U Aspergillus terreus, który jest mikroorganizmem produkującym lowastatynę, przebadano gen PKS związany z biosyntezą lowastatyny [opisane w Międzynarodowym zgłoszeniu otwartym w Japonii (KOHYO) Nr 9-504436, i zobacz odpowiedni WO 9512661, który zastrzega DNA kodujący syntazę poliketydu triolu].
Geny związane z biosyntezą metabolitów wtórnych grzybów nitkowatych często tworzą skupienia w genomie. W szlakach biosyntezy poliketydów, wiadomo, że istnieją skupienia genów biorących udział w tym szlaku. W biosyntezie aflatoksyny, która jest poliketydem produkowanym przez Aspergillus flavus i Aspergillus parasiticus, stwierdzano, że geny kodujące białka enzymatyczne biorące udział w tej biosyntezie (takie jak PKS) tworzą strukturę skupienia. Przeprowadzono analizę genomową i porównanie genów biorących udział w biosyntezie aflatoksyny u każdego z tych mikroorganizmów [zobacz Yu, J. i wsp., Appl. Environ. Microbiol., 61, 2365 (1995)]. Doniesiono, że geny biorące udział w biosyntezie sterigmatocystyny produkowanej przez Aspergillus nidulans tworzą strukturę skupienia w około 60 kb ciągłego regionu na jego genomie [opisane w Brown, D. W. i wsp., Proc. Natl. Acad. Sci. USA, 93, 1418 (1996)].
Modulacja aktywności syntazy poliketydów przez dodatkowe białka w czasie syntezy lowastatyny była badana [zobacz Kennedy, J i wsp., Science Vol 284, 1368 (1999)].
Jednak dotychczas analiza molekularno-biologiczna biosyntezy ML-236B i regulujących ją czynników była niewystarczająca. Niniejszy wynalazek ma na celu zajęcie się tym problemem.
Zgodny z wynalazkiem jest polinukleotyd odpowiedni do stosowania w przyspieszaniu biosyntezy ML-236B, wybrany z grupy złożonej z:
(a) polinukleotydu kodującego białko mające sekwencję aminokwasów SEQ ID NO 42, (b) polinukleotydu, który zawiera sekwencję nukleotydów SEQ ID NO 41, odpowiedniego do stosowania w przyspieszaniu biosyntezy ML-236B, (c) polinukleotydu, który stanowi sekwencję nukleotydów SEQ ID NO 41, (d) polinukleotydu, który hybrydyzuje w ostrych warunkach z p-linukleotydem określonym w (a) do (c), i który jest odpowiedni do przyspieszania biosyntezy ML-236B w mikroorganizmie wytwarzającym ML-236B gdy jest wprowadzany do tego mikroorganizmu wytwarzającego ML-236B, (e) mRNA, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (d).
PL 202 457 B1
Korzystnie polinukleotyd według wynalazku zawiera DNA, który można uzyskać z transformowanej Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006) i korzystnie jest on w połączeniu funkcjonalnym z jednym lub więcej polinukleotydów, przy czym ta kombinacja jest odpowiednia do stosowania w zwiększaniu wytwarzania ML-236B w mikroorganizmie wytwarzającym ML-236B.
Szczególnie korzystnie jest on w połączeniu funkcjonalnym z polinukleotydem kodującym białko, które zawiera lub stanowi sekwencję aminokwasów wybraną z SEQ ID NO 38, 42, 44, 46, 48 lub 50 albo zawiera polinukleotyd o SEQ ID NO 41 w połączeniu z jedną lub więcej sekwencji wybranych z SEQ ID NO 37, 41, 43, 45, 47 lub 49.
W szczególnych przypadkach polinukleotyd jest DNA, genomowym DNA lub cDNA.
Zgodnym z wynalazkiem jest również wektor zawierający powyżej określony polinukleotyd, a w szczególności zawierający ponadto polinukleotyd mający sekwencję nukleotydową SEQ ID NO 37 lub jedną albo więcej sekwencji nukleotydowych wybranych z SEQ ID NO 43, 45, 47 lub 49.
Korzystnym wektorem, zgodnie z wynalazkiem, jest wektor, który nie zawiera sekwencji nukleotydowych SEQ ID NO 37, 43, 45, 47 lub 49 albo wektor, który nie zawiera sekwencji nukleotydowych SEQ ID NO 43, 45, 47 lub 49.
Wektor według wynalazku korzystnie wytwarza się z Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006) i korzystnie jest to wektor ekspresyjny.
Zgodna z wynalazkiem jest komórka gospodarza transformowana określonym powyżej wektorem, zwłaszcza komórka gospodarza, który jest mikroorganizmem wytwarzającym ML-236B, zwłaszcza pochodzącym z gatunku Penicillium, korzystnie jest to komórka Penicillium citrinum.
Korzystnie komórką gospodarza jest też komórka Escherichia coli, a zwłaszcza komórka Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
Zgodnym z wynalazkiem jest również polipeptyd kodowany przez określony powyżej polinukleotyd, a zwłaszcza polipeptyd zawierający sekwencję SEQ ID NO 42 lub jej wariant, który ma przynajmniej 80% identyczności do SEQ ID NO 42 i który jest zdolny do przyspieszenia produkcji ML-236B w organizmie wytwarzają cym ML236B, przy czym szczególnie korzystnym polipeptydem według wynalazku jest polipeptyd mający sekwencję SEQ ID NO 42.
Sposób wytwarzania ML-236B według wynalazku polega na tym, że hoduje się komórkę gospodarza określoną powyżej i następnie odzyskuje się ML-236B z hodowli. Korzystnie komórkę gospodarza transformuje się wektorem zawierającym SEQ ID NO 41, przy czym szczególnie korzystnie wektorem, który równocześnie nie zawiera sekwencji polinukleotydowej SEQ ID NO 37 albo równocześnie nie zawiera co najmniej jednej sekwencji polinukleotydowej kodującej sekwencję aminokwasów odpowiadającą SEQ ID NO 44, 46, 48 i/lub 50.
Sposób wytwarzania według wynalazku jest korzystny gdy ML-236B wytwarza się w nieobecności jednego lub więcej zrekombinowanych polipeptydów mających sekwencje aminokwasowe odpowiadające SEQ ID NO 38, 44, 46, 48 i/lub 50 albo wówczas gdy ML-236B wytwarza się w nieobecności jednego lub więcej cDNA odpowiadającego SEQ ID NO 37,43,45,47 i/lub 49.
Sposób wytwarzania prawastatyny według wynalazku polega na tym, że przeprowadza się sposób wytwarzania ML-236B określony wyżej i następnie przekształca się ML-236B w prawastatynę.
Tabela Listy Sekwencji
Lista sekwencji tworzy część niniejszego opisu patentowego. Aby pomóc w zrozumieniu podajemy następującą tabelę wyliczonych sekwencji.
SEQ ID NR tożsamość wstawka pML48 komplementarne do SEQ ID NO 1 primer do PCR dla Przykładu 4 primer do PCR dla Przykładu 4 oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (1) do 5'-RACE oligonukleotyd DNA (2) do 5'-RACE oligonukleotyd DNA (2) do 5'-RACE
Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8 Przykład 8
PL 202 457 B1 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 oligonukleotyd DNA (2) do 5'-RACE, Przykład 8 Fragment końca 5'cDNA, Przykład 8
Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 Fragment końca 5'cDNA, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 oligonukleotyd DNA (3) do 3'-RACE, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 Fragment końca 3' cDNA, Przykład 8 primer RT-PCR, Przykład 9 primer RT-PCR, Przykład 9 mlcE; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcE primer RT-PCR, Przykład 12 primer RT-PCR, Przykład 12 mlcR; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcR mlcA; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcA mlcB; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcB mlcC; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcC mlcD; sekwencja nukleotydów cDNA i wydedukowana sekwencja aminokwasów wydedukowany polipeptyd mlcD primer RT-PCR, Przykład 17
Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17 Przykład 17
Polinukleotydy kodujące sekwencję aminokwasów SEQ ID NO 38, 42, 44, 46, 48 lub 50 mogą być cDNA, genomowym DNA lub mRNA. Genomowe DNA kodujące każdą z tych sześciu sekwencji są określane jako geny struktury mlcE, mlcR, mlcA, mlcB, mlcC i mlcD, odpowiednio. Bez wiązania się tymi określeniami, uważamy, że te geny struktury kodują białka z następującymi funkcjami:
mlcA syntaza poliketydów mlcB syntaza poliketydów primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR, primer RT-PCR,
PL 202 457 B1 mlcC monooksygenaza P450 mlcD reduktaza HMG-CoA mlcE pompa wypływowa mlcR czynnik transkrypcyjny
Stwierdzono, że włączenie mlcE lub cDNA odpowiadającego mlcE B oraz włączenie mlcR lub cDNA odpowiadającego mlcR może przyspieszyć biosyntezę ML-236B. Co więcej, mlcR stymuluje transkrypcyjną ekspresję mlcA do D. MlcA, B, C i D biorą udział w produkcji ML-236B, niezależnie i razem, jak wykazał y badania dysrupcji genów.
Warianty mlcA, B i/lub C uzyskiwane poprzez naturalne lub syntetyczne zmiany są pożyteczne do produkcji pochodnych ML-236B, w tym statyn takich jak prawastatyna lub lowastatyna. W tym względzie może być możliwe wyprodukowanie prawastatyny bezpośrednio przez takie warianty tylko z jednym etapem fermentacji i bez potrzeby konwersji ML-236B do prawastatyny przez mikroorganizmy Streptomyces carbophilus.
Polinukleotyd obejmujący sekwencję zawierającą SEQ ID NO 37, lub zawierającą jej mutanta lub wariant jest zdolny do przyspieszania biosyntezy ML-236B. Taki polinukleotyd DNA można uzyskać z transformowanej Escherichia coli pSAKexpE SANK 72499 (FERM BP-7005).
Polinukleotyd obejmujący sekwencję zawierającą SEQ ID NO 41 lub zawierającą jej mutanta lub wariant jest zdolny do przyspieszania biosyntezy ML-236B. Taki polinukleotyd DNA można uzyskać z transformowanej Escherichia coli pSAKexpE SANK 72599 (FERM BP-7006).
Polinukleotyd według wynalazku jest typowym DNA, cDNA lub genomowym DNA, lub RNA i może być sensowny albo antysensowny. Stosowany polinukleotyd jest oczyszczony, tzn. wolny od innych składników komórkowych.
Stosowane dalej określenie warianty polinukleotydu kodujące sekwencję aminokwasów wskazanych SEQ ID NO 38, 42, 44, 46, 48 lub 50, oznacza polinukleotydy gdzie zmieniony jest jeden lub więcej nukleotydów. Te zmiany mogą występować naturalnie i mogą być zrobione w obrębie nadmiarowości lub degeneracji tripletów kodu genetycznego. Takie zdegenerowane zmienione polinukleotydy kodują te same sekwencje aminokwasów. W obrębie tych wariantów polinukleotydów rozumiany jest także genomowy DNA mający eksony i introny, a nie samą sekwencję jak jest w przypadku cDNA.
Pojęcie warianty polinukleotydu kodujące sekwencję aminokwasów wskazanych SEQ ID NO 38, 42, 44, 46, 48 lub 50, obejmuje też polinukleotydy, które kodują zmodyfikowaną sekwencję aminokwasów mającą przynajmniej jedną delecję, addycję, substytucję lub zmianę oraz warianty polinukleotydu o wskazanych sekwencjach, które kodują sekwencje aminokwasów, które są krótsze, dłuższe lub tej samej długości jak kodowane przez wskazane sekwencje. Warianty polipeptydów zachowują zdolność do przyspieszania syntezy ML-236B i korzystnie mają aktywność zasadniczo podobną lub lepszą niż rodzicielska sekwencja, z której powstał wariant sekwencji.
Warianty polinukleotydu zachowują stopień identyczności z sekwencją rodzicielską. Odpowiedni stopień identyczności wynosi przynajmniej 60%, przynajmniej 80%, przynajmniej 90% lub przynajmniej 95% lub 100%. Stopień identyczności jest korzystnie oceniany przez program komputerowy taki jak program BLAST, który stosuje algorytm do przeprowadzenia poszukiwań homologii.
Polinukleotyd według wynalazku przyspiesza biosyntezę ML-236B w mikroorganizmie produkującym ML-236B. Przykłady mikroorganizmów produkujących ML-236B obejmują gatunki Penicillium, takie jak Penicillium citrinum, Penicillium brevicompactum [opisane w Brown, A.G. i wsp., J. Chem. Soc. Perkin-1., 1165(1976)], Penicillium cyclopium [opisane w Doss, S.L. i wsp., J. Natl. Prod.,49, 357 (1986)] lub podobne. Inne przykłady obejmują: Eupenicillium sp.M6603 [opisane w Endo A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Paecilomyces viridis FERM P-6236 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 58-98092], Paecilomyces sp.M2016 [opisane w Endo A. i wsp., J. Antibiot. -Tokyo, 39, 1609 (1986)], Trichoderma longibrachiatum M6735 [opisane w Endo, A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Hypomyces chrysospermus IFO 7798 [opisane w Endo A. i wsp., J. Antibiot.-Tokyo, 39, 1609(1986)], Gliocladium sp. YJ-9515 [opisane w WO 9806867], Trichorderma viride IFO 5836 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 62-19159], Eupenicillium reticulisporum IFO 9022 [opisane w Japońskim Zgłoszeniu Patentowym, Publikacja Nr 62-19159], lub dowolny inny odpowiedni organizm.
Wśród tych mikroorganizmów produkujących ML-236B, korzystny jest Penicillium citrinum, a bardziej korzystny jest szczep Penicillium citrinum SANK 13380. Szczep Penicillium citrinum SANK 13380 zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu. FERM BP-4129, zgodnie z Traktatem
PL 202 457 B1
Budapeszteńskim o Deponowaniu Mikroorganizmów. Przykłady mikroorganizmów produkujących ML-236B także obejmują izolowane z naturalnych źródeł i mutowane naturalnie lub syntetycznie.
Wynalazek dotyczy polipeptydu obejmującego sekwencję NO 42, lub jej wariant, który ma z nią specyficzny stopień identyczności i który jest zdolny do przyspieszania produkcji ML236B w organizmie produkującym ML236B. Inne polipeptydy według wynalazku to te, które są kodowane przez opisane powyżej sekwencje polinukleotydu i warianty, które zachowują stopień identyczności.
Odpowiedni stopień identyczności wariantów polipeptydu do SEQ ID NO 42 jest przynajmniej 80%, przynajmniej 90% lub przynajmniej 95% lub 100%. Stopień identyczności wariantu jest korzystnie oceniany przez program komputerowy, taki jak program BLAST, który stosuje algorytm do przeprowadzenia poszukiwań homologii.
Polipeptydy według wynalazku obejmują krótsze lub dłuższe sekwencje SEQ ID NO 42 lub wariantów. Krótsze polipeptydy zawierają częściową sekwencję aminokwasów SEQ ID NO 42 lub jej wariantów i korzystnie zachowują zdolność do przyspieszania biosyntezy ML236B. Dłuższe polipeptydy zawierają całą lub częściową sekwencję aminokwasów SEQ ID NO 42 lub ich wariantów i korzystnie zachowują zdolność do przyspieszania biosyntezy ML236B. Dłuższe polipeptydy obejmują fuzje białkowe takie jak białko w fuzji z Fc.
W odpowiedzi na obecność polipeptydu według wynalazku mogą być wytwarzane zarówno poliklonalne jak i monoklonalne przeciwciała. Są one użyteczne do regulowania wytwarzania pochodnych ML-236B, takich jak statyny, a w tym prawastatyny i lowastatyny. Ponadto przeciwciała mogą być korzystnie użyte do analizy biosyntezy ML-236B i jego mechanizmów regulacyjnych. Taka analiza jest użyteczna do modulowania wytwarzania ML-236B i do wytwarzania pochodnych ML-236B.
Szczegółowy opis wynalazku
Twórcy wynalazku sklonowali genomowy DNA zawierający geny biorące udział w biosyntezie ML-236B u Penicillium citrinum. Genomowy DNA jest dalej określany jako genomowy DNA związany z biosyntezą ML-236B, i był sklonowany z biblioteki genomowego DNA mikroorganizmu produkującego ML-236B. Genomowy DNA analizowano by znaleźć geny struktury na tym genomowym DNA, następnie uzyskano cDNA odpowiadające tym genom struktury za pomocą odwrotnej transkrypcji - reakcji łańcuchowej z polimerazą (dalej określana jak RT-PCR) stosując całkowity RNA, który zawiera mRNA Penicillium citrinum jako matrycę. Stwierdzono, że biosynteza ML-236B w mikroorganizmie produkującym ML-236B była przyspieszona gdy mikroorganizm produkujący ML-236B był transformowany zrekombinowanym wektorem zawierającym te cDNA.
Niniejszy wynalazek dotyczy szczególnie cDNA (dalej określane jako cDNA przyspieszające biosyntezę ML-236B), które przyspieszają biosyntezę ML-236B w mikroorganizmie produkującym ML-236B gdy są wprowadzone do tego mikroorganizmu produkującego ML-236B.
Polinukleotyd według niniejszego wynalazku przyspieszający biosyntezę ML-236B, taki jak cDNA przyspieszający biosyntezę ML-236B obejmuje, jako przykłady:
(I) DNA uzyskany za pomocą syntezy stosując jako matrycę transkrybowany produkt (informacyjny RNA, dalej określany jako mRNA) genu struktury, który bierze udział w biosyntezie ML-236B i który istnieje w genomowym DNA mikroorganizmu produkującego ML-236B;
(II) dwuniciowy DNA wytworzony w wyniku asocjacji DNA (I) i DNA drugiej nici zsyntetyzowanego stosując DNA (I) jako pierwszą nić;
(III) dwuniciowy DNA wytworzony przez replikację lub amplifikację dwuniciowego DNA (II), na przykład, przez metodę klonowania lub podobną;
(IV) DNA, który może hybrydyzować do jednego z powyższych DNA lub mRNA w warunkach ostrych.
DNA (IV) może być tym pokazanym w dowolnej sekwencji genu struktury, na przykład jako nukleotydy Nr 1 do 1662 SEQ ID No. 37 lub nukleotydy Nr 1 do 1380 SEQ ID No 41.
Gdy dwa jednoniciowe kwasy nukleinowe hybrydyzują tworzą dwuniciową cząsteczkę w regionie, w którym są komplementarne lub wysoce komplementarne, i warunki ostre odpowiednio dotyczą przypadku gdy roztwór do hybrydyzacji jest 6 x SSC [1 x SSC ma skład 150 mM NaCI, 15 mM cytrynian sodu] i temperatura hybrydyzacji wynosi 55°C.
cDNA przyspieszający biosyntezę ML-236B może być uzyskany, na przykład, przez izolację klonu zawierającego cDNA z biblioteki cDNA mikroorganizmu produkującego ML-236B. Jako alternatywa można zastosować RT-PCR z użyciem pary primerów zaprojektowanych na podstawie sekwencji nukleotydów genomowego DNA związanego z biosyntezą ML-236B razem z mRNA lub całkowitym RNA mikroorganizmu produkującego ML-236B.
PL 202 457 B1
Mikroorganizm produkujący ML-236B jest mikroorganizmem mającym wewnętrzną zdolność do produkcji ML-236B. Jak uprzednio wskazano, przykłady mikroorganizmów produkujących ML-236B obejmują gatunki Penicillium takie jak Penicillium citrinum, Penicillium brevicompactum, Penicillium cyclopium lub podobne i inne przykłady obejmują: Eupenicillium sp.M6603, Paecilomyces viridis FERM P-6236, Paecilomyces sp.M2016, Trichoderma longibrachiatum M6735, Hypomyces chrysospermus IFO 7798, Gliocladium sp. YJ-9515, Trichorderma viride IFO 5836, Eupenicillium reticulisporum IFO 9022 i inne dowolne odpowiednie organizmy.
Wśród tych mikroorganizmów produkujących ML-236B, Penicillium citrinum jest korzystny i szczep Penicillium citrinum SANK 13380 jest bardziej korzystny. Szczep Penicillium citrinum SANK 13380 zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu FERM BP-4129, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów. Przykłady mikroorganizmów produkujących ML-236B także obejmują zarówno te izolowane ze źródeł naturalnych jak i zmutowane naturalnie lub sztucznie.
Genomowy DNA związany z biosyntezą ML236-B może być też uzyskany przez przeszukanie genomowej biblioteki DNA mikroorganizmu produkującego ML-236B odpowiednią sondą. Odpowiednio sonda jest zaprojektowana na podstawie sekwencji DNA, dla której przewiduje się rolę w biosyntezie ML-236B, odpowiednio pochodzącej z grzyba nitkowatego.
Wybór sposobów tworzenia biblioteki genomowego DNA nie jest ograniczony i może być stosowana dowolny odpowiedni sposób, korzystnie będący ogólnym sposobem konstrukcji biblioteki genomowego DNA organizmu eukariotycznego. Przykłady tego obejmują sposób Maniatis i wsp. [Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2., Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Inne odpowiednie sposoby są znane w dziedzinie.
Pokrótce, genomowy DNA z mikroorganizmu produkującego ML-236B może być otrzymany przez odzyskanie komórek z hodowli tego mikroorganizmu produkującego ML-236B, fizyczne rozbicie komórek, ekstrakcję DNA obecnego w jego jądrach i oczyszczenie tego DNA.
Hodowlę mikroorganizmu produkującego ML-236B można prowadzić w warunkach odpowiednich dla danego mikroorganizmu produkującego ML-236B. Na przykład hodowla Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B może być przeprowadzona przez zaszczepienie komórek w podłożu MBG3-8 [skład: 7% (waga/obj) gliceryna, 3% (waga/obj) glukoza, 1% (waga/obj) proszek sojowy, 1% (waga/obj) pepton (wyprodukowany przez Kyokuto Seiyaku Kogyo corporation), 1% (waga/obj) płyn z maceracji kukurydzy (wyprodukowany przez Honen corporation), 0,5% (waga/obj) azotan sodu, 0,1%(waga/obj) siedmiowodny siarczan magnezu (pH 6,5)] i inkubację w 22 do 28°C z wytrząsaniem przez 3 do 7 dni. Skos do przechowywania bakterii można przygotować przez wylanie roztopionego podłoża agarowego PGA [skład: 200g/L wyciągu ziemniaczanego, 15% (waga/obj) gliceryna, 2% (waga/obj) agar] do probówki i zestalenie agaru pod kątem. Penicillium citrinum można wówczas zaszczepić na skosie platynową igłą a następnie prowadzi się inkubację w 22 do 28°C przez 7 do 15 dni. Mikroorganizmy lub bakterie hodowane w ten sposób mogą być w sposób ciągły utrzymywane na skosie przez trzymanie skosu w 0 do 4°C.
Komórki mikroorganizmu produkującego ML-236B hodowane w podłożu płynnym można odzyskać za pomocą wirowania, a hodowane na podłożu stałym można zdrapać z podłoża stałego zdrapywaczem do komórek lub podobnym.
Fizyczne rozbicie komórek można przeprowadzić przez roztarcie komórek stosując tłuczek i moździerz, zamrożenie w ciekłym azocie i podobnie. DNA w jądrach rozbitych komórek może być wyekstrahowany stosując związek powierzchniowo czynny taki jak sól sodowa siarczanu dodecylu (dalej określany jako SDS) lub inny odpowiedni związek powierzchniowo czynny. Wekstrahowany genomowy DNA jest odpowiednio poddany działaniu fenolu - chloroformu aby usunąć białka i odzyskiwany jako osad przez przeprowadzenie strącania etanolem.
Powstały genomowy DNA fragmentuje się przez trawienie odpowiednim enzymem restrykcyjnym. Nie ma ograniczenia na enzymy restrykcyjne, które mogą być stosowane do trawienia restrykcyjnego, korzystne są ogólnie dostępne enzymy restrykcyjne. Przykłady obejmują Sau3AI. Inne odpowiednie enzymy są znane w dziedzinie. Trawiony DNA poddaje się następnie elektroforezie w żelu i genomowy DNA mają cy odpowiednią wielkość odzyskuje się ż elu. Wielkość fragmentu DNA nie jest szczególnie ograniczana, ale korzystnie wynosi 20 kb lub więcej.
Także nie ma ograniczenia wyboru wektora DNA stosowanego w konstrukcji biblioteki genomowego DNA, o ile wektor ma sekwencję DNA potrzebną do replikacji w komórce gospodarza, która
PL 202 457 B1 ma być transformowana przez wektor. Przykłady odpowiednich wektorów obejmują wektor plazmidowy, wektor fagowy, wektor kosmidowy, wektor BAC lub podobne, korzystny jest wektor kosmidowy. Wektor DNA jest korzystnie wektorem ekspresyjnym. Bardziej korzystnie wektor DNA zawiera DNA lub sekwencję nukleotydów, która nadaje selektywny fenotyp komórce gospodarza transformowanej wektorem.
Wektor DNA jest odpowiednio wektorem, który może być stosowany zarówno do klonowania i do ekspresji. Korzystnie wektor jest wektorem wahadł owym, który moż e być stosowany do transformacji więcej niż jednego mikroorganizmu- gospodarza. Wektor wahadłowy ma odpowiednio sekwencję DNA, która pozwala na replikację w komórce gospodarza i korzystnie sekwencję lub sekwencje, które pozwalają na replikację w szeregu różnych komórek gospodarza z różnych grup mikroorganizmów takich jak bakterie i grzyby. Dalej, wektor wahadłowy korzystnie zawiera sekwencję DNA, która może zapewnić fenotyp selekcyjny dla zakresu różnych komórek gospodarza, takich jak komórki z róż nych grup mikroorganizmów.
Wybór kombinacji grupy mikroorganizmów i komórek gospodarza transformowanych przez wektor wahadłowy nie jest szczególnie ograniczany pod warunkiem, że jedna z grup mikroorganizmów może być użyta do klonowania a druga ma zdolność do produkcji ML-236B. Takie kombinacje mogą być, na przykład, kombinacją bakterii i grzybów nitkowatych, kombinacją drożdży i grzybów nitkowatych, z korzystną kombinacją bakterii i grzybów nitkowatych. Wybór bakterii nie jest szczególnie ograniczany o ile może ona być ogólnie stosowana w biotechnologii, taka jak na przykład Escherichia coli, Bacillus subtilis lub podobne. Escherichia coli jest korzystne i Escherichia coli XL1-Blue MR jest najbardziej korzystna. Podobnie nie ma ograniczenia gatunku drożdży o ile może być on ogólnie stosowany w biotechnologii tak jak na przykład Saccharomyces cerevisiae lub podobne. Przykłady grzybów nitkowatych obejmują mikroorganizmy produkujące ML-236B opisane powyżej. Inne odpowiednie przykłady mikroorganizmów są znane w dziedzinie.
W niniejszym wynalazku, grupa mikroorganizmów moż e być wybrana z bakterii, grzybów nitkowatych i drożdży.
Przykłady wymienionego powyżej wektora wahadłowego obejmują wektor kosmidowy mający odpowiedni gen markera do selekcji fenotypu i miejsce cos. Inne odpowiednie wektory są znane w dziedzinie. Korzystnym wektorem jest pSAKcos1, skonstruowany przez wstawienie miejsca cos z wektora kosmidowego pWE15 (wyprodukowany przez STRATAGENE) do plazmidu pSAK333, który zawiera sekwencję genu fosfotransferazy hygromycyny B Escherichia coli [opisane w Japońskim Zgłoszeniu Patentowym Publikacja Nr 3-262486]. Sposób konstrukcji pSAKcos1 przedstawiono na Figurze 1. Niniejszy wynalazek nie jest ograniczony do tego wektora.
Biblioteką genomowego DNA można przygotować przez wprowadzenie wektora wahadłowego do komórki gospodarza, wektor zawiera genomowy fragment DNA z mikroorganizmu produkującego ML-236B. Komórka gospodarza, która ma być stosowana jest korzystnie Escherichia coli, bardziej korzystnie Escherichia coli XL1-Blue MR. Gdy komórka gospodarza jest Escherichia coli, wprowadzenie można przeprowadzić przez pakowanie in vitro. W niniejszym wynalazku transformacja także obejmuje wprowadzanie obcego DNA przez pakowanie in vitro, i transformowana komórka także obejmuje komórkę, do której obcy DNA wprowadzono za pomocą pakowania in vitro.
Biblioteka genomowa może być przeszukiwana aby zidentyfikować pożądany klon stosując jako sondą przeciwciało lub kwas nukleinowy, przy czym sonda kwasu nukleinowego jest korzystna. Korzystnie sondę kwasu nukleinowego przygotowuje się w oparciu o sekwencją nukleotydów genu lub DNA związanego z biosyntezą poliketydów, korzystnie jest to sekwencja pochodząca z grzyba nitkowatego. Wybór danego genu nie jest ograniczony o ile bierze on udział w biosyntezie poliketydów a jego sekwencja nukleotydów jest znana. Przykł ady takich genów obejmują gen PKS aflatoksyny Aspergillus flavus i Aspergillus parasiticus, gen PKS sterygmatocystyny Aspergillus nidulans lub podobne.
Odpowiednie sondy kwasu nukleinowego można uzyskać, na przykład, przez syntezą sondy oligonukleotydowej zawierającej część znanej genomowej sekwencji DNA jak opisano powyżej lub przez przygotowanie primerów oligonukleotydowych i amplifikacją docelowego DNA stosując reakcję łańcuchową polimerazy [dalej określaną jako PCR, opisane w Saiki, R. K i wsp., Science, 239, 487 (1988)] i genomowy DNA jako matrycą lub poprzez RT-PCR stosując mRNA jako matrycę. Inne odpowiednie sposoby otrzymania takich sond są dobrze znane w dziedzinie.
Sonda kwasu nukleinowego może być otrzymana z mikroorganizmu produkującego ML-236B, używając na przykład PCR lub RT-PCR. Zaprojektowanie primerów stosowanych do PCR lub RT-PCR
PL 202 457 B1 (dalej określany jako primer do PCR) jest korzystnie przeprowadzane na podstawie sekwencji nukleotydów genu związanego z biosyntezą poliketydów dla którego jest znana sekwencja nukleotydów. Korzystnie gen jest genem PKS aflatoksyny Aspergillus flavus, Aspergillus parasiticus, lub genem PKS sterygmatocystyny Aspergillus nidulans.
Primery do PCR są odpowiednio zaprojektowane by zawierały sekwencje nukleotydów, które kodują sekwencje aminokwasów, które są wysoce konserwatywne w genach PKS. Sposoby identyfikacji sekwencji nukleotydów odpowiadających danej sekwencji aminokwasów obejmują dedukcję na podstawie wykorzystywania kodonów komórki gospodarza, i sposoby przygotowywania mieszanych sekwencji oligonukleotydów stosując wielokrotne kodony (dalej określany jako 'zdegenerowane oligonukleotydy'). W tym drugim przypadku wielokrotność oligonukleotydów może być zmniejszona przez wprowadzenie hipoksantyny do ich sekwencji nukleotydów.
Primer do PCR może zawierać sekwencją nukleotydów zaprojektowaną aby hybrydyzowała z nicią matrycy, primer jest połączony z dodatkową sekwencją 5'. Wybór takiej dodatkowej sekwencji nukleotydów 5' nie jest szczególnie ograniczony tak długo jak primer może być użyty do PCR lub RT-PCR. Taka dodatkowa sekwencja 5' może być na przykład, sekwencją nukleotydów wygodną dla klonowania produktu PCR. Taka sekwencja nukleotydów może być na przykład, miejscem cięcia enzymu restrykcyjnego lub sekwencją nukleotydów zawierającą miejsce cięcia enzymu restrykcyjnego.
Dalej w projektowaniu primera do PCR, jest korzystne, że suma liczby zasad guaninowych (G) i liczba cytozynowych (C) wynosi 40 do 60% całkowitej liczby zasad. Dalej, korzystnie występuje mało lub brak autohybrydyzacji danego primera i w przypadku pary primerów, korzystnie mało lub brak hybrydyzacji między primerami.
Liczba nukleotydów tworzących primer do PCR nie jest szczególnie ograniczona, o ile może być stosowany do PCR. Dolna granica liczby wynosi na ogół 10 do 14 nukleotydów, z górną granicą 40 do 60 nukleotydów. Korzystnie, primery mają 14 do 40 oligonukleotydów długości.
Primer do PCR korzystnie jest DNA. Nukleozydy w primerze mogą być deoksy adenozyną, deoksycytydyną, deoksytymidyną i deoksyguanozyną i dodatkowo deoksyinozyną. Pozycja 5' nukleozydu na końcu 5' primera do PCR jest odpowiednio grupą hydroksylową do której jest przyłączony jeden kwas fosforowy za pomocą wiązania estrowego.
Synteza primera do PCR może być przeprowadzona za pomocą sposobów do syntezy kwasów nukleinowych, na przykład metody fosfoamidynowej. W takim sposobie może być korzystnie stosowany automatyczny syntetyzator DNA.
Genomowy DNA i mRNA z mikroorganizmu produkującego ML-236B mogą być stosowane jako matryce dla odpowiednio PCR lub RT-PCR. Całkowity RNA może też być stosowany jako matryca do RT-PCR zamiast mRNA.
Produkt PCR lub produkt RT-PCR może być klonowany poprzez włączenie do odpowiedniego wektora DNA. Wybór wektora DNA stosowanego do etapu klonowania na ogół nie jest ograniczony. Zestawy do łatwego klonowania produktów PCR i RT-PCR są dostępne handlowo. Jako przykład, Original TA Cloning Kit (wyprodukowany przez lnvitrogen: stosujący pCR2.1 jako wektor DNA) jest odpowiedni do takiego klonowania.
Aby uzyskać taki sklonowany produkt PCR, transformowane komórki gospodarza zawierające plazmidy zawierające pożądany produkt PCR hoduje się i następnie plazmidy ekstrahuje się z komórek i oczyszcza. Wstawiony fragment DNA następnie odzyskuje się z powstałego plazmidu.
Hodowanie transformowanych komórek gospodarza odpowiednio przeprowadza się w warunkach odpowiednich dla komórek gospodarza. Korzystna komórka gospodarza, Escherichia coli, może być hodowana w podłożu LB [1% (waga/obj) trypton, 0,5% (waga/obj) ekstrakt drożdżowy, 0,5% (waga/obj) chlorek sodu] w 30 do 37°C przez 18 godzin do dwóch dni z wytrząsaniem.
Preparatyka plazmidów z hodowli transformowanych komórek gospodarza może być przeprowadzona przez odzyskanie komórek gospodarza i izolację plazmidów wolnych od innych składników komórki takich jak genomowy DNA lub białko gospodarza. Preparatykę DNA plazmidowego z hodowli Escherichia coli można przeprowadzić według metody lizy alkalicznej Maniatisa [opisane w Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2., Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Handlowo są dostępne zestawy do uzyskania plazmidu mającego wyższą czystość. Plasmid Mini Kit [wyprodukowany przez QIAGEN AG] jest korzystny. Dalej dostępny jest handlowo zestaw do masowej produkcji plazmidu. Plasmid Maxi Kit (wyprodukowany przez QIAGEN AG) jest korzystny.
PL 202 457 B1
Stężenie powstałego DNA plazmidu można określić przez pomiar absorbancji przy długości fali
260 nm po odpowiednim rozcieńczeniu próbki DNA i wyliczeniu na podstawie, że roztwór z absorbancją OD260 1 zawiera 50 μg/ml DNA (opisane w Maniatis T., i wsp., powyżej).
Czystość DNA można wyliczyć ze stosunku absorbancji przy długości fali 280 i 260 nm (opisane w Maniatis, T. i wsp., powyżej).
Sposoby znakowania sond kwasów nukleinowych można ogólnie sklasyfikować jako znakowanie radioaktywne i nie radioaktywne. Wybór radionukleotydu do znakowania radioaktywnego nie jest na ogół ograniczony i może być na przykład, 32P, 35S, 14C lub podobne. Stosowanie 32P w znakowaniu jest korzystne. Wybór czynnika do znakowania nieradioaktywnego także nie jest ogólnie ograniczony, o ile może być ogólnie stosowany do znakowania kwasów nukleinowych i może być, na przykład, digoksygeniną, biotyną lub podobnym, digoksygenina jest korzystna.
Sposoby znakowania sondy kwasów nukleinowych także nie są ogólnie ograniczone. Korzystne są powszechnie stosowane sposoby takie jak na przykład, sposoby włączające znak do produktu za pomocą PCR lub RT-PCR stosując znakowane substraty nukleotydowe, nick translację, stosowanie losowych primerów, znakowanie końców i sposoby syntetyzowania oligonukleotydów DNA stosując znakowane substraty nukleotydowe. Odpowiedni sposób może być wybrany z tych sposobów w zależności od typu sondy kwasu nukleinowego.
Obecność w genomie mikroorganizmu produkującego ML-236B sekwencji nukleotydów, która jest taka sama jak sekwencja nukleotydów danej sondy kwasu nukleinowego może być potwierdzona za pomocą hybrydyzacji typu Southerna z genomowym DNA tego mikroorganizmu produkującego
ML-236B.
Hybrydyzacja typu Southerna może być przeprowadzona według sposobu Maniatis [opisane w Maniatis, T. i wsp., powyżej].
Znakowana sonda kwasu nukleinowego przygotowana jak opisano powyżej może być stosowana do przeszukiwania biblioteki genomowego DNA. Wybór sposobu przeszukiwania nie jest szczególnie ograniczony o ile jest on ogólnie odpowiedni do klonowania genów, ale jest korzystnie metodą hybrydyzacji kolonijnej [opisane w Maniatis, T., i wsp., powyżej].
Hodowla kolonii stosowanych do hybrydyzacji kolonijnej jest odpowiednio przeprowadzana w warunkach odpowiednich dla komórki gospodarza. Hodowla Escherichia coli, korzystnego gospodarza może być przeprowadzona przez inkubację w podłożu agarowym LB [1% (waga/obj) trypton, 0,5% (waga/obj) ekstrakt drożdżowy, 0,5% (waga/obj) chlorek sodu, 1,5% (waga/obj) agaroza] w 30 do 37°C przez 18 godzin do dwóch dni.
Preparatyka wektora zrekombinowanego DNA z dodatniego klonu uzyskanego za pomocą hybrydyzacji kolonijnej na ogół jest przeprowadzana przez ekstrakcją plazmidu z hodowli dodatniego klonu i oczyszczenia go.
Transformowany szczep Escherichia coli, Escherichia coli pML48 SANK71199 reprezentujący dodatni klon uzyskany według niniejszego wynalazku, zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 7 lipca, 1999, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów i uzyskał numer dostąpu FERM BP-6780.
Typowy wektor DNA niesiony przez Escherichia coli pML48 SANK71199 określono jako pML48.
Potwierdzenie, że zrekombinowany wektor DNA obecny w dodatnim klonie zawiera genomowy DNA związany z biosyntezą ML-236B można odpowiednio uzyskać przez ustalenie sekwencji nukleotydów wstawki zrekombinowanego wektora DNA, hybrydyzację typu Southerna lub ekspresję wstawki w celu ustalenia funkcji.
Sekwencję nukleotydów DNA można ustalić za pomocą techniki modyfikacji chemicznej Maxama i Gilberta [opisane w Maxam, A. M. M. i Gilbert, W., Methods in Enzymology, 65, 499 (1980)] lub metodą terminacji łańcucha dideoksy [opisane w Messing, J. i Vieira, J., Gene, 19, 269 (1982)]. Inne odpowiednie sposoby są dobrze znane w dziedzinie. DNA plazmidowy stosowany do określania sekwencji nukleotydów korzystnie jest próbką o wysokiej czystości, jak opisano powyżej.
Sekwencja nukleotydów wstawki pML48 jest przedstawiona w SEQ ID No. 1 Listy sekwencji. Sekwencja nukleotydów przedstawiona w SEQ ID No. 2 Listy sekwencji jest całkowicie komplementarna do sekwencji nukleotydów przedstawionej w SEQ ID No. 1. Ogólnie, sekwencja nukleotydów genomowego DNA może mieć polimorfizmy genetyczne w obrębie gatunku, to znaczy różnice allogeniczne. Dalej, w procesie klonowania i sekwencjonowania DNA wiadomo, że podstawienia nukleotydów lub inne zmiany, mogą zachodzić z pewną częstością. Tak więc genomowy DNA związany z biosyntezą ML-236B także obejmuje genomowy i inne DNA, które mogą być hybrydyzowane do
PL 202 457 B1
DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji. Korzystny są genomowy lub inne DNA, które mogą hybrydyzować w warunkach ostrych do DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji. Te DNA obejmują DNA nukleotydu Nr 1 do 34203 SEQ ID No. 1 lub 2 Listy sekwencji, znamienny tym, że jeden lub więcej nukleotydów jest podstawionych, wydeletowanych i/lub dodanych. Dodatkowo ten hybrydyzujący genomowy lub inny DNA mogą obejmować DNA pochodzący z mikroorganizmów produkujących ML-236B innych niż Penicillium citrinum SANK13380, korzystnie są to te zdolne do poprawienia produkcji ML-236B gdy są wprowadzone do mikroorganizmu produkującego ML-236B.
Genomowy DNA związany z biosyntezą ML-236B odpowiednio się analizuje zgodnie z następującymi sposobami 1) do 3).
1) Analiza za pomocą programów analizujących geny
Geny w obrębie genomowego DNA można znaleźć stosując program do szukania genów (dalej określany jako GRAIL) i program do poszukiwania homologicznych sekwencji (BLASTN i BLASTX).
GRAIL jest programem, który poszukuje genów struktury w genomowym DNA przez rozdzielenie genomowych sekwencji na siedem parametrów dla oceny wyglądu sekwencji genu i integrację wyników stosując metodę sieci [opisane w Uberbacher, E.C. i Mural, R.J., Proc. Natl. Acad. Sci. USA., 88, 11261 (1991)]. Jako przykład, można stosować ApoCom GRAIL Toolkit [produkowany przez Apocom corporation].
BLAST jest programem stosującym algorytm do przeprowadzania poszukiwań homologii sekwencji nukleotydów i sekwencji aminokwasów [opisane w Altschul, S.F., Madden, T. L. i wsp., Nucl. Acids Res., 25, 3389 (1997)].
Pozycję i kierunek genu struktury w przykładowej sekwencji genomowego DNA można przewidzieć przez podział sekwencji DNA na odpowiednie długości i przeprowadzenie poszukiwania homologii w genetycznej bazie danych stosując BLASTN. Pozycja i kierunek genu struktury w sekwencji DNA, która ma być testowana może też być przewidziana przez translację podzielonych sekwencji genomowego DNA na sześć ramek translacji (trzy na nici sensownej i pozostałe trzy na nici antysensownej) i przeprowadzenie poszukiwania homologii wywiedzionych sekwencji aminokwasów w bazie danych peptydów stosując BLASTX.
Kodujące obszary genów struktury w genomowym DNA są czasami podzielone przez introny u organizmów eukariotycznych. Do analizy genów struktury mających takie przerwy, bardziej skuteczny jest program BLAST dla sekwencji zawierających przerwy, korzystny jest program Gapped-BLAST (zainstalowany w BLAST2: WISCONSIN GCG package ver. 10.0).
2) Analiza według metody hybrydyzacji typu Northern
Ekspresja genu struktury przewidzianego przez sposoby analizy opisane w akapicie 1) może być badana stosując metodę hybrydyzacji typu Northern.
Odpowiednio uzyskuje się całkowity RNA z mikroorganizmu produkującego ML-236B z hodowli mikroorganizmu. Hodowlę korzystnego mikroorganizmu produkującego ML-236B Penicillium citrinum można uzyskać przez zaszczepienie tego mikroorganizmu ze skosu do podłoża MGB3-8 a następnie inkubację z wytrząsaniem, inkubując w 22 do 28°C przez jeden do czterech dni.
Wybór metody ekstrakcji RNA z mikroorganizmu produkującego ML-236B nie jest ograniczony i korzystna jest metoda rodanek guanidyny- gorą cy fenol, metoda rodanek guanidyny- chlorowodorek guanidyny i podobne. Przykłady handlowo dostępnego zestawu do przygotowania całkowitego RNA o wysokiej czystoś ci obejmują RNeasy Plant Mini Kit (wyprodukowany przez Qiagen AG). Co wię cej, mRNA można uzyskać przez nałożenie całkowitego RNA na kolumnę oligo (dT) i odzyskanie frakcji zaadsorbowanej na kolumnie.
Przeniesienie RNA na membranę, przygotowanie sondy, hybrydyzacja i detekcja sygnału mogą być przeprowadzone w podobny sposób do wymienionej powyżej metody hybrydyzacji Southerna.
3) Analiza końca 5' i końca 3' transkryptu
Analiza końca 5' i końca 3' każdego transkryptu może być przeprowadzona według metody 'RACE' (szybka amplifikacja końców cDNA). RACE jest metodą uzyskania cDNA zawierającego znany region nukleotydów i nieznany region na końcu 5' lub końcu 3' genu, stosując RT-PCR z mRNA jako matrycą [opisane w Frohman. M. A., Methods Enzymol. 218, 340 (1998)].
5'-RACE można przeprowadzić według następującego sposobu. Pierwsza nić cDNA jest syntetyzowana według reakcji odwrotnej transkryptazy stosując mRNA jako matrycę. Jako primer stosuje się oligonukleotydy antysensowne (1), które są zaprojektowane na znane części sekwencji nukleotydów. Homopolimeryczny łańcuch nukleotydów (złożony z jednego rodzaju zasady) dodaje się do koń12
PL 202 457 B1 ca 3' pierwszej nici cDNA stosując terminalną transferazę deoksynukleotydów. Następnie dwuniciowy cDNA w regionie 5' końca amplifikuje się za pomocą PCR stosując pierwszą nić cDNA jako matrycę. Do amplifikacji stosuje się 2 primery; oligonukleotyd DNA z nici sensownej zawierający sekwencję komplementarną do sekwencji homopolimerycznej oligonukleotyd (2) na nici antysensownej na końcu 3' oligonukleotydu DNA (1) [opisane w Frohman, M.A., Methods in Enzymol., 218, 340 (1993]. Zestaw do 5' RACE jest dostępny handlowo, odpowiednio 5' RACE System for Rapid Amplification of cDNA ends, Version 2.0 (wyprodukowany przez GIBCO Corporation).
3' RACE jest metodą stosującą region poliA istniejący na końcu 3' mRNA. Specyficznie, pierwsza nić cDNA jest syntetyzowana przez reakcję odwrotnej transkrypcji stosując mRNA jako matrycę adaptor oligo d(T) jako primer. Następnie dwuniciowy cDNA w regionie końca 3' jest amplifikowany za pomocą PCR stosując pierwszą nić cDNA jako matrycę. Jako primery stosuje się oligonukleotyd DNA (3) na nici sensownej zaprojektowany do znanej części sekwencji nukleotydów nici sensownej i adaptor oligo d(T) na nici antysensownej. Zestaw do 3' RACE jest handlowo dostępny, odpowiednio Ready-To-Go T-primed First-Strand Kit (Pharmacia Corporation).
Wyniki analizy 1) i 2) powyżej są korzystnie stosowane w procedurze RACE, w projektowaniu primerów opartym na znanej części interesującej sekwencji nukleotydów.
Stosując metody analizy opisane w 1) do 3) powyżej można wydedukować kierunek genu struktury w sekwencji genomowego DNA, położenie miejsca inicjacji transkrypcji w genie struktury, pozycję kodonu inicjacji translacji i kodon terminacji translacji i jego pozycję. W oparciu o powyższą informację można uzyskać każdy gen struktury i jego cDNA a mianowicie cDNA przyspieszających biosyntezę ML-236B.
Zakłada się, że we włączonej sekwencji w zrekombinowanym wektorze DNA pML48 uzyskanym według niniejszego wynalazku jest obecnych sześć genów struktury. Nazwane są odpowiednio mlcA mlcB, mlcC, mlcD, mlcE, i mlcR. Wśród nich zakłada się, że mlcA mlcB, mlcE i mlcR mają region kodujący na sekwencji nukleotydów przedstawionych w SEQ ID No. 2 Listy sekwencji. Zakłada się, że mlcC i mlcD mają region kodujący na sekwencji nukleotydów przedstawionej w SEQ ID No. 1 Listy sekwencji.
Przykłady sposobu uzyskania cDNA specyficznie przyspieszających biosyntezę ML-236B odpowiadających wymienionym powyżej genom struktury obejmują: klonowanie z RT-PCR stosując primery zaprojektowane dla sekwencji każdego genu struktury i jego flankującego DNA i klonowanie z biblioteki cDNA stosują c odpowiednie sondy DNA zaprojektowane dla znanych sekwencji nukleotydów. Inne odpowiednie metody są dobrze znane w dziedzinie. Aby wyrażać funkcjonalnie cDNA uzyskany według tych sposobów, korzystne jest uzyskanie cDNA pełnej długości.
Poniżej wytłumaczono sposób uzyskana cDNA przyspieszających biosyntezę ML-236B stosując RT-PCR.
Musi być zaprojektowana para primerów do RT-PCR i do uzyskania cDNA przyspieszającego biosyntezę ML-236B tak, że selektywnie hybrydyzuje z każdym łańcuchem matrycy, aby pozwolić na uzyskanie cDNA. Jednak nie jest niezbędne by primery do RT-PCR były całkowicie komplementarne do części każdego łańcucha matrycy, pod warunkiem że spełniają warunek opisany powyżej. Odpowiednie primery do RT-PCR, które mogą hybrydyzować z łańcuchem antysensowny, (dalej określany jako primer sensowny) są primerami sensownymi, które są całkowicie komplementarne do części łańcucha antysensownego (dalej określany jako niepodstawiony primer sensowny) lub primery sensowne, które nie są całkowicie komplementarne do części łańcucha antysensownego (dalej określany jako częściowo podstawiony primer sensowny). Inne odpowiednie primery do RT-PCR, które mogą hybrydyzować z łańcuchem sensownym (dalej określany jako primer antysensowny) są primerami antysensownymi, które są całkowicie komplementarne do części łańcucha sensownego (dalej określany jako niepodstawiony primer antysensowny) lub primery antysensowne, które nie są całkowicie komplementarne do części łańcucha sensownego (dalej określany jako częściowo podstawiony primer antysensowny).
Primer sensowny jest zaprojektowany odpowiednio tak, że produkt RT-PCR uzyskany z jego zastosowaniem zawiera kodon ATG w oryginalnej pozycji inicjacji translacji. Odpowiednio produkt RT-PCR także tylko zawiera prawidłowy kodon terminacji translacji w ramce odczytu mającej oryginalne miejsce startu ATG i nie ma dodatkowych (pozornych) miejsc zakończenia translacji. Pozycja kodonu inicjacji translacji tych genów struktury przewidzianych w niniejszym wynalazku jest przedstawiona w Tabeli 5 dla genów umieszczonych w SEQ ID No. 1 i SEQ ID No. 2 Listy sekwencji.
PL 202 457 B1
Koniec 5' niepodstawionego primeru sensownego jest odpowiednio nukleotydem 'A' kodonu inicjacji translacji ATG, lub zasadą istniejącą na jego końcu 5'.
Częściowo podstawiony primer sensowny hybrydyzuje selektywnie ze specyficznym regionem w SEQ ID No. 1 lub SEQ ID No. 2 Listy sekwencji, sekwencja nukleotydów SEQ ID No. 2 Listy sekwencji, który jest całkowicie komplementarna do SEQ ID No. 1 Listy sekwencji.
Gdy częściowo podstawiony primer sensowny zawiera sekwencję nukleotydów obecną po stronie 3' kodonu inicjacji translacji ATG, odpowiednio nie zawiera sekwencji nukleotydów w tym regionie, które są kodonami terminacyjnymi (TAA, TAG lub TGA) w tej samej ramce odczytu jak ATG.
Częściowo podstawiony primer sensowny może zawierać nukleotyd A, sekwencję nukleotydówAT lub ATG (dalej określany jako nukleotyd lub sekwencja nukleotydów m') która odpowiada nukleotydowi A, sekwencji nukleotydówAT lub ATG kodonu inicjacji translacji (dalej określany jako nukleotyd lub sekwencja nukleotydów m'). Gdy nukleotyd m' jest A, odpowiadający A sekwencji m, preferujemy że m' A jest umieszczone na końcu 3' częściowo podstawionego primera sensownego. Podobnie, gdy m' jest AT, korzystne jest żeby ta sekwencja m' AT była zlokalizowana na końcu 3' częściowo podstawionego primera sensownego. Gdy nukleotyd lub sekwencja nukleotydów m jest ATG, odpowiadające m' ATG, korzystne jest by te trinukleotydy, które są od strony 3' ATG w primerze nie były kodonami stop. Inaczej mówiąc, dla trinukleotydów nukleotyd końca 5' jest (3 x n +1) tym nukleotydem (n przedstawia liczbę całkowitą o wartości jedne lub więcej) liczone od A do m' ATG w kierunku końca 3' sekwencja nukleotydów trinukleotydu korzystnie nie jest TAA, TAG ani TGA. Primery opisane powyżej mogą być stosowane do uzyskania cDNA mającego kodon metioniny w pozycji odpowiadającej kodonowi inicjacji translacji mRNA stosowanego jako matryca RT-PCT.
Gdy koniec 3' częściowo podstawionego primera sensownego jest pozycją nukleotydu (3 x n + 1), korzystnie trinukleotyd, który rozpoczyna się w tej pozycji nie jest TAA, TAG ani TGA w produkcie RT-PCR uzyskanym stosując częściowo podstawiony primer sensowny jako jeden z primerów i RNA lub mRNA mikroorganizmu produkującego ML-236B jako matrycę, lub w produktach PCR uzyskanych poprzez genomowy DNA lub cDNA jako matrycę. Pozycja nukleotydu jest liczona od 'A' kodonu inicjacji translacji ATG w kierunku końca 3' i gdzie 'n' reprezentuje liczbę całkowitą jeden lub więcej.
Gdy koniec 3' częściowo podstawionego primera sensownego jest pozycją nukleotydu (3 x n + 2), trójka, dla której pozycja 3 x n+2 jest nukleotydem centralnym korzystnie nie jest żadną z sekwencji TAA, TAG ani TGA dla produktu PCR lub RT-PCR otrzymanego jak powyżej.
Gdy koniec 3' częściowo podstawionego primera sensownego jest w pozycji nukleotydu (3 x n+ 3), trójka, dla której pozycja (3 x n+ 3) przy 3' nukleotydzie korzystnie nie jest żadną z sekwencji TAA, TAG lub TGA.
Wymagania dla primera sensownego są jak przedyskutowano powyżej.
Zaprojektowano primer antysensowny tak, że gdy jest sparowany z primerem sensownym, można zamplifikować cDNA kodujący każdy z genów struktury (mlcA, mlcB, mlcC, mlcD, mlcE i mlcR) stosując RT-PCR w kierunku równoważnym do N-końca i C-końca odpowiadających peptydów.
Wybór niepodstawionego primera antysensownego nie jest ograniczony o ile jest primerem antysensownym mającym sekwencję nukleotydów komplementarną do sekwencji nukleotydów umieszczonej w regionie miejsca terminacji translacji cDNA. Jednak korzystny jest primer mający zasadę na końcu 5', która jest komplementarna do zasady na końcu 3' tego primera. Primer zawierający trzy zasady komplementarne do kodonu terminacji translacji, jest korzystny. Tabele 8 do 10 przedstawiają kodon terminacji translacji każdego genu struktury, sekwencję komplementarną do kodonu terminacji translacji, resztę aminokwasu na C-końcu peptydu kodowanego przez każdy gen struktury, sekwencję nukleotydów kodującą reszty aminokwasów i ich pozycji SEOJD No. 1 lub SEQ ID No. 2.
Częściowo podstawione primery antysensowne hybrydyzują selektywnie ze specyficznym obszarem w sekwencji nukleotydów SEQ ID No. 1 lub SEQ ID No. 2 Listy sekwencji.
Powyższe są wymaganiami dla primera antysensownego.
Jest możliwe dodanie odpowiedniej sekwencji nukleotydów do końca 5' częściowo podstawionych primerów sensownych i częściowo podstawionych primerów antysensownych o ile są spełnione powyżej wymienione wymagania. Wybór takiej sekwencji nukleotydów nie jest szczególnie ograniczony o ile primer może być użyty do PCR. Przykłady odpowiednich sekwencji obejmują sekwencje nukleotydów wygodne do klonowania produktów PCR, takie jak miejsca cięcia enzymów restrykcyjnych i sekwencję nukleotydów zawierającą odpowiednie miejsca cięcia enzymów restrykcyjnych.
Dodatkowo primer sensowny i primer antysensowny są odpowiednio zaprojektowane zgodnie z powyż szym opisem i z ogólnym schematem projektowania primerów do PCR.
PL 202 457 B1
Jak opisano powyżej, mRNA lub całkowity RNA z organizmu produkującego ML-236B może być stosowany jako matryca do RT-PCR. W obecnym wynalazku przyspieszający biosyntezę ML-236B cDNA odpowiadający genowi struktury mlcE uzyskano przez zaprojektowanie i syntezę pary primerów odpowiednich do amplifikacji całej sekwencji kodującej genu struktury mlcE w sekwencji wstawki pMI-48 i następnie przeprowadzenie RT-PCR stosując całkowity RNA SANK13380 jako matrycę [primery reprezentowane przez sekwencje nukleotydów SEQ ID No. 35 i 36 Listy sekwencji, odpowiednio].
Przyspieszający biosyntezę ML-236B cDNA odpowiadający genowi struktury mlcR uzyskano w podobny sposób stosując primery reprezentowane przez sekwencje nukleotydów SEQ ID No. 39 i 40 Listy sekwencji, odpowiednio.
Jak opisano powyżej, produkt RT-PCR może być sklonowany przez włączenie do odpowiedniego wektora DNA. Wybór wektora DNA stosowanego do takiego klonowania nie jest ograniczony i jest odpowiednio wektorem DNA ogólnie stosowanym do klonowania fragmentów DNA. Zestawy do łatwego przeprowadzenia klonowania produktu RT-PCR są dostępne handlowo i korzystny jest Original TA Cloning Kit [wyprodukowany przez lnvitrogen: stosujący pCR2.1 jako wektor DNA].
Potwierdzenie funkcjonalnej ekspresji cDNA przyspieszającego biosyntezę ML-236B cDNA uzyskanego stosując powyższe sposoby w mikroorganizmie produkującym ML-236B może być uzyskane przez sklonowanie cDNA do wektora DNA odpowiedniego do funkcjonalnej ekspresji w mikroorganizmie produkującym ML-236B. Odpowiednie komórki są wówczas transformowane zrekombinowanym wektorem i porównuje się zdolność do biosyntezy ML-236B transformowanych i nietransformowanych komórek gospodarza. Jeśli cDNA przyspieszający biosyntezę ML-236B jest funkcjonalnie wyrażany w transformowanej komórce wówczas zdolność do biosyntezy ML-236B transformowanej komórki jest poprawiona w porównaniu z komórką gospodarza.
Wybór wektora DNA odpowiedniego do ekspresji w mikroorganizmie produkującym ML-236B [dalej określany jako funkcjonalny wektor ekspresyjny] nie jest szczególnie ograniczony o ile może być on stosowany do transformacji mikroorganizmu produkującego ML-236B i może funkcjonalnie wyrażać polipeptyd kodowany przez cDNA przyspieszający biosyntezę ML-236B w tym organizmie. Korzystnie wektor jest odpowiedni w komórce gospodarza, i ma sekwencję nukleotydów, która pozwala na replikację w komórce gospodarza.
Wektor do funkcjonalnej ekspresji może zawierać jeden lub więcej niż jeden cDNA przyspieszający biosyntezę ML-236B, na przykład cDNA odpowiadające genom struktury mlcE i/lub mlcR.
Wektor do funkcjonalnej ekspresji może zawierać jeden lub więcej rodzajów DNA, innych niż cDNA odpowiadający genom struktury mlcE i/lub mlcR, które przyspieszają biosyntezę ML-236B gdy są wprowadzane do mikroorganizmu produkującego ML-236B. Przykłady takich DNA obejmują: cDNA odpowiadające genom struktury mlcA, mlcB, mlcC, lub mlcD, genomowy DNA związany z biosyntezą ML-236B, DNA kodujący czynniki regulujące ekspresją cDNA przyspieszającego biosyntezę ML-236B według niniejszego wynalazku lub podobne.
Wektor do funkcjonalnej ekspresji korzystnie zawiera sekwencję nukleotydów dostarczającą fenotyp selektywny dla plazmidu w komórce gospodarza i korzystnie jest wektorem wahadłowym.
Co więcej, fenotyp selektywny może być fenotypem oporności na lek, korzystnie oporności na antybiotyk i bardziej korzystnie oporności na ampicylinę lub oporności na hygromycynę B.
Jeśli wektor ekspresyjny jest wektorem wahadłowym, wektor odpowiednio zawiera sekwencję nukleotydów, która pozwala wektorowi na replikację w komórce gospodarza z jednej z grup mikroorganizmów i sekwencję nukleotydów potrzebną dla ekspresji polipeptydów kodowanych przez wstawkę wektora w innym typie komórki gospodarza. Jest korzystne by wektor dawał inny fenotyp selektywny dla każdej komórki gospodarza z różnych transformowanych grup mikroorganizmów. Wymagania dla kombinacji grup mikroorganizmów są podobne jak dla wektora wahadłowego stosowanego do klonowania i ekspresji genomowego DNA związanego z biosyntezą ML-236B opisane w obecnym zgłoszeniu.
W niniejszym wynalazku odpowiednim wektorem wahadłowym DNA jest pSAK700, skonstruowany przez połączenie promotora kinazy 3-fosfoglicerynianowej (dalej określany jako pgk) pochodzącego z Aspergillus nidulans istniejącego w wektorze DNA pSAK333 (opisane w Japońskim Zgłoszeniu Patentowym Publikacja Nr 3-262486), adaptera do włączenia obcego genu i terminatora pgk istniejącego w DNA, w tej kolejności (zobacz Figura 4).
Polipeptyd może być wyrażany w mikroorganizmie produkującym ML-236B przez włączenie cDNA odpowiadającego genowi struktury mlcE, opisanego powyżej, do wektora ekspresyjnego opisanego powyżej. W niniejszym wynalazku zrekombinowany wektor do ekspresji cDNA pSAKexpE uzyPL 202 457 B1 skano przez włączenie cDNA odpowiadającego genowi struktury mlcE do miejsca adaptera pSAK700. Sekwencja włączona w pSAKexpE, a mianowicie sekwencja nukleotydów cDNA odpowiadającego genowi struktury mlcE jest przedstawiona w SEQ ID No. 37 Listy sekwencji. Podobnie uzyskano zrekombinowany wektor pSAKexpR do ekspresji cDNA przez włączenie cDNA odpowiadającego genowi struktury mlcR do miejsca adaptera pSAK700. Sekwencja włączona w pSAKexpR, a mianowicie sekwencja nukleotydów cDNA odpowiadającego genowi struktury mlcR jest przedstawiona w SEQ ID No. 41 Listy sekwencji.
Escherichia coli pSAKexpE SANK 72499 to znaczy szczep Escherichia coli transformowany pSAKexpE zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 22 grudnia, 1992 jako numery depozytu. FERM BP-7005, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów. Escherichia coli pSAKexpR SANK 72599 to znaczy szczep Escherichia coli transformowany przez pSAKexpR zdeponowano w Research Institute of Life Science and Technology, Agency of Industrial Science and Technology 25 stycznia 2000, jako numery depozytu. FERM BP-7006, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów.
Można wybrać odpowiednie sposoby transformacji w zależności od komórki gospodarza, aby uzyskać ekspresję cDNA przyspieszającego biosyntezę ML-236B, genomowego DNA związanego z biosyntezą ML-236B lub jego fragmentów. Transformacja Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B może być przeprowadzona przez przygotowanie protoplastów ze spor Penicillium citrinum, a następnie wprowadzenie zrekombinowanego wektora do protoplastów [opisane w Nara, F. i wsp., Curr. Genet. 23, 28 (1993)].
Odpowiednio spory ze skosu hodowli Penicillium citrinum zaszczepia się na płytkę podłoża agarowego PGA i inkubuje w 22 do 28°C, przez 10 do 14 dni. Spory następnie się zbiera z płytki i zaszczepia 1 x 107 - 1 x 109 spor do 50 do 100 ml podłoża hodowlanego YPL-20 [skład: 0,1% (waga/obj) ekstrakt drożdżowy (wyprodukowany przez Difco corporation), 0,5% (waga/obj) polipepton (wyprodukowany przez Nihon Seiyaku corporation), 20% (waga/obj) laktozy, pH 5,0], a następnie inkubuje w 22 do 28°C przez 18 godzin do dwóch dni. Kiełkujące spory odzyskuje się z hodowli i poddaje działaniu enzymów degradujących ścianę komórkową aby uzyskać protoplasty Wybór enzymu degradującego ścianę komórkową nie jest szczególnie ograniczony o ile może on degradować ścianę komórkową Penicillium citrinum i nie ma szkodliwego wpływu na mikroorganizm. Przykłady tego obejmują: zymoliazę, chitynazę lub podobne.
Zmieszanie zrekombinowanego wektora DNA zawierającego cDNA przyspieszającego biosyntezę ML-236B i mikroorganizmu produkującego ML-236B lub jego protoplastu w odpowiednich warunkach pozwala na wprowadzenie DNA zrekombinowanego wektora do tego protoplastu, aby dostarczyć transformanta.
Hodowla transformantów mikroorganizmu produkującego ML-236B jest odpowiednio przeprowadzana w warunkach odpowiednich dla każdej z komórek gospodarza. Hodowlę transformanta Penicillium citrinum, korzystnego mikroorganizmu produkującego ML-236B można przeprowadzić przez hodowlę uprzednio transformowanego protoplast w warunkach odpowiednich do regeneracji ściany komórkowej, a następnie hodowanie. Mianowicie transformowany protoplast Penicillium citrinum może być wprowadzony do podłoża agarowego VGS środkowej warstwy [skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 2% (waga/obj) agar], i następnie agar VGS warstwy środkowej umieszcza się między podłożem agarowym VGS warstwy dolnej [skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 2,7% (waga/obj) agar] i podłożem agarowym VGS warstwy górnej
[skład: minimalne podłoże Vogla, 2% (waga/obj) glukoza, 1M glucytol, 1,5% (waga/obj) agar] zawierającym 800 μg/ml hygromycyny B, a następnie inkubację w 22 do 28°C przez 7 do 15 dni. Powstały szczep subkulturuje się z inkubacją w 22 do 28°C na podłożu PGA. Szczep zaszczepia się platynową igłą na skos przygotowany z podłożem PGA, inkubuje w 22 do 28°C przez 10 do 14 dni, i następnie przechowuje w 0 do 4°C.
Jak opisano powyżej, można przygotować ML-236B wydajnie przez zaszczepienie transformanta Penicillium citrinum uzyskanego ze skosu jak powyżej i mającego zregenerowaną ścianę komórkową do podłoża MBG 3-8, a następnie inkubację w 22 do 28°C przez 7 do 12 z wytrząsaniem. Penicillium citrinum jako gospodarz może być hodowany także w podłożu płynnym aby wyprodukować
ML-236B.
Oczyszczanie ML-236B z hodowli transformanta mikroorganizmu produkującego ML-236B może być przeprowadzone przez połączenie różnych sposobów ogólnie stosowanych do oczyszczania
PL 202 457 B1 produktów naturalnych. Wybór takich metod nie jest szczególnie ograniczony i może być na przykład, przez wirowanie, rozdział substancji stałych i płynów przez sączenie, działanie zasadą lub kwasem, ekstrakcję rozpuszczalnikami organicznymi, rozpuszczenie, metody chromatograficzne takie jak chromatografia adsorpcyjna, chromatografia rozdziału lub podobne i krystalizacji lub podobne. ML-236B może być w postaci hydroksykwasu lub laktonu, które mogą być wzajemnie przekształcane w siebie. Hydroksykwas można przekształcić do jego soli, która jest bardziej stabilna. Stosując takie właściwości fizyczne można otrzymać ML-236B w formie hydroksykwasu (dalej określany jako wolny hydroksykwas), sole hydroksykwasu ML-236B (dalej określany jako sól hydroksykwasu), lub postać laktonu ML-236B (dalej określany jako lakton).
Hodowlę poddaje się hydrolizie alkalicznej w podwyższonej temperaturze lub pokojowej temperaturze dla otwarcia pierścienia i przekształcenia do soli hydroksykwasu i następnie roztwór reakcyjny zakwasza, a następnie przesącza. Przesącz ekstrahuje się rozpuszczalnikiem organicznym, który rozdziela się od wody by dostarczyć zamierzony produkt jako wolny hydroksykwas. Wybór rozpuszczalnika organicznego nie jest szczególnie ograniczony. Przykłady obejmują: alifatyczne węglowodory takie jak heksan, heptan lub podobne, aromatyczne węglowodory takie jak benzen, toluen lub podobne; chlorowcopochodne węglowodorów takie jak chlorek metylenu, chloroform lub podobne; etery takie jak eter dietylowy lub podobne; estry takie jak mrówczan etylu, octan etylu lub podobne; lub mieszanina złożona z dwóch lub więcej rozpuszczalników.
Zamierzony związek może być uzyskany jako sól hydroksykwasu przez rozpuszczenie wolnego hydroksykwasu w wodnym roztworze soli metalu alkalicznego takiego jak wodorotlenek sodu.
Dalej zamierzony związek może być uzyskany jako lakton przez zamknięcie pierścienia przez podgrzanie wolnego hydroksykwasu w rozpuszczalniku organicznym aby go odwodnić, lub za pomocą innych odpowiednich sposobów.
Możliwe jest oczyszczenie i izolacja otrzymanego w ten sposób wolnego hydroksykwasu, hydroksykwasu lub laktonu za pomocą chromatografii kolumnowej lub podobnej. Nośnik dla kolumny stosowanej do chromatografii nie jest szczególnie ograniczony. Przykłady obejmują: Sephadex LH-20 (produkowany przez Pharmacia Corporation), Diaion HP-20 (produkowany przez Mitsubishi Kagaku corporation), żel krzemionkowy, nośniki fazy odwróconej Iub podobne, nośniki serii C18 są korzystne.
Wybór sposobu oznaczenia ilościowego ML-236B nie jest szczególnie ograniczony, korzystna jest metoda ogólnie stosowana do oznaczenia ilościowego związków organicznych. Przykłady: wysokiej jakości chromatografia cieczowa fazy odwróconej (dalej określana jako HPLC fazy odwróconej) lub podobne. Oznaczenie ilościowe według HPLC fazy odwróconej może być przeprowadzone przez poddanie hodowli mikroorganizmu produkującego ML-236B hydrolizie alkalicznej, poddanie rozpuszczalnej frakcji HPLC fazy odwróconej stosując kolumnę C18, pomiar absorpcji w UV i przekształcenie wartości absorpcji na ilość ML-236B. Wybór kolumny C18 nie jest szczególnie ograniczony, korzystna jest kolumna C18 stosowana do ogólnego HPLC fazy odwróconej. Przykłady obejmują: SSC-ODS-262 (średnica 6 mm, długość 100 mm, wyprodukowany przez Senshu Kagaku corporation) lub podobne. Wybór rozpuszczalnika dla fazy ruchomej nie jest szczególnie ograniczony o ile jest to rozpuszczalnik ogólnie stosowany do HPLC fazy odwróconej. Jest to na przykład, 75% (obj/obj) metanol - 0,1% (obj/obj) trietyloamina - 0,1% (obj/obj) kwas octowy lub podobne. Gdy ML-236B jest dodawany w temperaturze pokojowej do kolumny SSC-ODS-262, gdzie stosuje się 75% (obj/obj) metanol - 0,1%(obj/obj) trietyloamina - 0,1%(obj/obj) kwas octowy jest stosowany jako faza ruchoma przy tempie 2 ml/minutę, ML-236B eluuje się po 4,0 minutach. ML-236B można wykryć stosując detektor do UV dla HPLC. Zaabsorbowana długość fali do detekcji UV wynosi 220 do 280 nm, korzystnie 220 do 260 nm, bardziej korzystnie 236 nm.
Dostarczone są kompozycje farmaceutyczne zawierające ML-236B uzyskane stosując niniejszy wynalazek, wraz z nośnikiem farmaceutycznym.
Dostarczone są także kompozycje farmaceutyczne zawierające prawastatyną preparowaną z ML-236B uzyskanego wedł ug niniejszego wynalazku razem z noś nikiem farmaceutycznym.
Kompozycje farmaceutyczne według wynalazku mogą być konwencjonalne i takie same jak te stosowane dla istniejących formuł ML-236B lub prawastatyny.
Sposoby leczenia są także częścią wynalazku i stosują związek lub kompozycje do leczenia hiperlipemii i innych stanów.
Wynalazek jest obecnie ilustrowany bardziej szczegółowo przez odniesienie do następujących Figur i Przykładów. Przykłady są ilustracją ale nie są ograniczeniem niniejszego wynalazku.
PL 202 457 B1
Opis figur
Figura 1 jest schematem przedstawiającym konstrukcję wektora DNA pSAKcos1;
Figura 2 jest wynikiem analizy genów struktury wstawionej sekwencji pML48;
Figura 3 przedstawia hybrydyzacje typu Northern wstawionej sekwencji pML48;
Figura 4 jest schematem przedstawiającym konstrukcję wektora ekspresyjnego cDNA pSAK700; i
Figura 5 przedstawia analizę RT-PCR dla transkrypcji mlc A-E i R w transformancie pSAKexpR.
Figura 6 przedstawia analizę RT-PCR dla transkrypcji mlcE w transformancie pSAKexpE.
P r z y k ł a d y w y n a l a z k u
P r z y k ł a d 1: Konstrukcja wektora pSAKcos1
Plazmid pSAK333 zawierający gen fosfotransferazy hygromycyny B (dalej określany jako HPT) pochodzący z Escherichia coli (Japońskie Zgłoszenie Patentowe Publikacja Nr 3-262486) strawiono enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia), i poddano działaniu polimerazy DNA T4 (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia) w celu uzyskania tępych końców.
Fragment DNA uzyskany jak powyżej samoligowano do formy kolistej stosując zestaw do ligacji Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia), i następnie transformowano nim kompetentne komórki Escherichia coli JM 109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Szczep mający plazmid, w którym miejsce BamHI uległo delecji wybrano z transformowanej Escherichia coli i określono jako pSAK360.
pSAK 360 strawiono enzymem restrykcyjnym Pvull i następnie poddano działaniu fosfatazy alkalicznej aby wyprodukować fragment defosforylowany na końcu 5'. Fragment Sall-Scal (około 3kb) zawierający miejsce cos uzyskano z wektora kosmidowego pWE15 (wyprodukowany przez STRATAGENE) i poddano działaniu polimerazy DNA T4 aby uzyskać tępe końce. Następnie został wligowany w miejsce Pvull pSAK360. JM109 transformowano tym DNA. Szczepy mające plazmid do którego wstawiono fragment Sall-Scal (około 3kb) w miejscu Pvull wybrano z transformowanej Escherichia coli, i plazmid niesiony przez szczep określono jako pSAKcos1. pSAKcos1 zawiera miejsca cięcia dla enzymów restrykcyjnych BamHI, EcoRI i Notl, każde miejsce pochodzi z pWE15. pSAKcos1 ma gen oporności na ampicylinę i gen oporności na hygromycynę jako markery selekcyjne.
W następujących przykładach, gdy jako gospodarza stosowano Escherichia coli selekcja transformantów pSAKcos1 lub transformantów pSAKcos1 zawierających wstawkę obcego genu była przeprowadzana przez dodanie 40 μg/ml ampicyliny (Ampicillin: wyprodukowana przez Sigma Corporation) do odpowiedniego podłoża. Gdy jako gospodarza stosowano Penicillium citrinum SANK13380, selekcja transformantów pSAKcos1 lub transformantów pSAKcos1 zawierających wstawkę obcego genu była przeprowadzana przez dodanie 200 μg/ml hygromycyny (Hygromycin B: wyprodukowana przez Sigma Corporation) do odpowiedniego podłoża.
Sposób konstrukcji pSAKcos1 przedstawiono na Fig.1
P r z y k ł a d 2: Przygotowanie genomowego DNA Penicillium citrinum SANK 13380
1) Hodowla Penicillium citrinum SANK 13380
Zrobiono wyjściową hodowlę Penicillium citrinum SANK 13380 na skosie z podłoża agarowego PGA. Mianowicie agar zaszczepiono Penicillium citrinum SANK 13380 stosując igłę platynową i trzymano w 26°C przez 14 dni. Skos przechowywano w 4°C.
Główną hodowlę prowadzono w napowietrzanej hodowli płynnej. Komórki z 5 mm kwadratu wymienionego powyżej skosu zaszczepiono do 50 ml podłoża MBG3-8 w 500 ml kolbie stożkowej i inkubowano w 26°C z wytrząsaniem przy 210 obr/min przez pięć dni.
2) Przygotowanie genomowego DNA z Penicillium citrinum SANK 13380
Hodowlę uzyskaną w etapie 1) zwirowano przy 10000 x G w temperaturze pokojowej przez 10 minut i zebrano komórki. 3g (mokra masa) komórek rozbito w moździerzu oziębionym suchym lodem do postaci proszku. Rozbite komórki umieszczono w probówce do wirowania wypełnionej 20 ml buforu 62,5 mM EDTA2Na (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) - 5% (waga/obj)SDS - 50mM Tris kwas solny (pH 8,0) (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i wymieszano je delikatnie a następnie pozostawiono w 0°C przez jedną godzinę. Dodano 10 ml fenolu nasyconego 10 mM Tris kwas solny - 0,1 mM EDTA2Na (pH 8,0, dalej określany jako TE) i mieszano delikatnie w 50°C przez jedną godzinę.
Po wirowaniu w temperaturze pokojowej przy 10000 x G przez 10 minut, 15 ml górnej warstwy (faza wodna) umieszczono w innej probówce do wirowania. Do roztworu dodano 0,5 objętości fenolu
PL 202 457 B1 nasyconego TE i 0,5 objętości roztworu chloroformu. Mieszaninę mieszano przez dwie minuty i wirowano w temperaturze pokojowej przy 10000 x G przez 10 minut (dalej określane jako ekstrakcja fenolem-chloroformem). Do 10 ml warstwy górnej (faza wodna) dodano 10 ml 8M octanu amonu (pH 7,5) i 25 ml 2-propanolu (wyprodukowany przez Wako Pure Chemical Industries, Ltd.), a następnie schł odzenie w -80°C przez 15 minut i wirowanie w 4°C przy 10000 x G przez 10 minut.
Po strąceniu osady rozpuszczono w 5 ml TE, po czym dodano 20 μΐ 10 mg/ml rybonukleazy A (wyprodukowana przez Sigma corporation) i 250 jednostek rybonukleazy T1 (wyprodukowana przez GIBCO Corporation), a następnie inkubowano w 37°C przez 20 minut. Dodano 20 ml 2-propanolu i łagodnie wymieszano. Następnie nici genomowego DNA nawinięto na koniec pipety pasterowskiej i rozpuszczono w jednym ml TE.
Następnie do roztworu DNA dodano 0,1 objętości 3 M octanu sodu (pH 6,5) i 2,5 objętości etanolu. Roztwór schłodzono do - 80°C przez 15 minut i następnie odwirowano w 4°C, przy 10000 x G przez pięć minut (następnie określane jako strącanie etanolem). Powstały osad rozpuszczono w 200 μl TE, i był frakcją genomowego DNA.
P r z y k ł a d 3: Przygotowanie biblioteki genomowego DNA Penicillium citrinum SANK13380
1) Przygotowanie fragmentu genomowego DNA
0,25 jednostek Sau3AI (Takara Shuzo Co., Ltd., Japonia) dodano do 100 μl wodnego roztworu genomowego DNA (50 μg) Penicillium citrinum SANK13380 uzyskanego w Przykładzie 2. Po przedziałach 10, 30, 60, 90 i 120 sekund pobrano próbki 20 μl mieszaniny i do każdej próbki dodano 0,5 M EDTA (pH 8,0) aby zakończyć reakcję enzymu restrykcyjnego. Powstałe częściowo strawione fragmenty DNA rozdzielono za pomocą elektroforezy w żelu agarozowym i odzyskano żel agarozowy zawierający fragmenty DNA 30 kb lub większe.
Odzyskany żel rozgnieciono na drobne fragmenty i umieszczono w Ultra Free C3 Centrifuged Filtration Unit (wyprodukowany przez Japan Milipore Corporation). Żel schłodzono w -80°C przez 15 minut do momentu zamarznięcia i następnie żel stopiono przez inkubację go w 37°C przez 10 minut. Był on wirowany przy 5000 x G przez 5 minut, aby wyekstrahować DNA. DNA poddano ekstrakcji fenol - chloroform i strącono etanolem. Powstałe osady rozpuszczono w małej odpowiedniej ilości TE.
2) Wstępna obróbka DNA wektora pSAKcos1 pSAKcos1 strawiono enzymem restrykcyjnym BamHI (Takara Shuzo Co., Ltd., Japonia), i następnie poddano działaniu fosfatazy alkalicznej (Takara Shuzo Co., Ltd., Japonia) w 65°C przez 30 minut. Powstały roztwór reakcyjny poddano ekstrakcji fenol-chloroform i strąceniu etanolem. Powstały osad rozpuszczono w małej ilości TE.
3) Ligacja i pakowanie in vitro
Genomowy fragment DNA (2 |ag) opisany w powyższym etapie 1) i pSAKcos1 (1 μg poddany wstępnej obróbce jak powyżej zmieszano i następnie zligowano w 16°C przez 16 godzin stosując zestaw do ligacji DNA kit Ver.2 (Takara Shuzo Co., Ltd., Japonia). Powstały roztwór reakcyjny poddano ekstrakcji fenol - chloroform i strąceniu etanolem. Powstałe osady rozpuszczono w 5 μl TE. Roztwór produktu ligacji poddano pakowaniu in vitro stosując GIGAPAK II Gold kit (wyprodukowany przez STRATAGENE corporation) aby dostarczyć transformanty Escherichia coli zawierające zrekombinowany wektor DNA. 3 ml podłoża LB wylano na szalkę, na której powstały kolonie transformanta Escherichia coli, i odzyskano kolonie na szalce stosując zdrapywacz do komórek (określane jako odzyskany roztwór 1). Płytkę wypłukano kolejnymi 3 ml podłoża LB i komórki odzyskano (określane jako odzyskany roztwór 2). Do mieszaniny odzyskanych roztworów 1 i 2 dodano glicerol aby uzyskać ostateczne stężenie 18% (określane jako roztwór komórek Escherichia coli), który trzymano w - 80°C jako bibliotekę genomowego DNA Penicillium citrinum SANK13380.
P r z y k ł a d 4: Amplifikacja fragmentu genu PKS za pomocą PCR stosując genomowy DNA Penicillium citrinum SANK13380 jako matrycę
1) Zaprojektowanie i synteza primerów do PCR.
W oparciu o sekwencję aminokwasów genu PKS Aspergillus flavus (opisana w Brown, D.W. i wsp., Proc. Natl. Acad. Sci. USA, 93, 1418 (1996)), zaprojektowano i zsyntetyzowano zdegenerowane primery pokazane w SEQ ID No. 3 i 4 Listy sekwencji. Syntezę przeprowadzono według metody fosfoaminidynowej.
SEQ ID No. 3 Listy sekwencji:
gayacngcntgyasttc
SEQ ID No. 4 Listy sekwencji:
tcnccnknrcwgtgncc
PL 202 457 B1
W sekwencji nukleotydów SEQ ID No. 3 i 4, n przedstawia inozynę (hipoksantynę ), y przedstawia t lub c, s przedstawia g lub c, k przedstawia g lub t, r przedstawia g lub a, i w przedstawia a lub t.
2) Amplifikacja odcinka DNA za pomocą PCR
Przygotowano 50 μΐ roztworu do reakcji zawierającego primery do PCR opisane w powyższym etapie 1) (każdy 100 pmol), genomowy DNA Penicillium citrinum SANK13380 uzyskany w Przykładzie 2 (500 ng), 0,2 mM dATP, 0,2 mM dCTP, 0,2 mM dGTP, 0,2 mM dTTP, 50 mM chlorek potasu, 2 mM chlorek magnezu i 1,25 jednostek polimerazy DNA Ex. Tac (Takara Shuzo Co., Ltd., Japonia). Roztwór poddano cyklowi reakcji złożonemu z trzech następujących kolejnych etapów: jedna minuta w 94°C, dwie minuty w 58°C i 3 minuty w 70°C. Cykl powtórzono 30 razy aby zamplifkować fragment DNA. PCR przeprowadzono stosując TaKaRa PCR Thermal Cycler MP TP 3000 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia).
Zamplifikowane fragmenty DNA poddano elektroforezie w żelu agarozowym i następnie odzyskano agarozę zawierającą fragmenty DNA mające wielkość około 1,0 do 2,0 kb. DNA odzyskano z żelu i poddano ekstrakcji fenol-chloroform i strącono etanolem. Powstały osad rozpuszczono w małej ilości TE.
3) Ligacja i transformacja
Fragment DNA uzyskany w etapie 2) zligowano z plazmidem pCR2.1 stosując system klonowania TA pCR 2.1 (wyprodukowany przez lnvitrogen Corporation), plazmid jest dostarczony jako część zestawu. Plazmidem transformowano Escherichia coli JM109 aby uzyskać transformanty.
Z powstałych transformantów wybrano kilka kolonii i hodowano je według metody Maniatis i wsp., [opisane w Maniatis, T. i wsp., Molecular cloning, a laboratory manual, wyd. 2, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989)]. Mianowicie każą z kolonii zaszczepiono do probówki 24 ml zawierającej 2 ml podłoża LB i inkubowano w 37°C przez 18 godzin z wytrząsaniem.
Zrekombinowany wektor DNA przygotowano z hodowli za pomocą metody lizy alkalicznej (opisanej w in Maniatis, T. i wsp., powyżej). A mianowicie 1,5 ml roztworu hodowli żwirowano w temperaturze pokojowej przy 10000 x G przez dwie minuty. Komórki następnie odzyskano z osadu. Do komórek dodano 100 μl roztworu 50 mM glukozy, 25 mM Tris - kwas solny, 10 mM EDTA (pH 8,0), aby wytworzyć zawiesinę. Do niej dodano 200 μl 0,2 N wodorotlenek sodu - 1% (waga/obj) SDS. Roztwór mieszano łagodnie aby zlizować mikroorganizmy. Następnie dodano 150 μl 3 M octanu potasu 11,5%(waga/obj) kwas octowy by zdenaturować białka a następnie wirowano w temperaturze pokojowej przy 10000 x G przez 10 minut. Odzyskano zawiesinę. Supernatant poddano ekstrakcji fenolem-chloroformem i strącaniu etanolem. Powstały osad rozpuszczono w 50 μl TE zawierającego 40 μg/ml rybonukleazy A (wyprodukowany przez Sigma Corporation).
Każdy ze zrekombinowanych wektorów DNA strawiono enzymem restrykcyjnym i poddano elektroforezie. Sekwencję nukleotydów wstawek DNA w zrekombinowanych wektorach DNA określono stosując sekwenator DNA (model 377: wyprodukowany przez Perkin Elmer Japonia) dla wszystkich wstawek mających różne wzory trawienia przy elektroforezie.
W ten sposób zidentyfikowano szczep mający wektor ze zrekombinowanym DNA zawierający fragment PKS pochodzący z Penicillium citrinum.
P r z y k ł a d 5: Genomowa hybrydyzacja techniką Southerna Penicillium citrinum SANK13380
1) Elektroforeza i przeniesienie na błonę
Genomowy DNA (10 μg) Penicillium citrinum SANK13380 uzyskany w Przykładzie 2 strawiono enzymem restrykcyjnym EcoRI, SalI, Hind-lll lub Sac1 (wszystkie wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), i następnie poddano elektroforezie w żelu agarozowym. Żel przygotowano stosując agarozę L03 TAKARA (Takara Shuzo Co., Ltd., Japonia). Po elektroforezie, żel moczono w 0,25 N kwasie solnym (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i inkubowano w temperaturze pokojowej przez 10 minut z łagodnym wytrząsaniem. Żel przenoszono do 0,4 N wodorotlenku sodu (wyprodukowany przez Wako Pure Chemical Industries, Ltd.) i łagodnie inkubowano w temperaturze pokojowej przez 30 minut. Stosując metodę zasadowego transferu Maniatis i wsp. (powyżej), DNA w żelu przenoszono na nylonową membranę Hybond ™-N+ (wyprodukowany przez Amersham corporation) i utrwalono na niej. Membranę płukano 2 x SSC (1 x SSC zawiera 150 mM NaCI, 15 mM cytrynian sodu) i suszono na powietrzu.
2) Hybrydyzacja i detekcja sygnału
Błonę uzyskaną w etapie 1) hybrydyzowano z fragmentem genu PKS uzyskanym w Przykładzie 4 jako sondą.
PL 202 457 B1
Aby uzyskać sondę 1 μg DNA fragmentu wstawki genu PKS uzyskanego w Przykładzie 4 znakowano DIG DNA Labeling Kit (wyprodukowany przez Boeringer-Mannheim) i gotowano przez 10 minut i następnie szybko schłodzono tuż przed użyciem.
Membranę opisaną w etapie 1) moczono w płynie do hybrydyzacji (DIG Easy Hyb: wyprodukowany przez Boeringer-Mannheim) i następnie poddano prehybrydyzacji z wytrząsaniem przy 20 obr/min w 42°C przez 2 godziny. Następnie do roztworu do hybrydyzacji dodano wymienioną powyżej wyznakowaną sondę, i przeprowadzono hybrydyzację z wytrząsaniem w 20 obr/min w 42°C przez 18 godzin stosując Multishaker Oven HB (wyprodukowany przez TAITEC corporation). Błona poddana hybrydyzacji była następnie płukana trzy razy stosując 2 x SSC w temperaturze pokojowej przez 20 minut, a następnie dwa płukania stosując 0,1 x SSC w 55°C przez 30 minut.
Przepłukaną membranę poddano działaniu DIG Luminescent Detection Kit for Nucleic Acids (wyprodukowany przez Boeringer-Mannheim) i eksponowano na kliszę rentgenowską (Lumifilm, wyprodukowany przez Boeringer-Mannheim). Ekspozycję przeprowadzono stosując maszynę do obrabiania klisz medycznych Fuji FPM 800A (wyprodukowany przez Fuji Film Corporation).
Potwierdzono, że fragment genu PKS uzyskany w Przykładzie 4 jest obecny w genomie Penicillium citrinum.
P r z y k ł a d 6: Przeszukiwanie biblioteki genomowego DNA Penicillium citrinum SANK13380 stosując fragment genu PKS jako sondę
Klonowanie genomowego fragmentu DNA zawierającego gen PKS przeprowadzono stosując metodę hybrydyzacji kolonijnej.
1) Przygotowanie membrany
Roztwór komórek Escherichia coli utrzymywany jako biblioteka genomowego DNA f Penicillium citrinum SANK13380 (opisany w Przykładzie 3) rozcieńczono i rozprowadzono na płytce z podłożem agarowym LB tak by na płytce rosło 5000 do 10000 kolonii. Płytki trzymano w 26°C przez 18 godzin i schłodzono do 4°C przez jedną godzinę. Hybond™-N+ (wyprodukowany przez Amasham corporation) umieszczono na płytce i kontaktowano go z nią przez jedną minutę. Błona do której przylegała kolonia była starannie usuwana z płytki. Powierzchnia, które była w kontakcie z koloniami była odwracana do góry i moczona w 200 ml roztworu 1,5 M chlorku sodu, 0,5 N wodorotlenku sodu przez 7 minut i następnie moczono w 200 ml roztworu 1,5 M chlorku sodu, 0,5 M Tris kwas solny, 1 mM EDTA (pH 7,5) przez trzy minuty dwa razy i następnie płukano 400 ml 2 x SSC. Płukaną membranę suszono na powietrzu 30 minut.
2) Hybrydyzacja
DNA wstawki genu otrzymany w Przykładzie 4 (1 μg) zastosowano jako sondę. DNA wyznakowano stosując DIG DNA Labeling Kit (wyprodukowany przez Boeringer-Mannheim) i gotowano go 10 minut i szybko schłodzono bezpośrednio przed użyciem.
Membranę opisaną w etapie 1) moczono w płynie do hybrydyzacji (DIG Easy Hyb: wyprodukowany przez Boeringer-Mannheim) a następnie poddano prehybrydyzacji z wytrząsaniem przy 20 obr/min w 42°C przez 2 godziny. Następnie do roztworu do hybrydyzacji dodano wymienioną powyżej wyznakowaną sondę i przeprowadzono hybrydyzację z wytrząsaniem w 20 obr/min w 42°C przez 18 godzin stosując Multishaker Oven HB (wyprodukowany przez TAITEC corporation). Błona poddana hybrydyzacji była następnie płukana trzy razy stosując 2 x SSC w temperaturze pokojowej przez 20 minut, a następnie dwa płukania stosując 0,1 x SSC w 68°C przez 30 minut.
Przepłukaną membranę poddano działaniu DIG Luminescent Detection Kit for Nucleic Acids (wyprodukowany przez Boehringer-Mannheim) i eksponowano na kliszę rentgenowską (Lumifilm, wyprodukowany przez Boeringer-Mannheim). Ekspozycję przeprowadzono stosując maszynę do obrabiania klisz medycznych Fuji FPM 800A (wyprodukowany przez Fuji Film Corporation).
Powyższe etapy 1) i 2) są określane jako przeszukiwanie.
Kolonie na płytce, na której wykryto dodatni sygnał przy pierwszym przeszukiwaniu zdrapano i odzyskane komórki zawieszono w podłożu LB. Następnie komórki odpowiednio rozcieńczono i rozsiano na odpowiedniej płytce. Następnie przeprowadzono drugie przeszukiwanie aby oczyścić dodatni klon.
Dodatni klon uzyskany w obecnym przykładzie, a mianowicie transformowana Escherichia coli, szczep Escherichia coli pML48 SANK71199 został zdeponowany w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 7 lipca 1999 jako depozyty Nr FERM BP-6780, zgodnie z Traktatem Budapeszteńskim o Deponowaniu Mikroorganizmów,
PL 202 457 B1
P r z y k ł a d 7: Analiza wstawionej sekwencji zrekombinowanego wektora DNA pML48 (1)
Hodowlę szczepu Escherichia coli pML48 SANK71199 uzyskanego w Przykładzie 6 i przygotowanie DNA zrekombinowanego wektora z hodowli przeprowadzono podobnie jak opisano w Przykładzie 4.
Uzyskany wektor DNA określono jako pML48. Wstawkę pML48, która jest genomowym DNA związanym z biosyntezą ML-236B strawiono różnymi enzymami restrykcyjnymi i powstałe fragmenty subklonowano w pUC119 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Stosując powstałe subklony jako sondy przeprowadzono hybrydyzację typu Southerna w sposób podobny jak opisano w Przykładzie 5. Mianowicie produkty uzyskane przez trawienie pML48 różnymi enzymami restrykcyjnymi poddano elektroforezie i DNA przeniesiono na membranę i poddano hybrydyzacji. W efekcie sporządzono mapę restrykcyjną wstawionej sekwencji pML48 stosując standardowe w dziedzinie techniki.
Ustalono sekwencję nukleotydów wstawionej sekwencji każdego z subklonów stosując sekwenator DNA model 377 (wyprodukowany przez Perkin Elmer Japonia Co.Ltd.), a następnie określono całą sekwencję nukleotydów pML48.
Wstawiona sekwencja pML48 składała się łącznie z 34203 zasad.
Sekwencja nukleotydów wstawionej sekwencji pML48 jest opisana w SEQ ID No. 1 i 2 Listy sekwencji. Sekwencje opisane w SEQ ID No. 1 i 2 Listy sekwencji są całkowicie komplementarne do siebie.
Istnienie genów strukturalnych na sekwencji wstawki pML48 analizowano stosując program poszukiwania genów GRAIL (ApoCom GRAIL Toolkit: wyprodukowany przez Apcom Corporation) i program poszukiwania homologii BLAST (Gapped-BLAST (BLAST2): zainstalowany w pakiecie WISCONSIN GCG ver.10.0).
W efekcie przewidziano, że we wstawionej sekwencji pML48 istnieje sześć różnych genów, i zostały one określone jako mlcA, mlcB, mlcC, mlcD, mlcE i mlcR odpowiednio. Co więcej przewidziano, że mlcA, mlcB, mlcE i mlcR mają region kodujący w sekwencji nukleotydów SEQ ID NO. 2 Listy sekwencji i mlcC i mlcD mają region kodujący w sekwencji nukleotydów SEQ ID NO. 1 Listy sekwencji. Względne położenie i długość każdego z przypuszczalnych genów struktury wstawionej sekwencji było też przewidziane.
Wyniki tego przykładu przedstawiono na Figurze 2. Każda strzałka wskazuje położenie, kierunek i względną wielkość każdego genu struktury na wstawce pML48. Strzałka, która wskazuje w lewo pokazuje, że region kodujący genu struktury (mlcA, B, E lub R) istnieje na ID SEQ NO 2. Strzałka, która wskazuje w prawo wskazuje, że region kodujący genu struktury (mlcC lub D) istnieje na ID SEQ NO 1.
P r z y k ł a d 8: Analiza wstawionej sekwencji wektora zrekombinowanego DNA pML48 (2)
Analizę ekspresji genów struktury, których obecność przewidziano w Przykładzie 7 przeprowadzono za pomocą hybrydyzacji typu Northern hybrydyzacja i RACE. Przeprowadzono analizę regionów końców 5' i 3'.
1) Preparatyka całkowitego RNA Penicillium citrinum SANK13380
Komórki z kwadratu 5 mm hodowli Penicillium citrinum SANK 13380 na skosie (opisanej w Przykładzie 2) zaszczepiono do 10 ml podłoża MGB3-8 w 100 ml kolbie stożkowej i inkubowano w 26°C przez 3 dni z wytrząsaniem.
Preparatykę całkowitego RNA z hodowli przeprowadzono z RNeasy Plant Mini Kit (wyprodukowany przez Qiagen AG), który stosuje metodę rodanku guanidyny. Mianowicie hodowlę zwirowano w temperaturze pokojowej przy 5000 x G przez 10 minut aby odzyskać komórki. Następnie 2 g (mokra masa) komórek zamrożono w ciekłym azocie i następnie rozgnieciono w moździerzu aby otrzymać proszek. Rozgniecione komórki zawieszono w 4 ml buforu do lizy (zawarty w zestawie). 450 μl zawiesiny wlano do każdej z 10 kolumn do wirowania QlAshredder zawartych w zestawie i następnie wirowano w temperaturze pokojowej przy 1000 x G przez 10 minut. Odzyskano każdy z powstałych eluatów i dodano do nich 225 μl etanolu, co następnie dodano do minikolumny do wirowania RNA zawartej w zestawie. Kolumnę płukano buforem do płukania zawartym w zestawie, a następnie eluowano zadsorbowane cząsteczki w każdej kolumnie za pomocą 50 μl wody destylowanej wolnej od rybonukleazy. Eluat użyto jako całkowitą frakcję RNA.
2) Hybrydyzacja typu Northern
Uzyskano próbkę RNA przez dodanie 2,25 μl wodnego roztworu zawierającego 20 μg całkowitego RNA Penicillium citrinum SANK13380 do: jednego μl 10 x MOPS (skład: 200 mM kwas 3-morfolino propanosulfonowy, 50 mM octan sodu, 10 mM EDTA2Na; pH 7,0; stosowane po sterylizacji w 121°C przez 20 minut w autoklawie; wyprodukowany przez Dojinkagaku Laboratory Co.Ltd.), 1,75μl formaldehydu i 5 μl formamidu, a następnie zmieszano. Próbkę RNA trzymano w 65°C przez 10 minut, a następnie
PL 202 457 B1 szybko schłodzono w wodzie z lodem i poddano elektroforezie w żelu agarozowym. Żel do elektroforezy przygotowano przez zmieszanie 10 ml 10 x MOPS i jednego grama agarozy L03 TAKARA (wyprodukowana przez Takara Shuzo Co., Ltd., Japonia) z 72 ml wody traktowanej estrem dietylowym kwasu pirowęglowego (wyprodukowany przez Sigma Corporation), podgrzano w celu rozpuszczenia agarozy, i następnie schłodzono, po czym dodano 18 ml formaldehydu. Jako bufor do próbki stosowano 1 x MOPS (przygotowany przez rozcieńczenie 10 x MOPS 10 krotnie wodą). RNA w żelu przeniesiono na Hybond ™-N+ (wyprodukowany przez Amasham corporation) w 10 X SSC.
Fragmenty DNA a, b, c, d i e, uzyskane przez trawienie wstawionej sekwencji pML48 enzymami restrykcyjnymi 1 i 2 przedstawione w następującej Tabeli 1, zastosowano jako sondy. Na górnym panelu Figury 3 pokazano lokalizację każdej sondy wstawki pML48.
T a b e l a 1
Sondy do hybrydyzacji typu Northern
Sonda | Enzym restrykcyjny 1 | Numer nukleotydu miejsca enzymu restrykcyjnego * | Enzym restrykcyjny 2 | Numer nukleotydu miejsca enzymu restrykcyjnego * |
a | EcoRI | 6319 do 6324 | EcoRI | 15799 do 15804 |
b | BamHI | 16793 do 16798 | Pstl | 18164 do 18169 |
c | Kpnl | 26025 do 26030 | BamHI | 27413 do 27418 |
d | SalI | 28691 do 28696 | SalI | 29551 do 29556 |
e | Hindlll | 33050 do 33055 | SacI | 34039 do 34044 |
* Każ dy Nr nukleotydu istnieje na SEQ ID No. 1 Listy sekwencji
Oznakowanie sond, hybrydyzacja i detekcja sygnału były przeprowadzone według hybrydyzacji typu Southerna opisanej w Przykładzie 5.
Wyniki Przykładu przedstawiono w dolnym panelu Figury 3.
Każdy sygnał pokazuje istnienie produktu transkrypcji homologicznego do sekwencji nukleotydów każdej sondy.
Wyniki sugerują, że geny struktury, których istnienie przewidziano we wstawionej sekwencji pML48 w obecnym przykładzie, a mianowicie mlcA mlcB, mlcC mlcD, mlcE i mlcR były transkrybowane w Penicillium citrinum SANK13380.
Pozycja każdego sygnału nie pokazuje względnej wielkości produktu transkrypcji.
3) Określenie końca 5' ekwencji za pomocą 5' RACE cDNA zawierający region końca 5' każdego genu struktury uzyskano stosując 5' RACE System for Rapid Amplification of cDNA ends, Version 2.0 (wyprodukowany przez GIBCO corporation).
Wyprodukowano dwa rodzaje antysensownych oligonukleotydów DNA. Projekt był oparty na sekwencji nukleotydów uważanej za obecną w regionie kodującym blisko końca 5' każdego genu struktury we wstawionej sekwencji pML48, jak przewidziały wyniki Przykładu 7 i punkt 2) tego przykładu.
Sekwencja nukleotydów antysensownego oligonukleotydu DNA (1) zaprojektowanego w oparciu o sekwencję nukleotydów na końcu 3' każdego genu struktury jest przedstawiona w Tabeli 2. Sekwencja nukleotydów antysensownego oligonukleotydu DNA (2), zaprojektowanego w oparciu o sekwencję nukleotydów na końcu 5' każdego genu struktury była przedstawiona w Tabeli 3.
T a b e l a 2: Oligonukleotydy DNA (1) stosowane do określenia sekwencji końca 3' za pomocą 5'RACE
Gen | SEQ ID No. z listy sekwencji | Sekwencja nukleotydów |
mlcA | SEQ ID No.5 | Gcatgttcaatttgctctc |
mlcB | SEQ ID No.6 | Ctggatcagacttttctgc |
mlcC | SEQ ID No.7 | Gtcgcagtagcatgggcc |
mlcD | SEQ ID No.8 | Gtcag ag tg atg ctcttctc |
mlcE | SEQ ID No.9 | Gttgagaggattgtgagggc |
mlcR | SEQ ID No.10 | Ttgcttgtgttggattgtc |
PL 202 457 B1
T a b e l a 3: Oligonukleotydy DNA (2) stosowane do określenia sekwencji końca 5' za pomocą 5'RACE
Gen | SEQ ID No. Listy sekwencji | Sekwencja nukleotydów |
mlcA | SEQ ID No.11 | Catggtactctcgcccgttc |
mlcB | SEQ ID No.12 | Ctccccagtacgtaagctc |
mlcC | SEQ ID No.13 | Ccataatgagtgtgactgttc |
mlcD | SEQ ID No.14 | Gaacatctgcatccccgtc |
mlcE | SEQ ID No.15 | Ggaaggcaaagaaagtgtac |
mlcR | SEQ ID No.16 | Ag attcattg ctgttg g catc |
Pierwszą nić cDNA zsyntetyzowano według reakcji odwrotnej transkryptazy stosując oligonukleotyd DNA (1) jako primer i całkowity RNA Penicillium citrinum SANK13380 jako matrycę. Mianowicie 24 μI mieszaniny reakcyjnej zawierającej jeden μg całkowitego RNA, 2,5 pmol oligonukleotydu DNA (1) i jeden μl odwrotnej transkryptazy SUPER SCRIPTTM II (zawartej w zestawie) inkubowano w 16°C przez jedną godzinę i produkt reakcji dodano do naboju do wirowania GLASSMAX zawartego w zestawie aby oczyścić pierwszą nić cDNA.
Do końca 3'cDNA pierwszej nici dodano łańcuch poliC stosując terminalną deoksyrybonukleotydylo transferazę zawartą w zestawie.
μl mieszaniny reakcyjnej zawierającej pierwszą nić cDNA do której końca 3' dodano łańuch poli C zmieszano z 40 pmol oligonukleotydu DNA (2) i 40 pmol Abriged Anchor Primer (zawartego w zestawie) a następnie inkubowano w 94°C przez dwie minuty. Cykl inkubacji 30 sekund w 94°C, 30 sekund w 55°C i dwie minuty w 72°C następnie powtórzono 35 razy a następnie inkubowano w 72°C przez pięć minut i 4°C przez 18 godzin. Powstały produkt poddano elektroforezie w żelu agarozowym i DNA odzyskano z żelu. Produkt oczyszczono za pomocą ekstrakcji fenol - chloroform i strącono etanolem i sklonowano podobnie do metody opisanej w Przykładzie 4 stosując pCR 2.1.
Powyżej opisana operacja to 5'-RACE.
Ustalono sekwencję nukleotydów fragmentu cDNA zawierającego koniec 5' i przewidziano pozycję miejsca inicjacji transkrypcji i miejsca inicjacji translacji.
Tabela 4 przedstawia SEQ ID No. w którym sekwencja nukleotydów fragmentu DNA końca 5' odpowiadającemu każdemu genowi struktury uzyskanemu za pomocą 5' RACE była opisana. Tabela 5 przedstawia SEQ ID No. w którym istnieje miejsce inicjacji transkrypcji i miejsce inicjacji translacji każdego genu struktury i pozycję miejsca inicjacji transkrypcji i miejsca inicjacji translacji.
T a b e l a 4: SEQ ID No, w których pokazano sekwencję nukleotydową końca 5' fragmentu cDNA.
Gen | Odpowiedni SEQ ID NO listy sekwencji |
mlcA | SEQ ID No.17 |
mlcB | SEQ ID No.18 |
mlcC | SEQ ID No.19 |
mlcD | SEQ ID No.20 |
mlcE | SEQ ID No.21 |
mlcR | SEQ ID No.22 |
T a b e l a 5: Pozycja początku transkrypcji oraz początku translacji każdego genu.
Gen nr | SEQ ID NO, w którym występuje kodon inicjacyjny dla translacji | Numer nukleotydu w SEQ ID NO 1 lub SEQ ID NO 2 | |
Pozycja początku transkrypcji | Pozycja kodonu inicjacyjnego dla translacji | ||
1 | 2 | 3 | 4 |
mlcA | SEQ ID No.2 | 22913 | 23045 do 23047 |
mlcB | SEQ ID No.2 | 11689 | 11748 do 11750 |
PL 202 457 B1 cd. tabeli 5
1 | 2 | 3 | 4 |
mlcC | SEQ ID No.1 | 11631 | 11796 do 11798 |
mlcD | SEQ ID No.1 | 24066 | 24321 do 24323 |
mlcE | SEQ ID No.2 | 3399 | 3545 do 3547 |
mlcR | SEQ ID No.2 | 365 | 400 do 402 |
* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.
4) Wyznaczenie sekwencji końca 3' przy pomocy techniki 3' RACE cDNA, zawierające końce 3'-każdego z genów struktury, otrzymano wykorzystując zestaw Ready To Go: T-Primed First-Strand (wyprodukowane przez Pharmacia).
W oparciu o dane z przykł adu 7 oraz punkt 2) opisywanego przykł adu, wytworzono jeden rodzaj sensownych oligonukleotydów DNA (3), będących przypuszczalnie w obszarze kodującym i jednocześnie blisko końca 3' każdego z genów struktury w sekwencji wstawionej w pML48.
Sekwencje oligonukleotydów DNA(3), wytworzonych dla każdego z genów struktury przedstawiono w Tabeli 6.
T a b e l a 6: Oligonukleotydy DNA (3) wykorzystywane do wyznaczania sekwencji końców 3' zgodnie z techniką 3' RACE
Gen nr | Odpowiedni SEQ ID NO listy sekwencji | Sekwencja nukleotydowa |
mlcA | SEQ ID No.23 | Atcataccatcttcaacaac |
mlcB | SEQ ID No.24 | Gctagaataggttacaagcc |
mlcC | SEQ ID No.25 | Acattgccaggcacccagac |
mlcD | SEQ ID No.26 | Caacgcccaagctgccaatc |
mlcE | SEQ ID No.27 | Gtcttttcctactatctacc |
mlcR | SEQ ID No.28 | Ctttcccag ctg ctactatc |
Pierwszą nić cDNA zsyntetyzowano w reakcji odwrotnej transkrypcji, wykorzystując starter Notl-d(T)18 (pochodzący z zestawu) oraz jako matrycę całkowite RNA Penicillium citrinum SANK13380 (1 mg).
100 ml mieszaniny reakcyjnej, zawierającej pierwszą nić cDNA, 10 pmoli oligonukleotydu DNA (3) oraz starter Notl-d(T)18 (pochodzący z zestawu) inkubowano w 94°C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 55°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 35 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz klonowano według metody opisanej w przykładzie 4, wykorzystując plazmid pCR2.1.
Procedury opisane powyżej to właśnie technika 3'-RACE.
Ustalono sekwencję nukleotydową cDNA na końcach 3', a następnie wyznaczono pozycję kodonu terminacyjnego dla translacji.
Tabela 7 przedstawia odpowiednie SEQ ID NO listy sekwencji, dla których przy pomocy techniki 3' RACE, przedstawionej powyżej, wyznaczono sekwencje nukleotydowe końców 3' fragmentów cDNA dla każdego z genów struktury. Tabela 8 przedstawia kodony terminacyjne dla translacji oraz pozycje tych kodonów w oparciu o SEQ ID No.1 i 2 w liście sekwencji.
T a b e l a 7: SEQ ID No, w których pokazano sekwencję nukleotydową końca 3' fragmentu cDNA.
Gen | Odpowiedni SEQ ID NO listy sekwencji |
1 | 2 |
mlcA | SEQ ID No.29 |
mlcB | SEQ ID No.30 |
mlcC | SEQ ID No.31 |
PL 202 457 B1 cd. tabeli 7
1 | 2 |
mlcD | SEQ ID No.32 |
mlcE | SEQ ID No.33 |
mlcR | SEQ ID No.34 |
T a b e l a 8: Kodony terminacyjne dla translacji oraz pozycje kodonów terminacyjnych, dla każdego z genów struktury.
Gen nr | Kodon terminacyjny dla translacji | SEQ ID NO w których występuje kodon terminacyjny dla translacji | Pozycja nukleotydowa kodonu terminacyjnego dla translacji w SEQ ID NO 1 lub SEQ ID NO 2 |
mlcA | tag | SEQ ID No.2 | 32723 do 32725 |
mlcB | taa | SEQ ID No.2 | 19840 do 19842 |
mlcC | taa | SEQ ID No.1 | 13479 do 13481 |
mlcD | tga | SEQ ID No.1 | 27890 do 27892 |
mlcE | tga | SEQ ID No.2 | 5730 do 5732 |
mlcR | tag | SEQ ID No.2 | 1915 do 1917 |
* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.
Tabela 9 przedstawia aminokwasy z końca C polipeptydów, kodowanych przez każdy z genów struktury, trójkę nukleotydów kodujących odpowiedni aminokwas oraz pozycję trójki.
T a b e l a 9: Aminokwas z końca C polipeptydu, kodowanego przez każdy z genów struktury
Gen nr | Aminokwas na końcu C | Sekwencja nukleotydowa trójki kodującej aminokwas | SEQ ID, w której występuje odpowiednia trójka | Pozycja nukleotydowa trójki w SEQ ID NO 1 lub SEQ ID NO 2 |
mlcA | alanina | gcc | SEQ ID No.2 | 32720 do 32722 |
mlcB | serina | agt | SEQ ID No.2 | 19837 do 19839 |
mlcC | cysteina | tgc | SEQ ID No.1 | 13476 do 13478 |
mlcD | arginina | cgc | SEQ ID No.1 | 27887 do 27889 |
mlcE | alanina | gct | SEQ ID No.2 | 5727 do 5729 |
mlcR | alanina | gct | SEQ ID No.2 | 1912 do 1914 |
* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.
Tabela 10 przedstawia sekwencje komplementarne do kodonów terminacji translacji, pokazanych w Tabeli 8, SEQ ID, w której występuje odpowiednia sekwencja komplementarna oraz pozycję tej sekwencji.
T a b e l a 10 Sekwencja komplementarna do kodonu terminacji translacji, dla każdego z genów struktury.
Gen nr | Sekwencja komplementarna do kodonu terminacji translacji | SEQ ID, w której występuje odpowiednia sekwencja komplementarna | Pozycja nukleotydowa sekwencji komplementarnej w SEQ ID NO 1 lub SEQ ID NO 2 |
mlcA | eta | SEQ ID No.1 | 1479 do 1481 |
mlcB | tta | SEQ ID No.1 | 14362 do 14364 |
mlcC | tta | SEQ ID No.2 | 20723 do 20725 |
mlcD | tca | SEQ ID No.2 | 6312 do 6314 |
mlcE | tca | SEQ ID No.1 | 28472 do 28474 |
mlcR | cta | SEQ ID No.1 | 32287 do 32289 |
* sekwencje nukleotydowe przedstawione jako SEQ ID No.1 i 2 w liście sekwencji, są względem siebie w pełni komplementarne.
PL 202 457 B1
Tak jak opisano powyżej, ustalono pozycję oraz orientację każdego z genów struktury. W oparciu o te informacje, można ustalić jaki będzie produkt transkrypcji i translacji każdego z nich.
P r z y k ł a d 9: Otrzymywanie cDNA genu struktury mlcE
1) Przygotowywanie całkowitego RNA
Całkowite RNA Penicillium citrinum izolowano zgodnie z procedurą z przykładu 8.
2) Projektowanie starterów
W celu otrzymanie pełnej długości cDNA dla genu struktury mlcE, określonego w przykładzie 8, zaprojektowano i zsyntetyzowano następujące startery:
Starter nici sensownej 5'-gttaacatgtcagaacctctaccccc-3' (patrz SEQ ID 35 listy sekwencji); oraz starter nici antysensownej 5'-aatatttcaagcatcagtctcaggcac-3': (patrz SEQ ID 36 listy sekwencji).
Startery pochodzą odpowiednio z sekwencji na 5' końcu obszaru powyżej genu struktury mlcE oraz z sekwencji na 3' końcu obszaru poniżej tego genu. Syntezę starterów przeprowadzono według metody fosfoamidowej.
3) Reakcja RT-PCR
W celu otrzymania pełnej długości cDNA, kodującego produkt genu mlcE, używano zestawu Takara RNA LA PCR (AMV) Ver. 1.1.
Dokładnie, 20 μl mieszaniny reakcyjnej, zawierającej 1 μg całkowitego RNA, 2.5 pmoli losowych starterów o długości 9 nukleotydów (zawarte w zestawie) oraz 1 μl odwrotnej transkryptazy (zawarta w zestawie) inkubowano w 42°C przez 30 minut w celu wytworzenia pierwszej nici cDNA. Następnie odwrotną transkryptazę inaktywowano poprzez inkubację w 99°C przez 5 minut.
100 μl kolejnej mieszaniny reakcyjnej, zawierającej całkowitą objętość mieszaniny reakcyjnej z pierwszą nicią cDNA (patrz wyżej), 40 pmoli startera dla nici sensownej oraz 40 pmoli startera dla nici antysensownej inkubowano w 94°C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 60°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 30 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz transformowano do kompetentnych komórek Escherichia coli JM109 (wytworzonych przez Takara Shuzo Co., Ltd., Japonia) wg metody opisanej w przykładzie 4, wykorzystującej pCR 2.1. Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA i nazwano go pCRexpE.
Ustalono sekwencję wstawionego fragmentu DNA w wynikowym plazmidzie (pCRexpE). DNA zawierające pełnej długości cDNA odpowiadało genowi struktury mlcE. Sekwencja nukleotydowa oraz sekwencja aminokwasów otrzymana w oparciu o sekwencję nukleotydów pokazano jako SEQ ID N0.37 i/lub SEQ ID NO 38 listy sekwencji.
Najbliższym homologiem mlcE jest ORF10 pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (70% identyczności na poziomie aminokwasów).
P r z y k ł a d 10: Wytwarzanie wektora ekspresyjnego pSAK 700
Wektor ekspresyjny cDNA pSAK700 wytworzono wykorzystując wektory pSAK333 i pSAK360 opisane w przykładzie 1.
pSAK333 strawiono enzymami restrykcyjnymi BamHI i Hind III (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), poddano elektroforezie w żelu agarozowym, następnie fragment o długości 4.1 kpz wyizolowano z żelu i stępiono jego końce przy użyciu T4 DNA polimerazy (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia).
W kolejnym kroku, do powyższego fragmentu dołączono adaptor EcoRI-Notl-BamHI (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia) wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM 109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący plazmid z adaptorem; nazwano go pSAK410.
Plazmid pSAK360 strawiono enzymami restrykcyjnymi Pvu II i Ssp I, poddano elektroforezie w żelu agarozowym, następnie fragment (o długości ok. 2,9 kb), zawierający promotor i terminator genu kinazy 3-fosfoglicerynianowej (tu określanej jako „pgk) i HPT, pochodzące Escherichia coli, wyizolowano z żelu
Tak wyizolowany fragment zligowano w miejsce Pvu II plazmidu pSAK410, używając zestawu do ligacji DNA Ver.2 (wyprodukowanego przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo
PL 202 457 B1
Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA; nazwano go pSAK700.
Sposób wytwarzania plazmidu pSAK700 pokazano na Fig. 4.
Plazmid pSAK700 zawierał po jednym miejscu dla enzymów restrykcyjnych BamHI i Notl, gen oporności na ampicylinę (tu określany jako „Ampr), jak również gen HTP, warunkujący oporność na higromycynę, jako marker selekcyjny. W opisywanych przykładach, przy selekcji komórek Escherichia coli, transformowanych pSAK700 lub pSAK700, zawierającym wstawkę DNA, stosowano pożywkę uzupełnioną ampicyliną o stężeniu 40 μg/ml. Natomiast, przy selekcji komórek Penicillium citrinum SANK13380, transformowanych pSAK700 lub pSAK700, zawierającym wstawkę DNA, stosowano pożywkę uzupełnioną higromycyną ampicyliną o stężeniu 200 μg/ml.
P r z y k ł a d 11: Wytwarzanie wektora ekspresyjnego pSAKexpE
Wektor pCRexpE, otrzymany w przykładzie 9, trawiono w 37°C przez 2 godziny enzymami restrykcyjnymi Hpal i Sspl (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia), następnie strawiony plazmid poddano elektroforezie w żelu agarozowym, poczym fragment, zawierający pełnej długości cDNA mlcE, o długości ok. 1.7 kpz izolowano DNA z żelu.
Po trawieniu plazmidu pSAK700 enzymem restrykcyjnym Not1 (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia) przez godzinę w 37°C, lepkie końce plazmidu stępiono przy użyciu T4 DNA polimerazy (wyprodukowanej przez Takara Shuzo Co., Ltd., Japonia). Następnie wektor poddano ekstrakcji mieszaniną fenolu z chloroformem i wytrącono etanolem. Wytrącone DNA zawieszono w małej ilości TE, po czym dodano do niego alkalicznej fosfatazy i inkubonano w 65°C przez 30 minut. Tak przygotowany wektor pSAK700 zligowano z fragmentem o długości 1.7 kpz (otrzymanym w pierwszym kroku), wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący odpowiedni wektor ekspresyjny.
Stransformowany szczep Escherichia coli, nazwany Escherichia coli pSAKexpE SANK 72499, otrzymany w opisywanym przykładzie zdeponowano w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 25 stycznia 2000, pod numerem depozytu FERM BP-7005, zgodnie z budapeszteńskim porozumieniem dotyczącym deponowania mikroorganizmów.
P r z y k ł a d 12: Otrzymywanie cDNA genu struktury mlcR
1) Przygotowywanie całkowitego RNA
Całkowite RNA Penicillium citrinum izolowano zgodnie z procedurą z przykładu 8.
2) Projektowanie starterów
W celu otrzymanie pełnej długości cDNA dla genu struktury mlcE, określonego w przykładzie 8, zaprojektowano i zsyntetyzowano następujące startery:
starter nici sensownej: 5'-ggatccatgtccctgccgcatgcaacgattc-3': (patrz SEQ ID 39 listy sekwencji);
oraz starter nici antysensownej 5'-ggatccctaagcaatattgtgtttcttcgc-3': (patrz SEQ ID 40 listy sekwencji).
Startery pochodzą odpowiednio z sekwencji na 5' końcu obszaru powyżej genu struktury mlcE oraz z sekwencji na 3' końcu obszaru poniżej tego genu. Syntezę starterów przeprowadzono według metody fosfoamidowej
3) RT-PCR
W celu otrzymania pełnej długości cDNA, kodującego produkt genu mlcR, używano zestawu Takara RNA LA PCR (AMV) Ver. 1.1.
Dokładnie, 20 μl mieszaniny reakcyjnej, zawierającej 1 μg całkowitego RNA, 2.5 pmoli losowych starterów o długości 9 nukleotydów (zawarte w zestawie) oraz 1 μl odwrotnej transkryptazy (zawarta w zestawie) inkubowano w 42°C przez 30 minut w celu wytworzenia pierwszej nici cDNA. Następnie odwrotną transkryptazę inaktywowano poprzez inkubację w 99°C przez 5 minut.
100 μl kolejnej mieszaniny reakcyjnej, zawierającej całkowitą objętość mieszaniny reakcyjnej z pierwszą nicią cDNA (patrz wyżej), 40 pmoli startera dla nici sensownej oraz 40 pmoli startera dla nici antysensownej inkubowano w 94 °C przez 2 minuty. Następnie cykl: 94°C przez 30 sekund, 60°C przez 30 sekund oraz 72°C przez 2 minuty powtarzano 30 razy, po czym następowała 5 minutowa inkubacja mieszaniny w 72°C oraz 18 godzinna w 4°C. Powstały produkt poddawano elektroforezie w żelu agarozowym, izolowano DNA z żelu, oczyszczano poprzez ekstrakcję mieszaniną fenolu z chloroformem i wytrącanie etanolem oraz transformowano do kompetentnych komórek Escherichia
PL 202 457 B1 coli JM109 (wytworzonych przez Takara Shuzo Co., Ltd., Japonia) wg metody opisanej w przykładzie 4, wykorzystującej pCR 2.1. Spośród transformantów wyizolowano szczep niosący plazmid z fragmentem DNA i nazwano go pCRexpR.
Ustalono sekwencję wstawionego fragmentu DNA w wynikowym plazmidzie (pCRexpE). DNA zawierające pełnej długości cDNA odpowiadało genowi struktury mlcE. Sekwencja nukleotydowa oraz sekwencja aminokwasów otrzymana w oparciu o sekwencję nukleotydów pokazano jako SEQ ID NO.41 i/lub SEQ ID NO 42 listy sekwencji.
Najbliższym homologiem mlcR jest lovE pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (34% identyczności na poziomie aminokwasów).
P r z y k ł a d 11: Wytwarzanie wektora ekspresyjnego pSAKexpR
Wektor pCRexpE, otrzymany w przykładzie 12, trawiono w 37°C przez 2 godziny enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia), następnie strawiony plazmid poddano elektroforezie w żelu agarozowym, po czym fragment, zawierający pełnej długości cDNA mlcR, o długości ok. 1.4 kpz izolowano DNA z żelu.
Po trawieniu plazmidu pSAK700 enzymem restrykcyjnym BamHI (wyprodukowanym przez Takara Shuzo Co., Ltd., Japonia) dodano do niego alkalicznej fosfatazy i inkubonano w 65°C przez 30 minut. Tak przygotowany wektor pSAK700 zligowano z fragmentem o długości 1.4 kpz (otrzymanym w pierwszym kroku), wykorzystując zestaw do ligacji DNA Ver.2 (wyprodukowany przez Takara Shuzo Co., Ltd., Japonia). Zligowanym DNA transformowano kompetentne komórki Escherichia coli JM109 (wyprodukowane przez Takara Shuzo Co., Ltd., Japonia). Spośród transformantów wyizolowano szczep niosący odpowiedni wektor ekspresyjny.
Stransformowany szczep Escherichia coli, nazwany Escherichia coli pSAKexpR SANK 72599, otrzymany w opisywanym przykładzie zdeponowano w Research Institute of Life Science and Technology of the Agency of Industrial Science and Technology 25 stycznia 2000, pod numerem depozytu FERM BP-7006, zgodnie z budapeszteńskim porozumieniem dotyczącym deponowania mikroorganizmów.
P r z y k ł a d 14: Transformacja mikroorganizmów produkujących ML-236B
1) Przygotowywanie protoplastów
Spory szczepu Penicillium citrinum SANK 13380 z hodowli na skosach inokulowano na podłożu z agarem PGA i hodowano przez 14 dni w 26°C. Po hodowli, 1 x 108, wyizolowanych spor szczepu Penicillium citrinum SANK 13380 inokulowano w 80 ml pożywki YPL-20 i inkubowano w 26°C przez 1 dzień. Po potwierdzeniu kiełkowania, poprzez obserwację pod mikroskopem, kiełkujące spory wirowano w temperaturze pokojowej w 5000 x G przez 10 minut, a następnie odzyskiwano w postaci osadu.
Następnie spory przemywano trzykrotnie w sterylnej wodzie, aby umożliwić wytworzenie protoplastów. Dokładnie, 200 mg zymoliazy 20 T (wyprodukowanej przez Seikagaku Kogyo Corporation) oraz 100 mg chitynazy (wyprodukowanej przez Sigma Corporation) rozpuszczono w 10 ml 0.55M chlorku magnezu i wirowano w temperaturze pokojowej w 5000 x G przez 10 minut. Supernatant używano jako roztworu enzymu. 20 ml roztworu enzymu oraz 0.5 g (mokrej masy) kiełkujących spor, umieszczono w 100 ml konikalnej butelce i inkubowano z delikatnym wytrząsaniem w 30°C przez 60 minut. Po potwierdzeniu uzyskania protoplastów z kiełkujących spor (obserwacja mikroskopowa), mieszaninę filtrowano przez filtr szklany 3G-2 (wyprodukowany przez HARIO corporation). Przefiltrowaną mieszaninę wirowano w temperaturze pokojowej w 1000 x G przez 10 minut, a następnie protoplasty odzyskiwano w postaci osadu
2) Transformacja
Protoplasty otrzymane w punkcie 1 przemywano dwukrotnie w 30 ml 0,55 M chlorku magnezu i raz w 30 ml roztworu zawierającego 0,55 M chlorku magnezu, 50 mM chlorku wapnia oraz 10 mM 3-morfiolino propano sulfonian (pH 6,3 lub mniejsze, poniżej określane jako roztwór MCM). Następnie protoplasty zawieszano w 100 μl 4% (w/v) glikolu polietylenowego 8000, 10 mM 3-morfiolino propano sulfonianu, 0,0025% (w/v) heparyny (wyprodukowanej przez sigma corporation), 50 mM chlorku magnezu (pH 6,3 lub mniejsze, poniżej określane jako „mieszanina transformacyjna).
μl mieszaniny transformacyjnej, zawierającej około 5 x 107 protoplastów oraz 10 μl of TE, zawierającego 120 μg pSAKexpE lub pSA-KexpR, mieszano i inkubowano w lodzie przez 30 minut. Do powyższej mieszaniny dodawano 1.2 ml mieszaniny, zawierającej 20% (w/v) glikolu polietylenowego, 50 mM chlorku magnezu, 10 mM 3- morfiolino propano sulfonianu (pH 6,3). Następnie, tak otrzymaną mieszaninę delikatnie pipetowano i pozostawiono w temperaturze pokojowej na 20 minut. W kolejnym kroku dodawano 10 ml roztworu MCM, delikatnie mieszano i wirowano w temperaturze pokojowej przy 1000 x G przez 10 minut. Stransformowane protoplasty odzyskiwano w postaci osadu.
PL 202 457 B1
3) Regeneracja ściany komórkowej stransformowanych protoplastów.
Stransformowane protoplasty otrzymane w kroku 2) zawieszono w 5 ml półpłynnej pożywki VGS wylano na 10 ml stałej pożywki VGS. Płytkę inkubowano w 26°C przez jeden dzień, po czym 10 ml płynnego VGS, zawierającego 5 mg higromycyny B na szalkę (końcowe stężenie higromycyny 200 μg/ml) wylano na górę. Po inkubacji w 26°C przez 14 dni, oba szczepy (tj. pochodzące z protoplastów transformowanych pSAKexpE lub pSAKexpR) przesiano na pożywkę PGA, zawirającą 200 (ng/ml higromycyny B, po czym przesiano na skosy z pożywką PGA i inkubowano w 26°C przez 14 dni.
Skosy przechowywano w 4°C.
Test Przykładu 1: Porównanie zdolności do biosyntezy ML-236B w transformowanych i nietransformowanych szczepach.
Hodowano stransformowane szczepy otrzymane w przykładzie 14 oraz Penicillium citrinum SANK 13380, następnie w przypadku każdej hodowli oznaczano ilość ML-236B.
mm kwadratowych inokulum spor ze skosów, na których przechowywano strasformowane szczepy z przykładu 14 oraz ze skosów opisanych w przykładzie 2 (Penicillium citrinum SANK 13380). Komórki inokulowano w 10 ml pożywki MBG3-8 w 100 ml butelkach i inkubowano w 24°C przez dwa dni z wytrząsaniem. Następnie dodawano 3.5 ml 50% (w/v) roztworu gliceryny i kontynuowano hodowlę w 24°C przez 10 dni z wytrząsaniem.
Do 10 ml hodowli dodawano 50 ml 0,2 N wodorotlenku sodu, a następnie inkubowano w 26°C przez jedną godzinę z wytrząsaniem. Hodowlę wirowano w temperaturze pokojowej w 3000 x G przez minuty. 1 ml uzyskanego supernatantu mieszano z 9 ml 75% metanolu i poddawano analizie HPLC.
Jako kolumny w HPLC, używano SSC-ODS-262 (o przekroju 6 mm i długości 100 mm, wyprodukowanej przez Senshu Kagaku Co.Ltd). 75% (v/v) metanolu - 0.1% (v/v) trietyloaminy - 0.1% (v/v) kwasu octowego używano jako fazy ciekłej. Elucję przeprowadzano w temperaturze pokojowej, z szybkością 2ml/minutę. W powyższych warunkach, ML 236B był eluowany w 4 minuty po nałożeniu na kolumny. Detekcje przeprowadzano w detektorze UV przy długości fali 236 nm.
Biosynteza ML-236B była podwyższona w 3 z 8 szczepów transformowanych pSAKexpE. Zdolność do bisyntezy ML-236B w tych szczepach była 10% wyższa w porównaniu ze szczepami nietransformowanymi. Jednocześnie biosynteza ML-236B była bardziej stabilna po przesiewaniu (na pojedyncze spory). Powyższe wyniki dowodzą, że wstawka na plazmidzie pSAKexpE, jest cDNA, przyśpieszającym biosyntezę ML-236B.
Biosynteza ML-236B była podwyższona w 5 szczepach transformowanych pSAKexpR. Zdolność do bisyntezy ML-236B w tych szczepach była 15% wyższa w porównaniu ze szczepami nietransformowanymi. Jednocześnie biosynteza ML-236B była bardziej stabilna po przesiewaniu (na pojedyncze spory). Powyższe wyniki dowodzą, że wstawka na plazmidzie pSAKexpR, jest cDNA, przyśpieszającym biosyntezę ML-236B.
Stąd, cDNA powodujące przyśpieszoną biosyntezę ML-236B, otrzymane ze szczepu produkującego ML-236B zgodnie z opisywanym wynalazkiem, przyśpiesza biosyntezę ML-236B w mikroorganizmach produkujących ML-236B, po wprowadzeniu do mikroorganizmu produkującego ML-236B.
P r z y k ł a d 15: Okeślenie sekwencji cDNA genów struktury mlc A-D.
Określono sekwencja cDNA genu struktury mlc A.
Pierwszą nić cDNA zsyntetyzowano używając zestawu TAKARA LA PCR kit ver1.1 (Takara Shuzo Co., Ltd.). Przeprowadzono kilka reakcji PCR w celu amplifikacji części lub całości cDNA, używając pierwszej nici cDNA jako matrycy oraz różnych par oligonukleotydów jako starterów.
Używano następujących cykli: 30 sekund w 94°C, 30 sekund w 60°C i 5 minut w 72°C, powtarzając 30 razy. Do reakcji używano zestawu Big Dye Primer/Terminator Cycle Sequencing Kit oraz aparatu ABI Prism 377 sequence (PE Applied Biosystems).
Produkt każdej reakcji wstawiano do plazmidu pCR2.1.
Otrzymano transformanty Escherichia coli dla każdego plazmidu.
Ustalano sekwencję nukleotydową każdej wstawki.
Sekwencje eksonów i intronów ustalono porównując sekwencje produktów reakcji RT-PCR, wspomnianych powyżej z sekwencją genu struktury mlc A.
Następnie ustalono sekwencję cDNA genu struktury mlc A (SEQ ID NO 43), sekwencję aminokwasów otrzymaną w oparciu o opisane cDNA (SEQ ID NO 44) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.
Najbliższym homologiem mlcA jest LNKS(lovB) pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (60% identyczności na poziomie aminokwasów).
PL 202 457 B1
W podobny sposób uzyskano sekwencję cDNA genu struktury mlc B (SEQ ID NO 45). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 46) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.
Najbliższym homologiem mlcB jest LDKS(lov/F) pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (61% identyczności na poziomie aminokwasów).
W podobny sposób uzyskano sekwencję cDNA genu struktury mlc C (SEQ ID NO 47). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 48) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji..
Najbliższym homologiem mlcC jest lovA, pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (72% identyczności na poziomie aminokwasów).
Następnie, uzyskano sekwencję cDNA genu struktury mlc D (SEQ ID NO 49). Sekwencję aminokwasów ustalono w oparciu o sekwencję nukleotydową cDNA (SEQ ID NO 50) oraz przewidziano potencjalną funkcję kodowanego polipeptydu na podstawie homologii sekwencji.
Najbliższym homologiem mlcC jest ORF8, pochodzący ze skupienia genów związanych z biosyntezą lowastatyny (63% identyczności na poziomie aminokwasów).
Miejsca występowania eksonów każdego z genów struktury w sekwencji SEQ ID NO 1 lub SEQ ID NO 2 określono jak podano poniżej:
T a b e l a 11: Miejsca występowania eksonów w mlcA-D we wstawkach pML48
SEQ ID sekwencji, w której występuje ekson | Bumer Eksonu | Numer nukleotydu w SEQ ID NO 1 lubSEQ ID NO 2 | |
MlcA | 2 | 1 | 22913 do 22945 |
2 | 23003 do 23846 | ||
3 | 23634 do 23846 | ||
4 | 23918 do 24143 | ||
5 | 24221 do 24562 | ||
6 | 24627 do 27420 | ||
7 | 27479 do 27699 | ||
8 | 27761 do 30041 | ||
9 | 30112 do 30454 | ||
10 | 30514 do 30916 | ||
11 | 30972 do 32910 | ||
MlcB | 2 | 1 | 11689 do 12002 |
2 | 12106 do 12192 | ||
3 | 12247 do 12304 | ||
4 | 12359 do 12692 | ||
5 | 12761 do 13271 | ||
6 | 13330 do 13918 | ||
7 | 13995 do 20052 | ||
MlcC | 1 | 1 | 11631 do 12140 |
2 | 12207 do 12378 | ||
3 | 12442 do 13606 | ||
MlcD | 1 | 1 | 24066 do 24185 |
2 | 24270 do 27463 | ||
3 | 27514 do 28130 |
PL 202 457 B1
Miejsca terminacji transkrypcji każdego z genów struktury w sekwencji SEQ ID NO 1 lub SEQ ID NO 2 określono jak podano poniżej:
T a b e l a 12: Miejsca terminacji transkrypcji każdego z genów struktury mlc A-E i R we wstawkach pML48
Gen | SEQ ID NO sekwencji, w której występuje miejsce terminacji transkrypcji | Numer nukleotydu w SEQ ID NO 1 lub SEQ ID NO 2 |
mlcA | SEQ ID NO 2 | 32910 |
mlcB | SEQ ID NO 2 | 20052 |
mlcC | SEQ ID NO 1 | 13606 |
mlcD | SEQ ID NO 1 | 28130 |
mlcE | SEQ ID NO 2 | 5814 |
mlcR | SEQ ID NO 2 | 1918 |
P r z y k ł a d 16: Badania dysrupcji genu.
Geny struktury mlc A, B i D P.citrinum poddano dysrupcji, przy użyciu ukierunkowaną mutagenezę, wykorzystującą rekombinację homologiczną.
Plazmid umożliwiający dysrupcję genu struktury mlcA P.citrinum wytworzono używając plazmidu pSAK333.
Fragment o długości 4,1 kpz, otrzymany po cięciu enzymem Kpnl plazmidu pML48, zawierający mlcA, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcA
P.citrinum SANK13380 stransformowano plazmidem pdismlcA
Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcA w celu potwierdzenia dysrupcji genu mlcA.
Otrzymany mutant dysrupcyjny, nie produkował ML-236B lub jego prekursora.
Plazmid umożliwiający dysrupcję genu struktury mlcB P.citrinum wytworzono używając plazmidu pSAK333.
Fragment o długości 1,4 kpz, otrzymany po cięciu enzymami Psl BamHI plazmidu pML48, zawierający mlcB, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcB.
P.citrinum SANK13380 stransformowano plazmidem pdismlcB.
Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcB, w celu potwierdzenia dysrupcji genu mlcB.
Otrzymany mutant dysrupcyjny genu mlcB, nie produkował ML-236B, ale produkował jego prekursor.
Plazmid umożliwiający dysrupcję genu struktury mlcD P.citrinum wytworzono używając plazmidu pSAK333.
Fragment o długości 1,4 kpz, otrzymany po cięciu enzymami Kpnl BamHI plazmidu pML48, zawierający mlcD, wyizolowano, oczyszczono, stępiono używając zestawu DNA Blunting Kit (Takara Shuzo Co., Ltd.), a następnie zligowano z plazmidem pSAK333, przeciętym Puull. Otrzymany plazmid nazwano pdismlcD.
P.citrinum SANK13380 stransformowano plazmidem pdismlcD.
Przeprowadzono hybrydyzację typu Southern genomowego DNA transformantów pdismlcD, w celu potwierdzenia dysrupcji genu mlcD.
Otrzymany mutant dysrupcyjny genu mlcD, produkował ML-236B w 30% wzglądem szczepu kontrolnego.
P r z y k ł a d 17: Analiza funkcjonalna mlc R w transformantach pSA-KexpR.
Dwa transformanty pSAKexpR otrzymane w przykładzie 12, oznaczone odpowiednio jako TR1 i TR2, oraz nietransformowany szczep Penicillium citrinum SANK13380 inokulowano w pożywce MBG3-8, a następnie inkubowano oddzielnie, jak opisano w przykładzie 8.
Wyizolowano całkowite RNA z każdej hodowli, jak opisano w przykładzie 8.
PL 202 457 B1
Przeprowadzono reakcję RT-PCR, używając całkowitego RNA jako matrycy i oligonukletydów zaprojektowanych w oparciu o sekwencje genów struktury mlc A, B, C D E i R jako starterów.
T a b e l a 13: Sekwencje nukleotydowe par starterów do reakcji RT-PCR.
Cel RT-PCR | Starter 1 | SEQ ID NO | Starter 2 | SEQ ID NO |
mlcA | 5'-gcaagctctgctaccagcac-3' | 51 | 5'-ctaggccaacttcagagccg-3' | 52 |
mlcB | 5'-agtcatgcaggatctgggtc-3' | 53 | 5'-gcagacacatcggtgaagtc-3' | 54 |
mlcC | 5'-aaaccgcacctgtctattcc-3' | 55 | 5'-ctttg tg gttg g atg catac-3' | 56 |
mlcD | 5'-cgctctatcatttcgaggac-3' | 57 | 5'-tcaatagacggcatggagac-3' | 58 |
mlcE | 5'-atgtcagaacctctaccccc-3' | 59 | 5'-tcaagcatcagtctcaggca-3' | 60 |
mlcR | 5'atgtccctgccgcatgcaac-3' | 61 | 5'-ctaagcaatattgtgtttct-3' | 62 |
Wyniki analizy RT-PCR przedstawiono na Fig. 5 dla nietransformowanego szczepu Pencillium citrinum 13380 oraz dla transformantów oznaczonych jako TR1 i TR2.
Geny struktury mlc A, B, C, D i R były wyrażane w transformantach pSAKexpR pierwszego, drugiego i trzeciego dnia hodowli.
Dla porównania, wymienione geny struktury w nietransformowanym szczepie były wyrażane jedynie trzeciego dnia hodowli.
Nie zaobserwowano różnicy w ekspresji struktury mlcE pomiędzy transformantami pSAKexpR i szczepem nietransformowanym.
Wyniki sugerują, że białko kodowane przez cDNA genu struktury mlc R, indukuje transkrypcje innych genów struktury (np. mlc A, B, C, D), znajdujących się w skupieniu genów biosyntezy ML-236B.
P r z y k ł a d 18: Analiza funkcjonalna mlc E w transformantach pSA-KexpE.
Transformant pSAKexpE otrzymany w przykładzie 12, oznaczony jako TE1 oraz nietransformowany szczep Penicillium citrinum SANK 13380 inokulowano w pożywce MBG3-8, a następnie inkubowano oddzielnie, jak opisano w przykładzie 8.
Wyizolowano całkowite RNA z każdej hodowli, jak opisano w przykładzie 8.
Przeprowadzono reakcję RT-PCR, używając całkowitego RNA jako matrycy i oligonukletydów zaprojektowanych w oparciu o sekwencje genów struktury mlc A, B, C D E i R jako starterów. Startery użyte w opisywanym przykładzie są takie same, jak przedstawione w tabeli z poprzedniego przykładu.
Wyniki analizy RT-PCR przedstawiono na Fig. 6 dla nietransformowanego szczepu Pencillium citrinum 13380 oraz dla transformanta oznaczonego jako TE1.
Gen struktury mlc E był wyrażany w transformantach pSAKexpE pierwszego, drugiego i trzeciego dnia hodowli.
Dla porównania, wymieniony gen struktury w nietransformowanym szczepie był wyrażany jedynie trzeciego dnia hodowli.
Z drugiej strony, nie zaobserwowano różnicy w ekspresji genów struktury mlcA, B, C, D i R pomiędzy transformantami pSAKexpE i szczepem nietransformowanym (wyniki nie załączone).
Wyniki sugerują, że białko kodowane przez cDNA genu struktury mlc E, przyśpiesza biosyntezę ML-236B, niezależnie od genów struktury mlc A, B, C, D i R.
PL 202 457 B1
WYKAZ SEKWENCJI
<110> | Sankyo Company. Limited | |||
<120> | Geny ze skupienia genów | |||
<130> | EPP83481 | |||
<150> | JP 2000-116591 | |||
<15li | 2000-04-18 | |||
<150> | JP 2000-117458 | |||
<151? | 2000-04-19 | |||
<160> | 52 | |||
<170 = | Patentln. version 3.0 | |||
<210> | 1 | |||
<211> | 34203 | |||
<212 > | DNA | |||
<213> | Penicillium citrinum | |||
<400> | 1 | |||
gatcaatact acgtcgttgt tatttccttg | tcagtaatga | ctaacaaatt | ccccagaaca | |
gacgaagtca cagctcacac cacaagagaa | aatgagtcca | gcgaggatta | cagatttctc | |
gccaggcaaa ccgagaaaag ctctcttatg | catccacggt | gccgggtgct | cagcagccat |
attccgcgtc cagatctcta aactgcgcgt ggcgttgaaa aacgagtttg aattcgtata tgcgaccgcg ccgtttagct ccagccccgg acccggcgtg cttcctgtct tccaaggcat gggtccatac tacacctggt tccaaaagca tcatgacgcc gttacaaaca cgacaacccc cacggtgggc gatagagtag cggctgtgat cgggcctgtg caaaagaccg tccaagattg gtctataact aacccacagg cacccattgt cggcatagtg gccttctctg agggcgcatt ggtcgccact ttgctgctcc atcaacagca aatgggaaaa ctgccatggt ttccgaaaat gagcattgct gttttgattt gctgtttcta tagcgatgaa gccagagatt acatgagagc cgaggcgcaa gacgacgacg acaagctaat aatcaacgtg ccgacactgc atcttcacgg tcgtcaagat tttgctctcc aagggtcgag acagatggtt gaaacacatt acctgcctca gaatgcagat gtactcgagt ttcagggaaa gcataatttt cccaacagac cgagtgatgt ccaggagacg gtcaagcgct tccaacagct atatcaaaag gtcaagatgt caggttcatt tgtctaggtg agacaacagg gtatatagca aggctctggc tctcatgcct agtccatacc acatttttac tgaacaaatt tgaatagttc taatcttaca cggtttgaat gctcaccttc caagggtgat ttagttatag tggtcgcgac catctcataa atatttcgtg aacatatttt ggatagatca tggaaggctc gttctgaaca ggcatgacag acatctaaaa ccactcgatc accacaacaa ggcactaaac cagtaactat ggaactattt gcaatggcgt cgaatttata tacaggatgg attgaaatca attccaagcc ttggaggttt caccttcctc acagagtctt tcgaaacgcg ctaccgaggt atatttatca ccgttacggt actctgaacc gcgctatcta acttgatgtt acgattgctg caataaagaa gagcaacgaa ggtagaagta attttgacaa agatacaaga cgaattcgct atttgtagat gaatatgcgt gtgtcaattg acgccgaatt caggatagat ttgccatctg ctctattgcc aatttctaat ccatctttat catgaacaac actcaaacca cacatctgaa ttcacggcgc tgaacgatct aggccaactt cagagccggg ttcatcgaga acatagtgag gattgaagaa aagtggtcta caaaggcctg agcgtgctca gggccataca gcgagctctg aagtttgaca tgaatgagtg ggtccttggt agggtcatcc
SO 12 0 180 240 300 3S0 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620
PL 202 457 B1 cacatctcga gaacgatgtc ataaggagtg cgctcacggg aagcgagaac actcgtcatt 1680 ttggcattgc caattgagcc actctccgct tgaccctgct tgtaatcaaa gacagcctgg 1740 aacaaggggg cgtgtgtctg agtcttgggt tcctcgcctg aggtagggag attcaggcct 1800 agacagtcga ggatgacgcc atacggcacc cgcgcgtgtt gcatggcctc acgcacactg 1860 tccttggtgg ctacaaggtg ctcgccgaat gtcttgctgc cgacgaactc atcaaagcgc 1920 a999gaa9ca cgttagcgaa aaagcccatc gccgaaattt cttccatggt ggatcggttg 1980 gtttcggcga ggccgatggt tatgtctttg ctgccggtaa gacgcgccaa caaaacgtgg 2040 taggcggcca ggtagaactg eatgggggtt gccttgtgct tgcggctccg ctctttgatt 2100 cggaaggcga ccatgggatc taaacgagca attgcttcat actgctgcca cgtgaatggc 2160 tgtatttgct gctgctctga attggcagca gggtcattga tcagattcat gatgggaagc 2220 acggttggcg cagatgacga gactttgcta tgcatggact tccagaacgc gatatcgtcc 2280 cccattcgcc cattttccag gttttcccgc tgttggacgg ctagatcaga gaattgggtc 2340 gatggtcgct gcattttcac cccgctgtaa atctgcccga tctcattgaa caggttttct 2400 gttgttgagc catcaccaac taatctgtgg tagccgatta ccaacaggtg gtcatctgtg 2460 ccccagtaga aatcaacgag tctgagagtg tcacctgtgg agatgctata gtttgtcttc 2520 tcgagtttcc ggtactcttc ctctgcctcc gcagcgttgt tcacctgaac aaagtgcact 2580 ctgttctccg ggttcttgag aaccacttgg acgggaccat ttaaatcgct gctatagtca 2640 tcgccagtaa caaagcacgt acggaagatc tcgtgacggc gcaatgaggc tttcagagcc 2700 cgcctcaacc ggtcgaggtc aatggtaccc ttcatgaaca tgccaatagt gttgttgaag 2760 atggtatgat cttttaccat ttgttgctgc ctccaggaat actcctggcc aagggacaac 2820 ctctcgcgac gaagaatctt acggcctccc tgctcattat cgtcctcttg ctcttcatcc 2880 tcttcggctg acgacgcatc tgtgctggta gcagagcttg cttcatcatg gctgtctgtt 2940 ggtgtcggag aagccccgct gtccgaggtt cccgtggaat caccaatttg caacagcagc 3000 ggaatggatg tagctgggag tcgggtggcc gcgtcgtcgg caagatcagc gacagaagca 3 OSO ccgccaagta ecctcaagag tgggaggtca aggtagagtt gctttgagaa ccatgagccg 3120 acagtcactg cacccaagga gtcgacacct tgatcaatga gaggaatggt tgggtccacg 3180 ctctccccgt ccgaaacttg gagggtaaca cggagtttct cagatagacc atctgcaact 3240 ttgttagttt gaactcgata tcaggaaacg catgagagat aacttaccaa tcacgatttg 3300 ccgaacttgg tctaaagttg ttgcttgttt gagctggtcg gcaatggagc ctttagaccc 33S0 tgatccattg tcgccaccgt ctccgcgttg accgggaatt ttgaagtttc cgaaacgagg 3420 gtcgttgaag taaataattc gatcttgaag cgcagggtca agatctggga tacccgtggt 3480 aagctcaagg tccgccatgt caatgaccgt cttgcgctgt ggttgctgcc gggcacgctg 3540 gtcagacacg accgcttcgg cgaaaagcgt gtgcagctca tgctcttcaa ctgagtcaaa 3600 catgaaacgg atagcatcaa agtcctcctc catctcggcc ctcgtgacaa accctacacc 36S0 gtaaacggca ccaatatcga tggttgatcc ctgtggttgt gcgttagtaa cttgacgtcg 3720 atgcatgata attcaggggt agaaaatacc gccaatcctc tggcgcaccg ttgctgggcc 3780 agagcctgta ggtaggcatt cgcagcgcca tagttggact ggccaggatt gccaataact 3840 gcaacaatgg acgaaaacat gatgaagaag tcgagcgcct tgctgcccgt ctgttcggag 3900 aaccgttcat gaagaatgcg tgctccttgt accttgggct tcaacaccat gtccatcatc 39S0 tggtggtcca tgttcttcag catgacatcc tgcagcacca aaggcccgaa cgcgatgccg 4020 gcaacaggtg gcaacttcat atcgacaagc ttgccaaggc cagcatcgac tgaatcctca 4080 ttggcaacat ccctaaagaa agtaattgga taagtaaacg aggatgtggt agcaaggtgt 4140 gatgtgatat caatcaactt acattgacag aacggtgatg tcaccaccaa gtgcctccat 4200 gttggcgatc catttgggat caagtcgagg gttccggcta gtgagcacaa catggcgggc 4260 gccatgcaag atcatccagc gacagagaga gcgaccaagg tccccggtaa gaccaacaag 4320 caaatacgtc ttcttgttgg aaaataagtt accagagtcg atggggcaaa tcctagcgga 4380 cacctcattt tccttccagt cgatgacggt ggccagattg aagcgttggt cattgtggtt 4440 gacagagagc tgaccaggca agagaatttg tgtggctgta ataactttct cagtgtcgtc 4500 gacagtcgac gcagagacgg tattttttgc cattgccaca gagtgctcga ggattggaat 4560 atcctcaaca tgactaactt tgtatgtgga agctgtactt cggataagat agtcaccact 4620 gtacatgaag caactgggtg gtagcaactt ggccaaacgg ttggttatcc cggcagcagt 4680 ccggtcggta gacaagtcaa agaatgccat catgtttgtc ggcaggctgt gtttcagccg 4740 agcgtcggtt tccttggcat gtaatcggat ccaaggagcc ggaatagttt tgacgtcgga 4800
PL 202 457 B1 cagagttgtt gccaaatgaa cctgaacacc gtaggttttg gccgactcca gaattgcttt 4860 gacgcagaag attgggggct ecataatcag aattgatgca tcagagccaa aggactgagc 4920 gctagagaga attgtttcgg caaggagggc tgcagctgtg gacaacaaga aggaactatc 4980 ctcgccttcc gccatgttat cgggcagact atgcatgtag tttctcggta catgcagtat 5040 agatccattc ttctcagcca gggcgactac aggcacctca catgtattct ccagaatact 5100 gccctgcacg acatggaagt atccgagatg gcccacgcga attgcctggg gaagagcgta 5160 gcgaacacga acagttgctt ttccagcatg acgagcgtct tctaacgaat cacacgtctc 5220 ggttgactca agatagtaca tcgatgagga tgctcccctc gcctctttca gtgcaatggc 5280 cgtcttggac gaattaaagt taccgaaaat tggacgacga gacgagttca tacggtcgtt 5340 cctagcaata tcctgcttca aacgagggac ccaggcacga cccttgcacc agtacacttc 5400 gggctcatga gtccatgtta ttgattccaa aagctgatca tcgctctcct cgaagcgcaa 5460 aagttgctca acgaagaatt tggtgtctag gttctccaca gtatcgacat cgaagacgtg 5520 cgttcccaag tcagggttct cgagcttgat tgtcctcaac attccgatgg tgctggcctg 5580 gtggggatga tcaatccagg cattctctgt cagccacatc atgcgtccgg cgtagaagag 5640 aagagacttg actgcctcaa acttgtcctc ttcaaggttg caaaacactt catcatcaag 5700 ttccgagagg atgacaaaag tcgacttagg ctgcaaggcc gggtcgtcga gaacactttc 5760 cagccgcttg acggagtgga tgtgtctatg cggtagggca gctttcatgt cgttcaaaat 5820 gcgttcggtt tttgtcgatt cgccaccgat aaccactaat ggcgggtatg agtccttcaa 5880 tggagcagaa agtggatcat acaaacgctc aacggtggca tccacagcat gtgtactgaa 5940 gacagacggg atcaaatcat cctctcgatc aagtgtccga ctatcgacgc cagagaaccc 6000 aactctcttg agggtatgct cccattggtc aacggacccc gaggcactca aagcacgagt 6060 ttcgtcttct ccagtccatc gatcagcgaa aagcccagag atgaaggcga ggcgagcagg 6120 ctcgcgatgg gtgaccccga aagtaaccaa gtgaccaccc ggcttgagca aggaccttat 6180 gtgagccaat ttttcctcga agttggagct ggcatggagg acatcggatg caataatcag 6240 atcgtaggag tgaggcttga atccttgctc tgctgggctt ctgttgatgt ctagtgcctc 6300 aaactgcatg agaccgtcga attcggaaag ttgttcacgg gccttgccaa taacatccgc 6360 cgagatgtca gtgcaagtgt aactgttgaa accaagttga ggtgatgcaa gaacgcgctt 6420 cgtggcgatg cctgtaccca agcctaaaaa gcgaacgaca gattagcaaa ctgcctagtt 6480 acttacattt cagattcgac ttaccgatct caaggatatc aatggattgg tagcgatgag 6540 caatttggct aaccagatcc tgaacgacgt gtattgctga gccaaaggcg agcttgttgg 6600 tatagtactc ggtgaacaac ccatcgcggt tcatgatatc caaaggatcc ccgttcccgc 6660 gaacaattga aattaattct ttgcctaccc tttggatcag gcgcacatgt gggtgggacg 6720 agttgcttca agtaaaaggt taatataaaa gaatgaaaaa acacggaaca gctttgggtg 6780 tacctttcac acatttgctc aatgtgaaca gaagtgtcct cctcccaaga ctcctggtac 6840 cactgatggt ggccagcccg agcatcggcc tgaacctggt cacaccattc aatgtacttc 6900 tgggaatgga ggtcggcatt ttgacggtcg tcgggggtta tctgggctag gaaggatttg 6960 atgtagaagt aaacgattcg ctcgatggtc agaatgtcct ccttgtcccg agctatgatc 7020 aacgtcgcag ggtcctccag cagtttttcg ggcgtgaggg gtccccagac ccactttgcg- 7080 aagattcggt ggtcggtcga agcagtcggg ggagagaaag gcttaaagac aatgttatca 7140 acttggaaaa gcgttgtctt ggtcgaatcg tacaccgtga tgtcgccgct caggaaatca 7200 cccttgtcgt gtgtgttgat tgtgtcaaac gcaagctcgg tttcaccaga attacccgcc 7260 gatatacaga gcgatggaat cagagtcact ctgtcaacgt gagtaggcac gtacaatgag 7320 cgtaggcgac gatctcctgg agaggaatac gctccaatga cagtctggaa cgcgatgtcc 7380 aggggcgctg ggtggagcaa gaggggctca ttgcgcaatt catccttaag tggaaggaaa 7440 gccaaggtgc cgctagcttt ggagtcggcc cttctcatgg tctgcaaacg acggaagtct 7500 ttgctgtagt catacccaag gaggtcaagt tcccgataga agaaatcgat gttgacattg 7560 ttcatctggg ggtactcttc ctcaggtggc ggcaaaagct gcgatgacgg tgatgcctcg 7620 ccaagggtta tgacgatttg gcctttggcg gatgtcgaaa gctcactctc ctttgccaga 7680 caggaatcaa taacaaattt gaccgtgact tggccatccg catcattgtc actggtgact 7740 tcggctgtca agttcagctc cacggaggtg ttttcatctt caaacacgat ggctttgttg 7800 atgctcatgt ccaagatttc caggagctga acttgggcgg cacgctcacc agccaccttc 7860 atggcagctt ccatggccat aattatgtac ccagcagcgg ggaacacagt ctggccttgt 7920 agcgcatgac cgtcgagcca ttccagatcc cggggcctga tgaagtttgt ccactggaag 7980
PL 202 457 B1 gtcgatgctg tgctgtaaga agaaagcttt ccaagcagaa gatggggcgc acctccacga 8040 agatgctggc gggtggagcg agattctgcc cagtattgac gagtatgatc ccaagagtat 8100 gtgggcaatg actttgacag gttttgaacg gcacgatcgg gccggacttg ttgtacgaag 8160 ccctcggcgt cgatactccg aactccgaaa cgctcccaaa tgtatcccag acctccagca 8220 aaagcgtcca catcgtcaac gtttcgtgcc aagcacccgg tatacggcag ctccacaccg 8280 gcaagagcat ccttgatggt ggctagacac ggacccttga gagcagggtg ggcgccaatt 8340 tcgatggcga cgtcgattag acgatgagtg atgactgctt tctgcacagc ctgcgagaac 8400 aagaccggag agacgagatt gtctttccaa taagcgggca tcacatcctg tacagtcatt 8460 tgcttgctgg tctcgtggac ggcagagaac caagcaacac tatcgttacc ttggccatcg 8520 gcaacagcac agtcgcactc cagcaatgcc ttgacatatg gagctgcgca tgggtgcatg 8580 tgatgcgaat ggtaggcctt gtcaactctc aagattctgg caaaagtgga ttcatcctcc 8640 aagacacctt caacgtgctg gatagcatcc atgtcgccgg agaaggtcac actatccggt 8700 gaattgctag cggcgacgca gacccgaccc tcaaaggctt cgagctcgca tagttccttt 8760 gcgtcatcgt acgacatacc tgccgcCagc atagcgcctg tctggccgct tggagaagag 8820 gcatgctccg cggacacaac tccacgcaga tgcgcaatac ggatagcttg agtggcactg 8880 atgaatcctg ccgcaaaggc acaggcaatc tcacctgaac tgtggccgac aattgcactg 8940 aactcgatac cagctgcagc gagaagtcgg accagaacga tttgtacggc gcagcataga 9000 ggctgggaga agctggcgag tctgacgttt gaggcatccc cttcaagcat gagctggtca 9050 tacagtgtcc acgtaggccg atacttttca ggcagtgttt gcagtgaatt atccagctct 9120 tcgagaatgc ctctcacaaa tggcataccc accatgagct tcttcagcat gcccggccac 9180 tgtgcacctt ggccagtaaa gacacctagt acgcgagggt tgtcattcgc gtcggtgcgg 9240 aagtcggtga cgacctcacc gtccgcgatg gcagcctcca gtgccgcgcg ggctacttcc 9300 ttgttgtgtg ctgeaatcgc acgacggaag ggcaagatag accgtttctc aagtaaggta 93S0 tatgcgatat catgcatgtc cacgtcatca tgcgtttcca gaaattggag catattttct 9420 agegttgcct tcatggagcg ctgcgacttc gatgaaagca caaggggcaa gctgcatgca 9480 tctgcatctg aggtcacctc tgttaccact gctgtcggct tgtgtggagg agccatatac 9540 tcttcgataa tagcatgggc atttgtacca ccaaatcctg atgtgtttat atgtttagct 9600 aacttcactt tcgttctcaa gaagtgcagt tgaatcctta ccaaatgaat taacgctgac 9660 tctgcgaggc tgcccgggcg caacaatcgg ccattctgtg gcctccgttg caattttcaa 9720 gtgcgtatag aacggagcga cacggggact gatcttctca aacagcaggt ttggcgggat 9780 cacgccattt cgtacagcaa acgatgcctt cattaagccc gcaataccag cagtgccttc 9840 cgtgtgaccg agaactgtct tgatgctgcc gacaaaaagc tcatctttct cgccgtcgct 9900 gtcgattgtt ccatccttgt gtccgaagaa ggctgttgca atagcctcag cttcctgtgg 9960 gtcaccggct ggtgtaccag ttcctgggat cttcgtgtta gggagagaga gactttctgc 10020 aacttccata aggctgatac ttccagggaa taccacttac catgggcttc aaagaactgg 10080 cagcgttcct gggggttggt aatatcaaga ccagccttgg catatgtggc ccgaatgagg 10140 gcttcttgtg cgctatggtt tggcattgtg atacctgtcg ttcggccatc ttggttgata 10200 ccggtctctc ggataacaca ctcgatactg tccccgtcgc gcagtgcctg gctcagcgtt 10260 ttcaggacaa tagagcaaac accttcctaa aaagcagtta caggaggtca gtgccatctt 10320 gctttttttg aaaggaattg atgcattgtc aacttactcc tctggcatat ccatcggcag 103Θ0 cagcatccca cattcgagat ctaccattgg gggacagcat gttcaatttg ctctccatta 10440 caaaggtcat ggggcccaat atcagattcg caccggctgc aaccgccatg gtactctcgc 10500 ccgttctaag ctgttggacg gccagatgca cggcagctaa ggatgaacta caggctgtgt 10560 cgatcgtcat ctgcagaatc agtcaggaat ctgtcagcac ttgacgaagt cgggctcgct 10620 caatgagtgg cactcacact cggcccatgc cagtcgaaga agtatgatac acggttggag 10680 gccacactga cagctacccc cgtggcagag tatgtaggaa tactatccaa ttcacgcgtc 10740 acgatagtct catagtcatg cgtcatcata ccgacgtaca cagcagtaga ggatccttga 10800 aggccttgga tccgtaggcc tgcgttggat acagcttcat agaccgtctc cagcagcagc 10860 ctttgctgtg ggtcaatcgt ttcggcctct ccagcttgga tgttgaagaa agaggcatca 10920 aaaccgcgta gatcctcctg cagcaagtat gcaaagggtg cgttcgtgcg cccggggtga 10980 gtgccatcgg ggctgtaaaa tgtatcgacg tcaaatctct ccttagggat cttggtctgt 11040 acatcccggg gctctttgag cagctcccaa agttttgatg gtgtgttgac accacctgga 11100 aaccgacaac cgcttcccac taccacaatt ggctcgtttg gatagttggc ttgatccata 11160
PL 202 457 B1 actgctgatc tcttctcact gagcgaacaa ctcatctaga gcaatgcaag tcctccatac ggctgtatca ctgctcctaa tttttttttt agtgctgtta ccactggtgt tcgaatcgta gtctcatcgc aatggtggga ggatcgaagc attgcaccat tgtacaagtt tCtCt3£ł^3.t tcaaggaaat cccaagcccc tgttcggtaa gacataccgc ttgtcacacg ggctggatat tatggcccat gtgaccaagt aaaaggccgc ggtttgaaga atttcgccgg ggcacccaga gctggacgcc agcgaatcaa tatccaatgg acaaccctga gcgaggatcc gcttcggctg ttctcctcgc aatactaccg ggcgcaacga aacaaatatg gctgtattag tttgtaatcg agaagggaga ctacaccgcc tctccccatt agtcttgatg tggacacaag gtgccaacgc gagaaaaaga agtataaaaa ttctcagggc gcattaaata ggccgctatg ctgtttttgg gcatgccggg gccggccttg ttcggacaat ctcggcacct ggcgttattc aggtgaaacc aggaaacaac ttcaaggttg ttcgattata gcataggtcc ccaatgggta ctaccgtttg gttgacgacc ttggttctcg cctcccatcg tttggcggat +- r-i-rt s l-na - fctgccaggat caagtacaca aagcgagggt gaatatacta aacagtcaca tgcaaagaac gctactgcga gcgccgcgca atgtgtagcg caccgccgac catctacgcc ccttattcag tgcctctctg gccggtcgag cctcttcatt tgtgtgggaa agacaaggcc gaacccacgc tcatatactg tcacgctttt ggacatcccg catccgtccc tcgagtaggt aacgtggtgt gagtgtgtat acgtagggaa ctctcaggcg ttcctactca tactccctcc ctttcgaccg gagaactttt gcattcactc cactgtaatg gtcaggctca ctccttcgta gcgataggat cacaacattt caaccgatac ttcaagatcc agcaaaccct ggtcacacga gagtttttca cgaactgccc actggaagag aaccgtcgca tatctgtctc tcgacccctc cgggggcgcc atgagggcta aaaaacgaca tccatggccg gtatgacctc i t i ΓίΓΐ -n /- +gcacatcttg aagccattgg aagtgtcaat gagtggcaaa ctcattatgg catgccgtga ccgctcgctc cgaaagatca aagggcgtgc ggccgctggt tcgacggatc cctctccgcc ttcaagctga tgcgccacta cccaagggcg aaccccgaaa ttcaccgctc gcttgtcccg attcagtatg agcgttcgta ctccctcatg caggcttatt tagtaaaata agactttggc tcctgctacg gtcggcagta ttgactggcg acatccccga cgccttccga ttcaacgcgc gacagtcaag ttccgacttc gtatttcagg gcccaggctc ctatacctcc tgggattaaa gttcttacag cgtcgttata attctagtac cccggcgtca ggctgaatga ctcggattgt catccaggta tgctctcggc gcgctctcat acgcaatgct aagcccttgt agtccgaact ggcaggactt agcccctgcg acgagtttcg tgaattttcc tcaacaaagt ctaccttggc ttttctgtct ccgcacctgt tcggcgacaa gtgtggcggt actggtttca ttgatcctga agccgcccca acgatgtggc ttttcgtcgg aagagatccg agctcctcga tgcgcagtac agttggccgc attatgatcc aattggagaa ggcggttctt atgtgaagcc tgcatccaac accggtgcta ccaatagttt aaacgcattt tatgtgcgag cagagcggcc atgaagcttt cttacgatga ctaggcgaaa ctacatatcc atttacaagg cctccgaggt gagaacgagt tatctctatt gattcagatt gtcgagctat ccttgtcttg aatcgeagag tttacttgca tcaaatgccc ttcggtgcac atcaaacgtg tcttgtgctg aacttcgatt cacaaaatcc tcttcgctct cggccaggtt ggcggtcgca gcaagtctat cgatacgtat cttcattgtt gaaaatcaaa attgttgtaa tctccctgga tgttttgaac cgacgctact tgagcattga ctattccaat aatctgccac acaagctcgc accgcaagga gattcagcga gtacgtcgat gggtgctcag tgcccttgtg cactgtaatc cagctgcatg cgctctcaga tgtggctgca ctaccgattt taccaacggt cgcctcgaag tgtaccagga cacaaagctc agatataaca ccgtcccaga tattcgattg agacagaaac atctgcttct tctcccggta cgagggctta gagaggacgg acaatctgta cttgcgggaa gctaagacag gcacatgtgt tactgctatc ggattcaggc acccgcttgg cgtcagtaga ttgaatctct cgtatcagta ccacttccca gaatagccat aatatcaatt ctcggtgaag gggggggggg cagaagcatt ttcttctttt cttctgaccg gtgcttctta aatcccaaaa ggtccgagct gattccggct gatatgtgca ctcaatgacg fcfcCy ciCyy y t cagttacaaa attgccaagt gcctctggct ggattggacc aatgaggagt caacttcgcg cgcaaattgc cgacgtgctg accatgcaat ctcgctatgg gacattgcca ggagaagggg aaagagacgc gacatcactc gaccgcatga atgcgcatgc gatcacatcg gaaatcaaga gacgatgaca atggtacgcc cgcaaactaa gaaactaggt tgatgccttc acagagagag ataccgccag caatcaccga ggctctgtta cgcaacgacg cccactgccc tcataatgga cttccctggt actttgttgc cagaagtcag ttcagaccat ccagacaaaa
11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 122 4 0 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740
800 13860 13920 13980 14040 14100 14160
22 0 14280 14340
PL 202 457 B1 ggcttcactg aacccttcaa cttaactgca tttcgccaca actaactcga cgaggccggc 14400 gatggtgtta ccattcatga gctcaaagat cgacacatca acatggattt cagatgtgat 14460 ccagtttcga agttcaatgg cgacgagtga gtctacgccg acacctgcca ggtttttgga 14520 cgaggacatg tcgtcttctg ccagaccaaa cattcgcatc agcttttccg tcattgcttt 14580 gaggacgata gaaatggcct cgtcgtgaga ggtgaccctg cttagttggg cccgcacgcc 14640 atctggtcct tttttatgcg aagagacaaa ggattggtct gcatgaagga cttggcggta 14700 tttaagtccc acaaaccgct gttcctgtat ccagtttgcc tcggtccagt gagcacccgg 14760 ggatgtgttg attcctgtaa ccacagctgc gggaggtgat ggaaattgag gggaagaaca 14820 caggattgcc ttctccaaca catccatgac gtccttttca tgcataggct tgtaacctat 14880 tctagcgagc cggtcggcca caccacggcc agtttcagcc acgtatccaa cagacttgac 14940 catgcccaag tcaatggtga cagccggcat gccatgggct ctccggtggt gcgcaagtgc 15000 gtcctggaat gcaccagcag ctgcgtaatt ggcctggcct gccccaccca tgaccccaac 15060 aagggatgag agcatcacga agaagtcaac atcctgtgcg atcttgtgaa gataccaact 15120 accctgtact tttgggcgtg ttgctgcatt aaattcatcc aatgtcattc gcgatagaag 15180 cgcgtccttg agaaccatgg caccttgtat gatacctcga attggcggtg catgtgcttc 15240 ttcgcacaac cggagcacct tggtgacctg atcttgatct gagatgtcac atgcgtgtag 15300 atagacagcg cactgttgat tttgcaagct ggttatgaat ggactggcct ttgcacttct 15360 cgataggata atcaagtgct tcgcgccatg atcaacaagc cactgacaga tctgctttcc 15420 aattcccccc agcccaccag caactaggta agaactgtca ggcttcagct tcagcgagaa 15480 ccctccatcg ccgactggga ccagttcgtc cccagataca ttgaccacaa ctttgccaac 15540 atgctgacca ctctgcatcg tacggaaggc cttctcgatg tttgacaagg agtgctgctg 15600 gattggacca atcaagccaa tcgcttttgt ctcgaggagt tttgtgacat ggttcaacgc 15660 ttcggatact tcttcacttt tggctctttg ccacgagaga agatcaattg atgtgaaaga 15720 gacgtcccgg gtgaatggca gcatgtcaag tctgctgttt tgctccaggt ccttttttcc 15780 aatctcaaca aatctgccga attcggccat gcagtcaaag cttgcttgga ggagttgacc 15840 tgccaatgag tttagaacga catgaacgcc aagtccgccc gtgtaggctt tgatgccgtc 15900 gacgaataag tcattcctgc tcgagaagat atgatccgga ttgatgccga atttatcgcc 15960 gacaaagtca cgcttggctt gagttcccgc tgtgacgaag acctcggcac ccgcaagctg 16020 ggacaaaatg atcgctgctt gaccgacgcc tccagctcca ctgtggatca agactctttc 16080 gcctcgtcgt agctttgccg tggtataaag cgcaatatat gcggtagtga aagccagggg 16140 gaccgaagcg gcttctggga agcccatttc gtccggaata cggacgacat tagtgtacgg 16200 cgtctgtgtt ctggtcgccc aatggccttt cagtagtgca catacgcggt cccctaatct 16260 gaggccttgg ctagcggcag cagctccacc gagctttgtg atcactccgg cgcattcgaa 16320 gcccatcaca cggttggcct ccaattgacc catggcaacc atgacatccc gaaaattgag 16380 accgaaagct ttgggttcga tttctaccca atcatccgga agatccttgc cttcacgtcc 16440 ttcgtcgtct cgaaattgca gggagtctaa gagccctggc gtctcaacct ccatccgcag 16500 acgacgcccg ggttgctcga acggctgcag tgtgaectca accgcttctt ggtccttcca 16560 gtgcgggtca ttgaaaagtc gcggtacgtg gatgacgccg tttctctctg caaattcaaa 16620 ctccttgtct tcggaaaggt cgccgaggcg gccattgaag atattgcaga tagcatacag 16680 ggactcgtgg gtgtatgcgt ttcgagaagg atcgagatcc aacgatacat attccttccc 16740 gttattttcg ttgcggatgg tacgcagcag accaatatgt agagctttcc atggatcctc 16800 ggagctcatg gctgctcctc tagacaccca gagaagtgcg ttgcagttat tcagcatcgc 16860 ggtgatggat ttgaaggtct cgcttcccac ctctccaagg agcgaggact ccatttcccc 16920 aagaaaaatg catgtccttc cagtggtatc tacctcgccc agagcgttga tcgatgggct 16980 agaactggtc ttttcacaaa ttgctgcctg gagactttcc agccaagatg aaggaggtcg 17040 gagcgctccg tgcagcaaaa gcacctccga ttctgccact gtatccgggg ttgtattctc 17100 ttttctagcc gtcgatagca ttgtgctgat catgtaaaac tcatcgtctt cacaatcacg 17160 aacctccaat tccacaccgt tgaaaccgct cgtgtccaac atggtgttcc aaagatcggt 17220 agtgagcgat ggcgtcgact tccgctcagg ctcctcactg agccaccaac ctggcaacag 17280 tccgaaggta aagaacaaat cgagctgatc cctggtagtc tcaaccaaaa tcaagttgcc 17340 cccaggcttg agcaattttc gaacgttact cagtgttcgt ttcatgcatc gagttgcatg 17400 caggacctgg caagccacga ccacatcgta ggtggcacat tcaaaccctt gttgctcggg 17460 atcgctttca atatccaatt ttttgaaagt catcacgtct tgccaatccg caaattgctc 17520
PL 202 457 B1 acgcgccgac tcgaaaaacc cggcagacac atcggtgaag tcataacgat cgatcggctt 17580 ggtgtttccc aatgcattga caataagctt tgtgcagccg cccgtgcctc cgccaatctc 17640 caaaatgcga gaacgcgggt tcttgtgggc gcaaagtcgg atcagctcgc tggcttgtgc 17700 gtttgatcgg ctccatttga ttgcgttgac gtagtatctg cttagcagct gatcttgcat 17760 catcaactca agtggctctg tttcgcggcg tagcattgct attaactgag gtcctagacg 17820 agaaatcatc tcgccattga cgctttctcc agcgactctg gcctgtaggc atttcttctg 17880 ctcagcatcg tcacttagcc agtcgcaact ggctgggctg agcttgtttt gtctcgcaag 17940 gtccaattgg acattcatcc aatcgaaata cttctgaagg tggccatcca gatgttggat 18000 atcagaattt gtcaaatcag tgacagcctc ctgtataaag ttgatcgtgc atcttcggag 18060 gCccatcatg agttccgttt ctttcgtctc agcctcagtg ctcaactttt ctttgagcca 18120 agtggagtca cccaagctga tgtcaggggc ccaaacccag gagctgcagg cattttctgt 18180 gtcgttggag tctgactttt ggtcagagaa gctgcttcca accgactgga aaacaaggcc 18240 ttcaatctct atgactggga ttccgtccga gggagaagaa ccgctatcat agtcatcaaa 18300 cactgccaag tcggtagaga aggattgaga gttgcgatcc ttgatgctgg cctgtgcgtc 18360 cagagcatca ccagcctcca agtcagccag gctagaggat attttgacat ttcttagcct 18420 ccttggtacc atggccgttt tcatacgtgt tcccgcgtag ggtaacaccg tgtatgccgc 18480 ctggatcacc gagtccagag tagtaggatg gacgatgtgt cgattctcgt acgagtgagg 18540 catagccgag gcagtgtcag caatggaaaa tctgcaaaac gagccctgtc cattyttttg 18600 aattcgctga atgttctgaa aaatgggtcc gtggcatatc ccattcgcgt gtaaggactc 18660 ccagagatcg ttgggatcaa tgctccggtt atctgagcct agattcaacc tgcgtgaggc 18720 ttccacagtt gaacagtcaa ggtggcttct ttcgctctcc gaacgtatta atccggtgca 18780 gtgttctgtc caggtattat tttcgcccga aattgagtgc acagaaaatt gatgccagtt 18840 ctttgtgccg agggaccttt cctcacatga acggatcgtt aggcgcaggt caacctctgc 18900 ttctgcatca gcgggtatta tgagagcctg cgcgagttca acgtcacgca agttgtagtt 18960 gatgctagcc cccgcaactg gtgggcagac ttgtgaaaac ccctcgatgg ccatgctgat 19020 gaagccagct cccggaaaga tgatgctcga accaacgacg tgatctcgta tccatggaat 19080 atctgacaga cggagaacat gtttccattt aggcgcgaaa tgaggagaga gagattcccg 19140 tgagcctatc aaagtgtgag gcggatgggt tctctgtttg gactcacgac Cgccgcgagg 19200 ctctctccaa taacgggttt ggtgattcca cgggtacgcc ggcaaatcgc tcagtacctt 19260 cactctgggc tcttttcttc catgaggaaa gtttatagcg tccattttga gcccataacc 19320 cttgcttatc aactccgtag cagcacgata cattgtctcc aacgagcttc tgccgcgaga 19380 aaggcaactg agatagttta tatctgttcc tttcagaccc agatcctgca tgacttggtt 19440 gattggacca ccaagcgctc cgtgaggccc tatttcaata atcacatcga cggctttctc 19500 tttggtgttg ggatcaaagc acatctcgcg gagtgaggac tcgaactcta ccggctgtag 19560 catactatcc atccagtgtg tgggatccaa tagcaattta agatcggtca tgcgactacc 19620 agtcttaggt gatgaatata atacaccctt tgaggtgtca gcattgggat tgtcgttgtt 19680 gttatccgag ttgaacagat ctctcagtga cgccccaaag gcatctgcca ttggtcgcat 19740 gtggcttgaa tggaaggctt cagtgacttt cagtttcctg gtaaagatgc catcggcgtg 19800 taacaacttt tcaagtttct cgattgcacc caaatctccc gacaccgtca cactacattg 19860 actgttgata catccaacca ccacacagcc gtcctcctgg ttgagacgcg aaatgtaaac 19920 attggtctca ctgcgaccaa gacccaccgc catcattcct cctttggctg ccaatgcggg 19980 cttgggctta gtggtcaata caccgcgtat ataagtgatc ccaatggccg accgcgcgga 20040 taaagcccca gctgcgtagg cagcagcagc ctctccactt gagtgactgg ttatccccgt 20100 tggccgaatt ccccatgacc aaaggagacg cacaagtgca atttggatag cggttgacag 20160 tggtagactg tattcggcat catttacccg agtcgtcagc tcatcacggt ggagctcctc 20220 tgtgcaattg aatgttagta cctcaagctt gatacagtat tacttttccc gggctcgcaa 20280 cttacccata aaattccaac tcgcgcccag ttgcttgatg tagccatcac attcaagaat 20340 cgcctgtttg aatactggga atgtattgac cagctctctg cccattgcat gccactgcgc 20400 cccctgaccg gtgaatacaa atccgagccg tactttctca ttcgctcgtt ttggttgatt 20460 ggactcatcg ctgagggcag aaacaaggcc gccaaggctg tctgctacat acactgacgt 20520 ccatggcaga atggaacggc gagagcctag tgtataggcg aggctggcga ggaagggttc 20580 cccgtcaatg tcagcgacgg atttaatgta gtctcgcagg cttgctatcg ttcgccgaca 20640 agcttgctcg tccttggcac gcacaacgta tatgcggctc tgtttggaac catcctcaac 20700
PL 202 457 B1 cctaccatgc tcagagttac cattgacatg cacttgatcc tctggcaggg ccaatgatgc 20760 gcgatcatat gattccaaaa tgacgtgagc attcgaacca ccaaagccga agttattgac 20820 agatgcgcga cgagtcccat ctttcacagg ccagtcttga gcagacatgg ggatctttga 20880 aacattaacc tttgaaacat ataactgaat ctgcgaatgc gcaaagcctt accttgatgt 20940 tcttttggtc aagcatcagc ttgctgttct tttgcaggaa ccgcgcatta gggggaatca 21000 agcccttctc caaggccaag gccaccttga ttatactggc caggccactg gcggcttctg 21060 tatggccaat atttgctttc acagagccaa ggtgcagagg atgtccttta aaagctgctg 21120 aaattgctga gatttcaagg gggtcaccag ttggtgttcc agttccgtgg gcctccacgt 21160 acgaggtcaa cgacatatct agcccagcct tatcgtaaca ctcctggatc agacttttct 21240 gcgccacatc actcggcgca gtaattgcgg gtgttttgcc atcctggttc agcgctgtct 21300 ctcgaatgac ggctcggata gggtcttggt ctcgcaacgc gttagggagg gcctttatta 21360 ccagagcggc aattccttcc ccgcgaccat atccattcgc tcgaggatca aaagagtacg 21420 agataccatc cggggacaaa aatctgtcat tgagcaacaa ggattgctta gttcaagact 21480 ctcgatctgg aatcttcttc ggaaaactca ccccaggttt gacatcgtaa caaaaacatc 21540 gggattgagc agaagatttg caccgataac gatggctgta tctgactccc cagtacgtaa 21600 gctctggcac gccaagtgca gtgcggtcaa tgtcgtcgaa caggccgtgt caaccgtcac 21S60 gctgggaeea cgtaagtcgt agaagtgtga tatccggttc gaaagcattg ttcctgagtt 21720 gccagttatg aaataacgcg gaactgtctc ggggtcacga ttgagcgaat cctgatagtc 21780 gtggtacatg acacccccaa acaccgacgt attagagcct gccataccat cgatggtgat 21840 accggctgga tgatggtcag tgacgtttgc ttacagtgag gatgacccac actacatacc 21900 actctccagc gattcgtaga ccacctcaag cataagccga tactgcggat ccatgcactg 21960 tccaatatta gatctctgcg tcccgggtta gatcaattga aataatcata cgctggcgac 22020 ctctgtggtc atgttgaaga acgcggcgtc aaataaagca ggatcctcgt cgatgaagtg 22080 tccacccttt acgtgggtct atccagtcat ccttggagtc agtaaccaag cttcagtgat 22140 gctcaaatct tgtgtcaaat attcaaaaca agatataaat gcatgcatgt tagatactca 22200 cggacccgac cctttcgcca ttcgggtggt atactcctct cacattgaat cgcgaggagg 22260 ggaccttaga ccaggcactg cctcctcttt caaccatttc ccaaagcttc tgtggactcg 22320 ttgcatctcc agcaaatcga catcccattc caactatggc aatgggcgtg gatgtgttag 22380 agcaagccga gcctgccatt gcggttgcgg ttgcggttgc ggttgcggtt gcggttacgg 22440 cgggggtatt gttcattcca acgttgtttc attgactgat atatcagtcg ccctggtgat 22500 aaaaccgttg atagtcttcc aacagtctac aggtccctgg catagctata gatgcataag 22560 ctgcccccga cacgtgattc atagttcggg gtttgttttc atcttggacg tgacacgata 22620 ttcgctctgt gcccatggga aaccccggac caccatgcta tgctcggggc aataccttag 22680 aggtaccggt tcgggaggca ttgtctgtcg tcacgataat cccgagtcaa aacgccgatg 22740 ggaaaccgtc gaacaagacg aaacaggtca ggccggccag gtagttttcg ggtataatgg 22800 aggctgtcag aatccgatac tccgtacaca gatgcgaaat acgcatacga gctatcaaac 22860 caaacgaatc caaaagcctt ggaaaagctt ggaaaggctt agtgggtaat cctgtcccaa 22920 ggtttgttga gggcctgagc gcagggtggg tcctgtaagc agttggtaat tcaatttcca 22980 acaatacaca atccccaaaa tttgcattat cggttgacta agacaagcaa acaaaatata 23040 tgcaggaagc gcaattcatc gcgagcaaac gatcatcatg agcatgtgac cctttcctct 23100 tttttctact tcggaaggcg gcatgatcat ctgtcagaac tcccaatcgg gagcaatacc 23160 ataccttacg gcaccccact cagacccatg cacaaagaaa atccatgcgc cgaatattga 23220 agccttggca acaaagcccc gtgtaactcc gaaggtatcc aaagaccgag agacgccgat 23280 ttgagagaca cgtacggagg tccacacaaa atgttcccga gtctatacac tatactccaa 23340 actgacttct tgtctacctg ggtatcttgt tcaggttgct gtttactgag ataaatgata 23400 ccgggggggg gggggggggg gggggttgac actggctttt cgtggacaga ataataccca 23460 tacatccctg cgtaagtagt cgtttcgaga agaatgtgtt tcgtggtgca ttactccgta 23520 ggcacaatat atttccattc ctcacgaagt ggcctcgtcc gggcgtgatc gatgcagctt 23580 gccgccccac caaaaaagga ccacaatacg agtcagatta gaaacgtcta acaggacgtc 23640 tatgtaagag gacgctcctt tgtatgtcgg atctaggcat gacaaaataa ctatacctag 23700 gtagtgttct gtcttattgg tcatttggcc tactttcgga acaatcttgg aagttcacat 23760 tcctaggtat cagggcaatt gattggtgtc cccagaattc ttttttctcg aataaaggat 23820 aaatttatgc ataaaaacct tggaaactga gcatagttat gagcacaaat actagttttc 23880
PL 202 457 B1 agtgcaattg agttgacacc aatctttccg tcccgtacct ccaatctacg tggaggtatg ttgcagagct tgtagcacag aatcaatgaa aatttctatc tagctagtac ttgataaagc agaatggctg atcaagcact caccattcct gccctttaac cgccggaact * .~r~^ rr.', r-Tiracacaaaacg tcaagagcgc tgactttcgt caagcgtcct taggggttcc ttggctttga gaaagcccca tcaattacgc tggtcgagat acttctgtgt acactgcgat ggtacgcgtt atgatgccca ttccgaagtt gctccaccct aaagtctgag gactagatga tcgcccccat acgagtatgg tcctctccaa tcaaggccgc ttgagcttga caagtctcca atgcctcatt cagccactag agaacacaat ttcccgggta gctctatcat agctgccgta ttggctatat atttcattcc aggcaatcaa gcccgtgtgt cggacgtcgg tacaaagtat gtcctactat ggtcatgaat ctgcctcagc aggaactgtt acggcagatt cactttatct gactagattc acctttcagc tcagcagcac caaaacggcg cacatacgtt agaatggggc gaagtggcag aatgaccttg tgctcccctc cgcctattcg cgtggctgct a h ł· n a h ± λ ca.
cagccttgct tcaaacgctc ctcactcttc tttgtcgtca gatgagcatg gaagagcatc gaagatacag cgtacgaagc ectgctccta tctagctgca tctgtctatc ggaagatgag agacagtgca caaattctgg tttccaagcc cggatcggcc actacttttc caagtacgaa agttggtgga atgggtgttt cagactggga ccaggccgaa agctcctcag agtcttaatt tgaacttccc cagcgagttg tgccctagag ttcgaggaca cgaaaactac gccagtccct tatggcaacc cctcggtggc gaagtttgat ccagaccgta gcggacaact cctttgcttg ccattcataa ctcaggggcg cagttgtccc atacctaggc caagccctaa ttttctcaga atggtcgctt cctctacgct tgtctacacc ggactactca tctttggtcg agcttcgacg gtattcccgg cctgtgaacc aaagataaag gttcaagaaa atggaacgcc caatgggtgc gacgtggttg ctcagcatga acatttgcct aggttgctat actctgacca tctgaccagg gccattcggg gttatcggtg ttgatcctgt aagctcgagg ggtctcagtc cgtacatatc atggtcgttg tcttctagtg attaaacccc caggcaagag ctagagtatc aaaatggtcg gtggcacttg atcaaagatc agcttcaacg accagagtgt aaagcatctc gtgtctcgca aacgatgagg aagagtctca ccggctaccg gcctgggaac gttggcgtcg accgagggcg ggtgccgtga gtccttgaac atgaaagaag atcgccggta
gtacccctta | ccaattatac | cctaggcagc | 23940 |
aggtggacca | gatgcaggga | taaggaagcg | 24000 |
cgcgccattt | gttattttct | tctactcatt | 24060 |
tcccaacccc | ttgggccgaa | caaccttcct | 24120 |
gcctaaccga | ttaggttgct | cattcgattt | 24180 |
ttcccaattg | aagtgctttt | ccgtccccat | 24240 |
gactacctag | ctataggtac | cactccaagc | 24300 |
cgttgctacc | ctctcgcttt | cgcggtaggg | 243S0 |
cgggaaatcg | ggcattgacc | tccacactcc | 24420 |
cgatccatac | cgtttgcacc | atagctattc | 24480 |
aagacagctt | cttccatggc | cccgcaaacg | 24540 |
aaggaagtcg | aagcttgatc | accggcccac | 24600 |
gggatgcaga | tgttctcgga | gatttcaacc | 24660 |
ggtcatatgg | ggttgcatct | caagcagcct | 24720 |
tatctgtgat | tgaccttccc | tcaacgtcga | 24780 |
ttttcgcctt | ctctgtggaa | tacagcagcg | 24840 |
tccccaacaa | cagtgccgac | ctgaaattgc | 24900 |
O \ U < 4” u—r/·« — +“ L---J uyyat | catgaaggct | yCCayyyCtC | 2 4 960 |
acgatacctg | gacagagtct | cttgatctta | 25020 |
tcatggtgct | aggttatata | tcaatgcact | 25080 |
aaaaattggg | atcgaaggtt | tggctggcta | 25140 |
ttctcctcgg | tctcgacgtg | gccataagac | 25200 |
ccgaaggcct | ccccttcttg | gtggtgatcg | 25260 |
gggctgtttt | gtcctatgct | gtgcagcacc | 25320 |
gtagcgtgac | agccattgct | gaaagtacca | 25380 |
agaagggtta | caatatcgtg | tgccactacg | 25440 |
ctgtcttagg | catccaaggt | gggctacagc | 25500 |
tctttgactg | tctgctgctg | tttacattct | 25560 |
taaaccgcct | caaacgtcat | atcaacatgc | 25620 |
agcggacggc | ggagagtgtc | gcgaccagca | 25680 |
tgtttggcaa | tgatatgaaa | ggcagcagtg | 25740 |
gtttccttat | cgtcaacctc | gtcaacatcg | 25800 |
gatcgttgtc | cagtatatca | tcttggaccg | 25860 |
cgcttgagcc | cttcaaggta | gctggaagtg | 25920 |
ggcgcggtca | atcgactatg | gtcactgtcc | 25980 |
cttccattca | ccgtggtacc | tcgcagctac | 26040 |
gtagcctgct | caccagcctg | gaagatcccg | 26100 |
ccctaagtgt | cgctctgaac | agctatctgt | 26160 |
ctaatctccc | gagtcaccca | gttgatccag | 26220 |
ctgcccagaa | ccagacccct | cagattcaat | 26280 |
tcactcctac | caccaccgac | agtgacagtg | 26340 |
taaaggtcac | taagcgagca | gaaggaaaga | 26400 |
cacaaatcga | actggacaat | ttgctgaagc | 26460 |
atgtcgttgc | cttgtctttg | cggggaaagg | 26520 |
aagactgcac | tcgtgccgtc | aaggttcgcc | 26580 |
cagagcttac | aagtatgctg | gagcactcga | 26640 |
gcgtgctcgg | tgcatgttgc | gagaacgtta | 26700 |
ccggtcctat | tgttatcgac | ggcaagagtt | 26760 |
tcctcgtcgc | tagtgctagc | cgtggcagta | 26820 |
cagtcctgac | tggcgacggt | atgacacgag | 26880 |
gagctggtgc | tgctaagatc | tggctcgatt | 26940 |
ccttcaattc | aaccagcaga | tttgcgcgct | 27000 |
ctcacttata | tattcgattt | aagactacta | 27060 |
PL 202 457 B1 ctggcgacgc tatgggaatg aatatgattt ctaagggcgt ggagcatgca ctgaatgtta 27120 tggcgacaga ggcaggtttc agcgatatga atattattac cctatcagga aattactgta 27180 cggataagaa accttcagct ttgaattgga tcgatggacg gggcaagggc attgtggccg 27240 aagccatcat accggcgaac gttgtcaggg atgtcttaaa gagcgatgtg gatagcatgg 27300 ttcagctcaa catatcgaaa aatctgattg ggtccgctat ggctggctca gttggcggct 27360 tcaacgccca agctgccaat cttgcggcag ccattttcat tgccacaggt caggatccgg 27420 cgcaagttgt ggagagcgct aactgcatca ctctcatgaa caagtaagtt gaaagcggcc 27480 gcttacttgg aaacattcac taatcctgtt tagtcttcgc ggatcgcttc aaatctctgt 27540 ctccatgccg tctattgagg ttggaacgtt gggcggtggt acgattctgg agccccaggg 27600 cgcaatgctt gacatgcttg gtgtccgcgg atcacacccg accactcccg gtgagaatgc 27660 acgtcaactt gcgcgcatca tcggaagcgc tgttttggct ggggagctct cgctatgtgc 27720 tgccetagcc gccggtcacc tggtcaaggc gcacatggcg cacaaccgtt ctgccccggc 27780 atcttcagcc ccttctcgaa gtgtctcccc gtcaggcgga accaggacag tccctgttcc 27840 taacaatgca ctgaggccga gtgctgcagc tactgatcgg gctcgacgct gattaggtcg 27900 gaatcttagg agcattccaa gctccgtacc ccctccagtg gattcattgc aggaggatca 27960 tattttttct cattggttgt tattgtcata attttcaaaa gcacaatgca atgagacagg 28020 caggtggtag agtgaacggc cagaaagggt atctcatgtt tatatgttgt tgaaatttac 28080 gatgcaagta gtagggaaga agaatatata aagagatggt ccttttccag agagtgttta 28140 ggtctgatcc ctcataatta tttaatgagt gaaagctttg ttcaagctat aacttactga 28200 gtaggttgaa tgttgatctg attcattcct gaggtatcag gattgatgcc tgaaacatca 28260 atcatccatt gtcagatgcc gtaactaact aactatgaat ctcaacatag ttatatgttg 28320 ccaatctagc cacggtgact agaaccttga gatggactta gactagacat gggtcgcggg 28380 caatgacata tagaatcttt gaaatcgaca ttaattaagt atgtggagat tctttgtgga 28440 ggcacggtaa tgtgtctatc tagcaacgcg gtcaagcatc agtctcaggc acagcccggg 28500 tgtcgttttt ggttgcaatc ttccgccatc ccattccaaa ggcaaacaca aacgtgcacg 28560 ccgtagctcc cactgctaag taaaaagtat gatcaacggc gagactgtaa gcttttacaa 28620 cccctggaag gttattcttg ctgaccacat ctctgaagcc agtcgcccct gctgccgtca 28680 cggcctgcgt gtcgacagtg ggcgcatact tgctcaggcc agttctcaaa ccggacccaa 28740 agacaaggtt agcaaagtcc aggaagagcg atcctccaaa cgtctgtcca aacacggcga 28800 gagaaattcc gagggcacct tgttcgggcg aaagcgtgct ttggatggcg atgataggct 28860 ggccattgag tattgatgtc agcgtctagc ggttgcatgc tcttcttgct ttgatacaaa 28920 gccgaaagcg tgagagatga tcaaaggttt catagcttac cgtttgcatg ccacaaccac 28980 gaccgaagcc cgcgataaat tggtacatga cccatttcac agttgatgta tggggctgga 29040 aggtggatac cagacctgcg cctatggcga cgagaacagc gctgcctagg gcccaaggca 29100 aatagtatcc tgtctttcca actggtgcgt catatgtcag tatacacgat atccaagccc 29160 gatgtcagac ggttgtggca agaaaggagc catagaaatg gacggggtgg agaaaaatgt 29220 gtacgcgagt ttcacttact tgcgaagcca gaaaccatag ccataatgac ttgtccaaga 29280 attccaggca acatgtacac accactcagt gtgggagaaa catccttcac agcctggaag 29340 tagatcggta gatagtagga aaagacaagc aaggagccag agaaaaagcc cataaataaa 29400 caagagcacc acacttgtcg tttaccagcc actgagccag gaatcatggc aacagcatcg 29460 ccaacatgac gctcccatag cacgaacgca atcagagcaa accctccgcc acagaacagg 29520 ccgatgatga cggaacttcg ccaggtgtag gtcgaccctc cccattctag tgcgagggaa 29580 atcatggttg cgaaggctgc aaagaccaca aagcctacaa ggtccagttt gcgaagtgtg 29640 gattttatgt tggccattgg tttgtcggtc gagagttcgc tgtccgtgga tgaaattcgg 29700 tcgggtatgg tgatgacgag aaggaggaat gcagcgacag cgccgatggg gagattgata 29760 taaaagcctg aattccaagt gagaacatgg acaacaatca taaaaaggcc aaaggtcaac 29820 atacaccatc gccaagtggc gtgttgagtg aaagcacctc cgagcagtgg tccacagaca 29880 atggcaatct gactaactga aaacatattg tcagacgacg aaccgttcgt ttggggtaca 29940 tcagatcttg agatgacata cgacccatca tcactccaat caaaacttca tatgcgaggt 30000 cagcgtgtac acggcaccca gcagacttcc aaaaatcggt tcccttacct ggttgcttgt 30060 gcttaggagc agctgttgag aggattgtga gggctccgtt gacaagacct gagcctccca 30120 ttccagcaac ggcccgccca acaatcaaca tggtggaaga tcttgcggca ccgcatagca 30180 ccgagcctag ttcaaaaata cagaggaagg caaagaaagt gtacttcaag cccaagagtg 30240
PL 202 457 B1 tatacaattt accggccagg ggctggagag cacagctaaa tatgatgtta gctaatctgt 30300 tcgtacaatg aacaaggtca aggagaacag agccatactt agccagaaga taagcactgc 30360 cgtaccaccc tacatcgttc agagagtgga actcgcttgt gatatgtggg attgcctgtg 30420 gctggagtca attgactgtg ctgcgctctg ttctgaggta gccaccatct taccgtgacg 30480 ataatggaca tatcaaggag catcaaaaat gctacgaaag taactgaagc aaccaccagc 30540 ccgagcttga ggcctgtgat gtgctgggac ttggactcag tcgcttcgag cgtgtcattt 30600 tgactttctt ccttctgtgg ccttggttcc ccttctttag ggggtagagg ttctgacatc 30660 gcgcaattcc ttccgacttt tgcttcaagg ggcggtgtga atctctactg cgcggcgctt 30720 ctatagtacc tgtgttttgg tgtatgaatg atctcgctct cgttgtttcg ttaaggtccg 30780 ctagcctgaa gtcagattga tggatgggga tcaggggaaa ttggcgacgt ctttaatttt 30840 gcttttcttt gttaccggaa gtgttgcggt attagcgtgt ctgggcttat ttacgacgca 30900 caagatgcat tgaactggcc ccactgctag atctcactag tattgtggtt gtaatttacc 30960 tatactccat attgactggg caggttttga acacaaccca caccccccca tactacacat 31020 tagttttgca tattttcctg ggggccaaaa aaaccccaaa aggcttcaat attttgcggc 31080 caatggagag tgtaactaat ttggcccaca ctccggtggt atcaatcgga tctcactgca 31140 tatatgatga aagcaagagg gggcaggaga tacgctcttt attggctgtc tgcgcgaagc 31200 tggacaaatg caaataaaaa gacaaacaac cagctggaag accgggcgac aaacatggtt 31260 tacctaacac cctcgatccc aacaatgtgc atgttaatca atgtgctccg tggggagtat 31320 gaactataac atacgaagca gccattcatg tcaaaaaaaa aaccaggcga atgggcgtcg 31380 tcaacggttt cacataagta ctatattgta ctaactaccc gtgagactgg agagaacagt 31440 ctcgcgcgaa gaaacgataa gagcatcggt catatcggtc catctcggtc taagtgtatg 31500 agaatattcc gacgtgaatc catccgtcag tgatcaatgt ctccaagtaa ttcatcattt 31560 caattaccct cgctttactc cgtagaatac aagaccttac tagcgcaaac aagtgggggc 31620 taacggtgtg atctccttcc gttgcggccg ccacctcggt tccagccgta atacgacgac 31680 ccgtctatcg cgacccccta gccttggcca tttttggcgt tacagtaaag ctttggagag 31740 aaacgccaag ggaaaatgct agccaccaat tctataaatt actcttcaca tgcagctagt 31300 atcactggta agtctacggg gcacatgtaa aatttttatt actttctaat aatctttcca 31860 agttcttttc cacggggccc caatgcttaa aatactcaaa agacgtgaaa aacctgcaag 31920 ccgccagtga tatcacacgt aatgcctcaa cagcctgatt ccgagccatt atatgctgtt 31980 tgatgatctc aaattgagat ggcgagcget ggatctggga aattggtagt gggattggta 32040 tagaaacgta agtgcagaag accatgtaat aagtacatat ggaggctatg tgatggcccg 32100 atctagtttc ttcaatatag cgctgggtat aaaaaaaagc aggggctttc tcagggtaat 32160 gtcgcagtct acaacgagtg gcgtccactg acagggaaag gcgagcgggg ctatgctacc 32220 ttcaatttcc atagaggggg gatgcaccat ctccgacaat ctatagttac tcaaacaggt 32280 acggtactaa gcaatattgt gtttcttcgc taatgcgaat atttccttat agcaacgtcg 32340 caacacattt atcgtcttcc ctgaggcctt tgttgacttg ggctcttcgt ctccggcttc 32400 gtcactccaa agcacagata ggagacgaga ggccggcgtt atggttttat tttcagcgcc 32460 aaggatttgc cacgatgtgc ttggcatatc tgataggacc tattccccct ctcccggtca 32520 gcgcattgct gatgtatgca agggaagaaa agactggtgg ttatcggtcc cacttactag 32580 acgaatagat gccgcagccc cgtgctcctg tgctatcccc aaagcagtct caatctcact 32640 caatagtcga aggcttacac gcaatgtcgt gcatgcagaa gataaggcgt gcatgaatgg 32700 gtcgagatgt gaaatgagct cgccgatatg aagattagag tgaaacgagg gaagtgcttc 32760 ggctcttcca ttgtcatttc tagtggttga gccagaccag taccaatcca ttcgtgtgct 32820 ttgcttttgt ccacaaggtt gggctttcat cacctcggat agtagcagct gggaaagtga 32880 tgtcatgatt ttgacagaca acatgtagca atgcaccgcc atgaacaagt tcttggtttg 32940 cagacaccca tctaacatgc tgctattgct gctcgtgatc acacgttctt gaagatgtag 33000 tagcaatcta ccaaaggcat tcaaaaagtc ccctatcggg tctaggaaga agctttagcg 33060 acaatcaaga ggcagtaaac aggcagaatt gaaaatctca cagcttaaaa ttttttgctt 33120 gggccattcc acagtcaccc cgtggagtat tacctctagg tcctgtgaca catccgacag 33180 actttcgaaa aggtctcgtt gcgtgttgct tgtgttggat tgtccggatg acgagttccc 33240 ctctacttcg aggtcaaaca gcgatggcga gacaggcgcc gttgcatcca aagggccttc 33300 aaagtcgtag cctagatctg gtatccccga agattcattg ctgttggcat cgtcgcgaaa 33360 tgtatttggc tgaggccagc cgccgggaaa cgactcggga tcatcaaagt tgattgatgt 33420
PL 202 457 B1 atcatagaat gccaatatgc cgtagaagat ggcttcttta ttgttgacaa cttttgtgca aatcgttgca ctttgcatgt agttcaggtc gacaccaaaa tagcctctgc gtattacact atgccagatg atc <210> 2 <211? 342 < 212> DNA <213> Pen tgcagggttg gtaggtggtg gtcgcggtca tgtaaattgc cgttgacact tgacaccggt tgcggcaggg tcctggatct gtcttgctgg gccaatagtc tcttatgcga agaaagagtt aaatacctgt cillium ci ccgctgatgg agcagtaagg tcggttgtga gcttgggtag gagcacggac cacatgagcg acataattat ttatgtattg aagacttact ttactatgaa gctcatcaaa ctaaaagaaa aacgtggggc rinum ttctgataat tggaggagtc ggtttctgtg cctttcgctg taaattggca tcgaaacgcg tggattaaga gaattggaga aagttatatg tgtcttttca gctgggcata tagattcggc ataaaaaggc gtttccttga tctgccaatg gctcttgtag tacacacacc ttgctaccgg cgacggcgta tcaaataatg gtaagctcgt caaacaagtg gtcacccgga cataccccat cccccatctg aggctctagt gtgccgaggt atgagaagac ttccagctgc ttaatccggc tacatttgag ggttcgtcgg tgaggtgaga gcaggagata ttttcgagcg gaaatactct ccagcgccac gctatcatat ctaccagcag
33480
33540
33600
33S60
33720
33780
33840
33900
33960
34020
34080
34140
34200
34203 <400> 2 gatctgctgg catatatgat tacgtggcgc ctaagagtat gtccgctcga acttatctcc aagtctcacc attccgacga aagctcaaat caagccggat gccgcagctg acggtcttct ggcacctcgg gatacatcaa acatttcgcg tttgaaggcc gaggggaact agtctgtcgg cccaagcaaa tgtcgctaaa ctactacatc ctgcaaacca acatcacttt caaagcacac gccgaagcac gacccattca ttgagtgaga cgtctagtaa cgctgaccgg cttggcgctg gacgaagccg ttgcgacgtt tagactagag agccagatgg tggatggggt ttctccgggt aaacacttgt tgcacgagct tcacattatt acctacgccg gtaccggtag taaggtgtgt gaactacaag catcattggc cactcaagga tcaactttga acgatgccaa ctttggatgc cgtcatccgg atgtgtcaca aaattttaag gcttcttcct ttcaagaacg agaacttgtt cccagctgct gaatggattg ttccctcgtt tgcacgcctt ttgagactgc gtgggaccga gagaggggga aaaataaaac gagacgaaga gctataagga cctgcctttt ggggccgaat atgtatgccc gactgaaaag ttgcatataa tactctccaa tgatcttaat tcgcgcgttt caatgccaat gtacagcgaa agccacagaa agagactcct aacattatca tgatcccgag cagcaatgaa aacggcgcct acaatccaac ggacctagag ctgtgagatt agacccgata tgtgatcacg catggcggtg actatccgag gtactggtct tcactctaat atcttctgca tttggggata taaccaccag ataggtccta cataacgccg gcccaagtca aatattcgca tatgccccac ctatttcttt agctttgatg acattcatag cttagtaagt ttccaataca ccaataatta cgacgctcat ttagtccgtg aggctaccca acctcacaac ccaccttact gaaccatcag tcgtttcccg tcttcgggga gtctcgccat acaagcaaca gtaatactcc ttcaattctg ggggactttt agcagcaata cattgctaca gtgatgaaag ggctcaacca cttcatatcg tgcacgacat gcacaggagc tcttttcttc tcagatatgc gcctctcgtc acaaaggcct ttagcgaaga gttacaggta tagaactctt agctcgcata taagactatt cttccagcaa taaagatcca tgtccctgcc gtgaccggtg ctcagtgtca agcgcaattt cgatgaccgc gctcaccacc cggcaaccct gcggctggcc taccagatct cgctgtttga cgcaacgaga acggggtgac cctgtttact tgaatgcctt gcagcatgtt tgttgtctgt cccaaccttg ctagaaatga gcgagctcat tgcgtgtaag acggggctgc ccttgcatac caagcacatc tcctatctgt cagggaagac aacacaatat tttcatctgg tctagtgtaa agagcagagg ggcttttggt gacgacctga ggaacatgca gcatgcaacg tcatgcacaa acgttgtcaa acataaagaa gacatcttct tacgcatatt gcaattctat tcagccaaat aggctacgac cctcgaagta ccttttcgaa tgtggaatgg gcctcttgat tggtagattg agatgggtgt caaaatcatg tggacaaaag caatggaaga ttcacatctc ccttcgacta ggcatctatt atcagcaatg gtggcaaatc gctttggagt gataaatgtg tgcttagtac
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
PL 202 457 B1 cgtacctgtt tgagtaacta tagattgtcg gagatggtgc atcccccctc tatggaaatt 1980 gaaggtagca tagccccgct cgcctttccc tgtcagtgga cgccactcgt tgtagactgc 2040 gacattaccc tgagaaagcc cctgcttttt tttataccca gcgctatatt gaagaaacta 2100 gatcgggcca tcacatagcc tccatatgta cttattacat ggtcttctgc acttacgttt 2160 ctataccaat cccactacca atttcccaga tccagcgctc gccatctcaa tttgagatca 2220 tcaaacagca tataatggct cggaatcagg ctgttgaggc attacgtgtg atatcactgg 2280 cggcttgcag gtttttcacg tcttttgagt attttaagca ttggggcccc gtggaaaaga 2340 acttggaaag attattagaa agtaataaaa attttacatg tgccccgtag acttaccagt 2400 gatactagct gcatgtgaag agtaatttat agaattggtg gctagcattt tcccttggcg 2460 tttctctcca aagctttact gtaacgccaa aaatggccaa ggctaggggg tcgcgataga 2520 cgggtcgtcg tattacggct ggaaccgagg tggcggccgc aacggaagga gatcacaccg 2580 ttagCcccca cttgtttgcg ctagtaaggt cttgtattct acggagtaaa gcgagggtaa 2640 ttgaaatgat gaattacttg gagacattga tcactgacgg atggattcac gtcggaatat 2700 tctcatacac ttagaccgag atggaccgat atgaccgatg ctcttatcgt ttcttcgcgc 2760 gagactgttc tctccagtct cacgggtagt tagtacaata tagtacttat gtgaaaccgt 2820 tgacgacgcc cattcgcctg gttttttttt tgacatgaat ggctgcttcg tatgttatag 2880 ttcatactcc ccacggagca cattgattaa catgcacatt gttgggatcg agggtgttag 2940 gtaaaccatg tttgtcgccc ggtcttccag ctggttgttt gtctttttat ttgcatttgc 3000 ccagcttcgc gcagacagcc aataaagagc gtatctcctg ccccctcttg ctttcatcat 3060 atatgcagtg agatccgatt gataccaccg gagtgtgggc caaattagtt acactctcca 3120 ttggccgcaa aatattgaag ccttttgggg tttttttggc ccccaggaaa atatgcaaaa 3180 ctaatgtgta gtatgggggg gtgtgggttg tgttcaaaac ctgcccagtc aatatggagt 3240 ataggtaaat tacaaccaca atactagtga gatctagcag tggggccagt tcaatgcatc 3300 ttgtgcgtcg taaataagcc cagacacgct aataccgcaa cacttccggt aacaaagaaa 3360 agcaaaatta aagacgtcgc caatttcccc tgatccccat ccatcaatct gacttcaggc 3420 tagcggacct taacgaaaca acgagagcga gatcattcat acaccaaaac acaggtacta 3480 tagaagcgcc gcgcagtaga gattcacacc gccccttgaa gcaaaagtcg gaaggaattg 3540 cgcgatgtca gaacctctac cccctaaaga aggggaacca aggccacaga aggaagaaag 3600 tcaaaatgac acgctcgaag cgactgagtc caagtcccag cacatcacag gcctcaagct 3660 cgggctggtg gttgcttcag ttactttcgt agcatttttg atgctccttg atatgtccat 3720 tatcgtcacg gtaagatggt ggctacctca gaacagagcg cagcacagtc aattgactcc 3780 agccacaggc aatcccacat atcacaagcg agttccactc tctgaacgat gtagggtggt 3840 acggcagtgc ttatcttctg gctaagtatg gctctgttct ccttgacctt gttcattgta 3900 cgaacagatt agctaacatc atatttagct gtgctctcca gcccctggcc ggtaaattgt 3960 atacactctt gggcttgaag tacactttct ttgccttcct ctgtattttt gaactaggct 4020 cggtgctatg cggtgccgca agatcttcca ccatgttgat tgttgggcgg gccgttgctg 4080 gaatgggagg ctcaggtctt gtcaacggag ccctcacaat cctctcaaca gctgctccta 4140 agcacaagca accaggtaag ggaaccgatt tttggaagtc tgctgggtgc cgtgtacacg 4200 ctgacctcgc atatgaagtt ttgattggag tgatgatggg tcgtatgtca tctcaagatc 4260 tgatgtaccc caaacgaacg gttcgtcgtc tgacaatatg ttttcagtta gtcagattgc 4320 cattgtctgt ggaccactgc tcggaggtgc tttcactcaa cacgccactt ggcgatggtg 4380 tatgttgacc tttggccttt ttatgattgt tgtccatgtt ctcacttgga attcaggctt 4440 ttatatcaat ctccccatcg gcgctgtcgc tgcattcctc cttctcgtca tcaccatacc 4500 cgaccgaatt tcatccacgg acagcgaact ctcgaccgac aaaccaatgg ccaacataaa 4560 atccacactt cgcaaactgg accttgtagg ctttgtggtc tttgcagcct tcgcaaccat 4620 gatttccctc gcactagaat ggggagggtc gacctacacc tggcgaagtt ccgtcatcat 4680 cggcctgttc tgtggcggag ggtttgctct gattgcgttc gtgctatggg agcgtcatgt 4740 t99C9atgct gttgccatga ttcctggctc agtggctggt aaacgacaag tgtggtgctc 4800 ttgtttattt atgggctttt tctctggctc cttgcttgtc ttttcctact atctaccgat 4860 ctacttccag gctgtgaagg atgtttctcc cacactgagt ggtgtgtaca tgttgcctgg 4920 aattcttgga caagtcatta tggctatggt ttctggcttc gcaagtaagt gaaactcgcg 4980 tacacatttt tctccaccec gtccatttct atggctcctt tcttgccaca accgtctgac 5040 atcgggcttg gatatcgtgt atactgacat atgacgcacc agttggaaag acaggatact 5100
PL 202 457 B1 atttgccttg ccttccagcc gtcgtggttg ggctttgtat gccagcctat ctctcgccgt tctttgggtc ccgtgacggc gggttgtaaa cggcgtgcac acacccgggc gcctccacaa ttgcccgcga tggcaacata gattgatgtt tactcagtaa acctaaacac ctgcctgtct atatgatcct ttccgaccta ttaggaacag gatgccgggg gcagcacata cgtgcattct gcgccctggg gagacagaga agcggccgct gcgccggatc tgaagccgcc gaaccatgct cttcggccac ccgtacagta ccataacatt cagtagtagt gtaagcgcgc ccgaatcgag ggcctcgtgt ccttactgcc aataactctt caataacgtt gcttcgagtg agcggcgaac gaacctttcc tctgcttcag ctgtctttcc catcactgtc ttgattgaat caactggatc tgaacagata ggacgggatc cgtgtagctg cgaggacagt ggccctaggc ccatacatca tggcatgcaa caaagcaaga catcgccatc gtttggacag cggtttgaga agcaggggcg agcttacagt gtttgtgttt tgtgcctgag agaatctcca cccatgtcta taactatgtt tcaggcatca gttatagctt tctctggaaa cattgcattg cctgcaatga atcagcgtcg ggactgtcct cagaacggtt gcgagagctc caccgggagt gctccagaat tttgaagcga ttcaacttac ctgacctgtg aactgagcca atccacatcg aatgcccttg atttcctgat cagtgcatgc cttaaatcga aaatctgctg ccagatctta cataccgtcg acggctagca gccgtcgata ctcgcaacat ctccagcata cttgacggca ccgcaaagac caaattgtcc ttctgctcgc actgtcggtg ctgaggggtc aactgggtga gctgttcaga ttccaggctg cgaggtacca gaccatagtc agcgctgttc actgtgaaat acggtaagct agagcatgca caaagcacgc acgtttggag actggcctga actggcttca ctcgccgttg gcctttggaa actgatgctt catacttaat gtctaagtcc gagattcata atcctgatac gaacaaagct aggaccatct 3 t 3.3.3. Ca t Cjci tgcttttgaa atccactgga agcccgatca ggttccgcct gtgcgccatg cccagccaaa ggtcgggtgt cgtaccaccg tccgcgaaga ttgttcatga gcaatgaaaa gccatagcgg ctctttaaga ccccgtccat agggtaataa tccacgccct atatataagt gttgaattga gcagcaccag ccagtcagga ctagcgacga acaataggac gcaccgagca cttgtaagct cgagtgcagt aaggcaacga agttcgattt ttagtgacct gtggtaggag tggttctggg ctcgggagat gcgacactta gtgagcaggc cggtgaatgg gattgaccgc tcgtcgccat gggtcatgta atgaaacctt accgctagac tttcgcccga gatcgctctt gcaagtatgc gagatgtggt atcatacttt tgggatggcg gaccgcgttg taatgtcgat atctcaaggt gttagttagt ctcaggaatg ttcactcatt ctttatatat ~~i H —i η Ή ł· yaLagpg i, tu aattatgaca gggggtacgg gtagctgcag gacggggaga tgcgccttga acagcgcttc gatccgcgga cccaacgttc ctaaacagga gagtgatgca tggctgccgc acccaatcag catccctgac cgatccaatt tattcatatc tagaaatcat gagtaccggc aggcttcttt ctcgttcaag ctgtcacggc ggacgccctc cggcgacgcc cgcgttccca ctgcggtagc ctttgagact catcctcatc gtgtgcgaga ttagagatgc tgaacactct cagcgttgaa taggatcttt gggcaagtgc taccgaccat aaggatactc gccctcttgc aggcgcaggt ccaatttatc tgatcatctc gctgacatca acaaggtgcc cctggacttt gcccactgtc cagcaagaat ttacttagca gaagattgca ctagatagac ttcaaagatt tctagtcacc tacggcatct aatcagatca aaataattat tcttcttccc ctggccgttc ataacaacca agcttggaat cactcggcct cacttcgaga ccaggtgacc cgatgatgcg caccaagcat caacctcaat ttagtgaatg gttagcgctc aagattggca atttttcgat aacgttcgcc caaagctgaa gctgaaacct attcattccc gatagttgtc cattacggtc gacatcaaac accgccaccg ggtggttgcc aacagggact ggcgtagttt cggtgtcctc cttctctagg gttcaactcg cacgggaagt tttaattaag ggtctgagga gctttcggcc gattcccagt cacaaacacc ttttccacca tagttcgtac ctggaaaagt ctggtatcca gcgggcttcg tcacgctttc atactcaatg ctcggaattt gctaaccttg gacacgcagg aaccttccag gtgggagcta accaaaaacg acattaccgt ctatatgtca gtggctagat gacaatggat acattcaacc gagggatcag tactacttgc —i 4-n4--ir*r*-\ratgagaaaaa gctcctaaga cagtgcattg aggggctgaa ggcggctagg cgcaagttga gtcaagcatt agacggcatg tttccaagta tccacaactt gcttgggcgt atgttgagct ggtatgatgg ggtttcttat gcctctgtcg atagcgtcgc cgcatacttt tggccgacgt ttcacacacg aggttgattg ataggaatga ggcatatagc tcgtacggca gaaatgatag gcatacccgg ctgattgtgt tcactagtgg actaatgagg gcttggagac tggtcaagct ctggcggcct catttggaga actccatact ttgatggggg agttcatcta
5150
5220
5280
5340
5400
5450
5520
5580
5640
5700
5760
5820
5880
5940
5000
6060
6120 r ·ολ U _L O 'J
6240 6300 6360 6420 6480 6540 6600 6660 6720 67B0 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 7500 7560 7620 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 82 80
PL 202 457 B1 gtccacttcc agctaccttg aagggctcaa gcgggggttt aatggccgat ccgctcagac 8340 tttcggtcca agatgatata ctggacaacg atccactaga agaggcttgg aaaagggtgg 8400 agccgatgtt gacgaggttg acgataagga aaccaacgac catccagaat ttgaacttcg 8460 gaacactgct gcctttcata tcattgccaa acagatatgt acgtgcactg tcttgggcat 8520 cattgctggt cgcgacactc tccgccgtcc gctgactgag accctcatct tccaacgcgt 8580 accgcatgtt gatatgacgt ttgaggcggt ttacctcgag cttgatagac agaatcgcag 8640 tgtagaatgt aaacagcagc agacagtcaa agaacaggat caatgcagct agaacacaga 8700 agtgctgtag cccaccttgg atgcctaaga cagcaccgat aactaggagc aggatctcga 8760 ccacgtagtg gcacacgata ttgtaaccct tctcccgaat ggcgcttcgt acggcgtaat 8820 tgatggtact ttcagcaatg gctgtcacgc taccctggtc agactgtatc ttctggggct 8880 ttcggtgctg cacagcatag gacaaaacag ccctggtcag agtgatgctc ttctcaaagc 8940 caacgatcac caccaagaag gggaggcctt cggatagcaa cctcatgctc atcggaaccc 9000 ctagtcttat ggccacgtcg agaccgagga gaaaggcaaa tgttgacgac aaaaggacgc 9060 ttgtagccag ecaaaccttc gatcccaatt ttttcatgct gaggaagagt gagacgaaag 9120 tcaagtgcat tgatatataa cctagcacca tgacaaccac gtcgagcgtt tgagcgctct 9180 tgataagatc aagagactct gtccaggtat cgtgcaccca ttgagcaagg ctgcgttttg 9240 tgtgagccct ggcagccttc atgatccaca tctggcgttc catctcgatc aattgcgtct 9300 cctgcaattt caggtcggca ctgttgttgg ggatttcttg aacagcagcc acgagttccg 9360 gcgcgctgct gtattccaca gagaaggcga aaactttatc tttcgaatag gcggttaaag 9420 ggctcgacgt tgagggaagg tcaatcacag ataggttcac agggagggga gcaaggaatg 9480 gtgaggctgc ttgagatgca accccatatg accccgggaa taccaaggtc attagtgctt 9540 gatggttgaa atctccgaga acatctgcat ccccgtcgaa gctctgccac ttccagccat 9600 tctgtgggcc ggtgatcaag cttcgacttc cttcgaccaa agagccccat tctgctttat 9660 caacgtttgc ggggccatgg aagaagctgt ctttgagtag tccaacgtat gtggtactag 9720 ctagaatagc tatggtgcaa acggtatgga tcgggtgtag acacgccgtt ttggatagaa 9780 attggagtgt ggaggtcaat gcccgatttc ccgagcgtag agggtgctgc tgattcattg 9840 attccctacc gcgaaagcga gagggtagca acgaagcgac catgctgaaa ggtctgtgct 9900 acagcttgga gtggtaccta tagctaggta gtctctgaga aaagaatcta gtcagctctg 9960 caaatgggga cggaaaagca cttcaattgg gaattagggc ttgagataaa gtgcatacct 10020 ccaaaatcga atgagcaacc taatcggtta ggcgcctagg tataatctgc cgtcgtagat 10080 tggaggaagg ttgttcggcc caaggggttg ggagggacaa ctgaacagtt cctaggtacg 10140 ggaaatgagt agaagaaaat aacaaatggc gcgcgcccct gaggctgagg cagcggaaag 10200 attcgcttcc ttatccctgc atctggtcca cctttatgaa tggattcatg accggtgtca 10260 actgctgcct agggtataat tggtaagggg taccaagcaa aggatagtag gaccaattgc 10320 actgaaaact agtatttgtg ctcataacta tgctcagttt ccaaggtttt tatgcataaa 10380 tttatccttt attcgagaaa aaagaattct ggggacacca atcaattgcc ctgataccta 10440 ggaatgtgaa cttccaagat tgttccgaaa gtaggccaaa tgaccaataa gacagaacac 10500 tacctaggta tagttatttt gtcatgccta gatccgacat acaaaggagc gtcctcttac 10560 atagacgtcc tgttagacgt ttctaatctg actcgtattg tggtcctttt ttggtggggc 10620 ggcaagctgc atcgatcacg cccggacgag gccacttcgt gaggaatgga aatatattgt 10680 gcctacggag taatgcacca cgaaacacat tcttctcgaa acgactactt acgcagggat 10740 gtatgggtat tattctgtcc acgaaaagcc agtgtcaacc cccccccccc cccccccccc 10800 cggtatcatt tatctcagta aacagcaacc tgaacaagat acccaggtag acaagaagtc 10860 agtttggagt atagtgtata gactcgggaa cattttgtgt ggacctccgt acgtgtctct 10920 caaatcggcg tctctcggtc tttggatacc ttcggagtta cacggggctt tgttgccaag 10980 gcttcaatat tcggcgcatg gattttcttt gtgcatgggt ctgagtgggg tgccgtaagg 11040 tatggtattg ctcccgattg ggagttctga cagatgatca tgccgccttc cgaagtagaa 11100 aaaagaggaa agggtcacat gctcatgatg atcgtttgct cgcgatgaat tgcgcttcct 11160 gcatatattt tgtttgcttg tcttagtcaa ccgataatgc aaattttggg gattgtgtat 11220 tgttggaaat tgaattacca actgcttaca ggacccaccc tgcgctcagg ccctcaacaa 11280 accttgggac aggattaccc actaagcctt tccaagcttt tccaaggctt ttggattcgt 11340 ttggtttgat agctcgtatg cgtatttcgc atctgtgtac ggagtatcgg attctgacag 11400 cctccattat acccgaaaac tacctggccg gcctgacctg tttcgtcttg ttcgacggtt 11460
PL 202 457 B1 tcccatcggc gttttgactc gggattatcg tgacgacaga caatgcctcc cgaaccggta 11520 cctctaaggt attgccccga gcatagcatg gtggtccggg gtttcccatg ggcacagagc 11580 gaatatcgtg tcacgtccaa gatgaaaaca aaccccgaac tatgaatcac gtgtcggggg 11640 cagcttatgc atctatagct atgccaggga cctgtagact gttggaagac tatcaacggt 11700 tttatcacca gggcgactga tatatcagtc aatgaaacaa cgttggaatg aacaataccc 11760 ccgccgtaac cgcaaccgca accgcaaccg caaccgcaac cgcaatggca ggctcggctt 11820 gctctaacac atccacgccc attgccatag ttggaatggg atgtcgattt gctggagatg 11880 caacgagtcc acagaagctt tgggaaatgg ttgaaagagg aggcagtgcc tggtctaagg 11940 tcccctcctc gcgattcaat gtgagaggag tataccaccc gaatggcgaa agggtcgggt 12000 ccgtgagtat ctaacatgca tgcatttata tcttgttttg aatatttgac acaagatttg 12060 agcatcactg aagcttggtt actgactcca aggatgactg gatagaccca cgtaaagggt 12120 ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa catgaccaca 12180 gaggtcgcca gcgtatgatt atttcaattg atctaacccg ggacgcagag atctaatatt 12240 ggacagtgca tggatccgca gtatcggctt atgcttgagg tggtctacga atcgctggag 12300 agtggtatgt agtgtgggtc atcctcactg taagcaaacg tcactgacca tcatccagcc 12360 ggtatcacca tcgatggtat ggcaggctct aatacgtcgg tgtttggggg tgtcatgtac 12420 cacgactatc aggattcgct caatcgtgac cccgagacag ttccgcgtta tttcataact 12480 ggcaactcag gaacaatgct ttcgaaccgg afca.tcaca.ct· tctacgactt acytyytccc 12540 agcgtgacgg ttgacacggc ctgttcgacg acattgaccg cactgcactt ggcgtgccag 12600 agcttacgta ctggggagtc agatacagcc atcgttatcg gtgcaaatct tctgctcaat 12660 cccgatgttt ttgttacgat gtcaaacctg gggtgagttt tccgaagaag attccagatc 12720 gagagtcttg aactaagcaa tccttgttgc tcaatgacag atttttgtcc ccggatggta 12780 tctcgtactc ttttgatcct cgagcgaatg gatatggtcg cggggaagga attgccgctc 12840 tggtaataaa ggccctccct aacgcgttgc gagaccaaga ccctatccga gccgtcattc 12900 gagagacagc gctgaaccag gatggcaaaa cacccgcaat tactgcgccg agtgatgtgg 12960 cgcagaaaag tctgatccag gagtgttacg ataaggctgg gctagatatg tcgttgacct 13020 cgtacgtgga ggcccacgga actggaacac caactggtga cccccttgaa atctcagcaa 13080 tttcagcagc ttttaaagga catcctctgc accttggctc tgtgaaagca aatattggcc 13140 atacagaagc cgccagtggc ctggccagta taatcaaggt ggccttggcc ttggagaagg 13200 gcttgattcc ccctaatgcg cggttcctgc aaaagaacag caagctgatg cttgaccaaa 13260 agaacatcaa ggtaaggctt tgcgcattcg cagattcagt tatatgtttc aaaggttaat 13320 gtttcaaaga tccccatgtc tgctcaagac tggcctgtga aagatgggac tcgtcgcgca 13380 tctgtcaata acttcggctt tggtggttcg aatgctcacg tcattttgga atcatatgat 13440 cgcgcatcat tggccctgcc agaggatcaa gtgcatgtca atggtaactc tgagcatggt 13500 agggttgagg atggttccaa acagagccgc atatacgttg tgcgtgccaa ggacgagcaa 13560 gcttgtcggc gaacgatagc aagcctgcga gactacatta aatccgtcgc tgacattgac 13620 ggggaaccct tcctcgccag cctcgcctat acactaggct ctcgccgttc cattctgcca 13680 tggacgtcag tgtatgtagc agacagcctt ggcggccttg tttctgccct cagcgatgag 13740 tccaatcaac caaaacgagc gaatgagaaa gtacggctcg gatttgtatt caccggtcag 13800 ggggcgcagt ggcatgcaat gggcagagag ctggtcaata cattcccagt attcaaacag 13860 gcgattcttg aatgtgatgg ctacatcaag caactgggcg cgagttggaa ttttatgggt 13920 aagttgcgag cccgggaaaa gtaatactgt atcaagcttg aggtactaac attcaattgc 13980 acagaggagc tccaccgtga tgagctgacg actcgggtaa atgatgccga atacagtcta 14040 ccactgtcaa ccgctatcca aattgcactt gtgcgtctcc tttggtcatg gggaattcgg 14100 ccaacgggga taaccagtca ctcaagtgga gaggctgctg ctgcctacgc agctggggct 14160 ttatccgcgc ggtcggccat tgggatcact tatatacgcg gtgtattgac cactaagccc 14220 aagcccgcat tggcagccaa aggaggaatg atggcggtgg gtcttggtcg cagtgagacc 14280 aatgtttaca tttcgcgtct caaccaggag gacggctgtg tggtggttgg atgtatcaac 14340 agtcaatgta gtgtgacggt gtcgggagat ttgggtgcaa tcgagaaact tgaaaagttg 14400 ttacacgccg atggcatctt taccaggaaa ctgaaagtca ctgaagcctt ccattcaagc 14460 cacatgcgac caatggcaga tgcctttggg gcgtcactga gagatctgtt caactcggat 14520 aacaacaacg acaatcccaa tgctgacacc tcaaagggtg tattatattc atcacctaag 14580 actggtagtc gcatgaccga tcttaaattg ctattggatc ccacacactg gatggatagt 14640
PL 202 457 B1 atgctacagc cggtagagtt cgagtcctca ctccgcgaga tgtgctttga tcccaacacc 14700 aaagagaaag ccgtcgatgt gattattgaa atagggcctc acggagcgct tggtggtcca 14760 atcaaccaag tcatgcagga tctgggtctg aaaggaacag atataaacta tctcagttgc 14820 ctttctcgcg gcagaagctc gttggagaca atgtatcgtg ctgctacgga gttgataagc 14880 aagggttatg ggctcaaaat ggacgctata aactttcctc atggaagaaa agagcccaga 14940 gtgaaggtac tgagcgattt gccggcgtac ccgtggaatc accaaacccg ttattggaga 15000 gagcctcgcg gcagtcgtga gtccaaacag agaacccatc cgcctcacac tttgataggc 15060 tcacgggaat ctctctctcc tcatttcgcg cctaaatgga aacatgttct ccgtctgtca 15120 gatattccat ggatacgaga tcacgtcgtt ggttcgagca tcatctttcc gggagctggc 15180 ttcatcagca tggccatcga ggggttttca caagtctgcc caccagttgc gggggctagc 15240 atcaactaca acttgcgtga cgttgaactc gcgcaggctc tcataatacc cgctgatgca 15300 gaagćagagg ttgacctgcg cctaacgatc cgttcatgtg aggaaaggtc cctcggcaca 15360 aagaactggc atcaattttc tgtgcactca atttcgggcg aaaataatac ctggacagaa 15420 cactgcaccg gattaatacg ttcggagagc gaaagaagcc accttgactg ttcaactgtg 15480 gaagcctcac gcaggttgaa tctaggctca gataaccgga gcattgatcc caacgatctc 15540 tgggagtcct tacacgcgaa tgggatatgc cacggaccca tttttcagaa cattcagcga 15600 attcaaaaca atggacaggg ctcgttttgc agattttcca ttgctgacac tgcctcggct 15660 atgcctcact cgtacgagaa tcgacacatc gtccatccta ctactctgga ctcggtgatc 15720 caggcggcat acacggtgtt accctacgcg ggaacacgta tgaaaacggc catggtacca 15780 aggaggctaa gaaatgtcaa aatatcctct agcctggctg acttggaggc tggtgatgct 15840 ctggacgcac aggccagcat caaggatcgc aactctcaat ccttctctac cgacttggca 15900 gtgtttgatg actatgatag cggttcttct ccctcggacg gaatcccagt catagagatt 15960 gaaggccttg ttttccagtc ggttggaagc agcttctctg accaaaagtc agactccaac 16020 gacacagaaa atgcctgcag ctcctgggtt tgggcccctg acatcagctt gggtgactcc 16080 acttggctca aagaaaagtt gagcactgag gctgagacga aagaaacgga actcatgatg 16140 gacctccgaa gatgcacgat caactttata caggaggctg tcactgattt gacaaattct 16200 gatatccaac atctggatgg ccaccttcag aagtatttcg attggatgaa tgtccaattg 16260 gaccttgcga gacaaaacaa gctcagccca gccagttgcg actggctaag tgacgatgct 16320 gagcagaaga aatgcctaca ggccagagtc gctggagaaa gcgtcaatgg cgagatgatt 16380 tctcgtctag gacctcagtt aatagcaatg ctacgccgcg aaacagagcc acttgagttg 16440 atgatgcaag atcagctgct aagcagatac tacgtcaacg caatcaaatg gagccgatca 16500 aacgcacaag ccagcgagct gatccgactt tgcgcccaca agaacccgcg ttctcgcatt 16560 ttggagattg gcggaggcac gggcggctgc acaaagctta ttgtcaatgc attgggaaac 16620 accaagccga tcgatcgtta tgacttcacc gatgtgtctg ccgggttttt cgagtcggcg 16680 cgtgagcaat ttgcggattg gcaagacgtg atgactttca aaaaattgga tattgaaagc 16740 gatcccgagc aacaagggtt tgaatgtgcc acctacgatg tggtcgtggc ttgccaggtc 16800 ctgcatgcaa ctcgatgcat gaaacgaaca ctgagtaacg ttcgaaaatt gctcaagcct 16860 gggggcaact tgattttggt tgagactacc agggatcagc tcgatttgtt ctttaccttc 16920 ggactgttgc caggttggtg gctcagtgag gagcctgagc ggaagtcgac gccatcgctc 16980 actaccgatc tttggaacac catgttggac acgagcggtt tcaacggtgt ggaattggag 17040 gttcgtgatt gtgaagacga tgagttttac atgatcagca caatgctatc gacggctaga 17100 aaagagaata caaccccgga tacagtggca gaatcggagg tgcttttgct gcacggagcg 17160 ctccgacctc cttcatcttg gctggaaagt ctccaggcag caatttgtga aaagaccagt 17220 tctagcccat cgatcaacgc tctgggcgag gtagatacca ctggaaggac atgcattttt 17280 cttggggaaa tggagtcctc gctccttgga gaggtgggaa gcgagacctt caaatccatc 17340 accgcgatgc tgaataactg caacgcactt ctctgggtgt ctagaggagc agccatgagc 17400 tccgaggatc catggaaagc tctacatatt ggtctgctgc gtaccatccg caacgaaaat 17460 aacgggaagg aatatgtatc gttggatctc gatccttctc gaaacgcata cacccacgag 17520 tccctgtatg ctatctgcaa tatcttcaat ggccgcctcg gcgacctttc cgaagacaag 17580 gagtttgaat ttgcagagag aaacggcgtc atccacgtac cgcgactttt caatgacccg 17640 cactggaagg accaagaagc ggttgaggtc acactgcagc cgttcgagca acccgggcgt 17700 cgtctgcgga tggaggttga gacgccaggg ctcttagact ccctgcaatt tcgagacgac 17760 gaaggacgtg aaggcaagga tcttccggat gattgggtag aaatcgaacc caaagctttc 17820
PL 202 457 B1 ggtctcaatt ggcttcgaat ctcagattag acgccgtaca gtccccctgg ggcgaaagag tcccagcttg gtcggcgata gtcgacggca gcaggtcaac attggaaaaa gtctćtttca gaagcgttga atccagcagc catgttggca gggttctcgc attggaaagc ł-fi-rarfaar-rt-f-f
- ~ tatctacacg gaagaagcac gcgcttctat ggtagttggt cttgttgggg gacgcacttg atggtcaagt agaataggtt ctgtgttctt tccccgggtg aaataccgcc gatggcgtgc ctcaaagcaa tcgtccaaaa tggatcacat atcgccggcc gccttttgtc gccatggtct tgcctgactt gaagcaacaa actaccaggg ctctccatta cacgggcagt ccacgtcgtt acttaacaga agatcggtga tagctggcgg tctctctctc aaagaaggca agcacctagt gttttagttt gccggcgtac atttgtcatc gaatcttgat agccgatgtg ttcgggatgt gcgccggagt gggaccgcgt ctaatgtcgt ctttcactac tcttgatcca cgggtgccga aattcggcat tcaaagccta tcctccaagc aggacctgga catcaattga accatgtcac actccttgtc aagttgtggt tgaagctgaa agatctgtca catgtgacat atgcaecgcc cgcgaatgac atcttcacaa tcatgggtgg cgcaccaccg ctgttggata acaagcctat cccctcaatt ctcactggac aagtccttca gggcccaact tgacggaaaa acctggcagg ctgaaatcca tcgtcgagtt tggccaagcg gaagcctgaa ctggatagca agtacacatg aagctgtctt tgattcccgc gggtacagat gcgccgtcct gcctaagccc ttgtaccggg tatagaagca tgtgtttctg tcacaatcga ttctctggga gcgtgttata catgagcttt gtctcctggt ttccttcgag atcaccgttg catggttgcc gatcacaaag atgtgcacta ccgtattccg cgcatatatt cagtggagct ggtcttcgtc caatccggat cacgggcgga aagctttgac gcaaaacagc tcttctctcg aaaactcctc aaacatcgag caatgtatct gcctgacagt gtggcttgtt ctcagatcaa aattcgaggt attggatgaa gatcgcacag ggcaggccag gagagcccat cgtggctgaa gcatgaaaag tccatcacct cgaggcaaac tgcagaccaa aagcagggtc gctgatgcga tgtcggcgta tgttgatgtg agttgtggcg ggtatagctc tccaatctga gtaaatagag tgcactcgtt agcacctcgg aagccttgta tgtggatatg ctctttcgcc tcgtcatcgt agaaaagctt gatggccgct tctctcgcac ataaaatgcg cggaaactat tcttagcacc gtggttggat acaggcttca gcgaagaacc gtattctcca atgggtcaat ctcggtggag ctgaaaggcc gacgaaatgg gcgctttata ggaggcgtcg acagcgggaa catatcttct cttggcgttc tgcatggccg agacttgaca tggcaaagag gagacaaaag aaggccttcc ggggacgaac tcttacctag gatcatggcg accagcttgc gatcaggtca atcatacaag tttaatgcag gatgttgact gccaattacg ggcatgccgg actggccgtg gacgtcatgg cccgcagctg tggatacagg tcctttgtct acctctcacg atgtttggtc gactcactcg tcgatctttg aaatgcagtt gacggaggta atcgagcctg atacctgaaa ctcgaagtcg aggcttgact aatgcgcgtt tagtcggaag tagtcgggga aagcgccagt cattactgcc ctgcgtagca atagccaaag ttttatttta tggaataagc ggtcatgagg gcatacgaac catcatactg gcccgggaca attgagcggt tggaggccaa ctgctgccgc attgggcgac gcttcccaga ccacggcaaa gtcaagcagc ctcaagccaa cgagcaggaa atgtcgttct aattcggcag tgctgccatt ccaaaagtga cgattggctt gtacgatgca tggtcccagt ttgctggtgg cgaagcactt
a.a.aćłtCaaCa.
ccaaggtgct gtgccatggt caacacgccc tcttcgtgat cagctgctgg ctgtcaccat gtgtggccga atgtgttgga tggttacagg aacagcggtt cttcgcataa acgaggccat tggcagaaga tcgccattga agctcatgaa aagttgaagg tagtacgaag ggctgagcct taccattaca gaagagtgaa gtcaaaagtt gaacggtcga gcgggaggga tgttgagtag caacgcctga gacttcccta ggaatacaca tctacaccac ctaacctact ctggggacgg gagcgggatg gctaaaagcg aatcagtata agcgcgtggg gaaggccttg ccgtgtgatg tagccaaggc cagaacacag agccgcttcg gctacgacga gatcattttg gcgtgacttt tgacttattc aaactcattg atttgttgag cacccgggac agaagtatcc gattggtcca gagtggtcag cggcgatgga gctgggggga gattatccta gtgcgctgtc ccggttgtgc tctcaaggac aaaagtacag gctctcatcc tgcattccag tgacttgggc ccggctcgct gaaggcaatc aatcaacaca tgtgggactt aaaaggacca ttctatcgtc cgacatgtcc acttcgaaac tggtaacacc gttcagtgaa gagcatagcg gactatttaa gtggccctga tgctttttat ctctcttttt aaggcgttgg gtacttgtgt gaacatcaag gagaatgggg cgtggcggtg ctctctccct gttcgattac cgactaatac atgcatattt tcctcgttgc tgacggtagt tgagcgagga ttccagccga tctggatcct
17880
17940
18000
18060
18120
18180
18240
18300
18360
18420
18480
18540
18600
18660
18720
18780
18840 o 9 O G
18960
19020
19080
19140
19200
19260
19320
19380
19440
19500
19560
19620
19680
19740
19800
19860
19920
19980
20040
20100
20160
20220
20280
20340
20400
20460
20520
20580
20640
0700 20760 20820 20880 20940 21000
PL 202 457 B1 cgcgcatgcg cataaatcgg tagggatcat aattttcggg gttttcccac acatcagggt 21060 tgttcatgcg gtctgcagcc acagcggcca actcgccctt gggaatgaag aggccattgg 21120 atagagtgat gtctctgaga gcggtactgc gcatagtggc gcactcgacc ggcttgattc 21180 gctgcgtetc tttcatgcag ctgtcgagga gcttcagctt gaacagagag gcaggcgtcc 21240 agcccccttc tccgattaca gtgcggatct cttggcggag aggctgaata aggtctgggt 21300 gcctggcaat gtccacaagg gcaccgacga aaagatccgt cgaggcgtag atgccggcga 21360 aatccatagc gagctgagca cccgccacat cgtaccagcg gccgtcggcg gtgtcttcaa 21420 accattgcat ggtatcgacg tactggggcg gctgcacgcc cttcgctaca catgcggcct 21480 tttcagcacg tcgtcgctga atctcaggat caatgatctt tcgtgcgcgg cgcacttggt 21540 cacgcaattt gcgtccttgc ggttgaaacc agtgagcgag cggtcgcagt agcatgggcc 21600 atacgcgaag ttggcgagct tgtaccgcca cactcacggc atggttcttt gcaatatcca 21660 gccaćtcctc attgtggcag attttgtcgc cgaccataat gagtgtgact gttcgtgtga 21720 caaggtccaa tccattggaa tagacaggtg cggtttgcca ctctagtata ttcgcggtat 21780 gtcagccaga ggctcaatgc tcaagacaga aaaattgaca cttaccctcg cttttaccga 21840 acaacttggc aatagtagcg tcggccaagg tagccaatgg ctttgtgtac ttgggggctt 21900 gggtttgtaa ctggttcaaa acaactttgt tgacaagatg tgcatcctgg cagatttcct 21960 tgaacccgtc gaatccaggg agatgagagt gaaagtccta tacattcatc agaatcttag 22020 agacgfcoatt. gagt-tacaac a.atggaaaat tcagaggtca tacatccgcc aaaaacttgt 22080 acatgcacat atctttgatt ttccgaaact cgtcggccat ggacgatggg aggatggtgc 22140 aatagccgga atcaacaatg aagcgcaggg gcttgtcgtt tttcgagaac caagcttcga 22200 tccagctcgg accatacgta tcgaagtect gcctagccct catggtcgtc aactcccacc 22260 attttttggg attatagact tgcagttcgg actggcgccc ccgcaaacgg taggcgatga 22320 gaetaagaag cactgcgacc gccacaaggg cttgaggggt cgatacccat tggtacgatt 22380 cgacggtcag aagaacctgg ccgagcattg cgtgagacag ataggaccta tgcacaccag 22440 tggaaaagaa gaaagagcga agaatgagag cgctgcgacg gtttataatc gaataacagc 22500 actaatgctt ctgggatttt gtggccgaga gcactcttcc agtcaacctt gaaaaaaaaa 22560 aaaccccccc cccaatcgaa gtttacctgg atggggcagt tcggttgttt cctttaggag 22620 cagcttcacc gagcagcaca agaacaatcc gagtgaaaaa ctcggtttca ccttgataca 22680 gccaattgat attcacgttt gattcattca gcctcgtgtg accgaataac gccgtatgga 22740 ggaatggcta ttcgtgcacc gaatgacgcc gggagggttt gctaggtgcc gagcttgcat 22800 tgctgggaag tgggggcatt tgagtactag aatggatctt gaaattgtcc gaatctagat 22860 gagtactgat acgtgcaagt aaatataacg acggtatcgg ttgcaaggcc ggcttgttcg 22920 ctcagagatt caactctgcg attctgtaag aacaaatgtt gtgcccggca tgcagtgaga 22980 agatctactg acgcaagaca aggtttaatc ccaatcctat cgcccaaaaa caggatcagc 23040 agttatggat caagccaact atccaaacga gccaattgtg gtagtgggaa gcggttgtcg 23100 gtttccaggt ggtgtcaaca caccatcaaa actttgggag ctgctcaaag agccccggga 23160 tgtacagacc aagatcccta aggagagatt tgacgtcgat acattttaca gccccgatgg 23220 cactcacccc gggcgcacga acgcaccctt tgcatacttg ctgcaggagg atctacgcgg 23280 ttttgatgcc tctttcttca acatccaagc tggagaggcc gaaacgattg acccacagca 23340 aaggctgctg ctggagacgg tctatgaagc tgtatccaac gcaggcctac ggatccaagg 23400 ccttcaagga tcctctactg ctgtgtacgt cggtatgatg acgcatgact atgagactat 23460 cgtgacgcgt gaattggata gtattcctac atactctgcc acgggggtag ctgtcagtgt 23520 ggcctccaac cgtgtatcat acttcttcga ctggcatggg ccgagtgtga gtgccactca 23580 ttgagcgagc ccgacttcgt caagtgctga cagattcctg actgattctg cagatgacga 23640 tcgacacagc ctgtagttca tccttagctg ccgtgcatct ggccgtccaa cagcttagaa 23700 cgggcgagag taccatggcg gttgcagccg gtgcgaatct gafcattgggc cccatgacct 23760 ttgtaatgga gagcaaattg aacatgctgt cccccaatgg tagatctcga atgtgggatg 23820 ctgctgccga tggatatgcc agaggagtaa gttgacaatg catcaattcc tttcaaaaaa 23880 agcaagatgg cactgacctc ctgtaactgc tttttaggaa ggtgtttgct ctattgtcct 23940 gaaaacgctg agccaggcac tgcgcgacgg ggacagtatc gagtgtgtta tccgagagac 24000 cggtatcaac caagatggcc gaacgacagg tatcacaatg ccaaaccata gcgcacaaga 24060 agccctcatt cgggccacat atgccaaggc tggtcttgat attaccaacc cccaggaacg 24120 ctgccagttc tttgaagccc atggtaagtg gtattccctg gaagtatcag ccttatggaa 24180
PL 202 457 B1 gttgcagaaa gacccacagg gacagcgacg acggaaggca gtgatcccgc cacttgaaaa agagtcagcg gttagctaaa agagtatatg agatgcatgc gctagaaaat atatacctta caaggaagta cttccgcacc acagtggccg cgaagagctg gtatgaccag
-'Ί ,4 gttcagtgca catcagtgcc tgcctcttct cgcaaaggaa ttcaccggat cttggaggat tcacatgcac tgccgatggc gcaaatgact cttgttctcg cgaaattggc tgccggtgtg ttttgctgga gggcttcgta cacatactct tcttcgtgga gaccttccag gctacaaggc catgaaggtg catcaacaaa cgaagtcacc ctgtctggca tggcgaggca gaacaatgtc caaagacttc ggctttcctt cctggacatc acgctcattg atcggcgggt gggtgatttc agttgataac cttcgcaaag gttgatcata catcaaatcc ccagaagtac gtctctctct aagctgaggc gcgagaaaga ctgctggtat caaacctgct ttgcaacgga ttaattcatt catataaaca gctcctccac agcttgcccc atgctccaat cttgagaaac gcccgcgcgg gaegcgaatg ggcatgctga gataattcac ctcatgcttg tgcgccgtac attgtcggcc actcaagcta ccaagcggcc ctatgcgagc agtgtgacct gaatccactt ccatgcgcag caaggtaacg gtacaggatg caggctgtgc gcccaccctg gagctgccgt ggtctgggat caacaagtcc tgggatcata ggtgcgcccc tggacaaact cagactgtgt gctggtgagc gccatcgtgt agtgacaatg aaggagagtg tcaccgtcat aacatcgatt cgtcgtttgc ccacttaagg gcgttccaga tacgtgccta aattctggtg ctgagcggcg attgtcttta tgggtctggg gctcgggaca ttcctagccc attgaatggt ccctaacacg tattgcaaca tgagcttttt tgcgggctta gtttgagaag ggccacagaa tggtaaggat catcaggatt acaagccgac ttgtgctttc ttctggaaac ggtctatctt cactggaggc acaaccctcg agaagctcat tgcaaacact aaggggatgc —» —t —» Ί— r</-i ł- l- η łO.CŁCŁ l_ k_ l_ L.
acagttcagg tccgtattgc agacaggcgc tcgaagcctt tctccggcga ttgccagaat ctccatatgt atagtgttgc tgatgcccgc agaaagcagt ctctcaaggg ataccgggtg acatttggga ggcccgatcg ctcgtcaata atcttctgct tcatcaggcc tccccgctgc gtgccgccca ttgaagatga atgcggatgg agctttcgac cgcagctttt tcttctatcg agaccatgag atgaattgcg ctgtcattgg ctcacgttga aaaccgagct acatcacggt agcctttctc gacccctcac aggaggacat agataacccc gtgaccaggt aagatcccag gccttcttcg gtcggcagca atgaaggcat atcagtcccc tggccgattg tcaactgcac tggtggtaca agcagtggta atcgaagtcg gcatgatgac gcccttccgt tgccatcgcg cgtactaggt ggtgggtatg gcctgaaaag ctcaaacgtc
-~r·—vł— β-t —1 r~. 4— 4— y y i_ l.
tgagattgcc gcatctgcgt tatgctagcg tgagggtcgg catggatgct cttgagagtt caaggcattg ttggttctct ttattggaaa catcactcat tccgtgtcta cttggcacga gcgtttcgga tgccgttcaa ctgggcagaa tggaaagctt ccgggatctg tgggtacata agttcagctc aaacacctcc ccaagtcacg atccgccaaa gccgccacct ggaacttgac aagggccgac caatgagccc agcgtattcc cagagtgact tgcgtttgac gtacgattcg tcccccgact gcccgaaaaa tctgaccatc cgacgaccgt tcaggccgat gaactggtac gacacaagga tcaagacagt cgtttgctgt gtgtcgctcc ttgcgcccgg ttcttgagaa aatgcccatg acagaggtga cagcgctcca gtggacatgc cgtgcgattg gacggtgagg gtctttactg ccatttgtga tatcggccta agactcgcca
Ct-CyCtyCay tgtgcctttg ggagttgtgt gcaggtatgt gtctgcgtcg atccagcacg gacaaggcct ctggagtgcg gccgtccacg gacaatctcg cgtctaatcg gccaccatca aacgttgacg gttcggagta aacctgtcaa tctcgctcca tcttcttaca gaatggctcg attatggcca ctggaaatct gtggagctga gtcaaatttg ggccaaatcg gaggaagagt ctccttgggt tccaaagcta ctcttgctcc tctccaggag ctgattccat acaatcaaca accaagacaa gcttcgaccg ctgctggagg gagcgaatcg caaaatgccg gctcgggctg accagccggt tggaacaatc tctcggtcac acgaaatggc gttctatacg gcagcctcgc cgaaagtgaa ctattatcga cctcagatgc tgaaggcaac atgatatcgc cagcacacaa tcgtcaccga gccaaggtgc gaggcattct cgtggacact gcttctccca Ctyy ta. uCy S. cggcaggatt ccgcggagca cgtacgatga ccgctagcaa ttgaaggtgt accattcgca actgtgctgt agaccagcaa tctctccggt acgtcgccat aggatgctct atgtggacgc tcgacgccga agtcattgcc cccgccagca gcacagcatc acggtcatgc tggaagctgc tggacatgag acttgacagc ttattgattc tcataaccct acccccagat atgactacag gcggcacctt acccagcgcc atcgtcgcct cgctctgtat cacacgacaa cgcttttcca accaccgaat accctgcgac tttacttcta acctccattc gccaccatca
24240 24300 24360 24420 24480 24540 24600 24660 24720 24780 24840 24900 24960 25020 25080 25140 25200 25 2 6 0 25320 25380 25440 25500 25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 26220 26280 26340 26400 26460 26520 26580 26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360
PL 202 457 B1 gtggtaccag gagtcttggg aggaggacac ttctgttcac attgagcaaa tgtgtgaaag 27420 gtacacccaa agctgttccg tgttttttca ttcttttata ttaacctttt acttgaagca 27490 actcgtccca cccacatgtg cgcctgatcc aaagggtagg caaagaatta atttcaattg 27540 ttcgcgggaa cggggatcct ttggatatca tgaaccgcga tgggttgttc accgagtact 27600 ataccaacaa gctcgccttt ggctcagcaa tacacgtcgt tcaggatctg gttagccaaa 27660 ttgctcatcg ctaccaatcc attgatatcc ttgagatcgg taagtcgaat ctgaaatgta 27720 agtaactagg cagtttgcta atctgtcgtt cgctttttag gcttgggtac aggcatcgcc 27780 acgaagcgcg ttcttgcatc acctcaactt ggtttcaaca gttacacttg cactgacatc 27840 tcggcggatg ttattggcaa ggcccgtgaa caactttccg aattcgacgg tctcatgcag 27900 tttgaggcac tagacatcaa cagaagccca gcagagcaag gattcaagcc tcactcctac 27960 gatctgatta ttgcatccga tgtcctccat gccagctcca acttcgagga aaaattggct 28020 cacataaggt ccttgctcaa gccgggtggt cacttggtta ctttcggggt cacccatcgc 28080 gagcctgctc gcctcgcctt catctctggg cttttcgctg atcgatggac tggagaagac 28140 gaaactcgtg ctttgagtgc ctcggggtcc gttgaccaat gggagcatac cctcaagaga 28200 gttgggttct ctggcgtcga tagtcggaca cttgatcgag aggatgattt gatcccgtct 28260 gtcttcagta cacatgctgt ggatgccacc gttgagcgtt tgtatgatcc actttctgct 28320 ccattgaagg actcataccc gccattagtg gttatcggtg gcgaatcgac aaaaaccgaa 28380 cgcattttga acgacatgaa agctgcccta ccgcatagac acatccactc cgtcaagcgg 28440 ctggaaagtg ttctcgacga cccggccttg cagcctaagt cgacttttgt catcctctcg 28500 gaacttgatg atgaagtgtt ttgcaacctt gaagaggaca agtttgaggc agtcaagtct 28560 cttctcttct acgccggacg catgatgtgg ctgacagaga atgcctggat tgatcatccc 28620 caccaggcca gcaccatcgg aatgttgagg acaatcaagc tcgagaaccc tgacttggga 28680 acgcacgtct tcgatgtcga tactgtggag aacctagaca ccaaattctt cgttgagcaa 28740 cttttgcgct tcgaggagag cgatgatcag cttttggaat caataacatg gactcatgag 28800 cccgaagtgt actggtgcaa gggtcgtgcc tgggtccctc gtttgaagca ggatattgct 28860 aggaacgacc gtatgaactc gtctcgtcgt ccaattttcg gtaactttaa ttcgtccaag 28920 acggccattg cactgaaaga ggcgagggga gcatcctcat cgatgtacta tcttgagtca 28980 accgagacgt gtgattcgtt agaagacgct cgtcatgctg gaaaagcaac tgttcgtgtt 29040 cgctacgctc ttccccaggc aattcgcgtg ggccatctcg gatacttcca tgtcgtgcag 29100 ggcagtattc tggagaatac atgtgaggtg cctgtagtcg ccctggctga gaagaatgga 29160 tctatactgc atgtaccgag aaactacatg catagtctgc ccgataacat ggcggaaggc 29220 gaggatagtt ccttcttgtt gtccacagct gcagccctcc ttgccgaaac aattctctct 29280 agcgctcagt cctttggctc tgatgcatca attctgatta tggagccccc aatcttctgc 29340 gtcaaagcaa ttctggagtc ggccaaaacc tacggtgttc aggttcattt ggcaacaact 29400 ctgtccgacg tcaaaactat tccggctcct tggatccgat tacatgccaa ggaaaccgac 29460 gctcggctga aacacagcct gccgacaaac atgatggcat tctttgactt gtctaccgac 29520 cggactgctg ccgggataac caaccgtttg gccaagttgc taccacccag ttgcttcatg 29580 tacagtggtg actatcttat ccgaagtaca gcttccacat acaaagttag tcatgttgag 29640 gatattccaa tcctcgagca ctctgtggca atggcaaaaa ataccgtctc tgcgtcgact 29700 gtcgacgaca ctgagaaagt tattacagcc acacaaattc tcttgcctgg tcagctctct 29760 gtcaaccaca atgaccaacg cttcaatctg gccaccgtca tcgactggaa ggaaaatgag 29820 gtgtccgcta ggatttgccc catcgactct ggtaacttat tttccaacaa gaagacgtat 29880 ttgcttgttg gtcttaccgg ggaccttggt cgctctctct gtcgctggat gatcttgcat 29940 ggcgcccgcc atgttgtgct cactagccgg aaccctcgac ttgatcccaa atggatcgcc 30000 aacatggagg cacttggtgg tgacatcacc gttctgtcaa tgtaagttga ttgatatcac 30060 atcacacctt gctaccacat cctcgtttac ttatccaatt actttcttta gggatgttgc 30120 caatgaggat tcagtcgatg ctggccttgg caagcttgtc gatatgaagt tgccacctgt 30180 tgccggcatc gcgttcgggc ctttggtgct gcaggatgtc atgctgaaga acatggacca 30240 ccagatgatg gacatggtgt tgaagcccaa ggtacaagga gcacgcattc ttcatgaacg 30300 gttctccgaa cagacgggca gcaaggcgct cgacttcttc atcatgtttt cgtccattgt 30350 tgcagttatt ggcaatcctg gccagtccaa ctatggcgct gcgaatgcct acctacaggc 30420 tctggcccag caacggtgcg ccagaggatt ggcggtattt tctacccctg aattatcatg 30480 catcgacgtc aagttactaa cgcacaacca cagggatcaa ccatcgatat tggtgccgtt 30540
PL 202 457 B1 tacggtgtag atgtttgact gaccagcgtg cttaccacgg gaccctcgtt tcagggtcta cggcaaatcg caaagttgca gagcgtggac tgtcggctca cggtgcttct tccgćtgctg accaacagac agaggatgaa gaggttgtcc catcttcaac gcgggctctg at“'-‘u.
cagagtgcac cgagaagaca gggcacagat aacagaaaac atcgacccaa gggggacgat cgtgcttccc acagccattc ccgaatcaaa ctaccacgtt aaccaaccga cctgcgcttt ggacagtgtg tctaggcctg 'gttccaggct caaaatgacg gtgggatgac ccctgagcac gaacccggct agtgttgttc ctgaattcgg tctttgtcaa agttagatag cgaaagactc gtatataaat ggtgatcgag tccaaaatat ttggaaggtg tgtggtatgg acaaatgaac tggacatcac ttctgaggca cgaccgtgaa tcggctctca ctcattttcg ggtttgtcac cagttgaaga cccggcagca gtatcccaga tcggaaactt aaggctccat tgattggtaa gatggtctat ccaaccattc tggttctcaa gtcgctgatc ttgcaaattg agccatgatg gagcaagagg cttggccagg aacactattg aaagcctcat
ΟΓ-η-ΊΐίΊ^ΛίΏΐ-Ιu U L· tttgttcagg aactatagca gaccacctgt ctgttcaatg ttctctgatc atcgcgttct atcatgaatc acgtggcagc gagcggagcc ttgttggcgc tccaccatgg gatgagttcg cgtgaggcca aatctcccta gtctttgatt agtgttctcg cctaccaagg gctcaggcct ctgaagttgg atgataaaga cgtcaattga aattacttct cgcggttcag tgtgaggaag tcgacgccat tggttttaga gttcacgaaa agcattcaaa actaggcatg ctgacatctt tcggtctgtt ggtaatgtgt gatgcagtgt tgtaatctct gaaaccatgg gagggccgag gcatgagctg accacagcgc tcttgaccct caaaattccc tgccgaccag gttatctctc ctgagaaact ctctcattga agcaactcta ttgccgacga gtgattccac aagcaagctc acgataatga agtattcctg gcatgttcat tgcgccgtca ł“ —1 -Ί —1 4” ΓΤΠ— t-l i—l υ«αα uyy i_ \_ ·_ tgaacaacgc tctccacagg tggtaatcgg agatcgggca tagccgtcca ggaagtccat tgatcaatga agtatgaagc gcaagcacaa gtcttaccgg aagaaatttc tcggcagcaa tgcaacacgc cctcaggcga acaagcaggg cttcccgtga acccactcat ttgtagacca cctagatcgt tggattagaa cacacgcata accttcgttg agtaccgtaa gtgaaacctc tgcaaatagt tgtctgtcat tatttatgag ccgtgtaaga agagccagag gaccttttga gggaaaatta ttcaaccatc cggcacgttg ggcttcatcg cagttttccc atggaggagg cacacgcttt aagacggtca gcgcttcaag ggtcaacgcg ctcaaacaag atgcgtttcc ccgtgttacc tcaaggtgtc ccttgacctc cgcggccacc gggaacctcg tgctaccagc gcagggaggc gaggcagcaa gaagggtacc cgagatcttc cgtccaagtg tgcggaggca tgacactctc ctaccacaga gatttacagc acagcgggaa gcatagcaaa ccctgctgcc aattgctcgt ggcaaccccc cagcaaagac ggcgatgggc gacattcggc gcgggtgccg ggaacccaag tcaagcggag gcgcactcct tcatgtcaaa cttttcttca tcagcgccgt attggcaata ttcatctaca ctcttcttta cggtgataaa caaggcttgg tccatagtta gcctgttcag atggtcgcga ttagaactat ccttgctata tatagctgtt tgctttccct tgtctcgacc attattagct ctatagaaac atttgctgtt actttgatgc tcgccgaagc ttgacatggc atcgaattat gagacggtgg caacaacttt tgatatcgag ctccaagttt gactccttgg ccactcttga cgactcccag gacagcgggg acagatgcgt cgtaagattc caaatggtaa attgacctcg cgtacgtgct gttctcaaga gaggaagagt agactcgttg ttagttggtg ggggtgaaaa aacctggaaa gtctcgtcat aattcagagc ttagatccca atgcagttct ataaccatcg tttttcgcta gagcaccttg tatggcgtca actcagacac agtggctcaa tatgacatcg cttcagagct atcctcacta gaattcagat gagcagatgg aatagcgaat ttgcagcaat tatacctcgg aattgatttc ctggtttagt aacgagcctt ccactataac tcaaatttgt taccctgttg ggaagcgctt gaaactcgag cttggagagc tgtcgtcgtc agcaaatcaa gatggagcag tatccgtttc ggtcgtgtct ggaccttgag ttacttcaac cgacaatgga agaccaagtt ttcaaactaa cggacgggga gtgcagtgac gggtacttgg ctacatccat cttctccgac cgtcagccga ttcgtcgcga aagatcatac accggttgag ttgttactgg aCCCyy ety 3.S accggaaact atttctactg atggctcaac tgcagcgacc atgggcgaat ctgcgccaac agcagcaaat tggtcgcctt acctggccgc gcctcgccga acgtgcttcc tagccaccaa tcctcgactg acgccccctt ttggcaatgc ttctcgagat cgctgtatgg tgttctcgat gtgtggtttg caaatctatc tcgtcttgta cgtaacatca tagcgcgttt aatccatcct gccttgttgt ccatgatcta taaatcaccc tcagtaaaaa tctcacctag gaccgtctcc tacatctgca aaaatcttga gtcttgcgcc aacagcaatg caaagtggcg
30600 30660 30720 30780 30840 30900 30960 31020 31080 31140 31200 31260 31320 31380 31440 31500 31560 3162 0 31680 31740 31800 31860 31920 31980 32040 32100 32160 32220 32280 32340 32400 32460 32520 32580 32640 32700 32760 32820 32880 32940 33000 33060 33120 33180 33240 33300 33360 33420 33480 33540 33600 33660 33720
PL 202 457 B1 accaatgcgc cctcagagaa ggccactatg ccgacaatgg gtgcctgtgg gttagttata 33780 gaccaatctt ggacggtctt ttgcacaggc ccgatcacag ccgctactct atcgcccacc 33840 gtgggggttg tcgtgtttgt aacggcgtca tgatgctttt ggaaccaggt gtagtatgga 33900 cccatgcctt ggaagacagg aagcacgccg ggtccggggc tggagctaaa cggcgcggtc 33960 gcatatacga attcaaactc gtttttcaac gccacgcgca gtttagagat ctggacgcgg 34020 aatatggctg ctgagcaccc ggcaccgtgg atgcataaga gagcttttct cggtttgcct 34080 ggcgagaaat ctgtaatcct cgctggactc attttctctt gtggtgtgag ctgtgacttc 34140 gtctgttctg gggaatttgt tagtcattac tgacaaggaa ataacaacga cgtagtattg 34200 atc 34203 <210» 3 <2113 17 <212» DNA <213» Sekwencja syntetyczna <22 0» <221» misc_feature <223» Opis sekwencji syntetycznej: Mieszany primer mający sekwencję DNA wydedukowaną z sekwencji aminokwasów PKS of Aspergillus flavus.
<220» <221» zmodyfikowana zasada <222> (6) . . (6) <223» i <220» <221> zmodyfikowana zasada <222» (9) . . (9) <223» i <400» 3 gayacngcnt gyasttc 17 <210» 4 <211» 17 <212» DNA <213» Sekwencja syntetyczna <220>
<221» misc_feature ' <223» Opis sekwencji syntetycznej: Mieszany primer mający sekwencję dna wydedukowaną z sekwencji aminokwasów PKS of Aspergillus flavus.
<220» <221» zmodyfikowana zasada <222» (3)..(3) <223» i <22 0» <221» zmodyfikowana zasada <222» (6)..(6) <223» i
PL 202 457 B1
PL 202 457 B1
<210? | 10 |
<211? | 19 |
<212? | DNA |
<213? | Penicillium citrinum |
<400? 10 ttgcttgtgt tggattgtc 19
<210? | 11 |
<211? | 20 |
<212? | DNA |
<213? | Penicillium citrinum |
<400? 11 catggtactc tcgcccgttc 20
<210? | 12 |
<211? | 19 |
<212? | DNA |
<213? | Penicillium citrinum |
<400? 12 ctccccagta cgtaagctc 19
<210? | 13 |
<211? | 21 |
<212? | DNA |
<213? | Penicillium citrinum |
<400? 13 ccataatgag tgtgactgtt c 21
<210? | 14 |
<211? | 19 |
<212? | DNA |
<213? | Penicillium citrinum |
<400? 14 gaacatctgc atccccgtc 19
<210? | 15 |
<211 ? | 20 |
<212? | DNA |
<213? | Penicillium citrinum |
<400? | 15 |
ggaaggcaaa gaaagtgtac 20
<210? | 15 |
<211? | 21 |
<212 ? | DNA |
<213? | Penicillium citrinum |
PL 202 457 B1 <400 = 16 agattcattg ctgttggcat c <210 = 17 <211 = 722 <212 = DNA <213 = Penicillium citrinum <400 = 17 ggccacgcgt aactctgcga atcaagccaa gtggtgtcaa ccaagatccc ccgggcgcac cctctttctt tgctggagac gatcctctac gtgaattgga accgtgtatc gttcatcctt tg cgactagtac ttctgtttaa ctatccaaac cacaccatca taaggagaga gaacgcaccc caacatccaa ggtctatgaa tgctgtgtac tagtattcct atacttcttc agctgccgtg gggggggggg tcccaatcct gagccaattg aaactttggg tttgacgtcg tttgcatact gctggagagg gctgtatcca gtcggtatga acatactctg gactggcatg catctggccg gggggggggg atcgcccaaa tggtagtggg agctgctcaa atacatttta tgctgcagga ccgaaacgat acgcaggcct tgacgcatga ccacgggggt ggccgagtat tccaacagct gcttgttcgc aacaggatca aagcggttgt agagccccgg cagccccgat ggatctacgc tgacccacag acggatccaa ctatgagact agctgtcagt gacgatcgac tagaacgggc tcagagattc gcagttatgg cggtttccag gatgtacaga ggcactcacc ggttttgatg caaaggctgc ggccttcaag atcgtgacgc gtggcctcca acagcctgta gagagtacca
120
180
240
300
360
420
480
540
600
660
720
722 <210 = 18 <211 = 760 <212 = DNA <213 = Penicillium citrinum <400 = 18 ggccacgcgt ccagggcgac aaccgcaacc cacatccacg tccacagaag ctcgcgattc cgtaaagggt catgaccaca ctacgaatcg ggtgtttggg agttccgcgt cttctacgac cgcactgcac cgactagtac tgatatatca gcaaccgcaa cccattgcca ctttgggaaa aatgtgagag ggacacttca gaggtcgcca ctggagagtg ggtgtcatgt tatttcataa ttacgtggtc ttggcgtgcc gggggggggg gtcaatgaaa ccgcaaccgc tagttggaat tggttgaaag gagtatacca tcgacgagga gctgcatgga ccggtatcac accacgacta ctggcaactc ccagcgtgac agagcttacg gggggggggg caacgttgga aaccgcaatg gggatgtcga aggaggcagt cccgaatggc tcctgcttta tccgcagtat catcgatggt tcaggattcg aggaacaatg ggttgacacg tactggggag gactatcaac atgaacaata gcaggctcgg tttgctggag gcctggtcta gaaagggtcg tttgacgccg cggcttatgc atggcaggct ctcaatcgtg ctttcgaacc gcctgttcga ggttttatca cccccgccgt cttgctctaa atgcaacgag aggtcccctc ggtccaccca cgttcttcaa ttgaggtggt ctaatacgtc accccgagac ggatatcaca cgacattgac
120
180
240
300
360
420
480
540
600
660
720
760 <210 = 19 <211 = 773 <212=· DNA <213= Penicillium citrinum <400= 19 ggccacgcgt cgactagtac gggggggggg ggtttttttt ttttcaaggt tgactggaag 60 agtgctctcg gccacaaaat cccagaagca ttagtgctgt tattcgatta taaaccgtcg 120 cagcgctctc attcttcgct ctttcttctt ttccactggt gtgcataggt cctatctgtc 1BO tcacgcaatg ctcggccagg ttcttctgac cgtcgaatcg taccaatggg tatcgacccc 240
PL 202 457 B1 tcaagccctt ccagtccgaa
Łaggcaggac caagcccctg cgacgagttt ctctcatctc caaagttgtt cttggccgac tgtctattcc gtggcggtcg ctgcaagtct ttcgatacgt cgcttcattg cggaaaatca cctggattcg ttgaaccagt gctactattg aatggattgg cagtgcttct ataatcccaa atggtccgag ttgattccgg aagatatgtg ac999ttcaa tacaaaccca ccaagttgtt accttgtcac tagtctcatc aaaatggtgg ctggatcgaa ctattgcacc catgtacaag ggaaatctgc agcccccaag cggtaaaagc acgaacagtc gcctaccgtt gagttgacga gcttggttct atcctcccat tttttggcgg caggatgcac tacacaaagc gaggagtggc acactcatta tgcgggggcg ccatgagggc cgaaaaacga cgtccatggc atgactttca atcttgtcaa cattggctac aaaccgcacc tgg
300
360
420
480
540
600
660
720
773 <210> 20 <211» 527 <212» DNA <213» Penicillium citrinum <400» 20 ggccacgcgt cgactagtac gggggggggg aaccgattag gctgtagcac ggaatcaatg ccaatttcta tctagctagt cgttgataaa acagaatggc gttgctcatt agacctttca aatcagcagc tccaaaacgg accacatacg gcagaatggg tggaagtggc cgattttgga gcatggtcgc accctctacg cgtgtctaca ttggactact gctctttggt agagcttcga gtacctagga tdtSCyo-Cyy gagactacct ttcgttgcta ctcgggaaat cccgatccat caaagacagc cgaaggaagt cggggatgca actgttcagt
Caya.ttfitaC agctataggt ccctctcgct cgggcattga accgtttgca ttcttccatg cgaagcttga gatgttc tgtccctccc ctaggcgcct accactccaa ttcgcggtag cctccacact ccatagctat gccccgcaaa tcaccggccc
12 0 180 240 300 360 420 480 527 <210» 21 <211» 522 <212» DNA <213» Penicillium citrinum <400» 21 ggccacgcgt aggctagcgg actatagaag attgcgcgat aaagtcaaaa agctcgggct ccattatcgt ggtggtacgg tgtatacact cgactagtac accttaacga cgccgcgcag gtcagaacct tgacacgctc ggtggttgct cacggcaatc cagtgcttat cttgggcttg gggggggggg aacaacgaga tagagattca ctacccccta gaagcgactg tcagttactt ccacatatca cttctggcta aagtacactt gggggggggg gcgagatcat caccgcccct aagaagggga agtccaagtc tcgtagcatt caagcgagtt actgtgctct tctttgcctt ggatccatca tcatacacca tgaagcaaaa accaaggcca ccagcacatc tttgatgctc ccactctctg ccagcccctg cc atctgacttc aaacacaggt gtcggaagga cagaaggaag acaggcctca cttgatatgt aacgatgtag gccggtaaat
120
180
240
300
360
420
480
522 <210> 22 <211 » 541 <2 12» DNA <213» Penicillium citrinum <400» 22 ggccacgcgt cgactagtac gggggggggg ggctcacctc acattatttg atcttaatcc 60 aataattatg tccctgccgc atgcaacgat tccgacgaac ctacgccgtc gcgcgtttcg 120 acgctcatgt gaccggtgtc atgcacaaaa gctcaaatgt accggtagca atgccaattt 180 agtccgtgct cagtgtcaac gttgtcagca agccggatta aggtgtgtgt acagcgaaag 240 gctacccaag cgcaatttac ataaagaagc cgcagctgga actacaagag ccacagaaac 300
PL 202 457 B1 ctcacaaccg atgaccgcga catcttctac ggtcttctca tcattggcag agactcctcc accttactgc tcaccaccta cgcatattgg cacctcggca ctcaaggaaa cattatcaga accatcagcg gcaaccctgc aattctatga tacatcaatc aactttgatg atcccgagtc gtttcccggc ggctggcctc agccaaatac atttcgcgac gatgccaaca gcaatgaatc
360
420
480
540
541 <210? 23 <211? 20 <212? DNA <213? Penicillium citrinum <400? 23 atcataccat cttcaacaac <210? 24 <211? 20 <212? DNA <213? Penicillium citrinum <400? 24 gctagaatag gttacaagcc <210? 25 <211? 20 <212? DNA <213? Penicillium citrinum <400? 25 acattgccag gcacccagac <210 ? 2 6 <211? 20 <212? DNA <213? Penicillium citrinum <400? 26 caacgcccaa gctgccaatc <210? 27 <211? 20 <212? DNA <213? Penicillium citrinum <400? 27 gtcttttcct actatctacc <210? 28 <211? 20 <212? DNA <213? Penicillium citrinum <400? 28 ctttcccagc tgctactatc
PL 202 457 B1 <210> 29 <211? 1524 <212? DNA <213? Penicillium citrinum <400? 29 aactggaaga agtaattttg attgaagccg ttatcatgaa acttcagagc cctgagcgtg tggtagggtc gaacactcgt caaagacagc ggagattcag cctcacgcac actcatcaaa tggtggatcg ccaacaaaac tccgctcttt gccacgtgaa tcatgatggg acgcgatatc cagagaattg tgaacaggtt ggtggtcatc tatagtttgt gaacaaagtg cgctgctata aggctttcag tagtgttgtt attcgcggcc acaaagatac aattcaggat caacactcaa cgggttcatc ctcagggcca atcccacatc cattttggca ctggaacaag gcctagacag actgtccttg gcgcagggga gttggtttcg gtggtaggcg gattcggaag tggctgtatt aagcacggtt gtcccccatt ggtcgatggt ttctgttgtt tgtgccccag cttctcgagt cactctgttc gtcatcgcca agcccgcctc gaagatggta gcaggaattt aagacgaatt agatttgcca accacacatc gagaacatag tacagcgagc tcgagaacga ttgccaattg ggggcgtgtg tcgaggatga gtggctacaa agcacgttag gcgaggccga gccaggtaga gcgaccatgg tgctgctgct ggcgcagatg cgcccatttt cgctgcattt gagccatcac tagaaatcaa ttccggtact tccgggttct gtaacaaagc aaccggtcga tgat tttttttttt cgctatttgt tctgctctat tgaattcacg tgaggattga tctgaagttt tgtcataagg agccactctc tctgagtctt cgccatacgg ggtgctcgcc cgaaaaagcc tggttatgtc actgcatggg gatctaaacg ctgaattggc acgagacttt ccaggttttc tcaccccgct caactaatct cgagtctgag cttcctctgc tgagaaccac acgtacggaa ggtcaatggt tttttttcaa agatgaatat tgccaatttc gcgctgaacg agaaaagtgg gacatgaatg agtgcgctca cgcttgaccc gggttcctcg cacccgcgcg gaatgtcttg catcgccgaa tttgctgccg ggttgccttg agcaattgct agcagggtca gctatgcatg ccgctgttgg gtaaatctgc gtggtagccg agtgtcacct ctccgcagcg ttggacggga gatctcgtga acccttcatg cgaaggtaga gcgtgtgtca taatccatct atctaggcca tctacaaagg agtgggtcct cgggaagcga tgcttgtaat cctgaggtag tgttgcatgg ctgccgacga atttcttcca gtaagacgcg tgcttgcggc tcatactgct ttgatcagat gacttccaga acggctagat ccgatctcat attaccaaca gtggagatgc ttgttcacct ccatttaaat cggcgcaatg aacatgccaa
120 ISO 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 12 6 0 1320 1380 1440 1500 1524 <210? 30 <211? 784 <212? DNA <213? Penicillium citrinum <400? 30 aactggaaga ctcagggcca attaaatagt ccgctatgct cttcactgaa tggtgttacc agtttcgaag aggacatgtc ggacgataga ctggtccttt taagtcccac atgtgttgat ggattgcctt tagc attcgcggcc ctgtaatggt caggctcagc ccttcgtact cccttcaact attcatgagc ttcaatggcg gtcttctgcc aatggcctcg tttatgcgaa aaaccgctgt tcctgtaacc ctccaacaca gcaggaattt atttcaggta ccaggctcga atacctccgt taactgcatt tcaaagatcg acgagtgagt agaccaaaca tcgtgagagg gagacaaagg tcctgtatcc acagctgcgg tccatgacgt tttttttttt tctctattta ttcagattgg cgagctatac tcgccacaac acacatcaac ctacgccgac ttcgcatcag tgaccctgct attggtctgc agtttgcctc gaggtgatgg ccttttcatg tttttttttc ctgctatcca attcaggctt ccgcttggcc taactcgacg atggatttca acctgccagg cttttccgtc tagttgggcc atgaaggact ggtccagtga aaattgaggg cataggcttg tttgttgctt gaagtcaggc cagaccatgg agacaaaagg aggccggcga gatgtgatcc tttttggacg attgctttga cgcacgccat tggcggtatt gcacccgggg gaagaacaca taacctattc
120
180
240
300
360
420
480
540
600
660
720
780
784
PL 202 457 B1 <210? 31 <211? 764 <212? DNA <213? Penicillium citrinum <400? 31 aactggaaga cgttttattt attggaataa ccggtcatga atgcatacga cacatcatac ccgcccggga caattgagcg ataattttcg caactcgccc gcgcatagtg gagcttcagc ctcttggcgg attcgcggcc tactaaccta gcctggggac gggagcggga acgctaaaag tgaatcagta caagcgcgtg gtgaaggcct gggttttccc ttgggaatga gcgcactcga ttgaacagag agaggctgaa gcaggaattt ctcgactaat ggatgcatat tgtcctcgtt cgtgacggta tatgagcgag ggttccagcc tgtctggatc acacatcagg agaggccatt ccggcttgat aggcaggcgt taaggtctgg tttttttttt acagcaccta ttgttttagt gcgccggcgt gtatttgtca gagaatcttg gaagccgatg ctcgcgcatg gttgttcatg ggatagagtg tcgctgcgtc ccagccccct gtgcctggca tttttttttc gtttctctgg ttgcgtgtta accatgagct tcgtctcctg atttccttcg tgatcaccgt cgcataaatc cggtctgcag atgtctctga tctttcatgc tctccgatta atgt gaataaaatg gacggaaacc tatcttagca ttgtggttgg gtacaggctt aggcgaagaa tggtattctc ggtagggatc ccacagcggc gagcggtact agctgtcgag cagtgcggat
120
180
240
300
360
420
480
540
600
660
720
764 <210? 32 <211? 765 <212? DNA <213? Penicillium citrinum <400? 32 aactggaaga tctctttata tgagataccc gaaaattatg ggagggggta tcagtagctg cctgacgggg atgtgcgcct aaaacagcgc tgtgatccgc ccgcccaacg agattgttca gtggcaatga attcgcggcc tattcttctt tttctggccg acaataacaa cggagcttgg cagcactcgg agacacttcg tgaccaggtg ttccgatgat ggacaccaag ttccaacctc tgagagtgat aaatggctgc gcaggaattt ccctactact ttcactctac ccaatgagaa aatgctccta cctcagtgca agaaggggct accggcggct gcgcgcaagt catgtcaagc aatagacggc gcagttagcg cgcaagattg tttttttttt tgcatcgtaa cacctgcctg aaaatatgat agattccgac ttgttaggaa gaagatgccg agggcagcac tgacgtgcat attgcgccct atggagacag ctctccacaa gcagcttggg ttttttctgg atttcaacaa tctcattgca cctcctgcaa ctaatcagcg cagggactgt gggcagaacg atagcgagag tctcaccggg ggggctccag agatttgaag cttgcgccgg cgttg aaaaggacca catataaaca ttgtgctttt tgaatccact tcgagcccga cctggttccg gttgtgcgcc ctccccagcc agtggtcggg aatcgtacca cgatccgcga atcctgacct
120
180
240
300
360
420
480
540
600
660
720
765 <210? 33 <211? 802 <212? DNA <213? Penicillium citrinum <400? 33 aactggaaga tcgacattaa aacgcggtca gccatcccat aagtatgatc ccacatctct catacttgct attcgcggcc ttaagtatgt agcatcagtc tccaaaggca aacggcgaga gaagccagtc caggccagtt gcaggaattt ggagattctt tcaggcacag aacacaaacg ctgtaagctt gcccctgctg ctcaaaccgg tttttttttt tgtggaggca cccgggtgtc tgcacgccgt ttacaacccc ccgtcacggc acccaaagac tttttataga cggtaatgtg gtttttggtt agctcccact tggaaggtta ctgcgtgtcg aaggttagca atctttgaaa tctatctagc gcaatcttcc gctaagtaaa ttcttgctga acagtgggcg aagtccagga
120
180
240
300
360
420
PL 202 457 B1 agagcgatcc cgggcgaaag agcccgcgat ataccagacc atcctgtctt caggcaacat tcggtagata tccaaacgtc cgtgctttgg aaattggtac tgcgcctatg tccaattgcg gtacacacca gtaggaaaag tgtccaaaca atggcgatga atgacccatt gcgacgagaa aagccagaaa ctcagtgtgg cggcgagaga taggcgtttg tcacagttga cagcgctgcc ccatagccat gagaaacatc aattccgagg catgccacaa tgtatggggc tagggcccaa aatgacttgt cttcacagcc gcaccttgtt ccacgaccga tggaaggtgg ggcaaatagt ccaagaattc tggaagtaga
480
540
600
660
720
780
802 <210> 34 <211? 562 <212> DNA <213? Penicillium citrinum <400> 34 aactggaaga tgtgtttctt tccctgaggc ataggagacg tgcttggcat tccccaaagc cagaagataa tagagtgaaa accagtacca cggatagtag attcgcggcc cgctaatgcg ctttgttgac agaggccggc atctgatagg agtctcaatc ggcgtgcatg cgagggaagt atccattcgt cagctgggaa gcaggaattt aatatttcct ttgggctctt gttatggttt actagacgaa ccactcaata aatgggtcga gcttcggctc gtgctttgct ag tttttttttt tatagcaacg cgtctccggc tattttcagc tagatgccgc gtcgaaggct gatgtgaaat ttccattgtc tttgtccaca ttttttttac tcgcaacaca ttcgtcactc gccaaggatt agccccgtgc tacacgcaat gagctcgccg atttctagtg aggttgggct taagcaatat tttatcgtct caaagcacag tgccacgatg tcctgtgcta gtcgtgcatg atatgaagat gttgagccag ttcatcacct
120
130
240
300
360
420
480
540
562 <210> 35 <211? 26 <212> DNA <213> Penicillium citrinum <400> 35 gttaacatgt cagaacctct accccc <210? 36 <211> 27 <212> DNA <213> Penicillium citrinum <400> 36 aatatttcaa gcatcagtct caggcac <210> 37 <211> 1662 <212> DNA <213> Penicillium citrinum <220> < 2 2 1 >
< 2 2 2 >
CDS (1) . . (1662)
PL 202 457 B1 <400> 37
atg Met 1 | tca Ser | gaa Glu | cct Pro | eta Leu 5 | ccc Pro | cct Pro | aaa Lys | gaa Glu | ggg Gly 10 | gaa Glu | cca Pro | agg Arg | cca Pro | cag Gin 15 | aag Lys | 48 |
gaa | gaa | agt | caa | aat | gac | acg | ctc | gaa | gcg | act | gag | tcc | aag | tcc | cag | 96 |
Glu | Glu | Ser | Gin | Asn | Asp | Thr | Leu | Glu | Ala | Thr | Glu | Ser | Lys | Ser | Gin | |
20 | 25 | 30 | ||||||||||||||
cac | atc | aca | ggc | ctc | aag | ctc | ggg | ctg | gtg | gtt | gct | tca | gtt | act | ttc | 144 |
His | Ile | Thr | Gly | Leu | Lys | Leu | Gly | Leu | Val | Val | Ala | Ser | Val | Thr | Phe | |
35 | 40 | 45 | ||||||||||||||
gta | gca | ttt | ttg | atg | ctc | ctt | gat | atg | tcc | att | atc | gtc | acg | gca | atc | 192 |
Val | Ala | Phe | Leu | Met | Leu | Leu | Asp | Met | Ser | Ile | Ile | Val | Thr | Ala | Ile | |
50 | 55 | 60 | ||||||||||||||
cca | cat | atc | aca | agc | gag | ttc | cac | tct | ctg | aac | gat | gta | ggg | tgg | tac | 240 |
Pro | His | Ile | Thr | Ser | Glu | Phe | His | Ser | Leu | Asn | Asp | Val | Gly | Trp | Tyr | |
65 | 70 | 75 | 80 | |||||||||||||
99c | agt | gct | tat | ctt | ctg | gct | aac | tgt | gct | ctc | cag | ccc | ctg | gcc | ggt | 288 |
Gly | Ser | Ala | Tyr | Leu | Leu | Ala | Asn | Cys | Ala | Leu | Gin | Pro | Leu | Ala | Gly | |
85 | 90 | 95 | ||||||||||||||
aaa | ttg | tat | aca | ctc | ttg | ggc | ttg | aag | tac | act | ttc | ttt | gcc | ttc | CtC | 336 |
Lys | Leu | Tyr | Thr | Leu | Leu | Gly | Leu | Lys | Tyr | Thr | Phe | Phe | Ala | Phe | Leu | |
100 | 105 | 110 | ||||||||||||||
tgt | att | ttt | gaa | eta | ggc | teg | gtg | eta | tgc | ggt | gcc | gca | aga | tct | tcc | 384 |
Cys | Ile | Phe | Glu | Leu | Gly | Ser | Val | Leu | Cys | Gly | Ala | Ala | Arg | Ser | Ser | |
115 | 120 | 125 | ||||||||||||||
acc | atg | ttg | att | gtt | ggg | =gg | gcc | gtt | gct | gga | atg | gga | ggc | tca | ggt | 432 |
Thr | Met | Leu | Ile | Val | Gly | Arg | Ala | Val | Ala | Gly | Met | Gly | Gly | Ser | Gly | |
130 | 135 | 140 | ||||||||||||||
ctt | gtc | aac | gga | gcc | ctc | aca | atc | ctc | tca | aca | gct | gct | cct | aag | cac | 480 |
Leu | Val | Asn | Gly | Ala | Leu | Thr | Ile | Leu | Ser | Thr | Ala | Ala | Pro | Lys | His | |
145 | 150 | 155 | 160 | |||||||||||||
aag | caa | cca | gtt | ttg | att | gga | gtg | atg | atg | ggt | ctt | agt | cag | att | gcc | 528 |
Lys | Gin | Pro | Val | Leu | Ile | Gly | Val | Met | Met | Gly | Leu | Ser | Gin | Ile | Ala | |
165 | 170 | 175 | ||||||||||||||
att | gtc | tgt | gga | cca | ctg | ctc | gga | ggt | gct | ttc | act | caa | cac | gcc | act | 576 |
Ile | Val | Cys | Gly | Pro | Leu | Leu | Gly | Gly | Ala | Phe | Thr | Gin | His | Ala | Thr | |
180 | 185 | 190 | ||||||||||||||
tgg | ega | tgg | tgc | ttt | tat | atc | aat | ctc | ccc | atc | ggc | gct | gtc | gct | gca | 624 |
Trp | Arg | Trp | Cys | Phe | Tyr | Ile | Asn | Leu | Pro | Ile | Gly | Ala | Val | Ala | Ala |
195 200 205
PL 202 457 B1
ttc Phe | ctc Leu 210 | ctt Leu | ctc Leu | gtc Val | atc Ile | acc Thr 215 | ata Ile | ccc Pro | gac Asp | ega Arg | att Ile 220 | tea Ser | tcc Ser | acg Thr | gac Asp | 672 |
age | gaa | ctc | teg | acc | gac | aaa | cca | atg | gcc | aac | ata | aaa | tcc | aca | ctt | 720 |
Ser | Glu | Leu | Ser | Thr | Asp | Lys | Pro | Met | Ala | Asn | Ile | Lys | Ser | Thr | Leu | |
225 | 230 | 235 | 240 | |||||||||||||
ege | aaa | ctg | gac | ctt | gta | ggc | ttt | gtg | gtc | ttt | gca | gcc | ttc | gca | acc | 768 |
Arg | Lys | Leu | Asp | Leu | Val | Gly | Phe | Val | val | Phe | Ala | Ala | Phe | Ala | Thr | |
245 | 250 | 255 | ||||||||||||||
atg | att | tcc | ctc | gca | eta | gaa | tgg | gga | ggg | teg | acc | tac | acc | tgg | ega | 816 |
Met | ile | Ser | Leu | Ala | Leu | Glu | Trp | Gly | Gly | Ser | Thr | Tyr | Thr | Trp | Arg | |
260 | 265 | 270 | ||||||||||||||
agt | tcc | gtc | atc | atc | ggc | ctg | ttc | tgt | ggc | gga | ggg | ttt | gct | ctg | att | 364 |
Ser | Ser | Val | Ile | Ile | Gly | Leu | Phe | Cys | Gly | Gly | Gly | Phe | Ala | Leu | Ile | |
275 | 280 | 285 | ||||||||||||||
gcg | ttc | gtg | eta | tgg | gag | cgt | cat | gtt | ggc | gat | gct | gtt | gcc | atg | att | 912 |
Ala | Phe | Val | Leu | Trp | Glu | Arg | His | Val | Gly | Asp | Ala | Val | Ala | Met | Ile | |
290 | 295 | 300 | ||||||||||||||
cct | ggc | tea | gtg | gct | ggt | aaa | ega | caa | gtg | tgg | tgc | tct | tgt | tta | ttt | 960 |
Pro | Gly | Ser | Val | Ala | Gly | Lys | Arg | Gin | Val | Trp | Cys | Ser | Cys | Leu | Phe | |
305 | 310 | 315 | 320 | |||||||||||||
atg | ggc | ttt | ttc | tct | ggc | tcc | ttg | ctt | gtc | ttt | tcc | tac | tat | eta | ccg | 1008 |
Met | Gly | Phe | Phe | Ser | Gly | Ser | Leu | Leu | val | Phe | Ser | Tyr | Tyr | Leu | Pro | |
325 | 330 | 335 | ||||||||||||||
atc | tac | ttc | cag | gct | gtg | aag | gat | gtt | tct | ccc | aca | ctg | agt | ggt | gtg | 1056 |
Ile | Tyr | Phe | Gin | Ala | Val | Lys | Asp | Val | Ser | Pro | Thr | Leu | Ser | Gly | Val | |
340 | 345 | 350 | ||||||||||||||
tac | atg | ttg | cct | gga | att | ctt | gga | caa | gtc | att | atg | gct | atg | gtt | tct | 1104 |
Tyr | Met | Leu | Pro | Gly | Ile | Leu | Gly | Gin | val | Ile | Met | Ala | Met | Val | Ser | |
355 | 360 | 365 | ||||||||||||||
ggc | ttc | gca | att | gga | aag | aca | gga | tac | tat | ttg | cct | tgg | gcc | eta | ggc | 1152 |
Gly | Phe | Ala | Ile | Gly | Lys | Thr | Gly | Tyr | Tyr | Leu | Pro | Trp | Ala | Leu | Gly | |
370 | 375 | 380 | ||||||||||||||
age | gct | gtt | ctc | gtc | gcc | ata | ggc | gca | ggt | ctg | gta | tcc | acc | ttc | cag | 1200 |
Ser | Ala | Val | Leu | Val | Ala | Ile | Gly | Ala | Gly | Leu | Val | Ser | Thr | Phe | Gin | |
385 | 390 | 395 | 400 | |||||||||||||
CCC | cat | aca | tea | act | gtg | aaa | tgg | gtc | atg | tac | caa | ttt | atc | gcg | ggc | 1248 |
Pro | His | Thr | Ser | Thr | Val | Lys | Trp | Val | Met | Tyr | Gin | Phe | Ile | Ala | Gly | |
405 | 410 | 415 |
PL 202 457 B1
ttc Phe | ggt Gly | cgt Arg | ggt Gly 420 | tgt Cys | ggc Gly | atg Met | caa Gin | acg Thr 425 | cct Pro | atc ile | atc ile | gcc Ala | atc Ile 430 | caa Gin | agc Ser | 1296 |
acg | Ctt | teg | ccc | gaa | caa | ggt | gcc | ctc | gga | att | tct | ctc | gcc | gtg | ttt | 1344 |
Thr | Leu | Ser | Pro | Glu | Gin | Gly | Ala | Leu | Gly | Ile | Ser | Leu | Ala | Val | Phe | |
435 | 440 | 445 | ||||||||||||||
gga | cag | acg | ttt | gga | gga | teg | ctc | ttc | ctg | gac | ttt | gct | aac | ctt | gtc | 1392 |
Gly | Gin | Thr | Phe | Gly | Gly | Ser | Leu | Phe | Leu | Asp | Phe | Ala | Asn | Leu | Val | |
450 | 455 | 460 | ||||||||||||||
ttt | ggg | tcc | ggt | ttg | aga | act | ggc | ctg | agc | aag | tat | gcg | ccc | act | gtc | 1440 |
Phe | Gly | Ser | Gly | Leu | Arg | Thr | Gly | Leu | Ser | Lys | Tyr | Ala | Pro | Thr | Val | |
465 | 470 | 475 | 480 | |||||||||||||
gac | acg | cag | gcc | gtg | acg | gca | gca | ggg | gcg | act | ggc | ttc | aga | gat | gtg | 1488 |
Asp | Thr | Gin | Ala | Val | Thr | Ala | Ala | Gly | Ala | Thr | Gly | Phe | Arg | Aep | Val | |
485 | 490 | 495 | ||||||||||||||
gtc | agc | aag | aat | aac | ctt | cca | ggg | gtt | gta | aaa | gct | tac | agt | ctc | gcc | 1536 |
Val | Ser | Lys | Asn | Asn | Leu | Pro | Gly | Val | Val | Lys | Ala | Tyr | Ser | Leu | Ala | |
500 | 505 | 510 | ||||||||||||||
gtt | gat | cat | act | ttt | tac | tta | gca | gtg | gga | gct | acg | gcg | tgc | acg | ttt | 1584 |
Val | Asp | His | Thr | Phe | Tyr | Leu | Ala | Val | Gly | Ala | Thr | Ala | Cys | Thr | Phe | |
515 | 520 | 525 | ||||||||||||||
gtg | ttt | gcc | ttt | gga | atg | gga | tgg | cgg | aag | att | gca | acc | aaa | aac | gac | 1632 |
Val | Phe | Ala | Phe | Gly | Met | Gly | Trp | Arg | Lys | Ile | Ala | Thr | Lys | Asn | Asp | |
530 | 535 | 540 | ||||||||||||||
acc | cgg | gct | gtg | cct | gag | act | gat | gct | tga | 1662 | ||||||
Thr | Arg | Ala | Val | Pro | Glu | Thr | Asp | Ala | ||||||||
545 | 550 | |||||||||||||||
<210» 38 | ||||||||||||||||
<211» 553 |
<212» PRT <213> Penicillium citrinum
<400> 38 | Arg | Pro | Gin 15 | Lys | |||||||||||
Met 1 | Ser | Glu | Pro | Leu 5 | Pro | Pro | Lys | Glu | Gly 10 | Glu | Pro | ||||
C-lu | Glu | Ser | Gin 20 | Asn | Asp | Thr | Leu | Glu 25 | Ala | Thr | Glu | Ser | Lys 30 | Ser | Gin |
His | Ile | Thr 35 | Gly | Leu | Lys | Leu | Gly 40 | Leu | Val | Val | Ala | Ser 45 | Val | Thr | Phe |
Val | Ala | Phe | Leu | Met | Leu | Leu | Asp | Met | Ser | Ile | Ile | Val | Thr | Ala | Ile |
55 SO
PL 202 457 B1
Pro 65 | His | Tle | Thr | Ser | Glu 70 | Phe | His | Ser | Leu | Asn 75 | Asp | Val | Gly | Trp | Tyr 80 |
Gly | Ser | Ala | Tyr | Leu | Leu | Ala | Asn | Cys | Ala | Leu | Gin | Pro | Leu | Ala | Gly |
85 | 90 | 95 | |||||||||||||
Lys | Leu | Tyr | Thr | Leu | Leu | Gly | Leu | Lys | Tyr | Thr | Phe | Phe | Ala | Phe | Leu |
100 | 105 | 110 | |||||||||||||
Cys | Ile | Phe | Glu | Leu | Gly | Ser | Val | Leu | Cys | Gly | Ala | Ala | Arg | Ser | Ser |
115 | 120 | 125 | |||||||||||||
Thr | Met | Leu | Ile | Val | Gly | Arg | Ala | Val | Ala | Gly | Met | Gly | Gly | Ser | Gly |
130 | 135 | 140 | |||||||||||||
Leu | Val | Asn | Gly | Ala | Leu | Thr | Ile | Leu | Ser | Thr | Ala | Ala | Pro | Lys | His |
145 | 150 | 155 | 160 | ||||||||||||
Lys | Gin | Pro | Val | Leu | Ile | Gly | Val | Met | Met | Gly | Leu | Ser | Gin | Ile | Ala |
165 | 170 | 175 | |||||||||||||
ile | Val | Cys | Gly | Pro | Leu | Leu | Gly | Gly | Ala | Phe | Thr | Gin | His | Ala | Thr |
180 | 185 | 190 | |||||||||||||
Trp | Arg | Trp | Cys | Phe | Tyr | Ile | Asn | Leu | Pro | Ile | Gly | Ala | Val | Ala | Ala |
195 | 200 | 205 | |||||||||||||
Phe | Leu | Leu | Leu | Val | Ile | Thr | Ile | Pro | Asp | Arg | Ile | Ser | Ser | Thr | Asp |
210 | 215 | 220 | |||||||||||||
Ser | Glu | Leu | Ser | Thr | Asp | Lys | Pro | Met | Ala | Asn | Ile | Lys | Ser | Thr | Leu |
225 | 230 | 235 | 240 | ||||||||||||
Arg | Lys | Leu | Asp | Leu | Val | Gly | Phe | Val | Val | Phe | Ala | Ala | Phe | Ala | Thr |
245 | 250 | 255 | |||||||||||||
Met | Ile | Ser | Leu | Ala | Leu | Glu | Trp | Gly | Gly | Ser | Thr | Tyr | Thr | Trp | Arg |
260 | 265 | 270 | |||||||||||||
Ser | Ser | Val | Ile | Ile | Gly | Leu | Phe | Cys | Gly | Gly | Gly | Phe | Ala | Leu | ile |
275 | 280 | 285 | |||||||||||||
Ala | Phe | Val | Leu | Trp | Glu | Arg | His | Val | Gly | Asp | Ala | Val | Ala | Met | Ile |
290 | 295 | 300 | |||||||||||||
Pro | Gly | Ser | Val | Ala | Gly | Lys | Arg | Gin | Val | Trp | Cys | Ser | Cys | Leu | Phe |
305 | 310 | 315 | 320 | ||||||||||||
Met | Gly | Phe | Phe | Ser | Gly | Ser | Leu | Leu | Val | Phe | Ser | Tyr | Tyr | Leu | Pro |
325 | 330 | 335 | |||||||||||||
Ile | Tyr | Phe | Gin | Ala | Val | Lys | Asp | Val | Ser | Pro | Thr | Leu | Ser | Gly | Val |
340 | 345 | 350 |
PL 202 457 B1
PL 202 457 B1 <400> 40 ggatccctaa gcaatattgt gtttcttcgc 30 <210> 41 <211> 1380 <212> DNA
<213 | > Penicillium citrinum | |||||||||||||||
<22C | ) > | |||||||||||||||
<221> CDS | ||||||||||||||||
<222> | (1) . . | (1380) | ||||||||||||||
<400> 41 | ||||||||||||||||
atg | tcc | ctg | ccg | cat | gca | acg | att | ccg | acg | aac | eta | cgc | cgt | cgc | gcg | 48 |
Met | Ser | Leu | Pro | His | Ala | Thr | Ile | Pro | Thr | Asn | Leu | Arg | Arg | Arg | Ala | |
Ί | 5 | 10 | 15 | |||||||||||||
ttt | ega | cgc | tea | tgt | gac | cgg | tgt | cat | gca | caa | aag | ctc | aaa | tgt | acc | 96 |
Phe | Arg | Arg | Ser | Cys | Asp | Arg | Cys | His | Ala | Gin | Lys | Leu | Lys | Cys | Thr | |
20 | 25 | 30 | ||||||||||||||
ggt | agc | aat | gcc | aat | tta | gtc | cgt | get | cag | tgt | caa | cgt | tgt | caa | caa | 144 |
G] y | Ser | Asn | Ala | Asn | Leu | Val | Arg | Ala | Gin | Cys | Gin | Arg | Cys | Gin | Gin | |
35 | 40 | 45 | ||||||||||||||
gcc | gga | tta | agg | tgt | gtg | tac | agc | gaa | agg | eta | ccc | aag | cgc | aat | tta | 192 |
Ala | Gly | Leu | Arg | Cys | Val | Tyr | Ser | Glu | Arg | Leu | Pro | Lys | Arg | Asn | Leu | |
50 | 55 | 60 | ||||||||||||||
cat | aaa | gaa | gcc | gca | get | gga | act | aca | aga | gcc | aca | gaa | acc | tea | caa | 240 |
Hi s | Lys | Glu | Ala | Ala | Ala | Gly | Thr | Thr | Arg | Ala | Thr | Glu | Thr | Ser | Gin | |
65 | 70 | 75 | 80 | |||||||||||||
ccg | atg | acc | gcg | aca | tct | tct | acg | gtc | ttc | tea | tea | ttg | gca | gag | act | 288 |
Pro | Met | Thr | Ala | Thr | Ser | Ser | Thr | Val | Phe | Ser | Ser | Leu | Ala | Glu | Thr | |
85 | 90 | 95 | ||||||||||||||
cct | cca | cct | tac | tgc | tea | cca | cct | acg | cat | att | ggc | acc | teg | gca | ctc | 336 |
Pro | Pro | Pro | Tyr | Cys | Ser | Pro | Pro | Thr | His | Ile | Gly | Thr | Ser | Ala | Leu | |
100 | 105 | 110 | ||||||||||||||
aag | gaa | aca | tta | tea | gaa | cca | tea | gcg | gca | acc | ctg | caa | ttc | tat | gat | 384 |
Lys | Glu | Thr | Leu | Ser | Glu | Pro | Ser | Ala | Ala | Thr | Leu | Gin | Phe | Tyr | Asp | |
115 | 12 0 | 125 | ||||||||||||||
aca | tea | atc | aac | ttt | gat | gat | ccc | gag | teg | ttt | ccc | ggc | ggc | tgg | cct | 432 |
Thr | Ser | Ile | Asn | Phe | Asp | Asp | Pro | Glu | Ser | Phe | Pro | Gly | Gly | Trp | Pro | |
130 | 135 | 140 | ||||||||||||||
cag | cca | aat | aca | ttt | cgc | gac | gat | gcc | aac | agc | aat | gaa | tct | teg | ggg | 480 |
Gin | Pro | Asn | Thr | Phe | Arg | Asp | Asp | Ala | Asn | Ser | Asn | Glu | Ser | Ser | Gly | |
145 | 150 | 155 | 160 |
PL 202 457 B1
ata cca | gat | eta | 9SC | tac | gac | ttt | gaa | ggc | cct | ttg | gat | gca | acg | gtg | 528 |
Ile Pro | Asp | Leu | Gly | Tyr | Asp | Phe | Glu | Gly | Pro | Leu | Asp | Ala | Thr | Ala | |
165 | 170 | 175 | |||||||||||||
cct gtc | tcg | cca | tcg | ctg | ttt | gac | ctc | gaa | gta | gag | ggg | aac | tcg | tca | 576 |
Pro Va1 | Ser | Pro | Ser | Leu | Phe | Asp | Leu | Glu | Val | Glu | Gly | Asn | Ser | Ser | |
180 | 185 | 190 | |||||||||||||
tcc gga | caa | tcc | aac | aca | agc | aac | acg | caa | ega | gac | ctt | ttc | gaa | agt | 624 |
Ser Gly | Gin | Ser | Asn | Thr | Ser | Asn | Thr | Gin | Arg | Asp | Leu | Phe | Glu | Ser | |
195 | 200 | 205 | |||||||||||||
ctg tcg | gat | gtg | tca | cag | gac | eta | gag | gta | ata | ctc | cac | ggg | gtg | act | 672 |
Leu Ser | Asp | Val | Ser | Gin | Asp | Leu | Glu | Val | Ile | Leu | His | Gly | val | Thr | |
210 | 215 | 220 | |||||||||||||
gtg gaa | tgg | ccc | aag | caa | aaa | att | tta | agc | tac | ccg | ata | ggg | gac | ttt | 720 |
Val Glu | Trp | Pro | Lys | Gin | Lys | Ile | Leu | Ser | Tyr | Pro | Ile | Gly | Asp | Phe | |
225 | 230 | 235 | 240 | ||||||||||||
ttg aat | gcc | ttt | ggt | aga | ttg | eta | eta | cat | Ctt | caa | gaa | cgt | gtg | atc | 768 |
Leu Asn | Ala | Phe | Gly | Arg | Leu | Leu | Leu | His | Leu | Gin | Glu | Arg | Val | Ile | |
245 | 250 | 255 | |||||||||||||
acg agc | agc | aat | agc | agc | atg | tta | gat | ggg | tgt | ctg | caa | acc | aag | aac | 816 |
Thr Ser | Ser | Asn | Ser | Ser | Met | Leu | Asp | Gly | Cys | Leu | Gin | Thr | Lys | Asn · | |
260 | 265 | 270 | |||||||||||||
ttg ttc | atg | gcg | gtg | cat | tgc | tac | atg | ttg | tct | gtc | aaa | atc | atg | aca | 864 |
Leu Phe | Met | Ala | Val | His | Cys | Tyr | Met | Leu | Ser | Val | Lys | Ile | Met | Thr | |
275 | 280 | 285 | |||||||||||||
tca ctt | tcc | cag | ctg | eta | eta | tcc | gag | gtg | atg | aaa | gcc | caa | cct | tgt | 912 |
Ser Leu | Ser | Gin | Leu | Leu | Leu | Ser | Glu | Val | Met | Lys | Ala | Gin | Pro | Cys | |
290 | 2S5 | 300 | |||||||||||||
gga caa | aag | caa | agc | aca | ega | atg | gat | tgg | tac | tgg | tct | ggc | tca | acc | 960 |
Gly Gin | Lys | Gin | Ser | Thr | Arg | Met | Asp | Trp | Tyr | Trp | Ser | Gly | Ser | Thr | |
305 | 310 | 315 | 320 | ||||||||||||
act aga | aat | gac | aat | gga | aga | gcc | gaa | gca | ctt | ccc | tcg | ttt | cac | tct | 1003 |
Thr Arg | Asn | Aep | Asn | Gly | Arg | Ala | Glu | Ala | Leu | Pro | Ser | Phe | His | Ser | |
325 | 330 | 335 | |||||||||||||
aat ctt | cat | atc | ggc | gag | ctc | att | tca | cat | ctc | gac | cca | ttc | atg | cac | 1056 |
Asn Leu | His | Ile | Gly | Glu | Leu | Ile | ser | His | Leu | Asp | Pro | Phe | Met | His | |
340 | 345 | 350 | |||||||||||||
gcc tta | tct | tct | gca | tgc | acg | aca | ttg | cgt | gta | agc | ctt | ega | eta | ttg | 1104 |
Ala Leu | Ser | Ser | Ala | Cys | Thr | Thr | Leu | Arg | Val | Ser | Leu | Arg | Leu | Leu | |
355 | 360 | 365 |
PL 202 457 B1
agt Ser | gag Glu 370 | att Ile | gag act Glu Thr | gct Ala | ttg Leu 375 | ggg Gly | ata Ile | gca Ala | cag Gin | gag Glu 380 | cac His | ggg Gly | gct Ala | gcg Ala | 1152 |
gca | tet | att | cgt eta | gtc | eta | tca | gat | atg | cca | agc | aca | teg | tgg | caa | 1200 |
Ala | Ser | Ile | Arg Leu | Val | Leu | Ser | Asp | Met | Pro | Ser | Thr | Ser | Trp | Gin | |
385 | 390 | 395 | 400 | ||||||||||||
atc | ctt | ggc | gct gaa | aat | aaa | acc | ata | acg | ccg | gcc | tet | cgt | ctc | eta | 1248 |
Ile | Leu | Gly | Ala Glu | Asn | Lyc | Thr | Ile | Thr | Pro | Ala | Ser | Arg | Leu | Leu | |
405 | 410 | 415 | |||||||||||||
tet | gtg | ctt | tgg agt | gac | gaa | gcc | gga | gac | gaa | gag | ccc | aag | tca | aca | 1296 |
Ser | Val | Leu | Trp Ser | Asp | Glu | Ala | Gly | Asp | Glu | Glu | Pro | Lys | Ser | Thr | |
420 | 425 | 430 | |||||||||||||
aag | gcc | tca | ggg aag | acg | ata | aat | gtg | ttg | ega | cgt | tgc | tat | aag | gaa | 1344 |
Lys | Ala | Ser | Gly Lys | Thr | Ile | Asn | Val | Leu | Arg | Arg | Cys | Tyr | Lys | Glu | |
435 | 440 | 445 | |||||||||||||
ata | ttc | gca | tca gcg | aag | aaa | cac | aat | att | gct | tag | 1380 | ||||
ile | Phe | Ala | Leu Ala | Lys | Lys | His | Asn | Ile | Ala | ||||||
450 | 455 | ||||||||||||||
<210> · | 42 | ||||||||||||||
<211> | 459 | ||||||||||||||
<212? 1 | PRT | ||||||||||||||
<213> 1 | Penicillium citrinum | ||||||||||||||
<400> > | 42 | ||||||||||||||
Met | Ser | Leu | Pro His | Ala | Thr | Ile | Pro | Thr | Asn | Leu | Arg | Arg | Arg | Ala | |
3 | 5 | 10 | 15 | ||||||||||||
Phe | Arg | Arg | Ser Cys | Asp | Arg | Cys | His | Ala | Gin | Lys | Leu | Lys | Cys | Thr | |
20 | 25 | 30 | |||||||||||||
Gly | Ser | Asn | Ala Asn | Leu | Val | Arg | Ala | Gin | Cys | Gin | Arg | Cys | Gin | Gin | |
35 | 40 | 45 | |||||||||||||
Ala | Gly | Leu | Arg Cys | Val | Tyr | Ser | GlU | Arg | Leu | Pro | Lys | Arg | Asn | Leu | |
50 | 55 | 60 | |||||||||||||
His | Lys | Glu | Ala Ala | Ala | Gly | Thr | Thr | Arg | Ala | Thr | Glu | Thr | Ser | Gin | |
65 | 70 | 75 | 80 | ||||||||||||
Pro | Met | Thr | Ala Thr | Ser | Ser | Thr | Val | Phe | Ser | Ser | Leu | Ala | Glu | Thr | |
85 | 90 | 95 | |||||||||||||
Pro | Pro | Pro | Tyr Cys | Ser | Pro | Pro | Thr | His | Ile | Gly | Thr | Ser | Ala | Leu | |
100 | 105 | 110 | |||||||||||||
Lys | Glu | Thr | Leu Ser | Glu | Pro | Ser | Ala | Ala | Thr | Leu | Gin | Phe | Tyr | Asp | |
115 | 120 | 125 |
PL 202 457 B1
Thr | Ser 130 | Ile | Asn | Phe | Asp | Asp 135 | Pro | Glu | Ser | Phe | Pro 140 | Gly | Gly | Trp | Pro |
Gin | Pro | Asn | Thr | Phe | Arg | Asp | Asp | Ala | Asn | Ser | Asn | Glu | Ser | Ser | Gly |
145 | 150 | 155 | 160 | ||||||||||||
Ile | Pro | Asp | Leu | Gly | Tyr | Asp | Phe | Glu | Gly | Pro | Leu | Asp | Ala | Thr | Ala |
165 | 170 | 175 | |||||||||||||
Pro | Va 1 | Ser | Pro | Ser | Leu | Phe | Asp | Leu | Glu | Val | Glu | Gly | Asn | Ser | Ser |
180 | 185 | 190 | |||||||||||||
Ser | Gly | Gin | Ser | Asn | Thr | Ser | Asn | Thr | Gin | Arg | Asp | Leu | Phe | Glu | Ser |
195 | 200 | 205 | |||||||||||||
Leu | Ser | Asp | Val | Ser | Gin | Asp | Leu | Glu | Val | Ile | Leu | His | Gly | Val | Thr |
210 | 215 | 220 | |||||||||||||
Val | Glu | Trp | Pro | Lys | Gin | Lys | Ile | Leu | Ser | Tyr | Pro | Ile | Gly | Asp | Phe |
225 | 230 | 235 | 240 | ||||||||||||
Leu | Asn | Ala | Phe | Gly | Arg | Leu | Leu | Leu | His | Leu | Gin | Glu | Arg | Val | Ile |
245 | 250 | 255 | |||||||||||||
Thr | Ser | Ser | Asn | Ser | Ser | Met | Leu | Asp | Gly | Cys | Leu | Gin | Thr | Lys | Asn |
260 | 265 | 270 | |||||||||||||
Leu | Phe | Met | Ala | Val | His | Cys | Tyr | Met | Leu | Ser | Val | Lys | Ile | Met | Thr |
275 | 280 | 285 | |||||||||||||
Ser | Leu | Ser | Gin | Leu | Leu | Leu | Ser | Glu | val | Met | Lys | Ala | Gin | Pro | Cys |
290 | 295 | 300 | |||||||||||||
Gly | Gin | Lys | Gin | Ser | Thr | Arg | Met | Asp | Trp | Tyr | Trp | Ser | Gly | Ser | Thr |
305 | 310 | 315 | 320 | ||||||||||||
Thr | Arg | Asn | Asp | Asn | Gly | Arg | Ala | Glu | Ala | Leu | Pro | Ser | Phe | His | Ser |
325 | 330 | 335 | |||||||||||||
Asn | Leu | His | Ile | Gly | Glu | Leu | Ile | Ser | His | Leu | Asp | Pro | Phe | Met | His |
340 | 345 | 350 | |||||||||||||
Ala | Leu | Ser | Ser | Ala | Cys | Thr | Thr | Leu | Arg | Val | Ser | Leu | Arg | Leu | Leu |
355 | 3S0 | 365 | |||||||||||||
Ser | Glu | Ile | Glu | Thr | Ala | Leu | Gly | Ile | Ala | Gin | Glu | His | Gly | Ala | Ala |
370 | 375 | 380 | |||||||||||||
Ala | Ser | Ile | Arg | Leu | Val | Leu | Ser | Asp | Met | Pro | Ser | Thr | Ser | Trp | Gin |
385 | 390 | 395 | 400 | ||||||||||||
Ile | Leu | Gly | Ala | Glu | Asn | Lys | Thr | Ile | Thr | Pro | Ala | Ser | Arg | Leu | Leu |
405 | 410 | 415 |
PL 202 457 B1
Ser | Val | Leu | Trp 420 | Ser | Asp | Glu | Ala | Gly 425 | Asp | Glu | Glu | Pro | Lys 430 | Ser | Thr |
Lys | Ala | Ser 435 | Gly | Lys | Thr | Ile | Asn 440 | Val | Leu | Arg | Arg | Cys 445 | Tyr | Lys | Glu |
Ile | Phe | Ala | Leu | Ala | Lys | Lys | His | Asn | Ile | Ala |
450 455 <210> 43 <211> 9099 <212 > DNA <213> Penicillium citrinum
<220 = | ||||||||||||||||
<221= CDS | (9099) | |||||||||||||||
<222 | > ( | :u .. | ||||||||||||||
<4 0 0 > 4 3 | ||||||||||||||||
atg | gat | caa | gcc | aac | tat | cca | aac | gag | cca | att | gtg | gta | gtg | gga | age | 48 |
Met | Asp | Gin | Ala | Asn | Tyr | Pro | Asn | Glu | Pro | Ile | val | Val | Val | Gly | Ser | |
1 | 5 | 10 | 15 | |||||||||||||
ggt | tgt | cgg | ttt | cca | ggt | ggt | gtc | aac | aca | cca | tea | aaa | ctt | tgg | gag | 96 |
Gly | Cys | Arg | Phe | Pro | Gly | Gly | Val | Asn | Thr | Pro | Ser | Lys | Leu | Trp | Glu | |
20 | 25 | 30 | ||||||||||||||
ctg | ctc | aaa | gag | ccc | cgg | gat | gta | cag | acc | aag | atc | cct | aag | gag | aga | 144 |
Leu | Leu | Lys | Glu | Pro | Arg | Asp | Val | Gin | Thr | Lys | Ile | Pro | Lys | Glu | Arg | |
35 | 40 | 45 | ||||||||||||||
ttt | gac | gtc | gat | aca | ttt | tac | age | ccc | gat | ggc | act | cac | ccc | ggg | ege | 192 |
Phe | Asp | Val | Asp | Thr | Phe | Tyr | Ser | Pro | Asp | Gly | Thr | His | Pro | Gly | Arg | |
50 | 55 | 60 | ||||||||||||||
acg | aac | gca | ccc | ttt | gca | tac | ttg | ctg | cag | gag | gat | eta | ege | ggt | ttt | 240 |
Thr | Asn | Ala | Pro | Phe | Ala | Tyr | Leu | Leu | Gin | Glu | Asp | Leu | Arg | Gly | Phe | |
65 | 70 | 75 | 80 | |||||||||||||
gat | gcc | tct | ttc | ttc | aac | atc | caa | gct | gga | gag | gcc | gaa | acg | att | gac | 288 |
Asp | Ala | Ser | Phe | Phe | Asn | Ile | Gin | Ala | Gly | Glu | Ala | Glu | Thr | Ile | Asp | |
85 | 90 | 95 | ||||||||||||||
cca | cag | caa | agg | ctg | ctg | ctg | gag | acg | gtc | tat | gaa | gct | gta | tcc | aac | 336 |
Pro | Gin | Gin | Arg | Leu | Leu | Leu | Glu | Thr | Val | Tyr | Glu | Ala | Val | Ser | Asn | |
100 | 105 | 110 | ||||||||||||||
gca | ggc | eta | cgg | atc | caa | ggc | ctt | caa | gga | tcc | tct | act | gct | gtg | tac | 384 |
Ala | Gly | Leu | Arg | Ile | Gin | Gly | Leu | Gin | Gly | Ser | Ser | Thr | Ala | Val | Tyr | |
115 | 120 | 125 |
PL 202 457 B1
gtc Val | ggt Gly 130 | atg Met | atg Met | acg Thr | cat His | gac Asp 135 | tat Tyr | gag Glu | act Thr | atc Ile | gtg Val 140 | acg Thr | cgt Arg | gaa Glu | ttg Leu | 432 |
gat | agt | att | cct | aca | tac | tct | gcc | acg | ggg | gta | gct | gtc | agt | gtg | gcc | 480 |
Asp | Ser | Ile | Pro | Thr | Tyr | Ser | Ala | Thr | Gly | Val | Ala | Val | Ser | Val | Ala | |
145 | 150 | 155 | 160 | |||||||||||||
tcc | aac | cgt | gta | tca | tac | ttc | ttc | gac | tgg | cat | ggg | ccg | agt | atg | acg | 528 |
Ser | Asn | Arg | Val | Ser | Tyr | Phe | Phe | Asp | Trp | His | Gly | Pro | Ser | Met | Thr | |
165 | 170 | 175 | ||||||||||||||
atc | gac | aca | gcc | tgt | agt | tca | tcc | tta | gct | gcc | gtg | cat | ctg | gcc | gtc | 576 |
Ile | Asp | Thr | Ala | Cys | Ser | Ser | Ser | Leu | Ala | Ala | Val | Hi s | Leu | Ala | Val | |
180 | 185 | 190 | ||||||||||||||
caa | cag | ctt | aga | acg | ggc | gag | agt | acc | atg | gcg | gtt | gca | gcc | ggt | gcg | 624 |
Gin | Gin | Leu | Arg | Thr | Gly | Glu | Ser | Thr | Met | Ala | val | Ala | Ala | Gly | Ala | |
195 | 200 | 205 | ||||||||||||||
aat | ctg | ata | ttg | ggc | ccc | atg | acc | ttt | gta | atg | gag | agc | aaa | ttg | aac | 672 |
Asn | Leu | Ile | Leu | Gly | Pro | Met | Thr | Phe | Val | Met | Glu | Ser | Lys | Leu | Asn | |
210 | 215 | 220 | ||||||||||||||
atg | ctg | tcc | ccc | aat | ggt | aga | tct | ega | atg | tgg | gat | gct | gct | gcc | gat | 720 |
Met | Leu | Ser | Pro | Asn | Gly | Arg | Ser | Arg | Met | Trp | Asp | Ala | Ala | Ala | Asp | |
225 | 230 | 235 | 240 | |||||||||||||
gga | tat | gcc | aga | gga | gaa | ggt | gtt | tgc | tct | att | gtc | ctg | aaa | acg | ctg | 768 |
Gly | Tyr | Ala | Arg | Gly | Glu | Gly | Val | Cys | Ser | Ile | val | Leu | Lys | Thr | Leu | |
245 | 250 | 255 | ||||||||||||||
agc | cag | gca | ctg | cgc | gac | ggg | gac | agt | atc | gag | tgt | gtt | atc | ega | gag | 816 |
Ser | Gin | Ala | Leu | Arg | Asp | Gly | Asp | Ser | Ile | Glu | Cys | Val | Ile | Arg | Glu | |
260 | 265 | 270 | ||||||||||||||
acc | ggt | atc | aac | caa | gat | ggc | ega | acg | aca | ggt | atc | aca | atg | cca | aac | 864 |
Thr | Gly | Ile | Asn | Gin | Asp | Gly | Arg | Thr | Thr | Gly | Ile | Thr | Met | Pro | Asn | |
275 | 280 | 285 | ||||||||||||||
cat | agc | gca | caa | gaa | gcc | ctc | att | cgg | gcc | aca | tat | gcc | aag | gct | ggt | 912 |
His | Ser | Ala | Gin | Glu | Ala | Leu | Ile | Arg | Ala | Thr | Tyr | Ala | Lys | Ala | Gly | |
290 | 295 | 300 | ||||||||||||||
ctt | gat | att | acc | aac | ccc | cag | gaa | cgc | tgc | cag | ttc | ttt | gąa | gcc | cat | 960 |
Leu | Asp | Ile | Thr | Asn | Pro | Gin | Glu | Arg | Cys | Gin | Phe | Phe | Glu | Ala | His | |
305 | 310 | 315 | 320 | |||||||||||||
gga | act | ggt | aca | cca | gcc | ggt | gac | cca | cag | gaa | gct | gag | gct | att | gca | 1008 |
Gly | Thr | Gly | Thr | Pro | Ala | Gly | Asp | Pro | Gin | Glu | Ala | Glu | Ala | Ile | Ala | |
325 | 330 | 335 |
PL 202 457 B1
aca Thr | gcc Ala | ttc Phe | ttc Phe 340 | gga Gly | cac His | aag Lys | gat Asp | gga Gly 345 | aca Thr | atc Ile | gac Asp | agc Ser | gac Asp 350 | ggc Gly | gag Glu | 1056 |
aaa | gat | gag | ctt | ttt | gtc | ggc | agc | atc | aag | aca | gtt | ctc | ggt | cac | acg | 1104 |
Lys | Asp | Glu | Leu | Phe | Val | Gly | Ser | Ile | Lys | Thr | Val | Leu | Gly | His | Thr | |
355 | 360 | 365 | ||||||||||||||
gaa | ggc | act | gct | ggt | att | gcg | ggc | tta | atg | aag | gca | teg | ttt | gct | gta | 1152 |
Glu | Gly | Thr | Ala | Gly | Ile | Ala | Gly | Leu | Met | Lys | Ala | Ser | Phe | Ala | Val | |
370 | 375 | 380 | ||||||||||||||
ega | aat | 99c | gtg | atc | ccg | cca | aac | ctg | ctg | ttt | gag | aag | atc | agt | ccc | 1200 |
Arg | Asn | Gly | Val | Ile | Pro | Pro | Asn | Leu | Leu | Phe | Glu | Lys | Ile | Ser | Pro | |
3 85 | 390 | 395 | 400 | |||||||||||||
cgt | gtc | gct | ccg | ttc | tat | acg | cac | ttg | aaa | att | gca | acg | gag | gcc | aca | 1248 |
Arg | Val | Ala | Pro | Phe | Tyr | Thr | His | Leu | Lys | Ile | Ala | Thr | Glu | Ala | Thr | |
405 | 410 | 415 | ||||||||||||||
gaa | tgg | ccg | att | gtt | gcg | ccc | ggg | cag | cct | cgc | aga | gtc | agc | gtt | aat | 1296 |
Glu | Trp | Pro | Ile | Val | Ala | Pro | Gly | Gin | Pro | Arg | Arg | Val | Ser | Val | Asn | |
420 | 425 | 430 | ||||||||||||||
tea | ttt | gga | ttt | ggt | ggt | aca | aat | gcc | cat | gct | att | atc | gaa | gag | tat | 1344 |
Ser | Phe | Gly | Phe | Gly | Gly | Thr | Asn | Ala | His | Ala | Ile | Ile | Glu | Glu | Tyr | |
435 | 440 | 445 | ||||||||||||||
atg | gct | cct | cca | cac | aag | ccg | aca | gca | gtg | gta | aca | gag | gtg | acc | tea | 1392 |
Met | Ala | Pro | Pro | His | Lys | Pro | Thr | Ala | Val | Val | Thr | Glu | Val | Thr | Ser | |
450 | 455 | 460 | ||||||||||||||
gat | gca | gat | gca | tgc | agc | ttg | ccc | ctt | gtg | ctt | tea | teg | aag | teg | cag | 1440 |
Asp | Ala | Asp | Ala | Cys | Ser | Leu | Pro | Leu | Val | Leu | Ser | Ser | Lys | Ser | Gin | |
465 | 470 | 475 | 480 | |||||||||||||
cgc | tcc | atg | aag | gca | acg | eta | gaa | aat | atg | ctc | caa | ttt | ctg | gaa | acg | 1488 |
Arg | Ser | Met | Lys | Ala | Thr | Leu | Glu | Asn | Met | Leu | Gin | Phe | Leu | Glu | Thr | |
485 | 490 | 495 | ||||||||||||||
cat | gat | gac | gtg | gac | atg | cat | gat | atc | gca | tat | acc | tta | ctt | gag | aaa | 1536 |
His | Asp | Asp | Val | Asp | Met | His | Asp | Ile | Ala | Tyr | Thr | Leu | Leu | Glu | Lys | |
500 | 505 | 510 | ||||||||||||||
cgg | tct | atc | ttg | ccc | ttc | cgt | cgt | gcg | att | gca | gca | cac | aac | aag | gaa | 1584 |
Arg | Ser | Ile | Leu | Pro | Phe | Arg | Arg | Ala | Ile | Ala | Ala | His | Asn | Lys | Glu | |
515 | 520 | 525 | ||||||||||||||
gta | gcc | cgc | gcg | gca | ctg | gag | gct | gcc | atc | gcg | gac | ggt | gag | gtc | gtc | 1632 |
val | Ala | Arg | Ala | Ala | Leu | Glu | Ala | Ala | Ile | Ala | Asp | Gly | Glu | Val | Val | |
530 | 535 | 540 |
PL 202 457 B1
acc Thr 545 | gac Asp | ttc Phe | cgc Arg | acc Thr | gac Asp 550 | gcg Ala | aat Asn | gac Asp | aac Asn | cct Pro 555 | cgc Arg | gta val | cta Leu | ggt Gly | gtc Val 560 | 1680 |
ttt | act | ggc | caa | ggt | gca | cag | tgg | ccg | ggc | atg | ctg | aag | aag | ctc | atg | 1728 |
Phe | Thr | Gly | Gin | Gly | Ala | Gin | Trp | Pro | Gly | Met | Leu | Lys | Lys | Leu | Met | |
565 | 570 | 575 | ||||||||||||||
gtg | ggt | atg | cca | ttt | gtg | aga | ggc | att | ctc | gaa | gag | ctg | gat | aat | tca | 1776 |
val | Gly | Met | Pro | Phe | Val | Arg | Gly | Ile | Leu | Glu | Glu | Leu | Asp | Asn | Ser | |
580 | 585 | 590 | ||||||||||||||
ctg | caa | aca | ctg | cct | gaa | aag | tat | cgg | cct | acg | tgg | aca | ctg | tat | gac | 1824 |
Leu | Gin | Thr | Leu | Pro | Glu | Lys | Tyr | Arg | Pro | Thr | Trp | Thr | Leu | Tyr | Asp | |
595 | 600 | 605 | ||||||||||||||
cag | ctc | atg | ctt | gaa | ggg | gat | gcc | tca | aac | gtc | aga | ctc | gcc | agc | ttc | 1872 |
Gin | Leu | Met | Leu | Glu | Gly | Asp | Ala | Ser | Asn | Val | Arg | Leu | Ala | Ser | Phe | |
510 | 615 | 620 | ||||||||||||||
tcc | cag | cct | cta | tgc | tgc | gcc | gta | caa | atc | gtt | ctg | gtc | ega | ctt | ctc | 1920 |
Ser | Gin | Pro | Leu | Cys | Cys | Ala | Val | Gin | Ile | Val | Leu | Val | Arg | Leu | Leu | |
S25 | 630 | 635 | 640 | |||||||||||||
gct | gca | gct | ggt | atc | gag | ttc | agt | gca | att | gtc | ggc | cac | agt | tca | ggt | 1968 |
Ala | Ala | Ala | Gly | Ile | Glu | Phe | Ser | Ala | Ile | Val | Gly | His | Ser | Ser | Gly | |
645 | 550 | 655 | ||||||||||||||
gag | att | gcc | tgt | gcc | ttt | gcg | gca | gga | ttc | atc | agt | gcc | act | caa | gct | 2016 |
Glu | Ile | Ala | Cys | Ala | Phe | Ala | Ala | Gly | Phe | Ile | Ser | Ala | Thr | Gin | Ala | |
660 | 665 | 670 | ||||||||||||||
atc | cgt | att | gcg | cat | ctg | cgt | gga | gtt | gtg | tcc | gcg | gag | cat | gcc | tct | 2064 |
Ile | Arg | Ile | Ala | His | Leu | Arg | Gly | Val | Val | Ser | Ala | Glu | His | Ala | Ser | |
575 | 680 | 685 | ||||||||||||||
tct | cca | agc | ggc | cag | aca | ggc | gct | atg | cta | gcg | gca | ggt | atg | teg | tac | 2112 |
Ser | Pro | Ser | Gly | Gin | Thr | Gly | Ala | Met | Leu | Ala | Ala | Gly | Met | Ser | Tyr | |
690 | 695 | 700 | ||||||||||||||
gat | gac | gca | aag | gaa | cta | tgc | gag | ctc | gaa | gcc | ttt | gag | ggt | cgg | gtc | 2160 |
Asp | Asp | Ala | Lys | Glu | Leu | Cys | Glu | Leu | Glu | Ala | Phe | Glu | Gly | Arg | Val | |
705 | 710 | 715 | 720 | |||||||||||||
tgc | gtc | gcc | gct | agc | aat | tca | ccg | gat | agt | gtg | acc | ttc | tcc | ggc | gac | 2208 |
Cys | Val | Ala | Ala | Ser | Asn | Ser | Pro | Asp | Ser | val | Thr | Phe | Ser | Gly | Asp | |
725 | 730 | 735 | ||||||||||||||
atg | gat | gct | atc | cag | cac | gtt | gaa | ggt | gtc | ttg | gag | gat | gaa | tcc | act | 2256 |
Met | Asp | Al a | Ile | Gin | His | Val | Glu | Gly | Val | Leu | Glu | Asp | Glu | Ser | Thr | |
740 | 745 | 750 |
PL 202 457 B1
ttt Phe | gcc Ala | aga Arg 755 | atc Ile | ttg Leu | aga Arg | gtt Val | gac Asp 760 | aag Lys | gcc Ala | tac Tyr | cat His | tcg Ser 765 | cat His | cac His | atg Met | 2304 |
cac | cca | tgc | gca | gct | cca | tat | gtc | aag | gca | ttg | ctg | gag | tgc | gac | tgt | 2352 |
His | Pro | Cys | Ala | Ala | Pro | Tyr | Val | Lys | Ala | Leu | Leu | Glu | Cys | Asp | Cys | |
770 | 775 | 780 | ||||||||||||||
gct | gtt | gcc | gat | ggc | caa | ggt | aac | gat | agt | gtt | gct | tgg | ttc | tct | gcc | 2400 |
Ala | Val | Ala | Asp | Gly | Gin | Gly | Asn | Asp | Ser | Val | Ala | Trp | Phe | Ser | Ala | |
785 | 790 | 795 | 800 | |||||||||||||
gtc | cac | gag | acc | agc | aag | caa | atg | act | gta | cag | gat | gtg | atg | ccc | gct | 2448 |
Val | His | Glu | Thr | Ser | Lys | Gin | Met | Thr | Val | Gin | Asp | Val | Met | Pro | Ala | |
805 | 810 | 815 | ||||||||||||||
tat | tgg | 3.3.3. | gac | aat | ctc | gtc | tct | ccg | gtc | ttg | ttc | tcg | cag | gct | gtg | 2496 |
Tyr | Trp | Lys | Asp | Asn | Leu | val | Ser | Pro | Val | Leu | Phe | Ser | Gin | Ala | val | |
820 | 825 | 830 | ||||||||||||||
cag | aaa | gca | gtc | atc | act | cat | cgt | eta | atc | gac | gtc | gcc | atc | gaa | att | 2544 |
Gin | Lys | Ala | Val | Ile | Thr | His | Arg | Leu | Ile | Asp | Val | Ala | Ile | Glu | Ile | |
835 | 840 | 845 | ||||||||||||||
ggc | gcc | cac | cct | gct | ctc | aag | ggt | ccg | tgt | eta | gcc | acc | atc | aag | gat | 2592 |
Gly | Ala | His | Pro | Ala | Leu | Lys | Gly | Pro | Cys | Leu | Ala | Thr | Ile | Lys | Asp | |
850 | 855 | 860 | ||||||||||||||
gct | ctt | gcc | ggt | gtg | gag | ctg | ccg | tat | acc | ggg | tgc | ttg | gca | ega | aac | 2640 |
Ala | Leu | Ala | Gly | Val | Glu | Leu | Pro | Tyr | Thr | Gly | Cys | Leu | Ala | Arg | Asn | |
865 | 870 | 875 | 380 | |||||||||||||
gtt | gac | gat | gtg | gac | gct | ttt | gct | gga | ggt | ctg | gga | tac | att | tgg | gag | 2688 |
Val | Asp | Asp | val | Asp | Ala | Phe | Ala | Gly | Gly | Leu | Gly | Tyr | Ile | Trp | Glu | |
835 | 890 | 895 | ||||||||||||||
cgt | ttc | gga | gtt | cgg | agt | atc | gac | gcc | gag | ggc | ttc | gta | caa | caa | gtc | 2736 |
Arg | Phe | Gly | Val | Arg | Ser | I le | Asp | Ala | Glu | Gly | Phe | Val | Gin | Gin | Val | |
900 | 905 | 910 | ||||||||||||||
cgg | ccc | gat | cgt | gcc | gtt | caa | aac | ctg | tca | aag | tca | ttg | ccc | aca | tac | 2784 |
Arg | Pro | Asp | Arg | Ala | Val | Gin | Asn | Leu | Ser | Lys | Ser | Leu | Pro | Thr | Tyr | |
915 | 920 | 925 | ||||||||||||||
tct | tgg | gat | cat | act | cgt | caa | tac | tgg | gca | gaa | tct | ege | tcc | acc | ege | 2832 |
Ser | Trp | Asp | His | Thr | Arg | Gin | Tyr | Trp | Ala | Glu | Ser | Arg | Ser | Thr | Arg | |
930 | 935 | 94 0 | ||||||||||||||
cag | cat | ctt | cgt | gga | ggt | gcg | ccc | cat | ctt | ctg | ctt | gga | aag | ctt | tct | 2880 |
Gin | His | Leu | Arg | Gly | Gly | Ala | Pro | His | Leu | Leu | Leu | Gly | Lys | Leu | Ser | |
94 5 | 950 | 955 | 960 |
PL 202 457 B1 tct tac agc aca gca teg acc Ser Tyr Ser Thr Ala Ser Thr
965 cgg gat ctg gaa tgg ctc gac Arg Asp Leu Glu Trp Leu Asp 980 ttc ccc get get ggg tac ata Phe Pro Ala Ala Gly Tyr Ile
995
ttc Phe | cag Gin | tgg Trp 970 | aca aac | ttc Phe | atc Ile | agg ccc | 2928 | ||
Thr | Asn | Arg 975 | Pro | ||||||
ggt | cat | gcg | eta | caa | ggc | cag | act | gtg | 2976 |
Gly | His | Ala | Leu | Gin | Gly | Gin | Thr | Val | |
985 | 990 | ||||||||
att | atg | - gcc | atg | i gaa | get | gcc atg aag | 3024 | ||
Ile | Met | Ala | Met | Glu | Ala | Ala Met Lys | |||
1000 | 1005 |
gtg Val | get Ala 1010 | ggt Gly | gag Glu | cgt Arg | gcc Ala | gcc Ala 1015 | caa Gin | gtt Val | cag Gin | ctc Leu | ctg Leu 1020 | gaa Glu | atc Ile | ttg Leu | 3069 |
gac | atg | agc | atc | aac | aaa | gcc | atc | gtg | ttt | gaa | gat | gaa | aac | acc | 3114 |
Asp | Met 1025 | Ser | Ile | Asn | Lys | Ala 1030 | Ile | Val | Phe | Glu | Asp 1035 | Glu | Asn | Thr | |
tcc | gtg | gag | ctg | aac | ttg | aca | gcc | gaa | gtc | acc | agt | gac | aat | gat | 3159 |
Ser | Val 1040 | Glu | Leu | Asn | Leu | Thr 1045 | Ala | Glu | Val | Thr | Ser 1050 | Asp | Asn | Asp | |
gcg | gat | ggc | caa | gtc | acg | gtc | aaa | ttt | gtt | att | gat | tcc | tgt | ctg | 3204 |
Ala | Asp 1055 | Gly | Gin | Val | Thr | Val 1060 | Lys | Phe | Val | Ile | Asp 1065 | Ser | Cys | Leu | |
gca | aag | gag | agt | gag | ctt | teg | aca | tcc | gcc | aaa | ggc | caa | atc | gtc | 3249 |
Ala | Lys 1070 | Glu | Ser | Glu | Leu | Ser 1075 | Thr | Ser | Ala | Lys | Gly 1080 | Gin | Ile | Val | |
ata | acc | ctt | ggc | gag | gca | tea | ccg | tea | teg | cag | ctt | ttg | ccg | cca | 3 2 94 |
Ile | Thr 1085 | Leu | Gly | Glu | Ala | Ser 1090 | Pro | Ser | ser | Gin | Leu 1095 | Leu | Pro | Pro | |
cct | gag | gaa | gag | tac | ccc | cag | atg | aac | aat | gtc | aac | atc | gat | ttc | 3339 |
Pro | Glu 1100 | Glu | Glu | Tyr | Pro | Gin 1105 | Met | Asn | Asn | Val | Asn 1110 | Ile | Asp | Phe | |
ttc | tat | cgg | gaa | ctt | gac | ctc | ctt | ggg | tat | gac | tac | agc | aaa | gac | 3384 |
Phe | Tyr 1115 | Arg | Glu | Leu | Asp | Leu 1120 | Leu | Gly | Tyr | Asp | Tyr 1125 | Ser | Lys | Asp | |
ttc | cgt | cgt | ttg | cag | acc | atg | aga | agg | gcc | gac | tcc | aaa | get | agc | 3429 |
Phe | Arg 1130 | Arg | Leu | Gin | Thr | Met 1135 | Arg | Arg | Ala | Asp | Ser 1140 | Lys | Ala | Ser | |
ggc | acc | ttg | get | ttc | ctt | cca | ctt | aag | gat | gaa | ttg | cgc | aat | gag | 3474 |
Gly | Thr 1145 | Leu | Ala | Phe | Leu | Pro 1150 | Leu | Lys | Asp | Glu | Leu 1155 | Arg | Asn | Glu |
PL 202 457 B1
ccc Pro | ctc Leu 1160 | ttg Leu | ctc Leu | cac His | cca Pro | gcg Ala 1165 | ccc Pro | ctg Leu | gac Asp | atc ile | gcg Ala 1170 | ttc Phe | cag Gin | act Thr | 3519 |
gtc | att | gga | gcg | tat | tcc | tet | cca | gga | gat | cgt | cgc | eta | cgc | tca | 3564 |
Val | Ile 1175 | Gly | Ala | Tyr | Ser | Ser 1180 | Pro | Gly | Asp | Arg | Arg 1185 | Leu | Arg | Ser | |
ttg | tac | gtg | cct | act | cac | gtt | gac | aga | gtg | act | ctg | att | cca | teg | 3609 |
Leu | Tyr 1190 | Val | Pro | Thr | His | Val 1195 | Asp | Arg | Val | Thr | Leu 1200 | Ile | Pro | Ser | |
ctc | tgt | ata | teg | gcg | ggt | aat | tet | ggt | gaa | acc | gag | ctt | gcg | ttt | 3654 |
Leu | Cys 1205 | Ile | Ser | Ala | Gly | Asn 1210 | Ser | Gly | Glu | Thr | Glu 1215 | Leu | Ala | Phe | |
gac | aca | atc | aac | aca | cac | gac | aag | ggt | gat | ttc | ctg | agc | ggc | gac | 3699 |
Asp | Thr 1220 | Ile | Asn | Thr | His | Asp 1225 | Lys | Gly | Asp | Phe | Leu 1230 | Ser | Gly | Asp | |
atc | acg | gtg | tac | gat | teg | acc | aag | aca | acg | ctt | ttc | caa | gtt | gat | 3744 |
Ile | Thr 1235 | Val | Tyr | Asp | Ser | Thr 1240 | Lys | Thr | Thr | Leu | Phe 1245 | Gin | Val | Asp | |
aac | att | gtc | ttt | aag | cct | ttc | tet | ccc | ccg | act | gct | teg | acc | gac | 3789 |
Asn | Ile 1250 | Val | Phe | Lys | Pro | Phe 1255 | Ser | Pro | Pro | Thr | Ala 1260 | Ser | Thr | Asp | |
cac | ega | atc | ttc | gca | aag | tgg | gtc | tgg | gga | ccc | ctc | acg | ccc | gaa | 3834 |
His | Arg 1265 | Ile | Phe | Ala | Lys | Trp 1270 | val | Trp | Gly | Pro | Leu 1275 | Thr | Pro | Glu | |
aaa. | ctg | ctg | gag | gac | cct | gcg | acg | ttg | atc | ata | gct | cgg | gac | aag | 3879 |
Lys | Leu 1280 | Leu | Glu | Asp | Pro | Ala 1285 | Thr | Leu | Ile | Ile | Ala 1290 | Arg | Asp | Lys | |
gag | gac | att | ctg | acc | atc | gag | ega | atc | gtt | tac | ttc | tac | atc | aaa | 3924 |
Glu | Asp 1295 | Ile | Leu | Thr | Ile | Glu 1300 | Arg | Ile | Val | Tyr | Phe 1305 | Tyr | Ile | Lys | |
tcc | ttc | eta | gcc | cag | ata | acc | ccc | gac | gac | cgt | caa | aat | gcc | gac | 3969 |
Ser | Phe 1310 | Leu | Ala | Gin | Ile | Thr 1315 | Pro | Asp | Asp | Arg | Gin 1320 | Asn | Ala | Asp | |
ctc | cat | tcc | cag | aag | tac | att | gaa | tgg | tgt | gac | cag | gtt | cag | gcc | 4014 |
Leu | His 1325 | Ser | Gin | Lys | Tyr | Ile 1330 | Glu | Trp | Cys | Asp | Gin 1335 | Val | Gin | Ala | |
gat | gct | cgg | gct | ggc | cac | cat | cag | tgg | tac | cag | gag | tet | tgg | gag | 4059 |
Asp | Ala 1340 | Arg | Ala | Gly | His | His 1345 | Gin | Trp | Tyr | Gin | Glu 1350 | Ser | Trp | Glu |
PL 202 457 B1
gag Glu | gac Asp 1355 | act Thr | tct Ser | gtt Val | cac His | att Ile 1360 | gag Glu | caa Gin | atg Met | tgt Cys | gaa Glu 1365 | age Ser | aac Asn | teg Ser | 4104 |
tcc | cac | cca | cat | gtg | cgc | ctg | atc | caa | agg | gta | ggc | aaa | gaa | tta | 4149 |
Ser | His 137 0 | Pro | His | Val | Arg | Leu 1375 | ile | Gin | Arg | Val | Gly 1380 | Lys | Glu | Leu | |
att | tea | att | gtt | cgc | ggg | aac | ggg | gat | cct | ttg | gat | atc | atg | aac | 4194 |
Ile | Ser 1385 | Ile | Val | Arg | Gly | Asn 1390 | Gly | Asp | Pro | Leu | Asp 1395 | Ile | Met | Asn | |
cgc | gat | ggg | ttg | ttc | acc | gag | tac | tat | acc | aac | aag | ctc | gcc | ttt | 4239 |
Arg | Asp 1400 | Gly | Leu | Phe | Thr | Glu 1405 | Tyr | Tyr | Thr | Asn | Lys 1410 | Leu | Ala | Phe | |
ggc | tea | gca | ata | cac | gtc | gtt | cag | gat | ctg | gtt | age | caa | att | gct | 4284 |
Gly | Ser 1415 | Ala | Ile | His | Val | Val 1420 | Gin | Asp | Leu | Val | Ser 1425 | Gin | Ile | Ala | |
cat | cgc | tac | caa | tcc | att | gat | atc | ctt | gag | atc | ggc | ttg | ggt | aca | 4329 |
His | Arg 1430 | Tyr | Gin | Ser | Ile | Asp 1435 | Ile | Leu | Glu | Ile | Gly 1440 | Leu | Gly | Thr | |
ggc | atc | gcc | acg | aag | cgc | gtt | ctt | gca | tea | cct | caa | ctt | ggt | ttc | 4374 |
Gly | 11 e 1445 | Ala | Thr | Lys | Arg | val 1450 | Leu | Ala | Ser | Pro | Gin 1455 | Leu | Gly | Phe | |
aac | agt | tac | act | tgc | act | gac | atc | teg | gcg | gat | gtt | att | ggc | aag | 4419 |
Asn | Ser 1460 | Tyr | Thr | Cys | Thr | Asp 1465 | Ile | Ser | Ala | Asp | val 1470 | Ile | Gly | Lys | |
gcc | cgt | gaa | caa | ctt | tcc | gaa | ttc | gac | ggt | ctc | atg | cag | ttt | gag | 4464 |
Ala | Arg 1475 | Glu | Gin | Leu | Ser | Glu 1480 | Phe | Asp | Gly | Leu | Met 1485 | Gin | Phe | Glu | |
gca | eta | gac | atc | aac | aga | age | cca | gca | gag | caa | gga | ttc | aag | cct | 4509 |
Ala | Leu 1490 | Asp | Tle | Asn | Arg | Ser 1495 | Pro | Ala | Glu | Gin | Gly 1500 | Phe | Lys | Pro | |
cac | tcc | tac | gat | ctg | att | att | gca | tcc | gat | gtc | ctc | cat | gcc | age | 4554 |
His | Ser 1505 | Tyr | Asp | Leu | Ile | Ile 1510 | Ala | Ser | Asp | Val | Leu 1515 | His | Ala | Ser | |
tcc | aac | ttc | gag | gaa | aaa | ttg | gct | cac | ata | agg | tcc | ttg | ctc | aag | 4599 |
Ser | Asn 152 0 | Phe | Glu | Glu | Lys | Leu 1525 | Ala | His | Ile | Arg | Ser 1530 | Leu | Leu | Lys | |
ccg | ggt | ggt | cac | ttg | gtt | act | ttc | ggg | gtc | acc | cat | cgc | gag | cct | 4644 |
Pro | Gly 1535 | Glv | His | Leu | Val | Thr 1540 | Phe | Gly | Val | Thr | His 1545 | Arg | Glu | Pro |
PL 202 457 B1
gct Ala | cgc Arg 1550 | ctc Leu | gcc Ala | ttc Phe | atc Ile | tct Ser 1555 | ggg Gly | ctt Leu | ttc Phe | gct Ala | gat Asp 1560 | ega Arg | tgg Trp | act Thr | 4669 |
gga | gaa | gac | gaa | act | cgt | gct | ttg | agt | gcc | teg | ggg | tcc | gtt | gac | 4734 |
Gly | Glu 1565 | Asp | Glu | Thr | Arg | Ala 1570 | Leu | Ser | Ala | Ser | Gly 1575 | Ser | Val | Asp | |
CciĆL | tgg | gag | cat | acc | ctc | aag | aga | gtt | ggg | ttc | tct | ggc | gtc | gat | 4779 |
Gin | Trp 1580 | Glu | His | Thr | Leu | Lys 1585 | Arg | Val | Gly | Phe | Ser 1590 | Gly | Val | Asp | |
agt | cgg | aca | ctt | gat | ega | gag | gat | gat | ttg | atc | ccg | tct | gtc | ttc | 4824 |
Ser | Arg 1595 | Thr | Leu | Asp | Arg | Glu 1600 | Asp | Asp | Leu | Ile | Pro 1605 | Ser | Val | Phe | |
agt | aca | cat | gct | gtg | gat | gcc | acc | gtt | gag | cgt | ttg | tat | gat | cca | 4869 |
Ser | Thr 1610 | His | Ala | Val | Asp | Ala 1615 | Thr | Val | Glu | Arg | Leu 1620 | Tyr | Asp | Pro | |
ctt | tct | gct | cca | ttg | aag | gac | tea | tac | ccg | cca | tta | gtg | gtt | atc | 4914 |
Leu | Ser 1625 | Ala | Pro | Leu | Lys | Asp 1630 | Ser | Tyr | Pro | Pro | Leu 1635 | Val | Val | Ile | |
ggt | ggc | gaa | teg | aca | aaa | acc | gaa | cgc | att | ttg | aac | gac | atg | aaa | 4959 |
Gly | Gly 1640 | Glu | Ser | Thr | Lys | Thr 1645 | Glu | Arg | Ile | Leu | Asn 1650 | Asp | Met | Lys | |
gct | gcc | eta | ccg | cat | aga | cac | atc | cac | tcc | gtc | aag | cgg | ctg | gaa | 5004 |
Ala | Ala 1655 | Leu | Pro | His | Arg | His 1660 | Ile | His | Ser | Val | Lys 1665 | Arg | Leu | Glu | |
agt | gtt | ctc | gac | gac | ccg | gcc | ttg | cag | cct | aag | teg | act | ttt | gtc | 5049 |
Ser | Val 1670 | Leu | Asp | Asp | Pro | Ala 1675 | Leu | Gin | Pro | Lys | Ser 1680 | Thr | Phe | Val | |
atc | ctc | teg | gaa | ctt | gat | gat | gaa | gtg | ttt | tgc | aac | ctt | gaa | gag | 5094 |
Ile | Leu 1685 | Ser | Glu | Leu | Asp | Asp 1690 | Glu | val | Phe | Cys | Asn 1695 | Leu | Glu | Glu | |
gac | aag | ttt | gag | gca | gtc | aag | tct | ctt | ctc | ttc | tac | gcc | gga | cgc | 5139 |
Asp | Lys 1700 | Phe | Glu | Ala | Val | Lys 1705 | Ser | Leu | Leu | Phe | Tyr 1710 | Ala | Gly | Arg | |
atg | atg | tgg | ctg | aca | gag | aat | gcc | tgg | att | gat | cat | ccc | cac | cag | 5184 |
Met | Met 1715 | Trp | Leu | Thr | Glu | Asn 1720 | Ala | Trp | Ile | Asp | His 1725 | Pro | His | Gin | |
gcc | agc | acc | atc | gga | atg | ttg | agg | aca | atc | aag | ctc | gag | aac | cct | 5229 |
Ala | Ser 1730 | Thr | Ile | Gly | Met | Leu 1735 | Arg | Thr | Ile | Lys | Leu 1740 | Glu | Asn | Pro |
PL 202 457 B1
gac Asp | ttg Leu 1745 | gga Gly | acg Thr | cac His | gtc Val | ttc Phe 1750 | gat Asp | gtc Val | gat Asp | acc Thr | gtg Val 1755 | gag Glu | aac Asn | cta Leu | 5274 |
gac | acc | aaa | ttc | ttc | gtt | gag | caa | ctt | ttg | cgc | ttc | gag | gag | agc | 5319 |
Asp | Thr 1760 | Lys | Phe | Phe | Val | Glu 1765 | Gin | Leu | Leu | Arg | Phe 1770 | Glu | Glu | Ser | |
gat | gat | cag | ctt | ttg | gaa | tca | ata | aca | tgg | act | cat | gag | ccc | gaa | 5364 |
Asp | Asp 1775 | Gin | Leu | Leu | Glu | Ser 1780 | Ile | Thr | Trp | Thr | His 1785 | Glu | Pro | Glu | |
gtg | tac | tgg | tgc | aag | ggt | cgt | gcc | tgg | gtc | cct | cgt | ttg | aag | cag | 5409 |
val | Tyr 1790 | Trp | Cys | Lys | Gly | Arg 1795 | Ala | Trp | Val | Pro | Arg 1800 | Leu | Lys | Gin | |
gat | att | gct | agg | aac | gac | cgt | atg | aac | teg | tct | cgt | cgt | cca | att | 5454 |
Asp | Ile 1805 | Ala | Arg | Asn | Asp | Arg 1810 | Met | Asn | Ser | Ser | Arg 1815 | Arg | Pro | Ile | |
ttc | ggt | aac | ttt | aat | teg | tcc | aag | acg | gcc | att | gca | ctg | aaa | gag | 5499 |
Phe | Glv 1820 | Asn | Phe | Asn | Ser | Ser 1825 | Lys | Thr | Ala | Ile | Ala 1830 | Leu | Lys | Glu | |
gcg | agg | gga | gca | tcc | tca | teg | atg | tac | tat | ctt | gag | tca | acc | gag | 5544 |
Ala | Arg 1S35 | Gly | Ala | Ser | Ser | Ser 1840 | Met | Tyr | Tyr | Leu | Glu 1845 | Ser | Thr | Glu | |
acg | tgt | gat | teg | tta | gaa | gac | gct | cgt | cat | gct | gga | aaa | gca | act | 5589 |
Thr | Cys 1850 | Asp | Ser | Leu | Glu | Asp 1855 | Ala | Arg | His | Ala | Gly 1860 | Lys | Ala | Thr | |
gtt | cgt | gtt | cgc | tac | gct | Ctt | ccc | cag | gca | att | cgc | gtg | ggc | cat | 5634 |
Val | Arg 1865 | Val | Arg | Tyr | Ala | Leu 1870 | Pro | Gin | Ala | Ile | Arg 1875 | Val | Gly | His | |
ctc | gga | tac | ttc | cat | gtc | gtg | cag | ggc | agt | att | ctg | gag | aat | aca | 5679 |
Leu | Gly 1880 | Tyr | Phe | His | Va] | Val 1885 | Gin | Gly | Ser | Ile | Leu 1890 | Glu | Asn | Thr | |
tgt | gag | gtg | cct | gta | gtc | gcc | ctg | gct | gag | aag | aat | gga | tct | ata | 5724 |
Cys | Glu 1895 | Val | Pro | Val | Val | Ala 1900 | Leu | Ala | Glu | Lys | Asn 1905 | Gly | Ser | Ile | |
ctg | cat | gta | ccg | aga | aac | tac | atg | cat | agt | ctg | ccc | gat | aac | atg | 5769 |
Leu | His 1910 | Val | Pro | Arg | Asn | Tyr 1915 | Met | His | Ser | Leu | Pro 1920 | Asp | Asn | Met | |
gcg | gaa | gg<= | gag | gat | agt | tcc | ttc | ttg | ttg | tcc | aca | gct | gca | gcc | 5814 |
Ala | Glu 1925 | Gly | Glu | Asp | Ser | Ser 1930 | Phe | Leu | Leu | Ser | Thr 1935 | Ala | Ala | Ala |
PL 202 457 B1
ctc Leu | ctt Leu 1940 | gcc Ala | gaa Glu | aca Thr | att Ile | ctc Leu 1945 | tct Ser | agc Ser | gct Ala | cag Gin | tcc Ser 1950 | ttt Phe | ggc Gly | tct Ser | 5859 |
gat | gca | tca | att | ctg | att | atg | gag | ccc | cca | atc | ttc | tgc | gtc | aaa | 5904 |
Asp | Ala 1955 | Ser | Ile | Leu | Ile | Met 1960 | Glu | Pro | Pro | Ile | Phe 1965 | Cys | Val | Lys | |
gca | att | ctg | gag | tcg | gcc | aaa | acc | tac | ggt | gtt | cag | gtt | cat | ttg | 5949 |
Ala | Ile 1970 | Leu | Glu | Ser | Ala | Lys 1975 | Thr | Tyr | Gly | Val | Gin 1980 | Val | His | Leu | |
gca | aca | act | ctg | tcc | gac | gtc | aaa | act | att | ccg | gct | cct | tgg | atc | 5994 |
Ala | Thr 1985 | Thr | Leu | Ser | Asp | Val 1990 | Lys | Thr | Ile | Pro | Ala 1995 | Pro | Trp | Ile | |
ega | tta | cat | gcc | aag | gaa | acc | gac | gct | cgg | ctg | aaa | cac | agc | ctg | 603 9 |
Arg | Leu 2000 | His | Ala | Lys | Glu | Thr 2005 | Asp | Ala | Arg | Leu | Lys 2010 | His | Ser | Leu | |
ccg | aca | aac | atg | atg | gca | ttc | ttt | gac | ttg | tct | acc | gac | cgg | act | 6084 |
Pro | Thr 2015 | Asn | Met | Met | Ala | Phe 2020 | Phe | Asp | Leu | Ser | Thr 2025 | Asp | Arg | Thr | |
gct | gcc | ggg | ata | acc | aac | cgt | ttg | gcc | aag | ttg | eta | cca | ccc | agt | 6129 |
Ala | Ala 2030 | Gly | Ile | Thr | Asn | Arg 2035 | Leu | Ala | Lys | Leu | Leu 2040 | Pro | Pro | Ser | |
tgc | ttc | atg | tac | agt | ggt | gac | tat | ctt | atc | ega | agt | aca | gct | tcc | 6174 |
Cys | Phe 2045 | Met | Tyr | Ser | Gly | Asp 2050 | Tyr | Leu | Ile | Arg | Ser 2055 | Thr | Ala | Ser | |
aca | tac | aaa | gtt | agt | cat | gtt | gag | gat | att | cca | atc | ctc | gag | cac | 6219 |
Thr | Tyr 2060 | Lys | val | Ser | His | Val 2065 | Glu | Asp | Ile | Pro | Ile 2070 | Leu | Glu | His | |
tct | gtg | gca | atg | gca | aaa | aat | acc | gtc | tct | gcg | tcg | act | gtc | gac | 6254 |
Ser | Val 2075 | Ala | Met | Ala | Lys | Asn 2080 | Thr | Val | Ser | Ala | Ser 2085 | Thr | Val | Asp | |
gac | act | gag | aaa | gtt | att | aca | gcc | aca | caa | att | ctc | ttg | cct | ggt | 6309 |
Asp | Thr 2090 | Glu | Lys | Val | Ile | Thr 2095 | Ala | Thr | Gin | Ile | Leu 2100 | Leu | Pro | Gly | |
cag | ctc | tct | gtc | aac | cac | aat | gac | caa | ege | ttc | aat | ctg | gcc | acc | 6354 |
Gin | Leu 2105 | Ser | Val | Asn | His | Asn 2110 | Asp | Gin | Arg | Phe | Asn 2115 | Leu | Ala | Thr | |
gtc | atc | gac | tgg | aag | gaa | aat | gag | gtg | tcc | gct | agg | att | tgc | CCC | 6399 |
Val | Ile 2120 | Asp | Trp | Lys | Glu | Asn 2125 | Glu | Val | Ser | Ala | Arg 2130 | Ile | Cys | Pro |
PL 202 457 B1
atc ile | gac Asp 213 5 | tct Ser | ggt Gly | aac Asn. | tta Leu | ttt Phe 2140 | tcc Ser | aac Asn | aag Lys | aag Lys | acg Thr 2145 | tat Tyr | ttg Leu | ctt Leu | 6444 |
gtt | ggt | ctt | acc | ggg | gac | ctt | ggt | cgc | tct | ctc | tgt | cgc | tgg | atg | 6489 |
Val | Gly 2150 | Leu | Thr | Gly | Asp | Leu 2155 | Gly | Arg | Ser | Leu | Cys 2160 | Arg | Trp | Met | |
atc | ttg | cat | ggc | gcc | cgc | cat | gtt | gtg | ctc | act | agc | cgg | aac | cct | 6534 |
Ile | Leu 2165 | His | Gly | Ala | Arg | His 2170 | Val | Val | Leu | Thr | Ser 2175 | Arg | Asn | Pro | |
ega | ctt | gat | ccc | aaa | tgg | atc | gcc | aac | atg | gag | gca | ctt | ggt | ggt | 6579 |
Arg | Leu 2180 | Asp | Pro | Lys | Trp | Ile 2185 | Ala | Asn | Met | Glu | Ala 2190 | Leu | Gly | Gly | |
gac | atc | acc | gtt | ctg | tea | atg | gat | gtt | gcc | aat | gag | gat | tea | gtc | 6624 |
Asp | Ile 2195 | Thr | Val | Leu | Ser | Met 2200 | Asp | Val | Ala | Asn | Glu 2205 | Asp | Ser | Val | |
gat | gct | ggc | ctt | ggc | aag | ctt | gtc | gat | atg | aag | ttg | cca | cct | gtt | 6669 |
Asp | Ala 2210 | Gly | Leu | Gly | Lys | Leu 2215 | Val | Asp | Met | Lys | Leu 2220 | Pro | Pro | Val | |
gcc | ggc | atc | gcg | ttc | ggg | cct | ttg | gtg | ctg | cag | gat | gtc | atg | ctg | 6714 |
Ala | Gly 2225 | Ile | Ala | Phe | Gly | Pro 2230 | Leu | Val | Leu | Gin | Asp 2235 | Val | Met | Leu | |
aag | aac | atg | gac | cac | cag | atg | atg | gac | atg | gtg | ttg | aag | ccc | aag | 6759 |
Lys | Asn 2240 | Met | Asp | His | Gin | Met 2245 | Met | Asp | Met | Val | Leu 2250 | Lys | Pro | Lys | |
gta | caa | gga | gca | cgc | att | ctt | cat | gaa | cgg | ttc | tcc | gaa | cag | acg | 6804 |
Val | Gin 2255 | Gly | Ala | Arg | Ile | Leu 2260 | His | Glu | Arg | Phe | Ser 2265 | Glu | Gin | Thr | |
ggc | agc | aag | gcg | ctc | gac | ttc | ttc | atc | atg | ttt | teg | tcc | att | gtt | 584 9 |
Gly | Ser 2270 | Lys | Ala | Leu | Asp | Phe 2275 | Phe | Ile | Met | Phe | Ser 2280 | Ser | Ile | Val | |
gca | gtt | att | ggc | aat | cct | ggc | cag | tcc | aac | tat | ggc | gct | gcg | aat | 6894 |
Ala. | Val 2285 | ile | Gly | Asn | Pro | Gly 2290 | Gin | Ser | Asn | Tyr | Gly 2295 | Ala | Ala | Asn | |
gcc | tac | eta | cag | gct | ctg | gcc | cag | caa | cgg | tgc | gcc | aga | gga | ttg | 6939 |
Ala | Tyr 2300 | Leu | Gin | Ala | Leu | Ala 2305 | Gin | Gin | Arg | Cys | Ala 2310 | Arg | Gly | Leu | |
gcg | gga | tea | acc | atc | gat | att | ggt | gcc | gtt | tac | ggt | gta | ggg | ttt | 6984 |
Ala | Gly 2315 | Ser | Thr | Ile | Asp | Ile 2320 | Gly | Ala | Val | Tyr | Gly 2325 | Val | Gly | Phe |
PL 202 457 B1
gtc Val | acg Thr 2330 | agg Arg | gcc Ala | gag Glu | atg Met | gag Glu 2335 | gag Glu | gac Asp | ttt Phe | gat Asp | get Ala 2340 | atc Ile | cgt Arg | ttc Phe | 7029 |
atg | ttt | gac | tea | gtt | gaa | gag | cat | gag | ctg | cac | acg | ctt | ttc | gcc | 7074 |
Met | Phe 2345 | Asp | Ser | Val | Glu | Glu 2350 | His | Glu | Leu | His | Thr 2355 | Leu | Phe | Ala | |
gaa | gcg | gtc | gtg | tct | gac | cag | cgt | gcc | cgg | cag | caa | cca | cag | cgc | 7119 |
Glu | Ala 2350 | Val | Val | Ser | Asp | Gin 2355 | Arg | Ala | Arg | Gin | Gin 2370 | Pro | Gin | Arg | |
aag | acg | gtc | att | gac | atg | gcg | gac | ctt | gag | ctt | acc | acg | ggt | atc | 7164 |
Lys | Thr 2375 | Val | Ile | Asp | Met | Ala 2380 | Asp | Leu | Glu | Leu | Thr 2385 | Thr | Gly | Ile | |
cca | gat | ctt | gac | cct | gcg | ctt | caa | gat | ega | att | att | tac | ttc | aac | 7209 |
Pro | Asp 23 90 | Leu | Asp | Pro | Ala | Leu 2395 | Gin | Asp | Arg | Ile | Ile 2400 | Tyr | Phe | Asn | |
gac | cct | cgt | ttc | gga | aac | ttc | aaa | att | ccc | ggt | caa | cgc | gga | gac | 7254 |
Asp | Pro 2405 | Arg | Phe | Gly | Asn | Phe 2410 | Lys | Ile | Pro | Gly | Gin 2415 | Arg | Gly | Asp | |
ggt | ggc | gac | aat | gga | tea | ggg | tct | aaa | ggc | tcc | att | gcc | gac | cag | 7299 |
Gly | Gly 2420 | Asp | Asn | Gly | Ser | Gly 2425 | Ser | Lys | Gly | Ser | Ile 2430 | Ala | Asp | Gin | |
ctc | aaa | caa | gca | aca | act | tta | gac | caa | gtt | cgg | caa | atc | gtg | att | 7344 |
Leu | Lys 2435 | Gin | Ala | Thr | Thr | Leu 2440 | Asp | Gin | Val | Arg | Gin 2445 | Ile | Val | Ile | |
gat | ggt | eta | tct | gag | aaa | ctc | cgt | gtt | acc | ctc | caa | gtt | teg | gac | 7389 |
Asp | Gly 2450 | Leu | Ser | Glu | Lys | Leu 2455 | Arg | Val | Thr | Leu | Gin 2460 | Val | Ser | Asp | |
ggg | gag | agc | gtg | gac | cca | acc | att | cct | ctc | att | gat | caa | ggt | gtc | 7434 |
Gly | Glu 2465 | Ser | Val | Asp | Pro | Thr 2470 | Ile | Pro | Leu | Ile | Asp 2475 | Gin | Gly | Val | |
gac | tcc | ttg | ggt | gca | gtg | act | gtc | ggc | tea | tgg | ttc | tea | aag | caa | 7479 |
Asp | Ser 2480 | Leu | Gly | Ala | Val | Thr 2485 | Val | Gly | Ser | Trp | Phe 2490 | Ser | Lys | Gin | |
ctc | tac | ctt | gac | ctc | cca | ctc | ttg | agg | gta | ctt | ggc | ggt | get | tct | 7524 |
Leu | Tyr 2495 | Leu | Asp | Leu | Pro | Leu 2500 | Leu | Arg | Val | Leu | Gly 2505 | Gly | Ala | Ser | |
gtc | get | gat | ctt | gcc | gac | gac | gcg | gcc | acc | ega | ctc | cca | get | aca | 7569 |
Val | Ala 2510 | Asp | Leu | Ala | Asp | Asp 2515 | Ala | Ala | Thr | Arg | Leu 2520 | Pro | Ala | Thr |
PL 202 457 B1
tcc Ser | att Ile 2525 | ccg Pro | ctg Leu | ctg Leu | ttg Leu | caa Gin 2530 | att Ile | ggt Gly | gat Asp | tcc Ser | acg Thr 2535 | gga Gly | acc Thr | tcg Ser | 7614 |
gac | agc | ggg | gct | tct | ccg | aca | cca | aca | gac | agc | cat | gat | gaa | gca | 7659 |
Asp | Ser 2540 | Gly | Ala | Ser | Pro | Thr 2545 | Pro | Thr | Asp | Ser | His 2550 | Asp | Glu | Ala | |
agc | tct | gct | acc | agc | aca | gat | gcg | tcg | tca | gcc | gaa | gag | gat | gaa | 7704 |
Ser | Ser 2555 | Ala | Thr | Ser | Thr | Asp 2560 | Ala | Ser | Ser | Ala | Glu 2565 | Glu | Asp | Glu | |
gag | caa | gag | gac | gat | aat | gag | cag | gga | ggc | cgt | aag | att | Ctt | cgt | 7749 |
Glu | Gin 2570 | Glu | Asp | Asp | Asn | Glu 2575 | Gin | Gly | Gly | Arg | Lys 2580 | Ile | Leu | Arg | |
cgc | gag | agg | ttg | tcc | ctt | ggc | cag | gag | tat | tcc | tgg | agg | cag | caa | 7794 |
Arg | Glu 2585 | Arg | Leu | Ser | Leu | Gly 2590 | Gin | Glu | Tyr | Ser | Trp 2595 | Arg | Gin | Gin | |
caa | atg | gta | aaa | gat | cat | acc | atc | ttc | aac | aac | act | att | ggc | atg | 7839 |
Gin | Met 2600 | Val | Lys | Asp | His | Thr 2605 | Ile | Phe | Asn | Asn | Thr 2610 | Ile | Gly | Met | |
ttc | atg | aag | ggt | acc | att | gac | ctc | gac | cgg | ttg | agg | cgg | gct | ctg | 7884 |
Phe | Met 2615 | Lys | Gly | Thr | Ile | Asp 2620 | Leu | Asp | Arg | Leu | Arg 2625 | Arg | Ala | Leu | |
aaa | gcc | tca | ttg | cgc | cgt | cac | gag | atc | ttc | cgt | acg | tgc | ttt | gtt | 7929 |
Lys | Ala 2630 | Ser | Leu | Arg | Arg | His 2635 | Glu | Ile | Phe | Arg | Thr 2640 | Cys | Phe | Val | |
act | ggc | gat | gac | tat | agc | agc | gat | tta | aat | ggt | ccc | gtc | caa | gtg | 7974 |
Thr | Gly 2645 | Asp | Asp | Tyr | Ser | Ser 2650 | Asp | Leu | Asn | Gly | Pro 2655 | Val | Gin | Val | |
gtt | ctc | aag | aac | ccg | gag | aac | aga | gtg | cac | ttt | gtt | cag | gtg | aac | 8019 |
Val | Leu 2660 | Lys | Asn | Pro | Glu | Asn 2665 | Arg | Val | His | Phe | Val 2670 | Gin | Val | Asn | |
aac | gct | gcg | gag | gca | gag | gaa | gag | tac | cgg | aaa | ctc | gag | aag | aca | 8064 |
Asn | Ala 2675 | Ala | Glu | Ala | Glu | Glu 2630 | Glu | Tyr | Arg | Lys | Leu 2685 | Glu | Lys | Thr | |
aac | tat | agc | atc | tcc | aca | ggt | gac | act | ctc | aga | ctc | gtt | gat | ttc | 8109 |
Asn | Tyr 2690 | Ser | Ile | Ser | Thr | Gly 2 6 95 | Asp | Thr | Leu | Arg | Leu 2700 | Val | Asp | Phe | |
tac | tgg | ggc | aca | gat | gac | cac | ctg | ttg | gta | atc | ggc | tac | cac | aga | 8154 |
Tyr | Trp 2705 | Gly | Thr | Asp | Asp | His 2710 | Leu | Leu | Val | Ile | Gly 2715 | Tyr | His | Arg |
PL 202 457 B1
tta Leu | gtt val 2720 | ggt Gly | gat Asp | ggc Gly | tea Ser | aca Thr 2725 | aca Thr | gaa Glu | aac Asn | ctg Leu | ttc Phe 2730 | aat Asn | gag Glu | atc Ile | 8199 |
ggg | cag | att | tac | agc | ggg | gtg | aaa | atg | cag | ega | cca | teg | acc | caa | 8244 |
Gly | Gin 2735 | Ile | Tyr | Ser | Gly | Val 2740 | Lys | Met | Gin | Arg | Pro 2745 | Ser | Thr | Gin | |
ttc | tct | gat | eta | gcc | gtc | caa | cag | cgg | gaa | aac | ctg | gaa | aat | ggg | 8289 |
Phe | Ser 2750 | Asp | Leu | Ala | Val | Gin 2755 | Gin | Arg | Glu | Asn | Leu 2760 | Glu | Asn | Gly | |
ega | atg | ggg | gac | gat | atc | gcg | ttc | tgg | aag | tcc | atg | cat | agc | aaa | 8334 |
Arg | Met 2755 | Gly | Asp | Asp | Ile | Ala 2770 | Phe | Trp | Lys | Ser | Met 2775 | His | Ser | Lys | |
gtc | teg | tea | tct | gcg | cca | acc | gtg | ctt | ccc | atc | atg | aat | ctg | atc | 8379 |
Val | Ser 2780 | Ser | Ser | Ala | Pro | Thr 2785 | Val | Leu | Pro | Ile | Met 2790 | Asn | Leu | Ile | |
aat | gac | cct | gct | gcc | aat | tea | gag | cag | cag | caa | ata | cag | cca | ttc | 8424 |
Asn | Asp 2795 | Pro | Ala | Ala | Asn | Ser 2800 | Glu | Gin | Gin | Gin | Ile 2805 | Gin | Pro | Phe | |
acg | tgg | cag | cag | tat | gaa | gca | att | gct | cgt | tta | gat | ccc | atg | gtc | 8469 |
Thr | Trp 2810 | Gin | Gin | Tyr | Glu | Ala 2815 | Ile | Ala | Arg | Leu | Asp 2820 | Pro | Met | Val | |
gcc | ttc | ega | atc | aaa | gag | cgg | agc | cgc | aag | cac | aag | gca | acc | ccc | 8514 |
Ala | Phe 2825 | Arg | Ile | Lys | Glu | Arg 2830 | Ser | Arg | Lys | His | Lys 2835 | Ala | Thr | Pro | |
atg | cag | ttc | tac | ctg | gcc | gcc | tac | cac | gtt | ttg | ttg | gcg | cgt | ctt | 8559 |
Met | Gin 2840 | Phe | Tyr | Leu | Ala | Ala 2845 | Tyr | His | Val | Leu | Leu 2850 | Ala | Arg | Leu | |
acc | ggc | agc | aaa | gac | ata | acc | atc | ggc | ctc | gcc | gaa | acc | aac | ega | 8604 |
Thr | Gly 2855 | Ser | Lys | Asp | Ile | Thr 2860 | Ile | Gly | Leu | Ala | Glu 2865 | Thr | Asn | Arg | |
tcc | acc | atg | gaa | gaa | att | teg | gcg | atg | ggc | ttt | ttc | gct | aac | gtg | 8649 |
Ser | Thr 2870 | Met | Glu | Glu | Ile | Ser 2875 | Ala | Met | Gly | Phe | Phe 2880 | Ala | Asn | Val | |
ctt | ccc | ctg | cgc | ttt | gat | gag | ttc | gtc | ggc | agc | aag | aca | ttc | ggc | 8694 |
Leu | Pro 2885 | Leu | Arg | Phe | Asp | Glu 2890 | Phe | Val | Gly | Ser | Lys 2895 | Thr | Phe | Gly | |
gag | cac | ctt | gta | gcc | acc | aag | gac | agt | gtg | cgt | gag | gcc | atg | caa | 8739 |
Glu | His 2900 | Leu | Val | Ala | Thr | Lys 2905 | Asp | Ser | Val | Arg | Glu 2910 | Ala | Met | Gin |
PL 202 457 B1
cac | gcg | cgg | gtg | ccg | tat | ggc | gtc | atc | ctc | gac | tgt | eta | ggc | ctg | 8784 |
His | Ala | Arg | Val | Pro | Tyr | Gly | val | Ile | Leu | Asp | Cys | Leu | Gly | Leu | |
2915 | 2920 | 2925 | |||||||||||||
aat | ctc | cct | acc | tea | ggc | gag | gaa | ccc | aag | act | cag | aca | cac | gcc | 8829 |
Asn | Leu | Pro | Thr | Ser | Gly | Glu | Glu | Pro | Lys | Thr | Gin | Thr | His | Ala | |
2930 | 2935 | 2940 | |||||||||||||
ccc | ttg | ttc | cag | get | gtc | ttt | gat | tac | aag | cag | ggt | caa | gcg | gag | 8874 |
Pro | Leu | Phe | Gin | Ala | Val | Phe | Asp | Tyr | Lys | Gin | Gly | Gin | Ala | Glu | |
2945 | 2950 | 2955 | |||||||||||||
agt | ggc | tea | att | ggc | aat | gcc | aaa | atg | acg | agt | gtt | ctc | get | tcc | 8919 |
Ser | Gly | Ser | Ile | Gly | Asn | Ala | Lys | Met | Thr | Ser | Val | Leu | Ala | Ser | |
2950 | 2965 | 2 97 0 | |||||||||||||
cgt | gag | cgc | act | cct | tat | gac | atc | gtt | ctc | gag | atg | tgg | gat | gac | 8964 |
Arg | Glu | Arg | Thr | Pro | Tyr | Asp | Ile | Val | Leu | Glu | Met | Trp | Asp | Asp | |
2975 | 2980 | 2985 | |||||||||||||
cct | acc | aag | gac | cca | ctc | att | cat | gtc | aaa | ctt | cag | agc | teg | ctg | 9009 |
Pro | Thr | Lys | Asp | Pro | Leu | Ile | His | Val | Lys | Leu | Gin | Ser | Ser | Leu | |
2990 | 2995 | 3000 | |||||||||||||
tat | ggc | cct | gag | cac | get | cag | gcc | ttt | gta | gac | cac | ttt | tct | tea | 9054 |
Tyr | Gly | Pro | Glu | His | Ala | Gin | Ala | Phe | Val | Asp | His | Phe | Ser | Ser | |
3005 | 3010 | 3015 | |||||||||||||
atc | ctc | act | atg | ttc | teg | atg | aac | ccg | get | ctg | aag | ttg | gcc | tag | 9099 |
Ile | Leu | Thr | Met | Phe | Ser | Met | Asn | Pro | Ala | Leu | Lys | Leu | Ala | ||
3020 | 3025 | 3030 |
<210> | 44 |
<211> | 3032 |
<212> | PRT |
<213> | Penicillium citrinum |
<400> | 44 |
Met
Asp Gin Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Se
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
Leu
Leu Lys Glu Pro Arg Asp Val Gin Thr Lys Ile Pro Lys Glu Arg
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gin Glu Asp Leu Arg Gly Phe
PL 202 457 B1
Asp Ala Ser Phe Phe Asn Ile Gin Ala Gly Glu Ala Glu Thr Ile Asp 85 90 95
Pro Gin Gin Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn 100 105 110
Ala Gly Leu Arg Ile Gin Gly Leu Gin Gly Ser Ser Thr Ala Val Tyr 115 120 125
Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu 130 135 140
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val 180 185 190
Gin Gin Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala 195 200 205
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn 210 215 220
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255
Ser Gin Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu 260 265 270
Thr Gly Ile Asn Gin Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn 275 280 285
His Ser Ala Gin Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly 290 295 300
Leu Asp Tle Thr Asn Pro Gin Glu Arg Cys Gin Phe Phe Glu Ala His
305 310 315 320
Gly Thr Gly Thr Pro Ala Gly Asp Pro Gin Glu Ala Glu Ala Ile Ala
325 330 335
Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu 340 345 350
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr 355 360 365
PL 202 457 B1
Glu | Gly 370 | Thr | Ala | Gly | Ile | Ala 375 | Gly | Leu | Met | Lys | Ala 380 | Ser | Phe | Ala | Val |
Arg | Asn | Gly | Val | Ile | Pro | Pro | Asn | Leu | Leu | Phe | Glu | Lys | Ile | Ser | Pro |
385 | 390 | 395 | 400 | ||||||||||||
Arg | Val | Ala | Pro | Phe | Tyr | Thr | His | Leu | Lys | Ile | Ala | Thr | Glu | Ala | Thr |
405 | 410 | 415 | |||||||||||||
Glu | Trp | Pro | Ile | Val | Ala | Pro | Gly | Gin | Pro | Arg | Arg | Val | Ser | Val | Asn |
420 | 425 | 430 | |||||||||||||
Ser | Phe | Gly | Phe | Gly | Gly | Thr | Asn | Ala | His | Ala | Ile | ile | Glu | Glu | Tyr |
435 | 440 | 445 | |||||||||||||
Met | Ala | Pro | Pro | His | Lys | Pro | Thr | Ala | Val | val | Thr | Glu | Val | Thr | Ser |
450 | 455 | 460 | |||||||||||||
Asp | Ala | Asp | Ala | Cys | Ser | Leu | Pro | Leu | Val | Leu | Ser | Ser | Lys | Ser | Gin |
465 | 470 | 475 | 480 | ||||||||||||
Arg | Ser | Met | Lys | Ala | Thr | Leu | Glu | Asn | Met | Leu | Gin | Phe | Leu | Glu | Thr |
485 | 490 | 495 | |||||||||||||
His | Asp | Asp | Val | Asp | Met | His | Asp | Ile | Ala | Tyr | Thr | Leu | Leu | Glu | Lys |
500 | 505 | 510 | |||||||||||||
Arg | Ser | Ile | Leu | Pro | Phe | Arg | Arg | Ala | Ile | Ala | Ala | His | Asn | Lys | Glu |
515 | 520 | 525 | |||||||||||||
Val | Ala | Arg | Ala | Ala | Leu | Glu | Ala | Ala | Ile | Ala | Asp | Gly | Glu | Val | Val |
530 | 535 | 540 | |||||||||||||
Thr | Asp | Phe | Arg | Thr | Asp | Ala | Asn | Asp | Asn | Pro | Arg | val | Leu | Gly | Val |
545 | 550 | 555 | 560 | ||||||||||||
Phe | Thr | Gly | Gin | Gly | Ala | Gin | Trp | Pro | Gly | Met | Leu | Lys | Lys | Leu | Met |
565 | 570 | 575 | |||||||||||||
Val | Gly | Met | Pro | Phe | Val | Arg | Gly | Ile | Leu | Glu | Glu | Leu | Asp | Asn | Ser |
580 | 585 | 590 | |||||||||||||
Leu | Gin | Thr | Leu | Pro | Glu | Lys | Tyr | Arg | Pro | Thr | Trp | Thr | Leu | Tyr | Asp |
595 | 600 | 605 | |||||||||||||
Gin | Leu | Met | Leu | Glu | Gly | Asp | Ala | Ser | Asn | Val | Arg | Leu | Ala | Ser | Phe |
SIO | 615 | 620 | |||||||||||||
Ser | Gin | Pro | Leu | Cys | Cys | Ala | Val | Gin | Ile | Val | Leu | Val | Arg | Leu | Leu |
625 | 530 | 635 | 640 | ||||||||||||
Ala | Ala | Ala | Gly | Ile | Glu | Phe | Ser | Ala | Ile | Val | Gly | His | Ser | Ser | Gly |
645 | 650 | 655 |
PL 202 457 B1
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gin Ala 660 565 670
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser 675 680 685
Ser Pro Ser Gly Gin Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr 690 695 7oo
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735
Met Asp Ala Ile Gin His Val Glu Gly Val Leu Glu Asp Glu Ser Thr 740 745 750
Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met 755 760 765
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys 770 775 780
Ala Val Ala Asp Gly Gin Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
Val His Glu Thr Ser Lys Gin Met Thr Val Gin Asp Val Met Pro Ala
805 810 815
Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gin Ala Val 820 825 830
Gin Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile 835 840 845
Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp 850 855 860
Aia Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 880
Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895
Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gin Gin Val 900 905 910
Arg Pro Asp Arg Ala Val Gin Asn Leu Ser Lys Ser Leu Pro Thr Tyr 915 920 925
Ser Trp Asp His Thr Arg Gin Tyr Trp Ala Glu Ser Arg Ser Thr Arg 930 935 940
PL 202 457 B1
Gin 945 | His | Leu | Arg | Gly | Gly 950 | Ala | Pro | His | Leu | Leu 955 | Leu | Gly Lys | Leu | Ser 960 |
Ser | Tyr | Ser | Thr | Ala 965 | Ser | Thr | Phe | Gin | Trp 970 | Thr | Asn | Phe Ile | Arg 975 | Pro |
Arg | Asp | Leu | Glu 980 | Trp | Leu | Asp | Gly | His 985 | Ala | Leu | Gin | Gly Gin 990 | Thr | Val |
Phe | Pro | Ala 995 | Ala | Gly | Tyr | Ile | Ile 100C | Met Ala Met Glu Ala Ala Met L- l 1005 |
Val | Ala 1010 | Gly | Glu | Arg | Ala | Ala 1015 | Gin | Val | Gin | Leu | Leu 1020 | Glu | Ile | Leu |
Asp | Met 1025 | Ser | ile | Asn | Lys | Ala 1030 | ile | Val | Phe | Glu | Asp 1035 | Glu | Asn | Thr |
Ser | Val 1040 | Glu | Leu | Asn | Leu | Thr 1045 | Ala | Glu | Val | Thr | Ser 1050 | Asp | Asn | Asp |
Ala | Asp 1055 | Gly | Gin | Val | Thr | Val 1060 | Lys | Phe | Val | Ile | Asp 1065 | Ser | Cys | Leu |
Ala | Lys 1070 | Glu | Ser | Glu | Leu | Ser 1075 | Thr | Ser | Ala | Lys | Gly 1080 | Gin | Ile | Val |
I le | Thr 1085 | Leu | Gly | Glu | Ala | Ser 1090 | Pro | Ser | Ser | Gin | Leu 1095 | Leu | Pro | Pro |
Pro | Glu 1100 | Glu | Glu | Tyr | Pro | Gin 1105 | Met | Asn | Asn | Val | Asn 1110 | Ile | Asp | Phe |
Phe | Tyr 1115 | Arg | Glu | Leu | Asp | Leu 1120 | Leu | Gly | Tyr | Asp | Tyr 1125 | Ser | Lys | Asp |
Phe | Arg 1130 | Arg | Leu | Gin | Thr | Met 1135 | Arg | Arg | Ala | Asp | Ser 1140 | Lys | Ala | Ser |
Gly | Thr 1145 | Leu | Ala | Phe | Leu | Pro 1150 | Leu | Lys | Asp | Glu | Leu 1155 | Arg | Asn | Glu |
Pro | Leu 1160 | Leu | Leu | His | Pro | Ala 1165 | Pro | Leu | Asp | Ile | Ala 1170 | Phe | Gin | Thr |
Val | Ile 1175 | Gly | Ala | Tyr | Ser | Ser 1180 | Pro | Gly | Asp | Arg | Arg 1185 | Leu | Arg | Ser |
Leu | Tyr 1190 | Val | Pro | Thr | His | Val 1195 | Asp | Arg | Val | Thr | Leu 1200 | Ile | Pro | Ser |
Leu | Cys 1205 | Ile | Ser | Ala | Gly | Asn 1210 | Ser | Gly | Glu | Thr | Glu 1215 | Leu | Ala | Phe |
PL 202 457 B1
Asp | Thr 1220 | Ile | Asn | Thr | His | Asp 1225 | Lys | Gly | Asp | Phe | Leu 1230 | Ser | Gly | Asp |
Ile | Thr 1235 | Val | Tyr | Asp | Ser | Thr 1240 | Lys | Thr | Thr | Leu | Phe 1245 | Gin | Val | Asp |
Asn | Ile 1250 | Val | Phe | Lys | Pro | Phe 1255 | Ser | Pro | Pro | Thr | Ala 1260 | Ser | Thr | Asp |
Hi s | Arg 1265 | Ile | Phe | Ala | Lys | Trp 1270 | val | Trp | Gly | Pro | Leu 1275 | Thr | Pro | Glu |
Lys | Leu 1280 | Leu | Glu | Asp | Pro | Ala 1285 | Thr | Leu | Ile | Ile | Ala 1290 | Arg | Asp | Lys |
Glu | Asp 1295 | Ile | Leu | Thr | Ile | Glu 1300 | Arg | Ile | Val | Tyr | Phe 1305 | Tyr | Ile | Lys |
Ser | Phe 1310 | Leu | Ala | Gin | Ile | Thr 1315 | Pro | Asp | Asp | Arg | Gin 1320 | Asn | Ala | Asp |
Leu | His 1325 | Ser | Gin | Lys | Tyr | Ile 1330 | Glu | Trp | Cys | Asp | Gin 1335 | Val | Gin | Ala |
Asp | Ala 1340 | Arg | Ala | Gly | His | His 1345 | Gin | Trp | Tyr | Gin | Glu 1350 | Ser | Trp | Glu |
Glu | Asp 1355 | Thr | Ser | Val | His | Ile 1360 | Glu | Gin | Met | Cys | Glu 1365 | Ser | Asn | Ser |
Ser | His 1370 | Pro | His | Val | Arg | Leu 1375 | Ile | Gin | Arg | Val | Gly 1380 | Lys | Glu | Leu |
Ile | Ser 1385 | Ile | Val | Arg | Gly | Asn 1390 | Gly | Asp | Pro | Leu | Asp 1395 | Ile | Met | Asn |
Arg | Asp 1400 | Gly | Leu | Phe | Thr | Glu 1405 | Tyr | Tyr | Thr | Asn | Lys 1410 | Leu | Ala | Phe |
Gly | Ser 1415 | Ala | Ile | His | Val | Val 1420 | Gin | Asp | Leu | val | Ser 1425 | Gin | Ile | Ala |
His | Arg 1430 | Tyr | Gin | Ser | Ile | Asp 1435 | Ile | Leu | Glu | Ile | Gly 1440 | Leu | Gly | Thr |
Gly | Ile 1445 | Ala | Thr | Lys | Arg | Val 1450 | Leu | Ala | Ser | Pro | Gin 1455 | Leu | Gly | Phe |
Asn | Ser 1460 | Tyr | Thr | Cys | Thr | Asp 1465 | Ile | Ser | Ala | Asp | Val 1470 | Ile | Gly | Lys |
Ala | Arg 1475 | Glu | Gin | Leu | Ser | Glu 1480 | Phe | Asp | Gly | Leu | Met 1485 | Gin | Phe | Glu |
PL 202 457 B1
Ala | Leu 1490 | Asp | Ile | Asn | Arg | Ser 1495 | Pro | Ala | Glu | Gin | Gly 1500 | Phe | Lys | Pro |
His | Ser 1505 | Tyr | Asp | Leu | Ile | Ile 1510 | Ala | Ser | Asp | Val | Leu 1515 | His | Ala | Ser |
Ser | Asn 1520 | Phe | Glu | Glu | Lys | Leu 1525 | Ala | His | Ile | Arg | Ser 1530 | Leu | Leu | Lys |
Pro | Gly 1535 | Gly | His | Leu | Val | Thr 1540 | Phe | Gly | Val | Thr | His 1545 | Arg | Glu | Pro |
Ala | Arg 1550 | Leu | Ala | Phe | Ile | Ser 1555 | Gly | Leu | Phe | Ala | Asp 1560 | Arg | Trp | Thr |
Gly | Glu 1565 | Asp | Glu | Thr | Arg | Ala 1570 | Leu | Ser | Ala | Ser | Gly 1575 | Ser | Val | Asp |
Gin | Trp 1580 | Glu | His | Thr | Leu | Lys 1585 | Arg | Val | Gly | Phe | Ser 1590 | Gly | Val | Asp |
Ser | Arg 1595 | Thr | Leu | Asp | Arg | Glu 1600 | Asp | Asp | Leu | Ile | Pro 1605 | Ser | Val | Phe |
Ser | Thr 1510 | His | Ala | Val | Asp | Ala 1615 | Thr | Val | Glu | Arg | Leu 1620 | Tyr | Asp | Pro |
Leu | Ser 1625 | Ala | Pro | Leu | Lys | Asp 1630 | Ser | Tyr | Pro | Pro | Leu 1635 | Val | Val | Ile |
Gly | Gly 1640 | Glu | Ser | Thr | Lys | Thr 1645 | Glu | Arg | Ile | Leu | Asn 1650 | Asp | Met | Lys |
Aia | Ala 1655 | Leu | Pro | His | Arg | His 1660 | Ile | His | Ser | Val | Lys 1665 | Arg | Leu | Glu |
Ser | Val 1670 | Leu | Asp | Asp | Pro | Ala 1675 | Leu | Gin | Pro | Lys | Ser 1680 | Thr | Phe | Val |
Ile | Leu 1685 | Ser | Glu | Leu | Asp | Asp 1690 | Glu | Val | Phe | Cys | Asn 1695 | Leu | Glu | Glu |
Asp | Lys 1700 | Phe | Glu | Ala | Val | Lys 1705 | Ser | Leu | Leu | Phe | Tyr 1710 | Ala | Gly | Arg |
Met | Met 1715 | Trp | Leu | Thr | Glu | Asn 1720 | Ala | Trp | Ile | Asp | His 1725 | Pro | His | Gin |
Ala | Ser 1730 | Thr | Ile | Gly | Met | Leu 1735 | Arg | Thr | Ile | Lys | Leu 1740 | Glu | Asn | Pro |
Asp | Leu 1745 | Gly | Thr | His | Val | Phe 1750 | Asp | Val | Asp | Thr | Val 1755 | Glu | Asn | Leu |
PL 202 457 B1
Asp Thr Lys 1760
Asp Asp Gin 1775
Val Tyr Trp 1790
Asp Ile Ala 1805
Phe Gly Asn 1820
Ala Arg Gly 1835
Thr Cys Asp 1850
Val Arg Val 1865
Leu Gly Tyr 18 80
Cys Glu Val 1895
Leu His Val 1910
Ala Glu Gly 1925
Leu Leu Ala 1940
Asp Ala Ser 1955
Ala Ile Leu 1970
Ala Thr Thr 1985
Arg Leu His 2000
Pro Thr Asn 2015
Phe
Leu
Cys
Arg
Phe
Ala
Ser
Arg
Phe
Pro
Pro
Glu
Glu
Ile
Glu
Leu
Ala
Met
Phe
Leu
Lys
Asn
Asn
Ser
Leu
Tyr
His
Val
Arg
Asp
Thr
Leu
Ser
Ser
Lys
Met
Val
Glu
Gly
Asp
Ser
Ser
Glu
Ala
Val
Val
Asn
Ser
Ile
Ile
Ala
Asp
Glu
Ala
Glu Gin Leu Leu 1765
Ser ile Thr Trp 1780
Arg Ala Trp Val 1795
Arg Met Asn Ser 1810
Ser Lys Thr Ala 1825
Ser Met Tyr Tyr 1840
Asp Ala Arg His 1855
Leu Pro Gin Ala 1870
Val Gin Gly Ser 1885
Ala Leu Ala Glu 1900
Tyr Met His Ser 1915
Ser Phe Leu Leu 1930
Leu Ser Ser Ala 1945
Met Glu Pro Pro 1960
Lys Thr Tyr Gly 1975
Val Lys Thr Ile 1990
Thr Asp Ala Arg 2005
Phe Phe Asp Leu 2020
Arg Phe Glu Glu Ser 1770
Thr His Glu Pro Glu 1785
Pro Arg Leu Lys Gin 1800
Ser Arg Arg Pro Ile 1815
Ile Ala Leu Lys Glu 1830
Leu Glu Ser Thr Glu 1845
Ala Gly Lys Ala Thr 1860
Ile Arg Val Gly His 1875 ile Leu Glu Asn Thr 1890
Lys Asn Gly Ser Ile 1905
Leu Pro Asp Asn Met 1920
Ser Thr Ala Ala Ala 1935
Gin Ser Phe Gly Ser 1950
Ile Phe Cys Val Lys 1965
Val Gin Val His Leu 1980
Pro Ala Pro Trp Ile 1995
Leu Lys His Ser Leu 2010
Ser Thr Asp Arg Thr 2025
PL 202 457 B1
Ala | Ala 2030 | Gly | Ile | Thr | Asn | Arg 2035 | Leu | Ala | Lys | Leu | Leu 2040 | Pro | Pro | Ser |
Cys | Phe 2045 | Met | Tyr | Ser | Gly | Asp 2050 | Tyr | Leu | Ile | Arg | Ser 2055 | Thr | Ala | Ser |
Thr | Tyr 2060 | Lys | val | Ser | His | Val 2065 | Glu | Asp | Ile | Pro | Ile 2070 | Leu | Glu | His |
Ser | Val 2075 | Ala | Met | Ala | Lys | Asn 2080 | Thr | Val | Ser | Ala | Ser 2085 | Thr | Val | Asp |
Asp | Thr 2090 | Glu | Lys | Val | Ile | Thr 2095 | Ala | Thr | Gin | Ile | Leu 2100 | Leu | Pro | Gly |
Gin | Leu 2105 | Ser | Val | Asn | His | Asn 2110 | Asp | Gin | Arg | Phe | Asn 2115 | Leu | Ala | Thr |
Val | Tle 2120 | Asp | Trp | Lys | Glu | Asn 2125 | Glu | Val | Ser | Ala | Arg 2130 | Ile | Cys | Pro |
Ile | Asp 2135 | Ser | Gly | Asn | Leu | Phe 2140 | Ser | Asn | Lys | Lys | Thr 2145 | Tyr | Leu | Leu |
fal | Gly 2150 | Leu | Thr | Gly | Asp | Leu 2155 | Gly | Arg | Ser | Leu | Cys 2160 | Arg | Trp | Met |
Ile | Leu 2165 | His | Gly | Ala | Arg | His 2170 | val | Val | Leu | Thr | Ser 2175 | Arg | Asn | Pro |
Arg | Leu 2180 | Asp | Pro | Lys | Trp | Ile 2185 | Ala | Asn | Met | Glu | Ala 2190 | Leu | Gly | Gly |
Asp | ile 2195 | Thr | val | Leu | Ser | Met 2200 | Asp | Val | Ala | Asn | Glu 2205 | Asp | Ser | Val |
Asp | Ala 2210 | Gly | Leu | Gly | Lys | Leu 2215 | Val | Asp | Met | Lys | Leu 2220 | Pro | Pro | Val |
Ala | Gly 2225 | I le | Ala | Phe | Gly | Pro 2230 | Leu | Val | Leu | Gin | Asp 2235 | Val | Met | Leu |
Lys | Asn 2240 | Met | Asp | His | Gin | Met 2245 | Met | Asp | Met | val | Leu 2250 | Lys | Pro | Lys |
Val | Gin 2255 | Gly | Ala | Arg | Ile | Leu 2260 | His | Glu | Arg | Phe | Ser 2265 | Glu | Gin | Thr |
Gly | Ser 2270 | Lys | Ala | Leu | Asp | Phe 2275 | Phe | Ile | Met | phe | Ser 2280 | Ser | Ile | Val |
Ala | Val 2285 | Ile | Gly | Asn | Pro | Gly 2290 | Gin | Ser | Asn | Tyr | Gly 2295 | Ala | Ala | Asn |
PL 202 457 B1
Ala Tyr Leu Gin Ala Leu Ala Gin Gin Arg Cys Ala Arg Gly Leu 2300 2305 2310
Ala Gly Ser Thr Ile Asp Ile Gly Ala Val Tyr Gly Val Gly Phe 2315 2320 2325 tal Thr Arg Ala Glu Met Glu Glu Asp Phe Asp Ala Ile Arg Phe 2330 2335 2340
Met Phe Asp Ser val Glu Glu His Glu Leu His Thr Leu Phe Ala 2345 2350 2355
Glu Ala Val Val Ser Asp Gin Arg Ala Arg Gin Gin Pro Gin Arg 2360 2365 2370
Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu Thr Thr Gly Ile 2375 2380 2385
Pro Asp Leu Asp Pro Ala Leu Gin Asp Arg Ile Ile Tyr Phe Asn 2390 2395 2400
Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gin Arg Gly Asp 2405 2410 2415
Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp Gin 2420 2425 2430
Leu Lys Gin Ala Thr Thr Leu Asp Gin Val Arg Gin Ile Val Ile 2435 2440 2445
Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gin Val Ser Asp 2450 2455 2460
Gly Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gin Gly Val 2465 2470 2475
Asp Ser Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gin 2480 2485 2490
Leu Tyr Leu Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser 2495 2500 2505
Val Ala Asp Leu Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr 2510 2515 2520
Ser Ile Pro Leu Leu Leu Gin Ile Gly Asp Ser Thr Gly Thr Ser 2525 2530 2535
Asp Ser Gly Ala Ser Pro Thr Pro Thr Asp Ser His Asp Glu Ala 2540 2545 2550
Ser Ser Ala Thr Ser Thr Asp Ala Ser Ser Ala Glu Glu Asp Glu 2555 2560 2565
PL 202 457 B1
Glu Glu 2570 | Glu | Asp | Asp | Asn Glu 2575 | Gin i | Gly i | Gly ; | Arg | Lys 2580 | Ile | Leu . | Arg |
Arg Glu 2 58 5 | Arg | Leu | Ser | Leu Gly 2590 | Gin | Glu | Tyr | Ser | Trp 2595 | Arg | Gin | Gin |
Gin Met 2600 | Val | Lys | Asp | His Thr 2605 | Ile | Phe | Asn | Asn | Thr 2610 | Ile | Gly | Met |
Phe Met 2615 | Lys | Gly | Thr | Ile Asp 2620 | Leu | Asp | Arg | Leu | Arg 2625 | Arg | Ala | Leu |
Lys Ala 2630 | Ser | Leu | Arg | Arg His 2635 | Glu | Ile | Phe | Arg | Thr 2640 | Cys | Phe | Val |
Thr Gly 2645 | Asp | Asp | Tyr | Ser Ser 2650 | Aap | Leu | Asn | Gly | Pro 2655 | val | Gin | Val |
Val Leu 2660 | Lys | Asn | Pro | Glu Asn 2665 | Arg | Val | His | Phe | Val 2670 | Gin | Val | Asn |
Ssn Ala 2575 | Ala | Glu | Ala | Glu Glu 2680 | Glu | Tyr | Arg | Lys | Leu 2685 | Glu | Lys | Thr |
Asn Tyr 2690 | Ser | Ile | Ser | Thr Gly 2695 | Asp | Thr | Leu | Arg | Leu 2700 | Val | Asp | Phe |
Tyr Trp 2705 | Gly | Thr | Asp | Asp His 2710 | Leu | Leu | Val | Ile | Gly 2715 | Tyr | His | Arg |
Leu Val 2720 | Gly | Asp | Gly | Ser Thr 2725 | Thr | Glu | Asn | Leu | Phe 2730 | Asn | Glu | Ile |
Gly Gin 2735 | Ile | Tyr | Ser | Gly Val 2740 | Lys | Met | Gin | Arg | Pro 2745 | Ser | Thr | Gin |
Phe Ser 2750 | Asp | Leu | Ala | Val Gin 2755 | Gin | Arg | Glu | Asn | Leu 2760 | Glu | Asn | Gly |
Arg Met 2765 | Gly | Asp | ASp | Ile Ala 2770 | Phe | Trp | Lys | Ser | Met 2775 | His | Ser | Lys |
Val Ser 2780 | Ser | Ser | Ala | Pro Thr 2 7SS | Val | Leu | Pro | Ile | Met 2790 | Asn | Leu | Ile |
Asn Asp 2795 | Pro | Ala | Ala | Asn Ser 2Θ00 | Glu | Gin | Gin | Gin | Ile 2805 | Gin | Pro | Phe |
Thr Trp 2310 | Gin | Gin | Tyr | Glu Ala 2815 | Ile | Ala | Arg | Leu | , Asp 2820 | Pro | Met | val |
Ala Phe 2825 | Arg | Ile | Lys | Glu Arg 2830 | Ser | Arg | ; Lys | His | i Lys 2835 | Ala | Thr | Pro |
PL 202 457 B1
100
PL 202 457 B1
gca Ala | acc Thr | gca Ala | atg Met 20 | gca Ala | ggc Gly | teg Ser | gct Ala | tgc Cys 25 | tct Ser | aac Asn | aca Thr | tcc Ser | acg Thr 30 | ccc Pro | att Ile | 95 |
gcc | ata | gtt | gga | atg | gga | tgt | ega | ttt | gct | gga | gat | gca | acg | agt | cca | 144 |
Ala | Ile | Val | Gly | Met | Gly | Cys | Arg | Phe | Ala | Gly | Asp | Ala | Thr | Ser | Pro | |
35 | 40 | 45 | ||||||||||||||
cag | aag | ctt | tgg | gaa | atg | gtt | gaa | aga | gga | ggc | agt | gcc | tgg | tct | aag | 192 |
Gin | Lys | Leu | Trp | Glu | Met | Val | Glu | Arg | Gly | Gly | Ser | Ala | Trp | Ser | Lys | |
50 | 55 | 60 | ||||||||||||||
gtc | ccc | tcc | teg | ega | ttc | aat | gtg | aga | gga | gta | tac | cac | ccg | aat | ggc | 240 |
Val | Pro | Ser | Ser | Arg | Phe | Asn | Val | Arg | Gly | Val | Tyr | His | Pro | Asn | Gly | |
55 | 70 | 75 | 80 | |||||||||||||
gaa | agg | gtc | ggg | tcc | acc | cac | gta | aaq | ggt | gga | cac | ttc | atc | gac | gag | 288 |
Glu | Arg | Val | Gly | Ser | Thr | His | Val | Lys | Gly | Gly | His | Phe | Ile | Asp | Glu | |
85 | 90 | 95 | ||||||||||||||
gat | cct | gct | tta | ttt | gac | g=c | gcg | ttc | ttc | aac | atg | acc | aca | gag | gtc | 33S |
Asp | Pro | Ala | Leu | Phe | Asp | Ala | Ala | Phe | Phe | Asn | Met | Thr | Thr | Glu | Val | |
100 | 105 | 110 | ||||||||||||||
gcc | agc | tgc | atg | gat | ccg | cag | tat | cgg | ctt | atg | ctt | gag | gtg | gtc | tac | 3 84 |
Ala | Ser | Cys | Met | Asp | Pro | Gin | Tyr | Arg | Leu | Met | Leu | Glu | Val | Val | Tyr | |
115 | 120 | 125 | ||||||||||||||
gaa | teg | ctg | gag | agt | gcc | ggt | atc | acc | atc | gat | ggt | atg | gca | ggc | tct | 432 |
Glu | Ser | Leu | Glu | Ser | Ala | Gly | Ile | Thr | Ile | Asp | Gly | Met | Ala | Gly | Ser | |
130 | 135 | 14 0 | ||||||||||||||
aat | acg | teg | gtg | ttt | ggg | ggt | gtc | atg | tac | cac | gac | tat | cag | gat | teg | 480 |
Asn | Thr | Ser | Val | Phe | Gly | Gly | Val | Met | Tyr | His | Asp | Tyr | Gin | Asp | Ser | |
14 5 | 150 | 155 | 160 | |||||||||||||
ctc | aat | cgt | gac | ccc | gag | aca | gtt | ccg | cgt | tat | ttc | ata | act | ggc | aac | 528 |
Leu | Asn | Arg | Asp | Pro | Glu | Thr | Val | Pro | Arg | Tyr | Phe | Ile | Thr | Gly | Asn | |
165 | 170 | 175 | ||||||||||||||
tea | gga | aca | atg | Ctt | teg | aac | cgg | ata | tea | cac | ttc | tac | gac | tta | cgt | 576 |
Ser | Gly | Thr | Met | Leu | Ser | Asn | Arg | Ile | Ser | His | Phe | Tyr | Asp | Leu | Arg | |
ISO | 185 | 190 | ||||||||||||||
ggt | ccc | agc | gtg | acg | gtt | gac | acg | gcc | tgt | teg | acg | aca | ttg | acc | gca | 624 |
Gly | Pro | Ser | Val | Thr | Val | Asp | Thr | Ala | Cys | Ser | Thr | Thr | Leu | Thr | Ala | |
195 | 200 | 205 | ||||||||||||||
ctg | cac | ttg | gcg | tgc | cag | agc | tta | cgt | act | ggg | gag | tea | gat | aca | gcc | 672 |
Leu | His | Leu | Ala | Cys | Gin | Ser | Leu | Arg | Thr | Gly | Glu | Ser | Asp | Thr | Ala | |
2 10 | 215 | 220 |
PL 202 457 B1
101
atc Ile 225 | gtt Val | atc Ile | ggt Gly | gca Ala | aat Asn 230 | Ctt Leu | ctg Leu | ctc Leu | aat Asn | ccc Pro 235 | gat Asp | gtt Val | ttt Phe | gtt Val | acg Thr 240 | 720 |
atg | tea | aac | ctg | gga | ttt | ttg | tcc | ccg | gat | ggt | atc | teg | tac | tct | ttt | 7S8 |
Met | Ser | Asn | Leu | Gly | Phe | Leu | Ser | Pro | Asp | Gly | Ile | Ser | Tyr | Ser | Phe | |
245 | 250 | 255 | ||||||||||||||
gat | cct | ega | gcg | aat | gga | tat | ggt | cgc | ggg | gaa | gga | att | gcc | get | ctg | 816 |
Asp | Pro | Arg | Ala | Asn | Gly | Tyr | Gly | Arg | Gly | Glu | Gly | Ile | Ala | Ala | Leu | |
260 | 265 | 270 | ||||||||||||||
gta | ata | aag | gcc | ctc | cct | aac | gcg | ttg | ega | gac | caa | gac | cct | atc | ega | 864 |
Val | Ile | Lys | Ala | Leu | Pro | Asn | Ala | Leu | Arg | Asp | Gin | Asp | Pro | Ile | Arg | |
275 | 280 | 285 | ||||||||||||||
gcc | gtc | att | ega | gag | aca | gcg | ctg | aac | cag | gat | ggc | aaa | aca | ccc | gca | 912 |
Ala | Val | Ile | Arg | Glu | Thr | Ala | Leu | Asn | Gin | Asp | Gly | Lys | Thr | Pro | Ala | |
290 | 295 | 300 | ||||||||||||||
att | act | gcg | ccg | agt | gat | gtg | gcg | cag | aaa | agt | ctg | atc | cag | gag | tgt | 9S0 |
Ile | Thr | Ala | Pro | Ser | Asp | Val | Ala | Gin | Lys | Ser | Leu | Ile | Gin | Glu | Cys | |
305 | 310 | 315 | 320 | |||||||||||||
tac | gat | aag | get | ggg | eta | gat | atg | teg | ttg | acc | teg | tac | gtg | gag | gcc | 1008 |
Tyr | Asp | Lys | Ala | Gly | Leu | Asp | Met | Ser | Leu | Thr | Ser | Tyr | Val | Glu | Ala | |
325 | 330 | 335 | ||||||||||||||
cac | gga | act | gga | aca | cca | act | ggt | gac | ccc | ctt | gaa | atc | tea | gca | att | 1056 |
Hi s | Gly | Thr | Gly | Thr | Pro | Thr | Gly | Asp | Pro | Leu | Glu | Ile | Ser | Ala | Ile | |
340 | 345 | 350 | ||||||||||||||
tea | gca | get | ttt | aaa | gga | cat | cct | ctg | cac | ctt | ggc | tct | gtg | aaa | gca | 1104 |
Ser | Ala | Ala | Phe | Lys | Gly | His | Pro | Leu | His | Leu | Gly | Ser | Val | Lys | Ala | |
355 | 360 | 365 | ||||||||||||||
aat | att | ggc | cat | aca | gaa | gcc | gcc | agt | ggc | ctg | gcc | agt | ata | atc | aag | 1152 |
Asn | Ile | Gly | His | Thr | Glu | Ala | Ala | Ser | Gly | Leu | Ala | Ser | I le | Ile | Lys | |
370 | 375 | 380 | ||||||||||||||
gtg | gcc | ttg | gcc | ttg | gag | aag | ggc | ttg | att | ccc | cct | aat | gcg | cgg | ttc | 1200 |
Val | Ala | Leu | Ala | Leu | Glu | Lys | Gly | Leu | Ile | Pro | Pro | Asn | Ala | Arg | Phe | |
385 | 390 | 395 | 400 | |||||||||||||
ctg | caa | aag | aac | agc | aag | ctg | atg | ctt | gac | caa | aag | aac | atc | aag | atc | 1248 |
Leu | Gin | Lys | Asn | Ser | Lys | Leu | Met | Leu | Asp | Gin | Lys | Asn | Ile | Lys | Ile | |
405 | 410 | 415 | ||||||||||||||
ccc | atg | tct | get | caa | gac | tgg | cct | gtg | aaa | gat | ggg | act | cgt | cgc | gca | 1296 |
Pro | Met | Ser | Ala | Gin | Asp | Trp | Pro | Val | Lys | Asp | Gly | Thr | Arg | Arg | Ala | |
420 | 425 | 430 |
102
PL 202 457 B1
tct Ser | gtc Val | aat Asn 435 | aac Asn | ttc Phe | ggc Gly | ttt Phe | ggt Gly 440 | ggt Gly | tcg Ser | aat Asn | gct Ala | cac His 445 | gtc Val | att Ile | ttg Leu | 1344 |
gaa | tca | tat | gat | cgc | gca | tca | ttg | gcc | ctg | cca | gag | gat | caa | gtg | cat | 1392 |
Glu | Ser | Tyr | Asp | Arg | Ala | Ser | Leu | Ala | Leu | Pro | Glu | Asp | Gin | Val | His | |
450 | 455 | 460 | ||||||||||||||
gtc | aat | ggt | aac | tct | gag | cat | ggt | agg | gtt | gag | gat | ggt | tcc | aaa | cag | 1440 |
Val | Asn | Gly | Asn | Ser | Glu | His | Gly | Arg | Val | Glu | Asp | Gly | Ser | Lys | Gin | |
465 | 470 | 475 | 480 | |||||||||||||
agc | cgc | ata | tac | gtt | gtg | cgt | gcc | aag | gac | gag | caa | gct | tgt | cgg | ega | 1488 |
Ser | Arg | Ile | Tyr | Val | Val | Arg | Ala | Lys | Asp | Glu | Gin | Ala | Cys | Arg | Arg | |
485 | 490 | 495 | ||||||||||||||
acg | ata | gca | agc | ctg | ega | gac | tac | att | aaa | tcc | gtc | gct | gac | att | gac | 1536 |
Thr | Ile | Ala | Ser | Leu | Arg | Asp | Tyr | Ile | Lys | Ser | Val | Ala | Asp | Ile | Asp | |
500 | 505 | 510 | ||||||||||||||
ggg | gaa | ccc | ttc | ctc | gcc | agc | ctc | gcc | tat | aca | eta | ggc | tct | cgc | cgt | 1584 |
Gly | Glu | Pro | Phe | Leu | Ala | Ser | Leu | Ala | Tyr | Thr | Leu | Gly | Ser | Arg | Arg | |
515 | 520 | 525 | ||||||||||||||
tcc | att | ctg | cca | tgg | acg | tca | gtg | tat | gta | gca | gac | agc | ctt | ggc | ggc | 1632 |
Ser | Ile | Leu | Pro | Trp | Thr | Ser | Val | Tyr | Val | Ala | Asp | Ser | Leu | Gly | Gly | |
530 | 535 | 540 | ||||||||||||||
ctt | gtt | tct | gcc | ctc | agc | gat | gag | tcc | aat | caa | cca | aaa | ega | gcg | aat | 1680 |
Leu | Val | Ser | Ala | Leu | Ser | Asp | Glu | Ser | Asn | Gin | Pro | Lys | Arg | Ala | Asn | |
545 | 550 | 555 | 560 | |||||||||||||
gag | aaa | gta | cgg | ctc | gga | ttt | gta | ttc | acc | ggt | cag | ggg | gcg | cag | tgg | 1728 |
Glu | Lys | Val | Arg | Leu | Gly | Phe | Val | Phe | Thr | Gly | Gin | Gly | Ala | Gin | Trp | |
565 | 570 | 575 | ||||||||||||||
cat | gca | atg | ggc | aga | gag | ctg | gtc | aat | aca | ttc | cca | gta | ttc | aaa | cag | 1776 |
His | Ala | Met | Gly | Arg | Glu | Leu | Val | Asn | Thr | Phe | Pro | Val | Phe | Lys | Gin | |
580 | 585 | 590 | ||||||||||||||
gcg | att | ctt | gaa | tgt | gat | ggc | tac | atc | aag | caa | ctg | ggc | gcg | agt | tgg | 1824 |
Ala | Ile | Leu | Glu | Cys | Asp | Gly | Tyr | Ile | Lys | Gin | Leu | Gly | Ala | Ser | Trp | |
595 | 600 | 605 | ||||||||||||||
aat | ttt | atg | gag | gag | ctc | cac | cgt | gat | gag | ctg | acg | act | cgg | gta | aat | 1872 |
Asn | Phe | Met | Glu | Glu | Leu | His | Arg | Asp | Glu | Leu | Thr | Thr | Arg | Val | Asn | |
610 | 615 | 620 | ||||||||||||||
gat | gcc | gaa | tac | agt | eta | cca | ctg | tca | acc | gct | atc | caa | att | gca | ctt | 1920 |
Asp | Ala | Glu | Tyr | Ser | Leu | Pro | Leu | Ser | Thr | Ala | Ile | Gin | Ile | Ala | Leu | |
625 | S30 | 635 | 640 |
PL 202 457 B1
103
gtg Val | cgt Arg | ctc Leu | Ctt Leu | tgg Trp 645 | tca Ser | tgg Trp | gga Gly | att Ile | cgg Arg 650 | cca Pro | acg Thr | ggg Gly | ata Ile | acc Thr 655 | agt Ser | 1968 |
cac | tca | agt | gga | gag | gct | gct | gct | gcc | tac | gca | gct | ggg | gct | tta | tcc | 2016 |
His | Ser | Ser | Gly | Glu | Ala | Ala | Ala | Ala | Tyr | Ala | Ala | Gly | Ala | Leu | Ser | |
660 | 665 | 670 | ||||||||||||||
gcg | cgg | teg | gcc | att | ggg | atc | act | tat | ata | cgc | ggt | gta | ttg | acc | act | 2064 |
Ala | Arg | Ser | Ala | Ile | Gly | Ile | Thr | Tyr | Ile | Arg | Gly | Val | Leu | Thr | Thr | |
675 | 680 | 685 | ||||||||||||||
aag | ccc | aag | ccc | gca | ttg | gca | gcc | aaa | gga | gga | atg | atg | gcg | gtg | ggt | 2112 |
Lys | Pro | Lys | Pro | Ala | Leu | Ala | Ala | Lys | Gly | Gly | Met | Met | Ala | Val | Gly | |
690 | 695 | 700 | ||||||||||||||
ctt | ggt | cgc | agt | gag | acc | aat | gtt | tac | att | teg | cgt | ctc | aac | cag | gag | 2160 |
Leu | Gly | Arg | Ser | Glu | Thr | Asn | Val | Tyr | ile | Ser | Arg | Leu | Asn | Gin | Glu | |
705 | 710 | 715 | 720 | |||||||||||||
gac | ggc | tgt | gtg | gtg | gtt | gga | tgt | atc | aac | agt | caa | tgt | agt | gtg | acg | 2208 |
Asp | Gly | Cys | Val | Val | Val | Gly | Cys | Ile | Asn | Ser | Gin | Cys | Ser | Val | Thr | |
725 | 730 | 735 | ||||||||||||||
gtg | teg | gga | gat | ttg | ggt | gca | atc | gag | aaa | ctt | gaa | aag | ttg | tta | cac | 2256 |
Val | Ser | Gly | Asp | Leu | Gly | Ala | Ile | Glu | Lys | Leu | Glu | Lys | Leu | Leu | His | |
740 | 745 | 750 | ||||||||||||||
gcc | gat | ggc | atc | ttt | acc | agg | aaa | ctg | aaa | gtc | act | gaa | gcc | ttc | cat | 2304 |
Ala | Asp | Gly | Ile | Phe | Thr | Arg | Lys | Leu | Lys | Val | Thr | Glu | Ala | Phe | His | |
755 | 760 | 765 | ||||||||||||||
tca | agc | cac | atg | ega | cca | atg | gca | gat | gcc | ttt | ggg | gcg | tca | ctg | aga | 2352 |
Ser | Ser | His | Met | Arg | Pro | Met | Ala | Asp | Ala | Phe | Gly | Ala | Ser | Leu | Arg | |
770 | 775 | 780 | ||||||||||||||
gat | ctg | ttc | aac | teg | gat | aac | aac | aac | gac | aat | ccc | aat | gct | gac | acc | 2400 |
Asp | Leu | Phe | Asn | Ser | Asp | Asn | Asn | Asn | Asp | Asn | Pro | Asn | Ala | Asp | Thr | |
785 | 790 | 795 | 800 | |||||||||||||
tca | aag | ggt | gta | tta | tat | tca | tca | cct | aag | act | ggt | agt | cgc | atg | acc | 2448 |
Ser | Lys | Gly | Val | Leu | Tyr | Ser | Ser | Pro | Lys | Thr | Gly | Ser | Arg | Met | Thr | |
805 | 810 | 815 | ||||||||||||||
gat | ctt | aaa | ttg | cta | ttg | gat | ccc | aca | cac | tgg | atg | gat | agt | atg | cta | 2496 |
Asp | Leu | Lys | Leu | Leu | Leu | Asp | Pro | Thr | His | Trp | Met | Asp | Ser | Met | Leu | |
820 | 825 | 830 | ||||||||||||||
cag | ccg | gta | gag | ttc | gag | tcc | tca | ctc | cgc | gag | atg | tgc | ttt | gat | ccc | 2544 |
Gin | Pro | Val | Glu | Phe | Glu | Ser | Ser | Leu | Arg | Glu | Met | Cys | Phe | Asp | Pro | |
835 | 840 | 845 |
104
PL 202 457 B1
aac Asn | acc Thr 850 | aaa gag Lys Glu | aaa Lys | gcc Ala | gtc Val 855 | gat Asp | gtg Val | att Ile | att Ile | gaa Glu 860 | ata Ile | ggg Gly | cct Pro | cac His | 2592 |
gga | gcg | ctt ggt | ggt | cca | atc | aac | caa | gtc | atg | cag | gat | ctg | ggt | ctg | 2640 |
Gly | Ala | Leu Gly | Gly | Pro | Ile | Asn | Gin | Val | Met | Gin | Asp | Leu | Gly | Leu | |
865 | 870 | 875 | 880 | ||||||||||||
aaa | gga | aca gat | ata | aac | tat | ctc | agt | tgc | Ctt | tct | cgc | ggc | aga | age | 2688 |
Lys | Gly | Thr Asp | Ile | Asn | Tyr | Leu | Ser | Cys | Leu | Ser | Arg | Gly | Arg | Ser | |
885 | 890 | 895 | |||||||||||||
teg | ttg | gag aca | atg | tat | cgt | gct | gct | acg | gag | ttg | ata | age | aag | ggt | 2736 |
Ser | Leu | Glu Thr | Met | Tyr | Arg | Ala | Ala | Thr | Glu | Leu | Ile | Ser | Lys | Gly | |
900 | 905 | 910 | |||||||||||||
tat | ggg | ctc aaa | atg | gac | gct | ata | aac | ttt | cct | cat | gga | aga | aaa | gag | 2784 |
Tyr | Gly | Leu Lys | Met | Asp | Ala | Ile | Asn | Phe | Pro | His | Gly | Arg | Lys | Glu | |
915 | 920 | 925 | |||||||||||||
ccc | aga | gtg aag | gta | ctg | age | gat | ttg | ccg | gcg | tac | ccg | tgg | aat | cac | 2832 |
Pro | Arg | val Lys | Val | Leu | Ser | Asp | Leu | Pro | Ala | Tyr | Pro | Trp | Asn | His | |
930 | 935 | 940 | |||||||||||||
caa | acc | cgt tat | tgg | aga | gag | cct | cgc | ggc | agt | cgt | gag | tcc | aaa | cag | 2880 |
Gin | Thr | Arg Tyr | Trp | Arg | Glu | Pro | Arg | Gly | Ser | Arg | Glu | Ser | Lys | Gin | |
945 | 950 | 955 | 960 | ||||||||||||
aga | acc | cat ccg | cct | cac | act | ttg | ata | ggc | tea | cgg | gaa | tct | ctc | tct | 2928 |
Arg | Thr | Hi s Pro | Pro | His | Thr | Leu | Ile | Gly | Ser | Arg | Glu | Ser | Leu | Ser | |
965 | 970 | 975 | |||||||||||||
cct | cat | ttc gcg | cct | aaa | tgg | aaa | cat | gtt | ctc | cgt | ctg | tea | gat | att | 2976 |
Pro | His | Phe Ala | Pro | Lys | Trp | Lys | His | Val | Leu | Arg | Leu | Ser | Asp | Ile | |
980 | 985 | 990 | |||||||||||||
cca | tgg | ata ega | gat | cac | gtc | gtt | ggt teg age atc atc ttt ccg gga | 3024 | |||||||
Pro | Trp | Ile Arg | Asp | His | Val | Val | Gly Ser Ser Ile Ile Phe Pro Gly | ||||||||
995 | 1000 | 1005 | |||||||||||||
gct | ggc | ttc atc age atg gcc atc gag ggg ttt tea | caa , | gtc | tgc | 3069 | |||||||||
Ala | Gly | Phe Ile Ser Met Ala Ile Glu Gly Phe Ser i | Gin ' | fal | Cys | ||||||||||
1010 | 1015 | 1020 | |||||||||||||
cca | cca | gtt gcg ggg gct | : age atc aac tac aac ttg | cgt ' | gac | gtt | 3114 | ||||||||
Pro | Pro | Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu . | Arg . | Asp | Val | ||||||||||
1025 | 1030 | 1035 | |||||||||||||
gaa | ctc | gcg cag gct ctc ata ata ccc gct gat gca | gaa ' | gca | gag | 3159 | |||||||||
Glu | Leu | Ala Gin Ala Leu Ile Ile Pro Ala Asp Ala | Glu . | Ala | Glu | ||||||||||
1040 | 1045 | 1050 |
PL 202 457 B1
105
gtt Val | gac Asp 1055 | ctg Leu | cgc Arg | eta Leu | acg Thr | atc Ile 1060 | cgt Arg | tca Ser | tgt Cys | gag Glu | gaa Glu 1065 | agg Arg | tcc Ser | ctc Leu | 3204 |
ggc | aca | aag | aac | tgg | cat | caa | ttt | tet | gtg | cac | tca | att | teg | ggc | 3249 |
Gly | Thr 1070 | Lys | Asn | Trp | His | Gin 1075 | Phe | Ser | val | His | Ser 1080 | Ile | Ser | Gly | |
gaa | aat | aat | acc | tgg | aca | gaa | cac | tgc | acc | gga | tta | ata | cgt | teg | 3294 |
Glu | Asn 1085 | Asn | Thr | Trp | Thr | Glu 1090 | His | Cys | Thr | Gly | Leu 1095 | Ile | Arg | Ser | |
gag | agc | gaa | aga | agc | cac | ctt | gac | tgt | tca | act | gtg | gaa | gcc | tca | 3339 |
Glu | Ser 1100 | Glu | Arg | Ser | His | Leu 1105 | Asp | Cys | Ser | Thr | Val 1110 | Glu | Ala | Ser | |
cgc | agg | ttg | aat | eta | ggc | tca | gat | aac | cgg | agc | att | gat | ccc | aac | 3384 |
Arg | Arg 1115 | Leu | Asn | Leu | Gly | Ser 1120 | Asp | Asn | Arg | Ser | Ile 1125 | Asp | Pro | Asn | |
gat | ctc | tgg | gag | tcc | tta | cac | gcg | aat | ggg | ata | tgc | cac | gga | ccc | 3429 |
Asp | Leu 1130 | Trp | Glu | Ser | Leu | His 1135 | Ala | Asn | Gly | Ile | Cys 114 0 | His | Gly | Pro | |
att | ttt | cag | aac | att | cag | ega | att | caa | aac | aat | gga | cag | ggc | teg | 3474 |
Ile | Phe 1145 | Gin | Asn | Ile | Gin | Arg 1150 | Ile | Gin | Asn | Asn | Gly 1155 | Gin | Gly | Ser | |
ttt | tgc | aga | ttt | tcc | att | gct | gac | act | gcc | teg | gct | atg | cct | cac | 3519 |
Phe | cys 1160 | Arg | Phe | Ser | Ile | Ala 1165 | Asp | Thr | Ala | Ser | Ala 1170 | Met | Pro | Hi s | |
teg | tac | gag | aat | ega | cac | atc | gtc | cat | cct | act | act | ctg | gac | teg | 3564 |
Ser | Tyr 1175 | Glu | Asn | Arg | His | Ile 1180 | val | His | Pro | Thr | Thr 1185 | Leu | Asp | Ser | |
gtg | atc | cag | gcg | gca | tac | acg | gtg | tta | ccc | tac | gcg | gga | aca | cgt | 3609 |
Val | ile 1190 | Gin | Ala | Ala | Tyr | Thr 1195 | Val | Leu | Pro | Tyr | Ala 1200 | Gly | Thr | Arg | |
atg | aaa | acg | gcc | atg | gta | cca | agg | agg | eta | aga | aat | gtc | cl <3. cl | ata | 3654 |
Met | Lys 1205 | Thr | Ala | Met | Val | Pro 1210 | Arg | Arg | Leu | Arg | Asn 1215 | Val | Lys | Ile | |
tcc | tet | agc | ctg | gct | gac | ttg | gag | gct | ggt | gat | gct | ctg | gac | gca | 3699 |
Ser | Ser 1220 | Ser | Leu | Ala | Asp | Leu 1225 | Glu | Ala | Gly | Asp | Ala 1230 | Leu | Asp | Ala | |
cag | gcc | agc | atc | aag | gat | cgc | aac | tet | caa | tcc | ttc | tet | acc | gac | 3744 |
Gin | Ala 1235 | Ser | Ile | Lys | Asp | Arg 1240 | Asn | Ser | Gin | Ser | Phe 1245 | Ser | Thr | Asp |
106
PL 202 457 B1
ttg Leu | gca Ala 1250 | gtg Val | ttt Phe | gat Asp | gac Asp | tat Tyr 1255 | gat Asp | agc Ser | ggt Gly | tct Ser | tct Ser 1260 | ccc Pro | teg Ser | gac Asp | 3789 |
gga | atc | cca | gtc | ata | gag | att | gaa | ggc | ctt | gtt | ttc | cag | teg | gtt | 3834 |
Gly | Ile 1265 | Pro | Val | Ile | Glu | Ile 1270 | Glu | Giy | Leu | Val | Phe 1275 | Gin | Ser | Val | |
gga | agc | agc | ttc | tct | gac | caa | aag | tea | gac | tcc | aac | gac | aca | gaa | 3879 |
Gly | Ser 1280 | Ser | Phe | Ser | Asp | Gin 1285 | Lys | Ser | Asp | Ser | Asn 1290 | Asp | Thr | Glu | |
aat | gcc | tgc | agc | tcc | tgg | gtt | tgg | gcc | cct | gac | atc | agc | ttg | ggt | 3924 |
Asn | Ala 1295 | Cys | Ser | Ser | Trp | Val 1300 | Trp | Ala | Pro | Asp | Ile 1305 | Ser | Leu | Gly | |
gac | tcc | act | tgg | ctc | aaa | gaa | aag | ttg | agc | act | gag | gct | gag | acg | 3969 |
Asp | Ser 1310 | Thr | Trp | Leu | Lys | Glu 1315 | Lys | Leu | Ser | Thr | Glu 1320 | Ala | Glu | Thr | |
aaa | gaa | acg | gaa | ctc | atg | atg | gac | ctc | ega | aga | tgc | acg | atc | aac | 4014 |
Lys | Glu 1325 | Thr | Glu | Leu | Met | Met 1330 | Asp | Leu | Arg | Arg | Cys 1335 | Thr | Ile | Asn | |
ttt | ata | cag | gag | gct | gtc | act | gat | ttg | aca | aat | tct | gat | atc | caa | 4059 |
Phe | Ile 1340 | Gin | Glu | Ala | Val | Thr 1345 | Asp | Leu | Thr | Asn | Ser 1350 | Asp | Ile | Gin | |
cat | ctg | gat | ggc | cac | ctt | cag | aag | tat | ttc | gat | tgg | atg | aat | gtc | 4104 |
His | Leu 1355 | Asp | Gly | Hi s | Leu | Gin 1360 | Lys | Tyr | Phe | Asp | Trp 1365 | Met | Asn | Val | |
caa | ttg | gac | ctt | gcg | aga | caa | aac | aag | ctc | agc | cca | gcc | agt | tgc | 4149 |
Gin | Leu 1370 | Asp | Leu | Ala | Arg | Gin 1375 | Asn | Lys | Leu | Ser | Pro 1380 | Ala | Ser | cys | |
gac | tgg | eta | agt | gac | gat | gct | gag | cag | aag | aaa | tgc | eta | cag | gcc | 4194 |
Asp | Trp 1385 | Leu | Ser | Asp | Asp | Ala 1390 | Glu | Gin | Lys | Lys | Cys 1395 | Leu | Gin | Ala | |
aga | gtc | gct | gga | gaa | agc | gtc | aat | ggc | gag | atg | att | tct | cgt | eta | 4239 |
Arg | Val 1400 | Ala | Gly | Glu | Ser | Val 1405 | Asn | Gly | Glu | Met | Ile 1410 | Ser | Arg | Leu | |
gga | cct | cag | tta | ata | gca | atg | eta | cgc | cgc | gaa | aca | gag | cca | ctt | 4284 |
Gly | Pro 1415 | Gin | Leu | Ile | Ala | Met 1420 | Leu | Arg | Arg | Glu | Thr 1425 | Glu | Pro | Leu | |
gag | ttg | atg | atg | caa | gat | cag | ctg | eta | agc | aga | tac | tac | gtc | aac | 4329 |
Glu | Leu 1430 | Met | Met | Gin | Asp | Gin 1435 | Leu | Leu | Ser | Arg | Tyr 1440 | Tyr | Val | Asn |
PL 202 457 B1
107
gca. Ala | atc Ile 1445 | aaa Lys | tgg Trp | agc Ser | ega Arg | tca Ser 1450 | aac Asn | gca Ala | caa Gin | gcc Ala | agc Ser 1455 | gag Glu | ctg Leu | atc Ile | 4374 |
ega | ctt | tgc | gcc | cac | aag | aac | ccg | cgt | tct | cgc | att | ttg | gag | att | 4419 |
Arg | Leu 1460 | Cys | Ala | His | Lys | Asn 1465 | Pro | Arg | Ser | Arg | Ile 1470 | Leu | Glu | Ile | |
ggc | gga | ggc | acg | ggc | ggc | tgc | aca | aag | ctt | att | gtc | aat | gca | ttg | 4464 |
Gly | Gly 1475 | Gly | Thr | Gly | Gly | Cys 1430 | Thr | Lys | Leu | Ile | Val 1485 | Asn | Ala | Leu | |
gga | aac | acc | aag | ccg | atc | gat | cgt | tat | gac | ttc | acc | gat | gtg | tct | 4509 |
Gly | Asn 1490 | Thr | Lys | Pro | Ile | Asp 1495 | Arg | Tyr | Asp | Phe | Thr 1500 | Asp | Val | Ser | |
gcc | ggg | ttt | ttc | gag | tcg | gcg | cgt | gag | caa | ttt | gcg | gat | tgg | caa | 4554 |
Ala | Gly 1505 | Phe | Phe | Glu | Ser | Ala 1510 | Arg | Glu | Gin | Phe | Ala 1515 | Asp | Trp | Gin | |
gac | gtg | atg | act | ttc | aaa | aaa | ttg | gat | att | gaa | agc | gat | ccc | gag | 4599 |
Asp | Val 1520 | Met | Thr | Phe | Lys | Lys 1525 | Leu | Asp | Ile | Glu | Ser 1530 | Asp | Pro | Glu | |
caa | caa | ggg | ttt | gaa | tgt | gcc | acc | tac | gat | gtg | gtc | gtg | gct | tgc | 4644 |
Gin | Gin 1535 | Gly | Phe | Glu | Cys | Ala 1540 | Thr | Tyr | Asp | val | Val 1545 | Val | Ala | Cys | |
cag | gtc | ctg | cat | gca | act | ega | tgc | atg | aaa | ega | aca | ctg | agt | aac | 4689 |
Gin | Val 1550 | Leu | His | Ala | Thr | Arg 1555 | cys | Met | Lys | Arg | Thr 1560 | Leu | Ser | Asn | |
gtt | ega | aaa | ttg | ctc | aag | cct | ggg | ggc | aac | ttg | att | ttg | gtt | gag | 4734 |
Val | Arg 1565 | Lys | Leu | Leu | Lys | Pro 1570 | Gly | Gly | Asn | Leu | Ile 1575 | Leu | Val | Glu | |
act | acc | agg | gat | cag | ctc | gat | ttg | ttc | ttt | acc | ttc | gga | ctg | ttg | 4779 |
Thr | Thr 1580 | Arg | Asp | Gin | Leu | Asp 1585 | Leu | Phe | Phe | Thr | Phe 1590 | Gly | Leu | Leu | |
cca | ggt | tgg | tgg | ctc | agt | gag | gag | cct | gag | cgg | aag | tcg | acg | cca | 4824 |
Pro | Gly 1595 | Trp | Trp | Leu | Ser | Glu 1600 | Glu | Pro | Glu | Arg | Lys 1605 | Ser | Thr | Pro | |
tcg | ctc | act | acc | gat | ctt | tgg | aac | acc | atg | ttg | gac | acg | agc | ggt | 4S69 |
Ser | Leu 1610 | Thr | Thr | Asp | Leu | Trp 1615 | Asn | Thr | Met | Leu | Asp 1620 | Thr | Ser | Gly | |
ttc | aac | ggt | gtg | gaa | ttg | gag | gtt | cgt | gat | tgt | gaa | gac | gat | gag | 4914 |
Phe | Asn 1625 | Gly | Val | Glu | Leu | Glu 1630 | Val | Arg | Asp | Cys | Glu 1635 | Asp | Asp | Glu |
108
PL 202 457 B1
ttt Phe | tac Tyr 1640 | atg Met | atc Ile | agc Ser | aca Thr | atg Met 1645 | eta Leu | tcg Ser | acg Thr | gct Ala | aga Arg 1650 | aaa Lys | gag Glu | aat Asn | 4959 |
aca | acc | ccg | gat | aca | gtg | gca | gaa | tcg | gag | gtg | ctt | ttg | ctg | cac | 5004 |
Thr | Thr 1655 | Pro | Asp | Thr | Val | Ala 1660 | Glu | Ser | Glu | Val | Leu 1665 | Leu | Leu | His | |
gga | gcg | ctc | ega | cct | cct | tca | tct | tgg | ctg | gaa | agt | ctc | cag | gca | 5049 |
Gly | Ala 1670 | Leu | Arg | Pro | Pro | Ser 1675 | Ser | Trp | Leu | Glu | Ser 1680 | Leu | Gin | Ala | |
gca | att | tgt | gaa | aag | acc | agt | tct | agc | cca | tcg | atc | aac | gct | ctg | 5094 |
Ala | Ile 1685 | Cys | Glu | Lys | Thr | Ser 1690 | Ser | Ser | Pro | Ser | Ile 1695 | Asn | Ala | Leu | |
ggc | gag | gta | gat | acc | act | gga | agg | aca | tgc | att | ttt | ctt | ggg | gaa | 5139 |
Gly | Glu 1700 | Val | Asp | Thr | Thr | Gly 1705 | Arg | Thr | Cys | Ile | Phe 1710 | Leu | Gly | Glu | |
atg | gag | tcc | tcg | ctc | ctt | gga | gag | gtg | gga | agc | gag | acc | ttc | aaa | 5184 |
Met | Glu 1715 | Ser | Ser | Leu | Leu | Gly 1720 | Glu | Val | Gly | Ser | Glu 1725 | Thr | Phe | Lys | |
tcc | atc | acc | gcg | atg | ctg | aat | aac | tgc | aac | gca | ctt | ctc | tgg | gtg | 5229 |
Ser | Ile 1730 | Thr | Ala | Met | Leu | Asn 1735 | Asn | Cys | Asn | Ala | Leu 1740 | Leu | Trp | Val | |
tct | aga | gga | gca | gcc | atg | agc | tcc | gag | gat | cca | tgg | aaa | gct | eta | 5274 |
Ser | Arg 1745 | Gly | Ala | Ala | Met | Ser 1750 | Ser | Glu | Asp | Pro | Trp 1755 | Lys | Ala | Leu | |
cat | att | ggt | ctg | ctg | cgt | acc | atc | cgc | aac | gaa | aat | aac | ggg | aag | 5319 |
His | Ile 1760 | Gly | Leu | Leu | Arg | Thr 1765 | Ile | Arg | Asn | Glu | Asn 1770 | Asn | Gly | Lys | |
gaa | tat | gta | tcg | ttg | gat | ctc | gat | cct | tct | ega | aac | gca | tac | acc | 5364 |
Glu | Tyr 1775 | Val | Ser | Leu | Asp | Leu 1780 | Asp | Pro | Ser | Arg | Asn 1785 | Ala | Tyr | Thr | |
cac | gag | tcc | ctg | tat | gct | atc | tgc | aat | atc | ttc | aat | ggc | cgc | ctc | 5409 |
His | Glu 1790 | Ser | Leu | Tyr | Ala | Ile 1795 | Cys | Asn | Ile | Phe | Asn 1800 | Gly | Arg | Leu | |
ggc | gac | ctt | tcc | gaa | gac | aag | gag | ttt | gaa | ttt | gca | gag | aga | aac | 5454 |
Gly | Asp 1805 | Leu | Ser | Glu | Asp | Lys 1810 | Glu | Phe | Glu | Phe | Ala 1815 | Glu | Arg | Asn | |
ggc | gtc | atc | cac | gta | ccg | ega | ctt | ttc | aat | gac | ccg | cac | tgg | aag | 5499 |
Gly | Val 1820 | Ile | His | Val | Pro | Arg 1825 | Leu | Phe | Asn | Asp | Pro 1830 | His | Trp | Lys |
PL 202 457 B1
109
gac Asp | caa Gin 1835 | gaa Glu | gcg Ala | gtt Val | gag Glu | gtc Val 1840 | aca Thr | ctg Leu | cag Gin | ccg Pro | ttc Phe 1845 | gag Glu | caa Gin | ccc Pro | 5544 |
ggg | cgt | cgt | ctg | cgg | atg | gag | gtt | gag | acg | cca | ggg | ctc | tta | gac | 5589 |
Gly | Arg 1850 | Arg | Leu | Arg | Met | Glu 1855 | Val | Glu | Thr | Pro | Gly 1860 | Leu | Leu | Asp | |
tcc | ctg | caa | ttt | ega | gac | gac | gaa | gga | cgt | gaa | ggc | aag | gat | ctt | 5634 |
Ser | Leu 1855 | Gin | Phe | Arg | Asp | Asp 1870 | Glu | Gly | Arg | Glu | Gly 1875 | Lys | Asp | Leu | |
ccg | gat | gat | tgg | gta | gaa | atc | gaa | ccc | aaa | get | ttc | ggt | ctc | aat | 5679 |
Pro | Asp 1880 | Asp | Trp | Val | Glu | Ile 1885 | Glu | Pro | Lys | Ala | Phe 1890 | Gly | Leu | Asn | |
ttt | cgg | gat | gtc | atg | gtt | gcc | atg | ggt | caa | ttg | gag | gcc | aac | cgt | 5724 |
Phe | Arg 1895 | Asp | Val | Met | Val | Ala 1900 | Met | Gly | Gin | Leu | Glu 1905 | Ala | Asn | Arg | |
gtg | atg | ggc | ttc | gaa | tgc | gcc | gga | gtg | atc | aca | aag | ctc | ggt | gga | 5769 |
Val | Met 1910 | Gly | Phe | Glu | Cys | Ala 1915 | Gly | Val | Ile | Thr | Lys 1920 | Leu | Gly | Gly | |
get | get | gcc | get | agc | caa | ggc | ctc | aga | tta | ggg | gac | cgc | gta | tgt | 5814 |
Ala | Ala 1925 | Ala | Ala | Ser | Gin | Gly 1930 | Leu | Arg | Leu | eiy | Asp 1935 | Arg | Val | Cys | |
gca | eta | ctg | aaa | ggc | cat | tgg | gcg | acc | aga | aca | cag | acg | ccg | tac | 5859 |
Ala | Leu 1940 | Leu | Lys | Gly | His | Trp 1945 | Ala | Thr | Arg | Thr | Gin 1950 | Thr | Pro | Tyr | |
act | aat | gtc | gtc | cgt | att | ccg | gac | gaa | atg | ggc | ttc | cca | gaa | gcc | 5904 |
Thr | Asn 1955 | Val | Val | Arg | Ile | Pro 1960 | Asp | Glu | Met | Gly | Phe 1965 | Pro | Glu | Ala | |
get | teg | gtc | ccc | ctg | get | ttc | act | acc | gca | tat | att | gcg | ctt | tat | 5949 |
Ala | Ser 1970 | val | Pro | Leu | Ala | Phe 1975 | Thr | Thr | Ala | Tyr | Ile 1980 | Ala | Leu | Tyr | |
acc | acg | gca | aag | eta | ega | ega | ggc | gaa | aga | gtc | ttg | atc | cac | agt | 5994 |
Thr | Thr 1985 | Ala | Lys | Leu | Arg | Arg 1990 | Gly | Glu | Arg | val | Leu 1995 | Ile | His | Ser | |
gga | get | gga | ggc | gtc | ggt | caa | gca | gcg | atc | att | ttg | tcc | cag | ctt | 6039 |
Gly | Ala 2000 | Gly | Gly | Val | Gly | Gin 2005 | Ala | Ala | Ile | Ile | Leu 2010 | Ser | Gin | Leu | |
gcg | ggt | gcc | gag | gtc | ttc | gtc | aca | gcg | gga | act | caa | gcc | aag | cgt | 6084 |
Ala | Gly 2015 | Ala | Glu | Val | Phe | Val 2020 | Thr | Ala | Gly | Thr | Gin 2025 | Ala | Lys | Arg |
110
PL 202 457 B1
gac Asp | ttt Phe 2030 | gtc Val | ggc Gly | gat Asp | aaa Lys | ttc Phe 2035 | ggc Gly | atc Ile | aat Asn | ccg Pro | gat Asp 2040 | cat His | atc Ile | ttc Phe | 6129 |
teg | agc | agg | aat | gac | tta | ttc | gtc | gac | ggc | atc | aaa | gcc | tac | acg | 6174 |
Ser | Ser 2045 | Arg | Asn | Asp | Leu | Phe 2050 | Val | Asp | Gly | Ile | Lys 2055 | Ala | Tyr | Thr | |
ggc | gga | ctt | ggc | gtt | cat | gtc | gtt | eta | aac | tea | ttg | gca | ggt | caa | 6219 |
Gly | Gly 2060 | Leu | Gly | Val | His | Val 2065 | Val | Leu | Asn | Ser | Leu 2070 | Ala | Gly | Gin | |
ctc | ctc | caa | gca | agc | ttt | gac | tgc | atg | gcc | gaa | ttc | ggc | aga | ttt | 6264 |
Leu | Leu 2075 | Gin | Ala | Ser | Phe | Asp 2080 | Cys | Met | Ala | Glu | Phe 2085 | Gly | Arg | Phe | |
gtt | gag | att | gga | aaa | aag | gac | ctg | gag | caa | aac | agc | aga | ctt | gac | 6309 |
Val | Glu 2090 | Ile | Gly | Lys | Lys | Asp 2095 | Leu | Glu | Gin | Asn | Ser 2100 | Arg | Leu | Asp | |
atg | ctg | cca | ttc | acc | cgg | gac | gtc | tct | ttc | aca | tea | att | gat | ctt | 6354 |
Met | Leu 2105 | Pro | Phe | Thr | Arg | Asp 2110 | Val | Ser | Phe | Thr | Ser 2115 | Ile | Asp | Leu | |
ctc | teg | tgg | caa | aga | gcc | aaa | agt | gaa | gaa | gta | tcc | gaa | gcg | ttg | 6399 |
Leu | Ser 2120 | Trp | Gin | Arg | Ala | Lys 2125 | Ser | Glu | Glu | Val | Ser 2130 | Glu | Ala | Leu | |
aac | cat | gtc | aca | aaa | ctc | ctc | gag | aca | aaa | gcg | att | ggc | ttg | att | 6444 |
Asn | His 2135 | val | Thr | Lys | Leu | Leu 2140 | Glu | Thr | Lys | Ala | Ile 2145 | Gly | Leu | Ile | |
ggt | cca | atc | cag | cag | cac | tcc | ttg | tea | aac | atc | gag | aag | gcc | ttc | 6489 |
Gly | Pro 2150 | Ile | Gin | Gin | His | Ser 2155 | Leu | Ser | Asn | Ile | Glu 2160 | Lys | Ala | Phe | |
cgt | acg | atg | cag | agt | ggt | cag | cat | gtt | ggc | aaa | gtt | gtg | gtc | aat | 6534 |
Arg | Thr 2165 | Met | Gin | Ser | Gly | Gin 2170 | His | Val | Gly | Lys | Val 2175 | Val | val | Asn | |
gta | tct | ggg | gac | gaa | ctg | gtc | cca | gtc | ggc | gat | gga | ggg | ttc | teg | 6579 |
Val | Ser 2180 | Gly | Asp | Glu | Leu | Val 2185 | Pro | Val | Gly | Asp | Gly 2190 | Gly | Phe | Ser | |
ctg | aag | ctg | aag | cct | gac | agt | tct | tac | eta | gtt | gct | ggt | ggg | ctg | 6624 |
Leu | Lys 2195 | Leu | Lys | Pro | Asp | Ser 2200 | Ser | Tyr | Leu | Val | Ala 2205 | Gly | Gly | Leu | |
ggg | gga | att | gga | aag | cag | atc | tgt | cag | tgg | ctt | gtt | gat | cat | ggc | 6669 |
Gly | Gly 2210 | Ile | Gly | Lys | Gin | Ile 2215 | Cys | Gin | Trp | Leu | val 2220 | Asp | His | Gly |
PL 202 457 B1
111
gcg Ala. | aag Lys 2225 | cac His | ttg Leu | att Ile | atc Ile | cta Leu 2230 | teg Ser | aga Arg | agt Ser | gca Ala | aag Lys 2235 | gcc Ala | agt Ser | cca Pro | 6714 |
ttc | ata | acc | agc | ttg | caa | aat | caa | cag | tgc | gct | gtc | tat | cta | cac | 6759 |
Phe | Ile 2240 | Thr | Ser | Leu | Gin | Asn 2245 | Gin | Gin | Cys | Ala | Val 2250 | Tyr | Leu | His | |
gca | tgt | gac | atc | tca | gat | caa | gat | cag | gtc | acc | aag | gtg | ctc | cgg | 6804 |
Ala | Cys 2255 | Asp | Ile | Ser | Asp | Gin 2260 | Asp | Gin | Val | Thr | Lys 2265 | Val | Leu | Arg | |
ttg | tgc | gaa | gaa | gca | cat | gca | ccg | cca | att | ega | ggt | atc | ata | caa | 6849 |
Leu | Cys 2270 | Glu | Glu | Ala | His | Ala 2275 | Pro | Pro | Ile | Arg | Gly 2280 | Ile | Ile | Gin | |
ggt | gcc | atg | gtt | ctc | aag | gac | gcg | ctt | cta | teg | ega | atg | aca | ttg | 6894 |
Gly | Ala 2285 | Met | Val | Leu | Lys | Asp 2290 | Ala | Leu | Leu | Ser | Arg 2295 | Met | Thr | Leu | |
gat | gaa | ttt | aat | gca | gca | aca | cgc | cca | aaa | gta | cag | ggt | agt | tgg | 6939 |
Asp | Glu 2300 | Phe | Asn | Ala | Ala | Thr 2305 | Arg | Pro | Lys | Val | Gin 2310 | Gly | Ser | Trp | |
tat | ctt | cac | aag | atc | gca | cag | gat | gtt | gac | ttc | ttc | gtg | atg | ctc | 6984 |
Tyr | Leu 2315 | His | Lys | Ile | Ala | Gin 2320 | Asp | Val | Asp | Phe | Phe 2325 | Val | Met | Leu | |
tca | tcc | ctt | gtt | ggg | gtc | atg | ggt | ggg | gca | ggc | cag | gcc | aat | tac | 7029 |
Ser | Ser 2330 | Leu | Val | Gly | Val | Met 2335 | Gly | Gly | Ala | Gly | Gin 2340 | Ala | Asn | Tyr | |
gca | gct | gct | ggt | gca | ttc | cag | gac | gca | ctt | gcg | cac | cac | cgg | aga | 7074 |
Ala | Al a 2345 | Ala | Gly | Ala | Phe | Gin 2350 | Asp | Ala | Leu | Ala | His 2355 | His | Arg | Arg | |
gcc | cat | ggc | atg | ccg | gct | gtc | acc | att | gac | ttg | ggc | atg | gtc | aag | 7119 |
Ala | His 2360 | Gly | Met | Pro | Ala | Val 2365 | Thr | Ile | Asp | Leu | Gly 2370 | Met | Val | Lys | |
tct | gtt | gga | tac | gtg | gct | gaa | act | ggc | cgt | ggt | gtg | gcc | gac | cgg | 7164 |
Ser | Val 2375 | Gly | Tyr | Val | Ala | Glu 2380 | Thr | Gly | Arg | Gly | Val 2385 | Ala | Asp | Arg | |
ctc | gct | aga | ata | ggt | tac | aag | cct | atg | cat | gaa | aag | gac | gtc | atg | 7209 |
Leu | Ala 23 90 | Arg | Ile | Gly | Tyr | Lys 2395 | Pro | Met | His | Glu | Lys 2400 | Asp | Val | Met | |
gat | gtg | ttg | gag | aag | gca | atc | ctg | tgt | tct | tcc | cct | caa | ttt | cca | 7254 |
Asp | Val 2405 | Leu | Glu | Lys | Ala | Ile 2410 | Leu | Cys | Ser | Ser | Pro 2415 | Gin | Phe | Pro |
112
PL 202 457 B1
tea | cct | CCC | gca | gct | gtg | gtt | aca | gga | atc | aac | aca | tcc | ccg | ggt | 7299 |
Ser | Pro | Pro | Ala | Ala | val | Val | Thr | Gly | Ile | Asn | Thr | Ser | Pro | Gly | |
2420 | 2425 | 2430 | |||||||||||||
gct | cac | tgg | acc | gag | gca | aac | tgg | ata | cag | gaa | cag | cgg | ttt | gtg | 7344 |
Ala | His | Trp | Thr | Glu | Ala | Asn | Trp | Ile | Gin | Glu | Gin | Arg | Phe | Val | |
2435 | 2440 | 2445 | |||||||||||||
gga | ctt | aaa | tac | cgc | caa | gtc | ctt | cat | gca | gac | caa | tcc | ttt | gtc | 7389 |
Gly | Leu | Lys | Tyr | Arg | Gin | Val | Leu | His | Ala | Asp | Gin | Ser | Phe | Val | |
2450 | 2455 | 2460 | |||||||||||||
tct | teg | cat | aaa | aaa | gga | cca | gat | ggc | gtg | cgg | gcc | caa | eta | age | 7434 |
Ser | Ser | His | Lys | Lys | Gly | Pro | Asp | Gly | Val | Arg | Ala | Gin | Leu | Ser | |
2465 | 2470 | 2475 | |||||||||||||
agg | gtc | acc | tct | cac | gac | gag | gcc | att | tct | atc | gtc | ctc | aaa | gca | 7479 |
Arg | Val | Thr | Ser | His | Asp | Glu | Ala | Ile | Ser | Ile | Val | Leu | Lys | Ala | |
2480 | 2485 | 2490 | |||||||||||||
atg | acg | gaa | aag | ctg | atg | ega | atg | ttt | ggt | ctg | gca | gaa | gac | gac | 7524 |
Met | Thr | Glu | Lys | Leu | Met | Arg | Met | Phe | Gly | Leu | Ala | Glu | Asp | Asp | |
2495 | 2500 | 2505 | |||||||||||||
atg | tcc | teg | tcc | aaa | aac | ctg | gca | ggt | gtc | ggc | gta | gac | tea | ctc | 7569 |
Met | Ser | Ser | Ser | Lys | Asn | Leu | Ala | Gly | val | Gly | Val | Asp | Ser | Leu | |
2510 | 2515 | 2520 | |||||||||||||
gtc | gcc | att | gaa | ctt | ega | aac | tgg | atc | aca | tct | gaa | atc | cat | gtt | 7614 |
Val | Ala | Ile | Glu | Leu | Arg | Asn | Trp | Ile | Thr | Ser | Glu | Ile | His | Val | |
2525 | 2530 | 2535 | |||||||||||||
gat | gtg | teg | atc | ttt | gag | ctc | atg | aat | ggt | aac | acc | atc | gcc | ggc | 7659 |
Asp | Val | Ser | Ile | Phe | Glu | Leu | Met | Asn | Gly | Asn | Thr | Ile | Ala | Gly | |
2540 | 2545 | 2550 | |||||||||||||
ctc | gtc | gag | tta | gtt | gtg | gcg | aaa | tgc | agt | taa | 7692 | ||||
Leu | Val | Glu | Leu | Val | Val | Ala | Lys | Cys | Ser | ||||||
2555 | 2560 |
<210 = 46 <211= 2563 :212:
PRT <213= Penicillium citrinum <400= 46
Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr
Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
PL 202 457 B1
113
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro 35 40 45
Gin Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys 50 55 60
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly 65 70 75 go
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
90 95
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val 100 105 no
Ala Ser Cys Met Asp Pro Gin Tyr Arg Leu Met Leu Glu Val Val Tyr 115 120 125
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser 130 135 140
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gin Asp Ser 145 150 155 iso
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg 180 185 190
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala 195 200 205
Leu His Leu Ala Cys Gin Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala 210 215 220
Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr
225 230 235 240
Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu 260 265 270
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gin Asp Pro Ile Arg 275 280 285
Ala Val Ile Arg Glu Thr Ala Leu Asn Gin Asp Gly Lys Thr Pro Ala 290 295 300
Ile Thr Ala Pro Ser Asp Val Ala Gin Lys Ser Leu Ile Gin Glu Cys 305 310 315 320
114
PL 202 457 B1
Tyr | Asp | Lys | Ala | Gly 325 | Leu | Asp | Met | Ser | Leu Thr 330 | Ser | Tyr | Val | Glu 335 | Ala | |
His | Gly | Thr | Gly | Thr | Pro | Thr | Gly | Asp | Pro | Leu | Glu | Ile | Ser | Ala | Ile |
340 | 345 | 350 | |||||||||||||
Ser | Ala | Ala | Phe | Lys | Gly | His | Pro | Leu | His | Leu | Gly | Ser | Val | Lys | Ala |
355 | 360 | 365 | |||||||||||||
Asn | Ile | Gly | His | Thr | Glu | Ala | Ala | Ser | Gly | Leu | Ala | Ser | Ile | Ile | Lys |
370 | 375 | 380 | |||||||||||||
Val | Ala | Leu | Ala | Leu | Glu | Lys | Gly | Leu | Ile | Pro | Pro | Asn | Ala | Arg | Phe |
385 | 390 | 395 | 400 | ||||||||||||
Leu | Gin | Lys | Asn | Ser | Lys | Leu | Met | Leu | Asp | Gin | Lys | Asn | Ile | Lys | Ile |
405 | 410 | 415 | |||||||||||||
Pro | Met | Ser | Ala | Gin | Asp | Trp | Pro | Val | Lys | Asp | Gly | Thr | Arg | Arg | Ala |
420 | 425 | 430 | |||||||||||||
Ser | Val | Asn | Asn | Phe | Gly | Phe | Gly | Gly | Ser | Asn | Ala | His | Val | Ile | Leu |
435 | 440 | 445 | |||||||||||||
Glu | Ser | Tyr | Asp | Arg | Ala | Ser | Leu | Ala | Leu | Pro | Glu | Asp | Gin | Val | His |
450 | 455 | 460 | |||||||||||||
Val | Asn | Gly | Asn | Ser | Glu | His | Gly | Arg | Val | Glu | Asp | Gly | Ser | Lys | Gin |
465 | 470 | 475 | 480 | ||||||||||||
Ser | Arg | Ile | Tyr | Val | Val | Arg | Ala | Lys | Asp | Glu | Gin | Ala | Cys | Arg | Arg |
485 | 490 | 495 | |||||||||||||
Thr | Ile | Ala | Ser | Leu | Arg | Asp | Tyr | Ile | Lys | Ser | Val | Ala | Asp | Ile | Asp |
500 | 505 | 510 | |||||||||||||
Gly | Glu | Pro | Phe | Leu | Ala | Ser | Leu | Ala | Tyr | Thr | Leu | Gly | Ser | Arg | Arg |
515 | 520 | 525 | |||||||||||||
Ser | Ile | Leu | Pro | Trp | Thr | Ser | Val | Tyr | Val | Ala | Asp | Ser | Leu | Gly | Gly |
530 | 535 | 540 | |||||||||||||
Leu | Val | Ser | Ala | Leu | Ser | Asp | Glu | Ser | Asn | Gin | Pro | Lys | Ara | Ala | Asn |
545 | 550 | 555 | 560 | ||||||||||||
Glu | Lys | Val | Arg | Leu | Gly | Phe | Val | Phe | Thr | Gly | Gin | Gly | Ala | Gin | Trp |
565 | 570 | 575 | |||||||||||||
His | Ala | Met | Gly | Arg | Glu | Leu | Val | Asn | Thr | Phe | Pro | Val | Phe | Lys | Gin |
580 | 585 | 590 | |||||||||||||
Ala | Ile | Leu | Glu | Cys | Asp | Gly | Tyr | Ile | Lys | Gin | Leu | Gly | Ala | Ser | Trp |
595 | 600 | 605 |
PL 202 457 B1
115
Asn | Phe 610 | Met | Glu | Glu | Leu | His 615 | Arg | Asp | Glu | Leu | Thr 620 | Thr | Arg | Val | Asn |
Asp | Ala | Glu | Tyr | Ser | Leu | Pro | Leu | Ser | Thr | Ala | Ile | Gin | Ile | Ala | Leu |
625 | 630 | 635 | 640 | ||||||||||||
Val | Arg | Leu | Leu | Trp | Ser | Trp | Gly | Ile | Arg | Pro | Thr | Gly | Ile | Thr | Ser |
645 | 650 | 655 | |||||||||||||
His | Ser | Ser | Gly | Glu | Ala | Ala | Ala | Ala | Tyr | Ala | Ala | Gly | Ala | Leu | Ser |
660 | 665 | 670 | |||||||||||||
Ala | Arg | Ser | Ala | Ile | Gly | Ile | Thr | Tyr | Ile | Arg | Gly | Val | Leu | Thr | Thr |
675 | 680 | 685 | |||||||||||||
Lys | Pro | Lys | Pro | Ala | Leu | Ala | Ala | Lys | Gly | Gly | Met | Met | Ala | Val | Gly |
690 | 695 | 700 | |||||||||||||
Leu | Gly | Arg | Ser | Glu | Thr | Asn | Val | Tyr | Ile | Ser | Arg | Leu | Asn | Gin | Glu |
705 | 710 | 715 | 720 | ||||||||||||
Asp | Gly | Cys | Val | Val | Val | Gly | Cys | Ile | Asn | Ser | Gin | Cys | Ser | Val | Thr |
725 | 730 | 735 | |||||||||||||
Val | Ser | Gly | Asp | Leu | Gly | Ala | Ile | Glu | Lys | Leu | Glu | Lys | Leu | Leu | His |
740 | 745 | 750 | |||||||||||||
Ala | Asp | Gly | Ile | Phe | Thr | Arg | Lys | Leu | Lys | Val | Thr | Glu | Ala | Phe | His |
755 | 760 | 765 | |||||||||||||
Ser | Ser | His | Met | Arg | Pro | Met | Ala | Asp | Ala | Phe | Gly | Ala | Ser | Leu | Arg |
770 | 775 | 780 | |||||||||||||
Asp | Leu | Phe | Asn | Ser | Asp | Asn | Asn | Asn | Asp | Asn | Pro | Asn | Ala | Asp | Thr |
785 | 790 | 795 | 800 | ||||||||||||
Ser | Lys | Gly | Val | Leu | Tyr | Ser | Ser | Pro | Lys | Thr | Gly | Ser | Arg | Met | Thr |
805 | 810 | 815 | |||||||||||||
Asp | Leu | Lys | Leu | Leu | Leu | Asp | Pro | Thr | His | Trp | Met | Asp | Ser | Met | Leu |
820 | 825 | 830 | |||||||||||||
Gin | Pro | Val | Glu | Phe | Glu | Ser | Ser | Leu | Arg | Glu | Met | Cys | Phe | Asp | Pro |
835 | 840 | 845 | |||||||||||||
Asn | Thr | Lys | Glu | Lys | Ala | Val | Asp | Val | Ile | Ile | Glu | Ile | Gly | Pro | His |
850 | 855 | 860 | |||||||||||||
Gly | Ala | Leu | Gly | Gly | Pro | Ile | Asn | Gin | Val | Met | Gin | Asp | Leu | Gly | Leu |
865 | 870 | 875 | 880 | ||||||||||||
Lys | Gly | Thr | Asp | Ile | Asn | Tyr | Leu | Ser | Cys | Leu | Ser | Arg | Gly | Arg | Ser |
885 | 890 | 895 |
116
PL 202 457 B1
Ser | Leu | Glu Thr Met 900 | Tyr Arg Ala | Ala 905 | Thr | Glu Leu Ile | Ser Lys 910 | Gly |
Tyr | Gly | Leu Lys Met | Asp Ala Ile | Asn | Phe | Pro His Gly | ' Arg Lys | Glu |
915 | 920 | 925 | ||||||
Pro | Arg | Val Lys Val | Leu Ser Asp | Leu | Pro | Ala Tyr Pro | > Trp Asn | His |
930 | 935 | 940 | ||||||
Gin | Thr | Arg Tyr Trp . | Arg Glu Pro | Arg | Gly | Ser Arg Glu | Ser Lys | Gin |
945 | 950 | 955 | 950 | |||||
Arg | Thr | His Pro Pro | His Thr Leu | Ile | Gly | Ser Arg Glu | . Ser Leu | Ser |
965 | 970 | 975 | ||||||
Pro | His | Phe Ala Pro | Lys Trp Lys | His | Val | Leu Arg Leu | . Ser Asp | Ile |
980 | 935 | 990 | ||||||
Pro | Trp | Ile Arg Asp | His Val Val | Gly Ser Ser Ile Ile Phe Pro G | ||||
995 | 1000 | 1005 | ||||||
Ala | Gly | Phe Ile Ser | Met Ala Ile Glu Gly Phe Ser | Gin Val | Cys | |||
1010 | 1015 | 1020 | ||||||
Pro | Pro | Val Ala Gly | Ala Ser Ile Asn Tyr Asn Leu | Arg Asp | Val | |||
102 5 | 1030 | 1035 | ||||||
Glu | Leu | Ala Gin Ala | Leu Ile Ile Pro Ala Asp Ala | Glu Ala | Glu | |||
1040 | 1045 | 1050 | ||||||
Val | Asp | Leu Arg Leu | Thr Ile Arg Ser Cys Glu Glu | Arg Ser | Leu | |||
1055 | 1060 | 1065 | ||||||
Gly | Thr | Lys Asn Trp | His Gin Phe Ser Val His Ser | Ile Ser | Gly | |||
1070 | 1075 | 1080 | ||||||
Glu | Asn | Asn Thr Trp | Thr Glu His Cys Thr Gly Leu | Ile Arg | Ser | |||
1035 | 1090 | 1095 | ||||||
Glu | Ser | Glu Arg Ser | His Leu Asp Cys ser Thr Val | Glu Ala | Ser | |||
1100 | 1105 | 1110 | ||||||
Arg | Arg | Leu Asn Leu | Gly Ser Asp Asn Arg Ser Ile | Asp Pro | Asn | |||
1115 | 1120 | 1125 | ||||||
Asp | Leu | Trp Glu Ser | Leu His Ala Asn Gly Ile Cys | His Gly | Pro | |||
1130 | 1135 | 114 0 | ||||||
Ile | Phe | Gin Asn Ile | Gin Arg Ile Gin Asn Asn Gly | Gin Gly | Ser | |||
1145 | 1150 | 1155 | ||||||
Phe | Cys | Arg Phe Ser | Ile Ala Asp Thr Ala Ser Ala | Met Pro | His | |||
1160 | 1165 | 1170 |
PL 202 457 B1
117
Ser Tyr Glu Asn Arg His 1175
Val Ile Gin Ala Ala Tyr 1190
Met Lys Thr Ala Met Val 1205
Ser Ser Ser Leu Ala Asp 1220
Gin Ala Ser Ile Lys Asp 1255
Leu Ala Val Phe Asp Asp 12 5 0
Gly ile Pro Val Ile Glu 1255
Gly Ser Ser Phe Ser Asp 1280
Asn Ala Cys Ser Ser Trp 1295
Asp Ser Thr Trp Leu Lys 1310
Lys Glu Thr Glu Leu Met 1325
Phe Ile Gin Glu Ala Val 1340
His Leu Asp Gly His Leu 1355
Gin Leu Asp Leu Ala Arg 1370
Asp Trp Leu Ser Asp Asp 1385
Arg Val Ala Gly Glu Ser 1400
Gly Pro Gin Leu Ile Ala
1415
Glu Leu Met Met Gin Asp 1430
Ile Val His Pro 1180
Thr Val Leu Pro 1195
Pro Arg Arg Leu 1210
Leu Glu Ala Gly 1225
Arg Asn Ser Gin 1240
Tyr Asp Ser Gly 1255
Ile Glu Gly Leu 1270
Gin Lys Ser Asp 1285
Val Trp Ala Pro 1300
Glu Lys Leu Ser 1315
Met Asp Leu Arg 1330
Thr Asp Leu Thr 1345
Gin Lys Tyr Phe 1360
Gin Asn Lys Leu 1375
Ala Glu Gin Lys 1390
Val Asn Gly Glu 1405
Met Leu Arg Arg 1420
Gin Leu Leu Ser 1435
Thr Thr Leu Asp Ser 1185
Tyr Ala Gly Thr Arg 1200
Arg Asn Val Lys Ile 1215
Asp Ala Leu Asp Ala 1230
Ser Phe Ser Thr Asp 1245
Ser Ser Pro Ser Asp 1250
Val Phe Gin Ser Val 1275
Ser Asn Asp Thr Glu 1290
Asp Ile Ser Leu Gly 1305
Thr Glu Ala Glu Thr 1320
Arg Cys Thr Ile Asn 1335
Asn ser Asp Ile Gin 1350
Asp Trp Met Asn Val 1355
Ser Pro Ala Ser Cys 1380
Lys Cys Leu Gin Ala 1395
Met Ile Ser Arg Leu 1410
Glu Thr Glu Pro Leu 1425
Arg Tyr Tyr Val Asn 1440
118
PL 202 457 B1
Ala Ile Lys 1445
Arg Leu Cys 1460
Gly Gly Gly 1475
Gly Asn Thr 1490
Ala Gly Phe 1505
Asp Val Met 1520
Gin Gin Gly 1535
Gin Val Leu 1550
Val Arg Lys 1565
Thr Thr Arg 1580
Pro Gly Trp 1595
Ser Leu Thr 1610
Phe Asn Gly 1625
Phe Tyr Met 1640
Thr Thr Pro 1655
Gly Ala Leu 1670
Ala Ile Cys 1685
Gly Glu Val 1700
Trp
Ala
Thr
Lys
Phe
Thr
Phe
His
Leu
Asp
Trp
Thr
Val
Ile
Asp
Arg
Glu
Asp
Ser
His
Gly
Pro
Glu
Phe
Glu
Ala
Leu
Gin
Leu
Asp
Glu
Ser
Thr
Pro
Lys
Thr
Arg
Lys
Gly
Ile
Ser
Lys
Cys
Thr
Lys
Leu
Ser
Leu
Leu
Thr
Val
Pro
Thr
Thr
Ser Asn Ala Gin 1450
Asn Pro Arg Ser 1465
Cys Thr Lys Leu 1430
Asp Arg Tyr Asp 1495
Ala Arg Glu Gin 1510
Lys Leu Asp Ile 1525
Ala Thr Tyr Asp 1540
Arg Cys Met Lys 1555
Pro Gly Gly Asn 1570
Asp Leu Phe Phe 1585
Glu Glu Pro Glu 1600
Trp Asn Thr Met 1615
Glu Val Arg Asp 1630
Met Leu Ser Thr 1645
Ala Glu Ser Glu 1660
Ser Ser Trp Leu 1675
Ser Ser Ser Pro 1690
Gly Arg Thr Cys 1705
Ala Ser Glu Leu Ile 1455
Arg Ile Leu Glu Ile 1470
Ile Val Asn Ala Leu 1485
Phe Thr Asp Val Ser 1500
Phe Ala Asp Trp Gin 1515
Glu Ser Asp Pro Glu 1530
Val Val Val Ala Cys 1545
Arg Thr Leu Ser Asn 1560
Leu Ile Leu Val Glu 1575
Thr Phe Gly Leu Leu 1590
Arg Lys Ser Thr Pro 1605
Leu Asp Thr Ser Gly 1620
Cys Glu Asp Asp Glu 1635
Ala Arg Lys Glu Asn 1650
Val Leu Leu Leu His 1665
Glu Ser Leu Gin Ala 1680
Ser Ile Asn Ala Leu 1695
Ile Phe Leu Gly Glu 1710
PL 202 457 B1
119
Met | Glu 1715 | Ser | Ser | Leu | Leu | Gly 1720 | Glu | Val | Gly | Ser | Glu 1725 | Thr | Phe | Lys |
Ser | Ile 1730 | Thr | Ala | Met | Leu | Asn 1735 | Asn | Cys | Asn | Ala | Leu 1740 | Leu | Trp | Val |
Ser | Arg 1745 | Gly | Ala | Ala | Met | Ser 1750 | Ser | Glu | Asp | Pro | Trp 1755 | Lys | Ala | Leu |
His | Ile 1760 | Gly | Leu | Leu | Arg | Thr 1765 | Ile | Arg | Asn | Glu | Asn 1770 | Asn | Gly | Lys |
Glu | Tyr 1775 | Val | Ser | Leu | Asp | Leu 1780 | Asp | Pro | Ser | Arg | Asn 1785 | Ala | Tyr | Thr |
His | Glu 1790 | Ser | Leu | Tyr | Ala | ile 1795 | Cys | Asn | Ile | Phe | Asn 1800 | Gly | Arg | Leu |
Gly | Asp 1805 | Leu | Ser | Glu | Asp | Lys 1810 | Glu | Phe | Glu | Phe | Ala 1815 | Glu | Arg | Asn |
Gly | Val 1820 | Ile | His | Val | Pro | Arg 1825 | Leu | Phe | Asn | Asp | Pro 1830 | His | Trp | Lys |
Asp | Gin 1835 | Glu | Ala | Val | Glu | Val 1840 | Thr | Leu | Gin | Pro | Phe 1845 | Glu | Gin | Pro |
Gly | Arg 1850 | Arg | Leu | Arg | Met | Glu 1855 | Val | Glu | Thr | Pro | Gly 1860 | Leu | Leu | Asp |
Ser | Leu 1865 | Gin | Phe | Arg | Asp | Asp 1870 | Glu | Gly | Arg | Glu | Gly 1875 | Lys | Asp | Leu |
Pro | Asp 1880 | Asp | Trp | Val | Glu | Ile 1885 | Glu | Pro | Lys | Ala | Phe 1890 | Gly | Leu | Asn |
Phe | Arg 1895 | Asp | Val | Met | Val | Ala 1900 | Met | Gly | Gin | Leu | Glu 1905 | Ala | Asn | Arg |
Val | Met 1910 | Gly | Phe | Glu | Cys | Ala 1915 | Gly | Val | Ile | Thr | Lys 1920 | Leu | Gly | Gly |
Ala | Ala 1925 | Ala | Ala | Ser | Gin | Gly 1930 | Leu | Arg | Leu | Gly | Asp 1935 | Arg | Val | Cys |
Ala | Leu 1940 | Leu | Lys | Gly | His | Trp 1945 | Ala | Thr | Arg | Thr | Gin 1950 | Thr | Pro | Tyr |
Thr | Asn 1955 | Val | Val | Arg | Ile | Pro 1960 | Asp | Glu | Met | Gly | Phe 1965 | Pro | Glu | Ala |
Ala | Ser 1970 | Val | Pro | Leu | Ala | Phe 1975 | Thr | Thr | Ala | Tyr | Ile 1980 | Ala | Leu | Tyr |
120
PL 202 457 B1
Thr Thr Ala Lys Leu 1985
Gly Ala Gly Gly Val 2000
Ala Gly Ala Glu Val 2015
Asp Phe Val Gly Asp 2030
Ser Ser Arg Asn Asp
2045
Gly Gly Leu Gly Val 2060
Leu Leu Gin Ala Ser 2075
Val Glu Ile Gly Lys 2090
Met Leu Pro Phe Thr 2105
Leu Ser Trp Gin Arg 212 0
Asn His Val Thr Lys 2135
Gly Pro Ile Gin Gin 2150
Arg Thr Met Gin Ser 2165
Val Ser Gly Asp Glu 2180
Leu Lys Leu Lys Pro 2195
Gly Gly Ile Gly Lys 2210
Ala Lys His Leu Ile 2225
Phe Ile Thr Ser Leu 2240
Arg
Gly
Phe
Lys
Leu
His
Phe
Lys
Arg
Ala
Leu
His
Gly
Leu
Asp
Gin
Ile
Gin
Arg Gly Glu Arg 1990
Gin Ala Ala Ile 2005
Val Thr Ala Gly 2020
Phe Gly Ile Asn 2035
Phe Val Asp Gly 2050
Val Val Leu Asn 2055
Asp Cys Met Ala 2080
Asp Leu Glu Gin 2095
Asp Val Ser Phe 2110
Lys Ser Glu Glu 2125
Leu Glu Thr Lys 2140
Ser Leu Ser Asn 2155
Gin His Val Gly 2170
Val Pro Val Gly 2185
Ser Ser Tyr Leu 2200
Ile Cys Gin Trp 2215
Leu Ser Arg Ser 2230
Asn Gin Gin Cys 2245
Val Leu Ile His Ser 1995
Ile Leu Ser Gin Leu 2010
Thr Gin Ala Lys Arg 2025
Pro Asp His Ile Phe 2040
Ile Lys Ala Tyr Thr 2055
Ser Leu Ala Gly Gin 2070
Glu Phe Gly Arg Phe 2085
Asn Ser Arg Leu Asp 2100
Thr Ser Ile Asp Leu 2115
Val Ser Glu Ala Leu 2130
Ala Ile Gly Leu Ile 2145
Ile Glu Lys Ala Phe 2160
Lys Val Val Val Asn 2175
Asp Gly Gly Phe Ser 2190
Val Ala Gly Gly Leu 2205
Leu Val Asp His Gly 2220
Ala Lys Ala Ser Pro 2235
Ala Val Tyr Leu His 2250
PL 202 457 B1
121
Ala | Cys 2255 | Asp | ile | Ser | Asp | Gin 2260 | Asp | Gin | Val | Thr | Lys 2265 | Val | Leu | Arg |
Leu | Cys | Glu | Glu | Ala | His | Ala | Pro | Pro | Ile | Arg | Gly | Ile | ile | Gin |
2270 | 2275 | 2280 | ||||||||||||
Gly | Ala | Met | Val | Leu | Lys | Asp | Ala | Leu | Leu | Ser | Arg | Met | Thr | Leu |
2285 | 2290 | 2295 | ||||||||||||
Asp | Glu | Phe | Asn | Ala | Ala | Thr | Arg | Pro | Lys | Val | Gin | Gly | Ser | Trp |
2300 | 2305 | 2310 | ||||||||||||
Tyr | Leu | His | Lys | Ile | Ala | Gin | Asp | Val | Asp | Phe | Phe | Val | Met | Leu |
2315 | 2320 | 2325 | ||||||||||||
Ser | Ser | Leu | Val | Gly | Val | Met | Gly | Gly | Ala | Gly | Gin | Ala | Asn | Tyr |
2330 | 2335 | 2340 | ||||||||||||
Ala | Ala | Ala | Gly | Ala | Phe | Gin | Asp | Ala | Leu | Ala | His | His | Arg | Arg |
2345 | 2350 | 2355 | ||||||||||||
Ala | His | Gly | Met | Pro | Ala | Val | Thr | Ile | Asp | Leu | Gly | Met | Val | Lys |
23S0 | 2365 | 2370 | ||||||||||||
Ser | Val | Gly | Tyr | Val | Ala | Glu | Thr | Gly | Arg | Gly | Val | Ala | Asp | Arg |
2375 | 2380 | 2385 | ||||||||||||
Leu | Ala | Arg | Ile | Gly | Tyr | Lys | Pro | Met | His | Glu | Lys | Asp | Val | Met |
23 90 | 2395 | 2400 | ||||||||||||
Asp | Val | Leu | Glu | Lys | Ala | Ile | Leu | Cys | Ser | Ser | Pro | Gin | Phe | Pro |
2405 | 2410 | 2415 | ||||||||||||
Ser | Pro | Pro | Ala | Ala | Val | Val | Thr | Gly | Ile | Asn | Thr | Ser | Pro | Gly |
2420 | 2425 | 2430 | ||||||||||||
Ala | His | Trp | Thr | Glu | Ala | Asn | Trp | Ile | Gin | Glu | Gin | Arg | Phe | Val |
2435 | 2440 | 2445 | ||||||||||||
Gly | Leu | Lys | Tyr | Arg | Gin | Val | Leu | His | Ala | Asp | Gin | Ser | Phe | Val |
2450 | 2455 | 2460 | ||||||||||||
Ser | Ser | His | Lys | Lys | Gly | Pro | Asp | Gly | Val | Arg | Ala | Gin | Leu | Ser |
2465 | 2470 | 2475 | ||||||||||||
Arg | Val | Thr | Ser | His | Asp | Glu | Ala | Ile | Ser | Ile | Val | Leu | Lys | Ala |
24 80 | 2485 | 2490 | ||||||||||||
Met | Thr | Glu | Lys | Leu | Met | Arg | Met | phe | Gly | Leu | Ala | Glu | Asp | Asp |
2495 | 2500 | 2505 | ||||||||||||
Met | Ser | Ser | Ser | Lys | Asn | Leu | Ala | Gly | Val | Gly | Val | Asp | Ser | Leu |
2510 | 2515 | 2520 |
122
PL 202 457 B1
<220>
<221» CDS <222 > (1),. (1557) <400> 47
atg Met 1 | ctc Leu | ggc Gly | cag Gin | gtt Val 5 | Ctt Leu | ctg Leu | acc Thr | gtc Val | gaa Glu 10 | teg Ser | tac Tyr | caa Gin | tgg Trp | gta Val 15 | teg Ser | 48 |
acc | cct | caa | gcc | ctt | gtg | gcg | gtc | gca | gtg | ctt | ctt | agt | ctc | atc | gcc | 96 |
Thr | Pro | Gin | Ala | Leu | Val | Ala | Val | Ala | Val | Leu | Leu | Ser | Leu | Ile | Ala | |
20 | 25 | 30 | ||||||||||||||
tac | cgt | ttg | cgg | ggg | cgc | cag | tcc | gaa | ctg | caa | gtc | tat | aat | ccc | aaa | 144 |
Tyr | Arg | Leu | Arg | Gly | Arg | Gin | Ser | Glu | Leu | Gin | Val | Tyr | Asn | Pro | Lys | |
35 | 40 | 45 | ||||||||||||||
aaa | tgg | tgg | gag | ttg | acg | acc | atg | agg | gct | agg | cag | gac | ttc | gat | acg | 192 |
Lys | Trp | Trp | Glu | Leu | Thr | Thr | Met | Arg | Ala | Arg | Gin | Asp | Phe | Asp | Thr | |
50 | 55 | 60 | ||||||||||||||
tat | ggt | ccg | agc | tgg | atc | gaa | gct | tgg | ttc | teg | aaa | aac | gac | aag | ccc | 240 |
Tyr | Gly | Pro | Ser | Trp | Ile | Glu | Ala | Trp | Phe | Ser | Lys | Asn | Asp | Lys | Pro | |
65 | 70 | 75 | 80 | |||||||||||||
ctg | cgc | ttc | att | gtt | gat | tcc | ggc | tat | tgc | acc | atc | ctc | cca | teg | tcc | 288 |
Leu | Arg | Phe | ile | Val | Asp | Ser | Gly | Tyr | Gys | Thr | Ile | Leu | Pro | Ser | Ser | |
85 | 90 | 95 | ||||||||||||||
atg | gcc | gac | gag | ttt | cgg | aaa | atc | aaa | gat | atg | tgc | atg | tac | aag | ttt | 336 |
Met | Ala | Asp | Glu | Phe | Arg | Lys | Ile | Lys | Asp | Met | Cys | Met | Tyr | Lys | Phe | |
100 | 105 | 110 | ||||||||||||||
ttg | gcg | gat | gac | ttt | cac | tct | cat | ctc | cct | gga | ttc | gac | ggg | ttc | aag | 384 |
Leu | Ala | Asp | Asp | Phe | His | Ser | His | Leu | Pro | Gly | Phe | Asp | Gly | Phe | Lys | |
115 | 120 | 125 |
PL 202 457 B1
123
gaa Glu | atc Ile 130 | tgc Cys | cag Gin | gat Asp | gca Ala | cat His 135 | ctt Leu | gtc val | aac Asn | aaa Lys | gtt Val 14 0 | gtt Val | ttg Leu | aac Asn | cag Gin | 432 |
tta | caa | acc | caa | gcc | ccc | aag | tac | aca | aag | cca | ttg | gct | acc | ttg | gcc | 480 |
Leu | Gin | Thr | Gin | Ala | Pro | Lys | Tyr | Thr | Lys | Pro | Leu | Ala | Thr | Leu | Ala | |
14 5 | 150 | 155 | 160 | |||||||||||||
gac | gct | act | att | gcc | aag | ttg | ttc | ggt | aaa | age | gag | gag | tgg | caa | acc | 528 |
Asp | Ala | Thr | Ile | Ala | Lys | Leu | Phe | Gly | Lys | Ser | Glu | Glu | Trp | Gin | Thr | |
165 | 170 | 175 | ||||||||||||||
gca | cct | gtc | tat | tcc | aat | gga | ttg | gac | ctt | gtc | aca | ega | aca | gtc | aca | 576 |
Ala | Pro | Val | Tyr | Ser | Asn | Gly | Leu | Asp | Leu | Val | Thr | Arg | Thr | Val | Thr | |
180 | 185 | 190 | ||||||||||||||
ctc | att | atg | gtc | ggc | gac | aaa | atc | tgc | cac | aat | gag | gag | tgg | ctg | gat | 624 |
Leu | Ile | Met | Val | Gly | Asp | Lys | Ile | Cys | His | Asn | Glu | Glu | Trp | Leu | Asp | |
195 | 200 | 205 | ||||||||||||||
att | gca | aag | aac | cat | gcc | gtg | agt | gtg | gcg | gta | caa | gct | cgc | caa | ctt | 672 |
Ile | Ala | Lys | Asn | His | Ala | Val | Ser | Val | Ala | Val | Gin | Ala | Arg | Gin | Leu | |
210 | 215 | 220 | ||||||||||||||
cgc | gta | tgg | ccc | atg | eta | ctg | ega | ccg | ctc | gct | cac | tgg | ttt | caa | ccg | 720 |
Arg | Val | Trp | Pro | Met | Leu | Leu | Arg | Pro | Leu | Ala | His | Trp | Phe | Gin | Pro | |
225 | 230 | 235 | 240 | |||||||||||||
caa | gga | cgc | aaa | ttg | cgt | gac | caa | gtg | cgc | cgc | gca | ega | aag | atc | att | 768 |
Gl n | Gly | Arg | Lys | Leu | Arg | Asp | Gin | Val | Arg | Arg | Ala | Arg | Lys | Ile | Ile | |
245 | 250 | 255 | ||||||||||||||
gat | cct | gag | att | cag | ega | ega | cgt | gct | gaa | aag | gcc | gca | tgt | gta | gcg | 816 |
Asp | Pro | Glu | Ile | Gin | Arg | Arg | Arg | Ala | Glu | Lys | Ala | Ala | Cys | Val | Ala | |
260 | 265 | 270 | ||||||||||||||
aag | ggc | gtg | cag | ccg | ccc | cag | tac | gtc | gat | acc | atg | caa | tgg | ttt | gaa | 864 |
Lys | Gly | Val | Gin | Pro | Pro | Gin | Tyr | Val | Asp | Thr | Met | Gin | Trp | Phe | Glu | |
275 | 280 | 285 | ||||||||||||||
gac | acc | gcc | gac | ggc | cgc | tgg | tac | gat | gtg | gcg | ggt | gct | cag | ctc | gct | 912 |
Asp | Thr | Ala | Asp | Gly | Arg | Trp | Tyr | Asp | Val | Ala | Gly | Ala | Gin | Leu | Ala | |
290 | 295 | 300 | ||||||||||||||
atg | gat | ttc | gcc | ggc | atc | tac | gcc | teg | acg | gat | ctt | ttc | gtc | ggt | gcc | 960 |
Met | Asp | Phe | Ala | Gly | Ile | Tyr | Ala | Ser | Thr | Asp | Leu | Phe | Val | Gly | Ala | |
305 | 310 | 315 | 320 | |||||||||||||
ctt | gtg | gac | att | gcc | agg | cac | cca | gac | ctt | att | cag | cct | ctc | cgc | caa | 1008 |
Leu | Val | Asp | Ile | Ala | Arg | His | Pro | Asp | Leu | Ile | Gin | Pro | Leu | Arg | Gin | |
325 | 330 | 335 |
124
PL 202 457 B1
gag Glu | atc Ile | cgc Arg | act Thr 340 | gta val | atc Ile | gga Gly | gaa Glu | ggg Gly 345 | ggc Gly | tgg Trp | acg Thr | cct Pro | gcc Ala 350 | tct Ser | ctg Leu | 1056 |
ttc | aag | ctg | aag | ctc | ctc | gac | agc | tgc | atg | aaa | gag | acg | cag | ega | atc | 1104 |
Phe | Lys | Leu | Lys | Leu | Leu | Asp | Ser | Cys | Met | Lys | Glu | Thr | Gin | Arg | Ile | |
355 | 360 | 365 | ||||||||||||||
aag | ccg | gtc | gag | tgc | gcc | act | atg | cgc | agt | acc | get | ctc | aga | gac | atc | 1152 |
Lys | Pro | Val | Glu | Cys | Ala | Thr | Met | Arg | Ser | Thr | Ala | Leu | Arg | Asp | Ile | |
370 | 375 | 380 | ||||||||||||||
act | eta | tcc | aat | ggc | ctc | ttc | att | ccc | aag | ggc | gag | ttg | gcc | get | gtg | 1200 |
Thr | Leu | Ser | Asn | Gly | Leu | Phe | Ile | Pro | Lys | Gly | Glu | Leu | Ala | Ala | Val | |
385 | 390 | 395 | 400 | |||||||||||||
get | gca | gac | cgc | atg | aac | aac | cct | gat | gtg | tgg | gaa | aac | ccc | gaa | aat | 1248 |
Al a | Ala | Asp | Arg | Met | Asn | Asn | Pro | Asp | Val | Trp | Glu | Asn | Pro | Glu | Asn | |
405 | 410 | 415 | ||||||||||||||
tat | gat | ccc | tac | ega | ttt | atg | cgc | atg | cgc | gag | gat | cca | gac | aag | gcc | 1296 |
Tyr | Asp | Pro | Tyr | Arg | Phe | Met | Arg | Met | Arg | Glu | Asp | Pro | Asp | Lys | Ala | |
420 | 425 | 430 | ||||||||||||||
ttc | acc | get | caa | ttg | gag | aat | acc | aac | ggt | gat | cac | atc | ggc | ttc | ggc | 1344 |
Phe | Thr | Ala | Gin | Leu | Glu | Asn | Thr | Asn | Gly | Asp | His | Ile | Gly | Phe | Gly | |
435 | 440 | 445 | ||||||||||||||
tgg | aac | cca | cgc | get | tgt | ccc | ggg | cgg | ttc | ttc | gcc | teg | aag | gaa | atc | 1392 |
Trp | Asn | Pro | Arg | Ala | Cys | Pro | Gly | Arg | Phe | Phe | Ala | Ser | Lys | Glu | Ile | |
450 | 455 | 460 | ||||||||||||||
aag | att | ctc | ctc | get | cat | ata | ctg | att | cag | tat | gat | gtg | aag | cct | gta | 1440 |
Lys | I Le | Leu | Leu | Ala | Hi s | Ile | Leu | Ile | Gin | Tyr | Asp | Val | Lys | Pro | val | |
4S5 | 470 | 475 | 480 | |||||||||||||
cca | gga | gac | gat | gac | cl cl cl | tac | tac | cgt | cac | get | ttt | agc | gtt | cgt | atg | 1488 |
Pro | Gly | Asp | Asp | Asp | Lys | Tyr | Tyr | Arg | His | Ala | Phe | Ser | Val | Arg | Met | |
485 | 490 | 495 | ||||||||||||||
cat | cca | acc | aca | aag | ctc | atg | gta | cgc | cgg | cgc | aac | gag | gac | atc | ccg | 1536 |
His | Pro | Thr | Thr | Lys | Leu | Met | Val | Arg | Arg | Arg | Asn | Glu | Asp | Ile | Pro | |
500 | 505 | 510 | ||||||||||||||
ctc | cct | cat | gac | cgg | tgc | taa | 1557 | |||||||||
Leu | Pro | His | Asp | Arg | Cys |
515 <210> 48 <211> 518 <212> PRT <213> Penicillium citrinum
PL 202 457 B1
125 <400> 48
Met Leu Gly Gin Val Leu Leu Thr Val Glu Ser Tyr Gin Trp Val Ser 15 10 15
Thr Pro Gin Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala 20 25 30
Tyr Arg Leu Arg Gly Arg Gin Ser Glu Leu Gin Val Tyr Asn Pro Lys 35 40 45
Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gin Asp Phe Asp Thr '50 55 60
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
70 75 80
Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
90 95
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe 100 105 110
Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys 115 120 125
Glu Ile Cys Gin Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gin 130 135 140
Leu Gin Thr Gin Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala
145 150 155 160
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gin Thr
165 170 175
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr 180 185 190
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp 195 200 205
Tle Ala Lys Asn His Ala Val Ser Val Ala Val Gin Ala Arg Gin Leu 210 215 220
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gin Pro
225 230 235 240
Gin Gly Arg Lys Leu Arg Asp Gin Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
Asp Pro Glu Ile Gin Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala 260 265 270
126
PL 202 457 B1
Glu
Ala
Ala
320
Gin
Leu
Ile
Ile
Val
400
Asn
Ala
Gly
Ile
Val
480
Met
Pro
PL 202 457 B1
127 <22 O >
<221? CDS <222> (1) . . (3522) <400> 49
atg Met 1 | gtc Val | gct Ala | teg Ser | ttg Leu 5 | eta Leu | ccc Pro | tct Ser | cgc Arg | ttt Phe 10 | cgc Arg | ggt Gly | agg Arg | gaa Glu | tea Ser 15 | atg Met | 48 |
aat | cag | cag | cac | cct | eta | cgc | teg | gga | aat | cgg | gca | ttg | acc | tcc | aca | 96 |
Asn | Gin | Gin | His | Pro | Leu | Arg | Ser | Gly | Asn | Arg | Ala | Leu | Thr | Ser | Thr | |
20 | 25 | 30 | ||||||||||||||
ctc | caa | ttt | eta | tcc | aaa | acg | gcg | tgt | eta | cac | ccg | atc | cat | acc | gtt | 144 |
Leu | Gin | Phe | Leu | Ser | Lys | Thr | Ala | Cys | Leu | His | Pro | Ile | His | Thr | Val | |
35 | 40 | 45 | ||||||||||||||
tgc | acc | ata | gct | att | eta | gct | agt | acc | aca | tac | gtt | gga | eta | ctc | aaa | 192 |
Cy s | Thr | ile | Ala | Ile | Leu | Ala | Ser | Thr | Thr | Tyr | Val | Gly | Leu | Leu | Lys | |
50 | 55 | 60 | ||||||||||||||
gac | agc | ttc | ttc | cat | ggc | ccc | gca | aac | gtt | gat | aaa | gca | gaa | tgg | ggc | 240 |
Asp | Ser | Phe | Phe | His | Gly | Pro | Ala | Asn | Val | Asp | Lys | Ala | Glu | Trp | Gly | |
55 | 70 | 75 | 80 | |||||||||||||
tct | ttg | gtc | gaa | gga | agt | ega | agc | ttg | atc | acc | ggc | cca | cag | aat | ggc | 288 |
Ser | Leu | Val | Glu | Gly | Ser | Arg | Ser | Leu | Ile | Thr | Gly | Pro | Gin | Asn | Gly | |
85 | 90 | 95 | ||||||||||||||
tgg | aag | tgg | cag | agc | ttc | gac | ggg | gat | gca | gat | gtt | ctc | gga | gat | ttc | 336 |
Trp | Lys | Trp | Gin | Ser | Phe | Asp | Gly | Asp | Ala | Asp | Val | Leu | Gly | Asp | Phe | |
100 | 105 | 110 | ||||||||||||||
aac | cat | caa | gca | eta | atg | acc | ttg | gta | ttc | ccg | ggg | tea | tat | ggg | gtt | 3 84 |
Asn | His | Gin | Ala | Leu | Met | Thr | Leu | Val | Phe | Pro | Gly | Ser | Tyr | Gly | Val | |
115 | 120 | 125 | ||||||||||||||
gca | tct | caa | gca | gcc | tea | cca | ttc | ctt | gct | CCC | ctc | cct | gtg | aac | eta | 432 |
Ala | Ser | Gin | Ala | Ala | Ser | Pro | Phe | Leu | Ala | Pro | Leu | Pro | Val | Asn | Leu | |
130 | 135 | 14 0 | ||||||||||||||
tct | gtg | att | gac | ctt | ccc | tea | acg | teg | agc | CCt | tta | acc | gcc | tat | teg | 480 |
Ser | Val | Ile | Asp | Leu | Pro | Ser | Thr | Ser | Ser | Pro | Leu | Thr | Ala | Tyr | Ser | |
145 | 150 | 155 | 160 | |||||||||||||
aaa | gat | aaa | gtt | ttc | gcc | ttc | tct | gtg | gaa | tac | agc | agc | gcg | ccg | gaa | 528 |
Lys | Asp | Lys | Val | Phe | Ala | Phe | Ser | Val | Glu | Tyr | Ser | Ser | Ala | Pro | Glu | |
165 | 170 | 175 | ||||||||||||||
ctc | gtg | gct | gct | gtt | caa | gaa | atc | ccc | aac | aac | agt | gcc | gac | ctg | aaa | 576 |
Leu | Val | Ala | Ala | Val | Gin | Glu | Ile | Pro | Asn | Asn | Ser | Ala | Asp | Leu | Lys | |
180 | 185 | 190 |
128
PL 202 457 B1
ttg Leu | cag Gin | gag Glu 195 | acg Thr | caa Gin | ttg Leu | atc Ile | gag Glu 200 | atg Met | gaa Glu | cgc Arg | cag Gin | atg Met 205 | tgg Trp | atc Ile | atg Met | 624 |
aag | gct | gcc | agg | gct | cac | aca | aaa | cgc | agc | ctt | gct | caa | tgg | gtg | cac | 672 |
Lys | Ala | Ala | Arg | Ala | His | Thr | Lys | Arg | Ser | Leu | Ala | Gin | Trp | Val | His | |
210 | 215 | 220 | ||||||||||||||
gat | acc | tgg | aca | gag | tet | ctt | gat | ctt | atc | aag | agc | gct | caa | acg | ctc | 720 |
Asp | Thr | Trp | Thr | Glu | Ser | Leu | Asp | Leu | ile | Lys | Ser | Ala | Gin | Thr | Leu | |
225 | 230 | 235 | 240 | |||||||||||||
gac | gtg | gtt | gtc | atg | gtg | eta | ggt | tat | ata | tca | atg | cac | ttg | act | ttc | 768 |
Asp | Val | val | Val | Met | Val | Leu | Gly | Tyr | Ile | Ser | Met | His | Leu | Thr | Phe | |
245 | 250 | 255 | ||||||||||||||
gtc | tca | ctc | ttc | ctc | agc | atg | aaa | aaa | ttg | gga | teg | aag | gtt | tgg | ctg | 816 |
Val | Ser | Leu | Phe | Leu | Ser | Met | Lys | Lys | Leu | Gly | Ser | Lys | Val | Trp | Leu | |
260 | 255 | 270 | ||||||||||||||
gct | aca | agc | gtc | ctt | ttg | teg | tca | aca | ttt | gcc | ttt | ctc | ctc | ggt | ctc | 864 |
Ala | Thr | Ser | Val | Leu | Leu | Ser | Ser | Thr | Phe | Ala | Phe | Leu | Leu | Gly | Leu | |
275 | 280 | 285 | ||||||||||||||
gac | gtg | gcc | ata | aga | eta | ggg | gtt | ccg | atg | agc | atg | agg | ttg | eta | tcc | 912 |
Asp | Val | Ala | Ile | Arg | Leu | Gly | Val | Pro | Met | Ser | Met | Arg | Leu | Leu | Ser | |
290 | 295 | 300 | ||||||||||||||
gaa | ggc | ctc | ccc | ttc | ttg | gtg | gtg | atc | gtt | ggc | ttt | gag | aag | agc | atc | 960 |
Glu | Gly | Leu | Pro | Phe | Leu | Val | val | ile | Val | Gly | Phe | Glu | Lys | Ser | Ile | |
305 | 310 | 315 | 320 | |||||||||||||
act | ctg | acc | agg | gct | gtt | ttg | tcc | tat | gct | gtg | cag | cac | ega | aag | ccc | 1008 |
Thr | Leu | Thr | Arg | Ala | Val | Leu | Ser | Tyr | Ala | Val | Gin | His | Arg | Lys | Pro | |
325 | 330 | 335 | ||||||||||||||
cag | aag | ata | cag | tet | gac | cag | ggt | agc | gtg | aca | gcc | att | gct | gaa | agt | 1056 |
Gin | Lys | Ile | Gin | Ser | Asp | Gin | Gly | Ser | Val | Thr | Ala | Ile | Ala | Glu | Ser | |
340 | 345 | 350 | ||||||||||||||
acc | atc | aat | tac | gcc | gta | ega | agc | gcc | att | cgg | gag | aag | ggt | tac | aat | 1104 |
Thr | Ile | Asn | Tyr | Ala | Val | Arg | Ser | Ala | Ile | Arg | Glu | Lys | Gly | Tyr | Asn | |
355 | 360 | 365 | ||||||||||||||
atc | gtg | tgc | cac | tac | gtg | gtc | gag | atc | ctg | ctc | eta | gtt | atc | ggt | gct | 1152 |
Ile | Val | cys | His | Tyr | val | Val | Glu | Ile | Leu | Leu | Leu | Val | Ile | Gly | Ala | |
370 | 375 | 380 | ||||||||||||||
gtc | tta | ggc | atc | caa | ggt | ggg | eta | cag | cac | ttc | tgt | gtt | eta | gct | gca | 12 00 |
Val | Leu | Gly | Ile | Gin | Gly | Gly | Leu | Gin | His | Phe | Cys | Val | Leu | Ala | Ala | |
385 | 390 | 395 | 400 |
PL 202 457 B1
129
ttg Leu | atc Ile | ctg Leu | ttc Phe | ttt Phe 405 | gac Asp | tgt Cys | ctg Leu | ctg Leu | ctg Leu 410 | ttt Phe | aca Thr | ttc Phe | tac Tyr | act Thr 415 | gcg Ala | 1248 |
att | ctg | tct | atc | aag | ctc | gag | gta | aac | cgc | ctc | aaa | cgt | cat | atc | aac | 1296 |
Ile | Leu | Ser | Ile | Lys | Leu | Glu | Val | Asn | Arg | Leu | Lys | Arg | His | Ile | Asn | |
420 | 425 | 430 | ||||||||||||||
atg | cgg | tac | gcg | ttg | gaa | gat | gag | ggt | ctc | agt | cag | cgg | acg | gcg | gag | 1344 |
Met | Arg | Tyr | Ala | Leu | Glu | Asp | Glu | Gly | Leu | Ser | Gin | Arg | Thr | Ala | Glu | |
435 | 440 | 445 | ||||||||||||||
agt | gtc | gcg | acc | agc | aat | gat | gcc | caa | gac | agt | gca | cgt | aca | tat | ctg | 1392 |
Ser | Val | Ala | Thr | Ser | Asn | Asp | Ala | Gin | Asp | Ser | Ala | Arg | Thr | Tyr | Leu | |
450 | 455 | 460 | ||||||||||||||
ttt | ggc | aat | gat | atg | aaa | ggc | agc | agt | gtt | ccg | aag | ttc | aaa | ttc | tgg | 1440 |
Phe | Gly | Asn | Asp | Met | Lys | Gly | Ser | Ser | Val | Pro | Lys | Phe | Lys | Phe | Trp | |
465 | 470 | 475 | 480 | |||||||||||||
atg | gtc | gtt | ggt | ttc | ctt | atc | gtc | aac | ctc | gtc | aac | atc | ggc | tcc | acc | 1480 |
Met | Val | Val | Gly | Phe | Leu | Ile | Val | Asn | Leu | Val | Asn | Ile | Gly | Ser | Thr | |
485 | 490 | 495 | ||||||||||||||
ctt | ttc | caa | gcc | tct | tct | agt | gga | tcg | ttg | tcc | agt | ata | tca | tct | tgg | 1536 |
Leu | Phe | Gin | Ala | Ser | Ser | Ser | Gly | Ser | Leu | Ser | Ser | Ile | Ser | Ser | Trp | |
500 | 505 | 510 | ||||||||||||||
acc | gaa | agt | ctg | agc | gga | tcg | gcc | att | aaa | ccc | ccg | ctt | gag | ccc | ttc | 1584 |
Ttir | Glu | Ser | Leu | Ser | Gly | Ser | Ala | Ile | Lys | Pro | Pro | Leu | Glu | Pro | Phe | |
515 | 520 | 525 | ||||||||||||||
aag | gta | gct | gga | agt | gga | eta | gat | gaa | eta | ctt | ttc | cag | gca | aga | ggg | 1632 |
Lys | Val | Ala | Gly | Ser | Gly | Leu | Asp | Glu | Leu | Leu | Phe | Gin | Ala | Arg | Gly | |
530 | 535 | 540 | ||||||||||||||
cgc | ggt | caa | tcg | act | atg | gtc | act | gtc | ctc | gcc | ccc | atc | aag | tac | gaa | 1680 |
Arg | Gly | Gin | Ser | Thr | Met | val | Thr | Val | Leu | Ala | Pro | Ile | Lys | Tyr | Glu | |
545 | 550 | 555 | 560 | |||||||||||||
eta | gag | tat | cct | tcc | att | cac | cgt | ggt | acc | tcg | cag | eta | cac | Sag | tat | 172 8 |
Leu | Glu | Tyr | Pro | Ser | Ile | His | Arg | Gly | Thr | Ser | Gin | Leu | His | Glu | Tyr | |
565 | 570 | 575 | ||||||||||||||
gga | gtt | ggt | gga | aaa | atg | gtc | ggt | agc | ctg | ctc | acc | agc | ctg | gaa | gat | 1776 |
Gly | Val | Gly | Gly | Lys | Met | Val | Gly | Ser | Leu | Leu | Thr | Ser | Leu | Glu | Asp | |
580 | 585 | 590 | ||||||||||||||
ccc | gtc | ctc | tcc | aaa | tgg | gtg | ttt | gtg | gca | ctt | gcc | eta | agt | gtc | gct | 1824 |
Pro | Val | Leu | Ser | Lys | Trp | Val | Phe | Val | Ala | Leu | Ala | Leu | Ser | Val | Ala | |
595 | 600 | 605 |
130
PL 202 457 B1
ctg Leu | aac Asn 610 | agc Ser | tat Tyir | ctg Leu | ttc Phe | aag Lys 615 | gcc Ala | gcc Ala | aga Arg | ctg Leu | gga Gly 620 | atc Ile | aaa Lys | gat Asp | cct Pro | 1872 |
aat | ctc | ccg | agt | cac | cca | gtt | gat | cca | gtt | gag | Ctt | gac | cag | gcc | gaa | 1920 |
Asn | Leu | Pro | Ser | His | Pro | Val | Asp | Pro | Val | Glu | Leu | Asp | Gin | Ala | Glu | |
625 | 630 | 635 | 640 | |||||||||||||
agc | ttc | aac | gct | gcc | cag | aac | cag | acc | cct | cag | att | caa | tca | agt | ctc | 1968 |
Ser | Phe | Asn | Al a | Ala | Gin | Asn | Gin | Thr | Pro | Gin | Ile | Gin | Ser | Ser | Leu | |
645 | 650 | 655 | ||||||||||||||
caa | gct | cct | cag | acc | aga | gtg | ttc | act | cct | acc | acc | acc | gac | agt | gac | 2016 |
Gin | Ala | Pro | Gin | Thr | Arg | Val | Phe | Thr | Pro | Thr | Thr | Thr | Asp | Ser | AS? | |
660 | 665 | 670 | ||||||||||||||
agt | gat | gcc | tca | tta | gtc | tta | att | aaa | gca | tct | cta | aag | gtc | act | aag | 2064 |
Ser | Asp | Ala | Ser | Leu | Val | Leu | Ile | Lys | Ala | Ser | Leu | Lys | Val | Thr | Lys | |
675 | 630 | 685 | ||||||||||||||
ega | gca | gaa | gga | aag | aca | gcc | act | agt | gaa | ctt | ccc | gtg | tct | cgc | aca | 2112 |
Arg | Ala | Glu | Gly | Lys | Thr | Ala | Thr | Ser | Glu | Leu | Pro | Val | Ser | Arg | Thr | |
690 | 695 | 700 | ||||||||||||||
caa | atc | gaa | ctg | gac | aat | ttg | ctg | aag | cag | aac | aca | atc | agc | gag | ttg | 2160 |
Gin | Ile | Glu | Leu | Asp | Asn | Leu | Leu | Lys | Gin | Asn | Thr | Ile | Ser | Glu | Leu | |
705 | 710 | 715 | 720 | |||||||||||||
aac | gat | gag | gat | gtc | gtt | gcc | ttg | tct | ttg | cgg | gga | aag | gtt | ccc | 999 | 2208 |
Asn | Asp | Glu | Asp | Val | Val | Ala | Leu | Ser | Leu | Arg | Gly | Lys | val | Pro | Gly | |
725 | 730 | 735 | ||||||||||||||
tat | gcc | cta | gag | aag | agt | ctc | aaa | gac | tgc | act | cgt | gcc | gtc | aag | gtt | 2256 |
Tyr | Ala | Leu | Glu | Lys | Ser | Leu | Lys | Asp | Cys | Thr | Arg | Ala | Val | Lys | Val | |
740 | 745 | 750 | ||||||||||||||
cgc | cgc | tct | atc | att | teg | agg | aca | ccg | gct | acc | gca | gag | ctt | aca | agt | 2304 |
Arg | Arg | Ser | Ile | Ile | Ser | Arg | Thr | Pro | Ala | Thr | Ala | Glu | Leu | Thr | Ser | |
755 | 760 | 765 | ||||||||||||||
atg | ctg | gag | cac | teg | aag | ctg | ccg | tac | gaa | aac | tac | gcc | tgg | gaa | cgc | 2352 |
Met | Leu | Glu | His | Ser | Lys | Leu | Pro | Tyr | Glu | Asn | Tyr | Ala | Trp | Glu | Arg | |
770 | 775 | 780 | ||||||||||||||
gtg | ctc | ggt | gca | tgt | tgc | gag | aac | gtt | att | ggc | tat | atg | cca | gtc | cct | 2400 |
Vai | Leu | Gly | Ala | Cys | Cys | Glu | Asn | Val | Ile | Gly | Tyr | Met | Pro | Val | Pro | |
785 | 790 | 795 | 800 | |||||||||||||
gtt | ggc | gtc | gcc | ggt | cct | att | gtt | atc | gac | ggc | aag | agt | tat | ttc | att | 2448 |
Val | Gly | Val | Ala | Gly | Pro | Ile | Val | Ile | Asp | Gly | Lys | Ser | Tyr | Phe | Ile | |
805 | 810 | 815 |
PL 202 457 B1
131
cct Pro | atg Met | gca Ala | acc Thr 820 | acc Thr | gag Glu | ggc Gly | gtc Val | ctc Leu 825 | gtc Val | gct Ala | agt Ser | gct Ala | agc Ser 830 | cgt Arg | ggc Gly | 2496 |
agt | aag | gca | atc | aac | ctc | ggt | ggc | ggt | gcc | gtg | aca | gtc | ctg | act | ggc | 2544 |
Ser | Lys | Ala 835 | Ile | Asn | Leu | Gly | Gly 840 | Gly | Ala | Val | Thr | Val 845 | Leu | Thr | Gly | |
gac | ggt | atg | aca | ega | ggc | ccg | tgt | gtg | aag | ttt | gat | gtc | ctt | gaa | ega | 2592 |
Asp | Gly 850 | Met | Thr | Arg | Gly | Pro 855 | Cys | Val | Lys | Phe | Asp 860 | Val | Leu | Glu | Arg | |
gct | ggt | gct | gct | aag | atc | tgg | ctc | gat | tcg | gac | gtc | ggc | cag | acc | gta | 2640 |
Ala 865 | Gly | Ala | Ala | Lys | Ile 870 | Trp | Leu | Asp | Ser | Asp 875 | Val | Gly | Gin | Thr | Val 880 | |
atg | aaa | gaa | gcc | ttc | aat | tca | acc | agc | aga | ttt | gcg | cgc | tta | caa | agt | 2688 |
Met | Lys | Glu | Ala | Phe Θ85 | Asn | Ser | Thr | Ser | Arg 890 | Phe | Ala | Arg | Leu | Gin 895 | Ser | |
atg | cgg | aca | act | atc | gcc | ggt | act | cac | tta | tat | att | ega | ttt | aag | act | 2736 |
Met | Arg | Thr | Thr 900 | Ile | Ala | Gly | Thr | His 905 | Leu | Tyr | Ile | Arg | Phe 910 | Lys | Thr | |
act | act | ggc | gac | gct | atg | gga | atg | aat | atg | att | tct | aag | ggc | gtg | gag | 2784 |
Thr | Thr | Gly 915 | Asp | Ala | Met | Gly | Met 920 | Asn | Met | Ile | Ser | Lys 925 | Gly | Val | Glu | |
cat | gca | ctg | aat | gtt | atg | gcg | aca | gag | gca | ggt | ttc | agc | gat | atg | aat | 2 832 |
His | Ala 930 | Leu | Asn | Val | Met | Ala 935 | Thr | Glu | Ala | Gly | Phe 940 | Ser | Asp | Met | Asn | |
att | att | acc | eta | tca | gga | aat | tac | tgt | acg | gat | aag | aaa | cct | tca | gct | 2880 |
Ile 945 | Ile | Thr | Leu | Ser | Gly 950 | Asn | Tyr | Cys | Thr | Asp 955 | Lys | Lys | Pro | Ser | Ala 960 | |
ttg | aat | tgg | atc | gat | gga | cgg | ggc | aag | ggc | att | gtg | gcc | gaa | gcc | atc | 2928 |
Leu | Asn | Trp | Ile | Asp 965 | Gly | Arg | Gly | Lys | Gly 970 | Ile | Val | Ala | Glu | Ala 975 | Ile | |
ata | ccg | gcg | aac | gtt | gtc | agg | gat | gtc | tta | aag | agc | gat | gtg | gat | agc | 2976 |
Ile | Pro | Ala | Asn 980 | Val | Val | Arg | Asp | Val 985 | Leu | Lys | Ser | Asp | Val 990 | Asp | Ser |
atg gtt cag ctc aac ata tcg aaa aat ctg att ggg tcc gct atg gct 3024
Met Val Gin Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala
995 1000 1005 ggc tca gtt ggc ggc ttc aac gcc caa gct gcc aat ctt gcg gca 3069
Gly Ser Val Gly Gly Phe Asn Ala Gin Ala Ala Asn Leu Ala Ala
1010 1015 1020
132
PL 202 457 B1
gcc Ala | att Ile 1025 | ttc Phe | att Ile | gcc Ala | aca Thr | ggt Gly 1030 | cag Gin | gat Asp | ccg Pro | gcg Ala | caa Gin 1035 | gtt Val | gtg val | gag Glu | 3114 |
agc | gct | aac | tgc | atc | act | ctc | atg | aac | aat | ctt | cgc | gga | teg | ctt | 3159 |
Ser | Ala 1040 | Asn | Cys | Ile | Thr | Leu 1045 | Met | Asn | Asn | Leu | Arg 1050 | Gly | Ser | Leu | |
caa | atc | tct | gtc | tcc | atg | ccg | tct | att | gag | gtt | gga | acg | ttg | ggc | 3204 |
Gin | Ile 1055 | Ser | Val | Ser | Met | Pro 1060 | Ser | Ile | Glu | Val | Gly 1065 | Thr | Leu | Gly | |
ggt | ggt | acg | att | ctg | gag | ccc | cag | ggc | gca | atg | ctt | gac | atg | ctt | 3249 |
Gly | Gly 1070 | Thr | Ile | Leu | Glu | Pro 1075 | Gin | Gly | Ala | Met | Leu 1080 | Asp | Met | Leu | |
ggt | gtc | cgc | gga | tea | cac | ccg | acc | act | ccc | ggt | gag | aat | gca | cgt | 3294 |
Gly | Val 1085 | Arg | Gly | Ser | His | Pro 1090 | Thr | Thr | Pro | Gly | Glu 1095 | Asn | Ala | Arg | |
caa | ctt | gcg | cgc | atc | atc | gga | agc | gct | gtt | ttg | gct | ggg | gag | ctc | 3339 |
Gin | Leu 1100 | Ala | Arg | Ile | Ile | Gly 1105 | Ser | Ala | Val | Leu | Ala 1110 | Gly | Glu | Leu | |
teg | eta | tgt | gct | gcc | eta | gcc | gcc | ggt | cac | ctg | gtc | aag | gcg | cac | 3384 |
Ser | Leu 1115 | Cys | Ala | Ala | Leu | Ala 1120 | Ala | Giy | His | Leu | Val 1125 | Lys | Ala | His | |
atg | gcg | cac | aac | cgt | tct | gcc | ccg | gca | tct | tea | gcc | cct | tct | ega | 3429 |
Met | Ala 1130 | His | Asn | Arg | Ser | Ala 1135 | Pro | Ala | Ser | Ser | Ala 1140 | Pro | Ser | Arg | |
agt | gtc | tcc | ccg | tea | ggt | gga | acc | agg | aca | gtc | cct | gtt | cct | aac | 3474 |
Ser | Val 1145 | Ser | Pro | Ser | Gly | Gly 1150 | Thr | Arg | Thr | Val | Pro 1155 | Val | Pro | Asn | |
aat | gca | ctg | agg | ccg | agt | gct | gca | gct | act | gat | cgg | gct | ega | cgc | 3519 |
Asn | Ala 1160 | Leu | Arg | Pro | Ser | Ala 1165 | Ala | Ala | Thr | Asp | Arg 1170 | Ala | Arg | Arg |
c9a 3522 <210? 50 <211? 1173 <212? PRT <213? Penicillium citrinum <400? 50
Met Val Aia Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met
10 15
PL 202 457 B1
133
Asn Gin Gin His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr 20 25 30
Leu Gin Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val 35 40 45
Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys 50 55 60
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
70 75 SO
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gin Asn Gly
90 95
Trp Lys Trp Gin Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe 100 105 110
Asn His Gin Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val 115 120 125
Ala Ser Gin Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu 130 135 140
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175
Leu Val Ala Ala Val Gin Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys 180 185 190
Leu Gin Glu Thr Gin Leu Ile Glu Met Glu Arg Gin Met Trp Ile Met 195 200 205
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gin Trp Val His 210 215 220
Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gin Thr Leu
225 230 235 240
Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255
Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu 260 265 270
Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu 275 280 285
Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser 290 295 300
134
PL 202 457 B1
Glu Gly Leu Pro Phe Leu 305 310
Thr Leu Thr Arg Ala Val 325
Gin Lys Ile Gin Ser Asp 340
Thr Ile Asn Tyr Ala Val 3 55
Ile Val Cys His Tyr Val 370
Val Leu Gly Ile Gin Gly 385 390
Leu Ile Leu Phe Phe Asp 405
Ile Leu Ser Ile Lys Leu 420
Met Arg Tyr Ala Leu Glu 435
Ser Val Ala Thr Ser Asn 450
Phe Gly Asn Asp Met Lys 465 470
Met Val Val Gly Phe Leu 485
Leu Phe Gin Ala Ser Ser 500
Thr Glu Ser Leu Ser Gly 515
Lys Val Ala Gly Ser Gly 530
Arg Gly Gin Ser Thr Met 545 550
Leu Glu Tyr Pro Ser Ile 565
Gly Val Gly Gly Lys Met 580
Val Val Ile Val
Leu Ser Tyr Ala 330
Gin Gly Ser Val 345
Arg Ser Ala Ile 360
Val Glu Ile Leu 375
Gly Leu Gin His
Cys Leu Leu Leu 410
Glu Val Asn Arg 425
Asp Glu Gly Leu 440
Asp Ala Gin Asp 455
Gly Ser Ser Val
Ile Val Asn Leu 490
Ser Gly Ser Leu 505
Ser Ala Ile Lys 520
Leu Asp Glu Leu 535
Val Thr Val Leu
His Arg Gly Thr 570
Val Gly Ser Leu 585
Gly Phe Glu Lys Ser Ile 315 320
Val Gin His Arg Lys Pro 335
Thr Ala Ile Ala Glu Ser 350
Arg Glu Lys Gly Tyr Asn 365
Leu Leu Val Ile Gly Ala 380
Phe Cys Val Leu Ala Ala 395 400
Phe Thr Phe Tyr Thr Ala 415
Leu Lys Arg His Ile Asn 430
Ser Gin Arg Thr Ala Glu 445
Ser Ala Arg Thr Tyr Leu 460
Pro Lys Phe Lys Phe Trp 475 480
Val Asn Ile Gly Ser Thr 495
Ser Ser Ile Ser Ser Trp 510
Pro Pro Leu Glu Pro Phe 525
Leu Phe Gin Ala Arg Gly 540
Ala Pro ile Lys Tyr Glu 555 560
Ser Gin Leu His Glu Tyr 575
Leu Thr Ser Leu Glu Asp 590
PL 202 457 B1
135
Pro | fal | Leu 595 | Ser | Lys | Trp | fal | Phe 600 | Val | Ala | Leu | Ala | Leu 605 | Ser | fal | Ala |
Leu | Asn | Ser | Tyr | Leu | Phe | Lys | Ala | Ala | Arg | Leu | Gly | Ile | Lys | Asp | Pro |
610 | 615 | 620 | |||||||||||||
Asn | Leu | Pro | Ser | His | Pro | fal | Asp | Pro | Val | Glu | Leu | Asp | Gin | Ala | Glu |
625 | 630 | 635 | 640 | ||||||||||||
Ser | Phe | Asn | Ala | Ala | Gin | Asn | Gin | Thr | Pro | Gin | Ile | Gin | Ser | Ser | Leu |
645 | 650 | 655 | |||||||||||||
Gl n | Ala | Pro | Gin | Thr | Arg | fal | Phe | Thr | Pro | Thr | Thr | Thr | Asp | Ser | Asp |
6S0 | 665 | 670 | |||||||||||||
Ser | Asp | Ala | Ser | Leu | fal | Leu | Ile | Lys | Ala | Ser | Leu | Lys | fal | Thr | Lys |
675 | 680 | 685 | |||||||||||||
Arg | Ala | Glu | Gly | Lys | Thr | Ala | Thr | Ser | Glu | Leu | Pro | Val | Ser | Arg | Thr |
690 | 695 | 700 | |||||||||||||
Gin | Ile | Glu | Leu | Asp | Asn | Leu | Leu | Lys | Gin | Asn | Thr | Ile | Ser | Glu | Leu |
705 | 710 | 715 | 720 | ||||||||||||
Asn | Asp | Glu | Asp | Val | fal | Ala | Leu | Ser | Leu | Arg | Gly | Lys | Val | Pro | Gly |
725 | 730 | 735 | |||||||||||||
Tyr | Ala | Leu | Glu | Lys | Ser | Leu | Lys | Asp | Cys | Thr | Arg | Ala | fal | Lys | fal |
740 | 745 | 750 | |||||||||||||
Arg | Arg | Ser | Ile | ile | Ser | Arg | Thr | Pro | Ala | Thr | Ala | Glu | Leu | Thr | Ser |
755 | 760 | 765 | |||||||||||||
Met | Leu | Glu | His | Ser | Lys | Leu | Pro | Tyr | Glu | Asn | Tyr | Ala | Trp | Glu | Arg |
770 | 775 | 780 | |||||||||||||
fal | Leu | Gly | Ala | Cys | Cys | Glu | Asn | Val | Ile | Gly | Tyr | Met | Pro | fal | Pro |
785 | 790 | 795 | 800 | ||||||||||||
fal | Gly | Val | Ala | Gly | Pro | Ile | Val | Ile | Asp | Gly | Lys | Ser | Tyr | Phe | Ile |
805 | 810 | 815 | |||||||||||||
Pro | Met | Ala | Thr | Thr | Glu | Gly | Val | Leu | val | Ala | Ser | Ala | Ser | Arg | Gly |
820 | 825 | 830 | |||||||||||||
Ser | Lys | Ala | Ile | Asn | Leu | Gly | Gly | Gly | Ala | Val | Thr | fal | Leu | Thr | Gly |
835 | 840 | 845 | |||||||||||||
Asp | Gly | Met | Thr | Arg | Gly | Pro | Cys | fal | Lys | Phe | Asp | fal | Leu | Glu | Arg |
850 | 855 | 860 | |||||||||||||
A-l a | Gly | Ala | Ala | Lys | ile | Trp | Leu | Asp | Ser | Asp | Val | Gly | Gin | Thr | Val |
865 | 870 | 875 | 880 |
136
PL 202 457 B1
Met | Lys | Glu | Ala | Phe 885 | Asn | Ser | Thr | Ser | Arg 890 | Phe | Ala | Arg | Leu | Gin 895 | Ser |
Met | Arg | Thr | Thr 900 | Ile | Ala | Gly | Thr | His 905 | Leu | Tyr | Ile | Arg | Phe 910 | Lys | Thr |
Thr | Thr | Gly 915 | Asp | Ala | Met | Gly | Met 92 0 | Asn | Met | Ile | Ser | Lys 925 | Gly | Val | Glu |
His | Ala 930 | Leu | Asn | Val | Met | Ala 935 | Thr | Glu | Ala | Gly | Phe 940 | Ser | Asp | Met | Asn |
Ile 945 | ile | Thr | Leu | Ser | Gly 950 | Asn | Tyr | Cys | Thr | Asp 955 | Lys | Lys | Pro | Ser | Ala 960 |
Leu | Asn | Trp | Ile | Asp 965 | Gly | Arg | Gly | Lys | Gly 970 | Ile | Val | Ala | Glu | Ala 975 | Ile |
Tle | Pro | Ala | Asn 980 | Val | Val | Arg | Asp | Val 985 | Leu | Lys | Ser | Asp | Val 990 | Asp | Ser |
Met
Gly
Ala
Ser
Gin
Gly
Gly
Gin
Ser
Met
Ser
Val Gin Leu Asn Ile I 995
Ser val Gly Gly Phe 1010
Ile Phe Ile Ala Thr 1025
Ala Asn Cys Ile Thr 1040
Ile Ser Val Ser Met 1055
Gly Thr Ile Leu Glu 1070
Vai Arg Gly Ser His 1085
Leu Ala Arg Ile Ile 1100
Leu Cys Ala Ala Leu
1115
Ala His Asn Arg Ser
1130
Val Ser Pro Ser Gly 1145 ier Lys Asn Leu Ile 1000
Asn Ala Gin Ala Ala 1015
Gly Gin Asp Pro Ala 1030
Leu Met Asn Asn Leu 1045
Pro Ser Ile Glu Val 1060
Pro Gin Gly Ala Met 1075
Pro Thr Thr Pro Gly 1090
Gly Ser Ala Val Leu 1105
Ala Ala Gly His Leu 1120
Ala Pro Ala Ser Ser 1135
Gly Thr Arg Thr Val 1150
Gly Ser Ala Met Ala 1005
Asn Leu Ala Ala 1020
Gin Val Val Glu 1035
Arg Gly Ser Leu 1050
Gly Thr Leu Gly 1065
Leu Asp Met Leu 1080
Glu Asn Ala Arg 1095
Ala Gly Glu Leu 1110
Val Lys Ala His 1125
Ala Pro Ser Arg 1140
Pro Val Pro Asn 1155
PL 202 457 B1
137
Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr Asp Arg Ala Arg Arg 1160 1165 1170 <210? 51 <211> 20 <212? DNA <213? Penicillium citrinum <400? 51 gcaagctctg ctaccagcac <2105 52 <211? 20 <212? DNA <213? Penicillium citrinum <400? 52 ctaggccaac btcagagccg <210? 53 <211? 20 <212? DNA <213? Penicillium citrinum <400? 53 agtcatgcag gatctgggtc <210? 54 <211? 20 <212? DNA <213? Penicillium citrinum <4C0> 54 gcagacacat cggtgaagtc <210? 55 <211? 20 <212? DNA <213? Penicillium citrinum <400? 55 aaaccgcacc tgtctattcc <210? 56 <211? 20 < 212 > DNA <213? Penicillium citrinum <400? 56 ctttgtggtt ggatgcatac <210? 57 <211? 20
138
PL 202 457 B1
PL 202 457 B1
139
Claims (31)
1. Polinukleotyd przyspieszają cy biosyntez ę ML-236B, wybrany z grupy zł o ż onej z:
(a) polinukleotydu kodującego białko mające sekwencję aminokwasów SEQ ID NO 42, (b) polinukleotydu, który zawiera sekwencję nukleotydów SEQ ID NO 41, odpowiedniego do stosowania w przyspieszaniu biosyntezy ML-236B, (c) polinukleotydu, który stanowi sekwencję nukleotydów SEQ ID NO 41, (d) polinukleotydu, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (a) do (c), i który jest odpowiedni do przyspieszania biosyntezy ML-236B w mikroorganizmie wytwarzającym ML-236B gdy jest wprowadzany do tego mikroorganizmu wytwarzającego ML-236B, (e) mRNA, który hybrydyzuje w ostrych warunkach z polinukleotydem określonym w (d).
2. Polinukleotyd według zastrz. 1, znamienny tym, ż e zawiera DNA, który można uzyskać z transformowanej Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
3. Polinukleotyd według zastrz. 1 albo 2, znamienny tym, że jest w połączeniu funkcjonalnym z jednym lub wię cej polinukleotydów, przy czym ta kombinacja jest odpowiednia do stosowania w zwię kszaniu wytwarzania ML-236B w mikroorganizmie wytwarzają cym ML-236B.
4. Polinukleotyd według zastrz. 3, znamienny tym, że zawiera polinukleotyd określony w zastrz. 1 albo 2 w połączeniu z polinukleotydem kodującym białko, które zawiera lub stanowi sekwencję aminokwasów wybraną z SEQ ID NO 38, 42, 44, 46, 48 lub 50.
5. Polinukleotyd według zastrz. 3, znamienny tym, że zawiera polinukleotyd o SEQ ID NO 41 w połączeniu z jedną lub wię cej sekwencji wybranych z SEQ ID NO 37, 41, 43, 45, 47 lub 49.
6. Polinukleotyd wedł ug zastrz. 1, znamienny tym, ż e jest nim DNA.
7. Polinukleotyd według zastrz. 1, znamienny tym, że jest genomowym DNA.
8. Polinukleotyd według zastrz. 1, znamienny tym, że jest nim cDNA.
9. Wektor znamienny tym, że zawiera polinukleotyd określony w zastrz. 1-8.
10. Wektor według zastrz. 9, znamienny tym, że ponadto zawiera polinukleotyd mający sekwencję nukleotydowa SEQ ID NO 37.
11. Wektor według zastrz. 9 albo 10, znamienny tym, że ponadto zawiera jedną lub więcej sekwencji nukleotydowych wybranych z SEQ ID NO 43, 45, 47 lub 49.
12. Wektor według zastrz. 9, znamienny tym, że nie zawiera sekwencji nukleotydowych SEQ ID NO 37, 43, 45, 47 lub 49.
13 Wektor według zastrz. 9, znamienny tym, że nie zawiera sekwencji nukleotydowych SEQ ID NO 43, 45, 47 lub 49.
14. Wektor według zastrz. 9, znamienny tym, że wytwarza się go z Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
15. Wektor według zastrz. 9, znamienny tym, że jest wektorem ekspresyjnym.
16. Komórka gospodarza transformowana wektorem określonym w dowolnym z zastrz. 9 do 15.
17. Komórka gospodarza według zastrz. 16, znamienna tym, że jest mikroorganizmem wytwarzającym ML-236B.
18. Komórka gospodarza według zastrz. 17, znamienna tym, że pochodzi z gatunku Penicillium.
19. Komórka gospodarza według zastrz. 17 albo 18, znamienna tym, że jest to komórka Penicillium citrinum.
20. Komórka gospodarza według zastrz. 16, znamienna tym, że jest to komórka Escherichia coli.
21. Komórka gospodarza według zastrz. 20, znamienna tym, że jest komórką Escherichia coli pSAKexpR SANK 72599 (FERM BP-7006).
22. Polipeptyd kodowany przez polinukleotyd określony w dowolnym z zastrz. 1 do 8.
23. Polipeptyd zawierający sekwencję SEQ ID NO 42, lub jej wariant, który ma przynajmniej
80% identyczności do SEQ ID NO 42 i który jest zdolny do przyspieszenia produkcji ML-236B w organizmie wytwarzającym ML236B.
24. Polipeptyd według zastrz. 22, znamienny tym, że ma sekwencję SEQ ID NO 42.
25. Sposób wytwarzania ML-236B, znamienny tym, że hoduje się komórki gospodarza określone w zastrz. 16 do 19 i następnie odzyskuje się ML-236B z hodowli.
26. Sposób według zastrz. 25, znamienny tym, że komórkę gospodarza transformuje się wektorem zawierającym SEQ ID NO 41.
140
PL 202 457 B1
27. Sposób według zastrz. 26, znamienny tym, że wektor nie zawiera sekwencji polinukleotydowej SEQ ID NO 37.
28. Sposób według zastrz. 26 albo 27, znamienny tym, że wektor nie zawiera co najmniej jednej sekwencji polinukleotydowej kodującej sekwencję aminokwasów odpowiadającą SEQ ID NO 44, 46, 48 i/lub 50
29. Sposób według zastrz. 25, znamienny tym, że wytwarzanie zachodzi w nieobecności jednego lub więcej zrekombinowanych polipeptydów mających sekwencje aminokwasowe odpowiadające SEQ ID NO 38, 44, 46, 48 i/lub 50.
30. Sposób według zastrz. 25, znamienny tym, że wytwarzanie zachodzi w nieobecności jednego lub więcej cDNA odpowiadającego SEQ ID NO 37, 43, 45, 47 i/lub 49.
31. Sposób wytwarzania prawastatyny, znamienny tym, że przeprowadza się sposób określony w zastrz. 25 do 30 i przekształca się ML-236B w prawastatynę.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000116591 | 2000-04-18 | ||
JP2000117458 | 2000-04-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
PL347118A1 PL347118A1 (en) | 2001-10-22 |
PL202457B1 true PL202457B1 (pl) | 2009-06-30 |
Family
ID=26590305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL347118A PL202457B1 (pl) | 2000-04-18 | 2001-04-18 | Polinukleotyd przyspieszający biosyntezę ML-236B, wektor, komórka gospodarza transformowana tym wektorem, polipeptyd, sposób wytwarzania ML-236B oraz sposób wytwarzania prawastatyny |
Country Status (24)
Country | Link |
---|---|
US (3) | US7056710B2 (pl) |
EP (1) | EP1149919B1 (pl) |
KR (1) | KR100632174B1 (pl) |
CN (1) | CN1325959B (pl) |
AR (1) | AR034550A1 (pl) |
AT (1) | ATE373101T1 (pl) |
AU (1) | AU783319B2 (pl) |
BR (1) | BR0101518A (pl) |
CA (1) | CA2342397C (pl) |
CY (1) | CY1106985T1 (pl) |
CZ (1) | CZ20011367A3 (pl) |
DE (1) | DE60130394T2 (pl) |
DK (1) | DK1149919T3 (pl) |
ES (1) | ES2293966T3 (pl) |
HK (1) | HK1037683A1 (pl) |
HU (1) | HUP0101569A3 (pl) |
IL (1) | IL142619A (pl) |
MX (1) | MXPA01003913A (pl) |
NO (1) | NO328653B1 (pl) |
NZ (1) | NZ511166A (pl) |
PL (1) | PL202457B1 (pl) |
PT (1) | PT1149919E (pl) |
RU (1) | RU2236463C2 (pl) |
TW (1) | TWI312807B (pl) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009540811A (ja) * | 2006-06-22 | 2009-11-26 | ディーエスエム アイピー アセッツ ビー.ブイ. | プラバスタチンの産生 |
WO2010034686A1 (en) * | 2008-09-24 | 2010-04-01 | Dsm Ip Assets B.V. | Improved statin production |
WO2010069914A1 (en) * | 2008-12-19 | 2010-06-24 | Dsm Ip Assets B.V. | Statin transcription regulators |
WO2015161856A1 (en) * | 2014-04-23 | 2015-10-29 | Danmarks Tekniske Universitet | Statin resistance and export |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS572240A (en) | 1980-06-06 | 1982-01-07 | Sankyo Co Ltd | Ml-236b derivative |
US5179013A (en) * | 1987-02-02 | 1993-01-12 | Sankyo Company, Limited | Cytochrome P-450 enzymes |
WO1995012661A1 (en) | 1993-11-02 | 1995-05-11 | Merck & Co., Inc. | Dna encoding triol polyketide synthase |
KR100186758B1 (ko) * | 1996-08-09 | 1999-04-01 | 영진약품공업 주식회사 | 프라바스타틴(pravastatin)전구체의제조방법 |
US6391583B1 (en) | 1998-12-18 | 2002-05-21 | Wisconsin Alumni Research Foundation | Method of producing antihypercholesterolemic agents |
AU6475800A (en) | 1999-08-11 | 2001-03-13 | Sankyo Company Limited | Ml-236b biosynthesis-associated dna |
FR2801648B1 (fr) * | 1999-11-30 | 2002-06-21 | Commissariat Energie Atomique | Injecteur a vapeur haute pression comportant un drain axial |
-
2001
- 2001-04-16 IL IL142619A patent/IL142619A/en not_active IP Right Cessation
- 2001-04-17 CA CA2342397A patent/CA2342397C/en not_active Expired - Fee Related
- 2001-04-17 RU RU2001110575/13A patent/RU2236463C2/ru not_active IP Right Cessation
- 2001-04-17 NO NO20011890A patent/NO328653B1/no not_active IP Right Cessation
- 2001-04-17 US US09/836,705 patent/US7056710B2/en not_active Expired - Fee Related
- 2001-04-17 CZ CZ20011367A patent/CZ20011367A3/cs unknown
- 2001-04-18 DK DK01303527T patent/DK1149919T3/da active
- 2001-04-18 AT AT01303527T patent/ATE373101T1/de not_active IP Right Cessation
- 2001-04-18 AR ARP010101821A patent/AR034550A1/es active IP Right Grant
- 2001-04-18 ES ES01303527T patent/ES2293966T3/es not_active Expired - Lifetime
- 2001-04-18 KR KR1020010020867A patent/KR100632174B1/ko not_active IP Right Cessation
- 2001-04-18 PT PT01303527T patent/PT1149919E/pt unknown
- 2001-04-18 CN CN011196556A patent/CN1325959B/zh not_active Expired - Fee Related
- 2001-04-18 BR BR0101518-4A patent/BR0101518A/pt not_active IP Right Cessation
- 2001-04-18 MX MXPA01003913A patent/MXPA01003913A/es active IP Right Grant
- 2001-04-18 AU AU37092/01A patent/AU783319B2/en not_active Ceased
- 2001-04-18 TW TW090109340A patent/TWI312807B/zh not_active IP Right Cessation
- 2001-04-18 PL PL347118A patent/PL202457B1/pl not_active IP Right Cessation
- 2001-04-18 NZ NZ511166A patent/NZ511166A/xx unknown
- 2001-04-18 EP EP01303527A patent/EP1149919B1/en not_active Expired - Lifetime
- 2001-04-18 DE DE60130394T patent/DE60130394T2/de not_active Expired - Lifetime
- 2001-04-18 HU HU0101569A patent/HUP0101569A3/hu unknown
- 2001-11-30 HK HK01108428A patent/HK1037683A1/xx not_active IP Right Cessation
-
2005
- 2005-05-11 US US11/127,939 patent/US20050214909A1/en not_active Abandoned
-
2006
- 2006-12-14 US US11/639,130 patent/US20070111293A1/en not_active Abandoned
-
2007
- 2007-11-08 CY CY20071101434T patent/CY1106985T1/el unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5849541A (en) | DNA encoding triol polyketide synthase | |
CN113684169B (zh) | 聚(3-羟基丁酸-4-羟基丁酸-5-羟基戊酸)三聚物及其微生物生产菌株构建 | |
WO2000037629A2 (en) | Method of producing antihypercholesterolemic agents | |
CN113227364A (zh) | 用于产生熊去氧胆酸及其前体的细胞和方法 | |
EP2029750A2 (en) | Production of pravastatin | |
JP2002518004A (ja) | エポチロン生合成用遺伝子 | |
US20070111293A1 (en) | Genes from a gene cluster | |
US6632650B1 (en) | Genes involved in cyclododecanone degradation pathway | |
US20030215930A1 (en) | Genes involved in cyclododecanone degradation pathway | |
JP2001169780A (ja) | ドコサヘキサエン酸生産細菌の遺伝子 | |
JP2002315579A (ja) | 遺伝子クラスター上の構造遺伝子 | |
JP2001112487A (ja) | Ml−236b生合成関連dna | |
KR20130097538A (ko) | 해양 미생물 하헬라 제주엔시스의 제주엔올라이드 생합성 유전자 클러스터 | |
CN114774443B (zh) | 生产小白菊内酯的重组酿酒酵母菌株及其构建方法 | |
CN115261243B (zh) | 重组酿酒酵母及其构建方法和应用 | |
JP2003116567A (ja) | 遺伝子クラスター | |
WO2001012814A1 (fr) | Adn lie a la biosynthese ml-236b | |
WO2000055304A2 (en) | A chc biosynthetic gene cluster | |
JP2006271380A (ja) | コマモナス属遺伝子破壊株を用いたステロイド代謝産物の製造方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Decisions on the lapse of the protection rights |
Effective date: 20110418 |