HU224492B1 - Eljárás L-lizin előállítására - Google Patents
Eljárás L-lizin előállítására Download PDFInfo
- Publication number
- HU224492B1 HU224492B1 HU9702360A HUP9702360A HU224492B1 HU 224492 B1 HU224492 B1 HU 224492B1 HU 9702360 A HU9702360 A HU 9702360A HU P9702360 A HUP9702360 A HU P9702360A HU 224492 B1 HU224492 B1 HU 224492B1
- Authority
- HU
- Hungary
- Prior art keywords
- dna
- amino acid
- seq
- lysine
- gly
- Prior art date
Links
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 title claims abstract description 216
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 27
- 239000004472 Lysine Substances 0.000 claims abstract description 94
- 235000019766 L-Lysine Nutrition 0.000 claims abstract description 92
- 238000000034 method Methods 0.000 claims abstract description 61
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 49
- 241000186254 coryneform bacterium Species 0.000 claims abstract description 37
- 241000186031 Corynebacteriaceae Species 0.000 claims abstract description 23
- 230000001580 bacterial effect Effects 0.000 claims abstract description 20
- 230000005764 inhibitory process Effects 0.000 claims abstract description 20
- 108010055400 Aspartate kinase Proteins 0.000 claims abstract description 19
- 108010064711 Homoserine dehydrogenase Proteins 0.000 claims abstract description 19
- 230000002829 reductive effect Effects 0.000 claims abstract description 19
- 108020004511 Recombinant DNA Proteins 0.000 claims abstract description 16
- 230000035945 sensitivity Effects 0.000 claims abstract description 12
- 108010003415 Aspartate Aminotransferases Proteins 0.000 claims abstract description 9
- 108030003594 Diaminopimelate decarboxylases Proteins 0.000 claims abstract description 9
- 102000004625 Aspartate Aminotransferases Human genes 0.000 claims abstract description 8
- 108010014468 Dihydrodipicolinate Reductase Proteins 0.000 claims abstract description 6
- 238000009825 accumulation Methods 0.000 claims abstract description 6
- WPLOVIFNBMNBPD-ATHMIXSHSA-N subtilin Chemical compound CC1SCC(NC2=O)C(=O)NC(CC(N)=O)C(=O)NC(C(=O)NC(CCCCN)C(=O)NC(C(C)CC)C(=O)NC(=C)C(=O)NC(CCCCN)C(O)=O)CSC(C)C2NC(=O)C(CC(C)C)NC(=O)C1NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C1NC(=O)C(=C/C)/NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C2NC(=O)CNC(=O)C3CCCN3C(=O)C(NC(=O)C3NC(=O)C(CC(C)C)NC(=O)C(=C)NC(=O)C(CCC(O)=O)NC(=O)C(NC(=O)C(CCCCN)NC(=O)C(N)CC=4C5=CC=CC=C5NC=4)CSC3)C(C)SC2)C(C)C)C(C)SC1)CC1=CC=CC=C1 WPLOVIFNBMNBPD-ATHMIXSHSA-N 0.000 claims abstract description 5
- 238000004113 cell culture Methods 0.000 claims abstract description 3
- 108020004414 DNA Proteins 0.000 claims description 125
- 150000001413 amino acids Chemical group 0.000 claims description 103
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 80
- 239000004473 Threonine Substances 0.000 claims description 23
- 229960002898 threonine Drugs 0.000 claims description 23
- 230000003362 replicative effect Effects 0.000 claims description 12
- 229960003767 alanine Drugs 0.000 claims description 9
- 235000004279 alanine Nutrition 0.000 claims description 8
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 7
- 238000012258 culturing Methods 0.000 claims description 5
- 108091000044 4-hydroxy-tetrahydrodipicolinate synthase Proteins 0.000 claims description 4
- 108090000854 Oxidoreductases Proteins 0.000 claims description 4
- 230000002378 acidificating effect Effects 0.000 claims description 4
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 2
- 125000000539 amino acid group Chemical group 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 60
- 230000008569 process Effects 0.000 abstract description 23
- 241000894006 Bacteria Species 0.000 abstract description 19
- 230000001965 increasing effect Effects 0.000 abstract description 18
- 108091026890 Coding region Proteins 0.000 abstract description 4
- 239000013612 plasmid Substances 0.000 description 136
- 101150035025 lysC gene Proteins 0.000 description 96
- 108090000623 proteins and genes Proteins 0.000 description 96
- 239000012634 fragment Substances 0.000 description 87
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 72
- 101150073654 dapB gene Proteins 0.000 description 62
- 239000002773 nucleotide Substances 0.000 description 61
- 125000003729 nucleotide group Chemical group 0.000 description 61
- 241000186226 Corynebacterium glutamicum Species 0.000 description 60
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 58
- 101150011371 dapA gene Proteins 0.000 description 56
- 101100465553 Dictyostelium discoideum psmB6 gene Proteins 0.000 description 55
- 101100169519 Pyrococcus abyssi (strain GE5 / Orsay) dapAL gene Proteins 0.000 description 55
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 49
- 101100492609 Talaromyces wortmannii astC gene Proteins 0.000 description 49
- 101150116772 aatA gene Proteins 0.000 description 49
- 101150005925 aspC gene Proteins 0.000 description 49
- 101150100742 dapL gene Proteins 0.000 description 49
- 101150033534 lysA gene Proteins 0.000 description 45
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 42
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 41
- 210000004027 cell Anatomy 0.000 description 41
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical class OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 39
- 229940024606 amino acid Drugs 0.000 description 39
- 235000001014 amino acid Nutrition 0.000 description 39
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 37
- 239000013598 vector Substances 0.000 description 33
- 230000035772 mutation Effects 0.000 description 31
- 238000003752 polymerase chain reaction Methods 0.000 description 31
- 241000588724 Escherichia coli Species 0.000 description 30
- 108020004707 nucleic acids Proteins 0.000 description 29
- 102000039446 nucleic acids Human genes 0.000 description 29
- 150000007523 nucleic acids Chemical class 0.000 description 29
- 239000013611 chromosomal DNA Substances 0.000 description 22
- 102000004169 proteins and genes Human genes 0.000 description 22
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 21
- 235000018102 proteins Nutrition 0.000 description 21
- 108010050848 glycylleucine Proteins 0.000 description 20
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 18
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000010276 construction Methods 0.000 description 17
- 238000002360 preparation method Methods 0.000 description 17
- 241000186216 Corynebacterium Species 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 15
- 241000186146 Brevibacterium Species 0.000 description 13
- 230000010076 replication Effects 0.000 description 13
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 12
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 12
- 239000013615 primer Substances 0.000 description 12
- 108010061238 threonyl-glycine Proteins 0.000 description 11
- 238000011282 treatment Methods 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 10
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 10
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 10
- 230000006820 DNA synthesis Effects 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 229940088598 enzyme Drugs 0.000 description 9
- 239000000835 fiber Substances 0.000 description 9
- 108010015792 glycyllysine Proteins 0.000 description 9
- 108010081551 glycylphenylalanine Proteins 0.000 description 9
- 230000002269 spontaneous effect Effects 0.000 description 9
- 230000003321 amplification Effects 0.000 description 8
- 108010013835 arginine glutamate Proteins 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 244000005700 microbiome Species 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 239000013600 plasmid vector Substances 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 108020001019 DNA Primers Proteins 0.000 description 7
- 239000003155 DNA primer Substances 0.000 description 7
- 101100098219 Dictyostelium discoideum argS1 gene Proteins 0.000 description 7
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 7
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 7
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 7
- 101150024756 argS gene Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 239000013599 cloning vector Substances 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 6
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 6
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 6
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 6
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 6
- 108010038633 aspartylglutamate Proteins 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 230000002195 synergetic effect Effects 0.000 description 6
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 5
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 5
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 5
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 5
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 5
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 5
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 5
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 5
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 5
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 5
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 5
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 5
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010077245 asparaginyl-proline Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 108010056582 methionylglutamic acid Proteins 0.000 description 5
- 108010068488 methionylphenylalanine Proteins 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 4
- 102100038238 Aromatic-L-amino-acid decarboxylase Human genes 0.000 description 4
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 4
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 4
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 4
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 4
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 4
- 101000833492 Homo sapiens Jouberin Proteins 0.000 description 4
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 description 4
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 4
- 102100024407 Jouberin Human genes 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 4
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 4
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 4
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 4
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 4
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 4
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 4
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 4
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- 101710159752 Poly(3-hydroxyalkanoate) polymerase subunit PhaE Proteins 0.000 description 4
- 101710130262 Probable Vpr-like protein Proteins 0.000 description 4
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 230000001851 biosynthetic effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 108010020688 glycylhistidine Proteins 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 231100000219 mutagenic Toxicity 0.000 description 4
- 230000003505 mutagenic effect Effects 0.000 description 4
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 4
- 229960004295 valine Drugs 0.000 description 4
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 3
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 3
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 3
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 3
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 3
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 3
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 3
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 3
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 3
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 3
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 3
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- ZOKPRHVIFAUJPV-GUBZILKMSA-N Cys-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O ZOKPRHVIFAUJPV-GUBZILKMSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 3
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 3
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 3
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 3
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 3
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 3
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 3
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 3
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 3
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 3
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 3
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 3
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 3
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 3
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 3
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 3
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 3
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 3
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 3
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 3
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 3
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 3
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 3
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 3
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 3
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 3
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 3
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 3
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 3
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 3
- CJNCVBHTDXKTMJ-CYDGBPFRSA-N Ser-Asp-Lys-Pro Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(O)=O CJNCVBHTDXKTMJ-CYDGBPFRSA-N 0.000 description 3
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 3
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 3
- CUTPSEKWUPZFLV-WISUUJSJSA-N Thr-Cys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(O)=O CUTPSEKWUPZFLV-WISUUJSJSA-N 0.000 description 3
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 3
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 3
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 3
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 3
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 3
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 3
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 229910000019 calcium carbonate Inorganic materials 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 101150066555 lacZ gene Proteins 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000003471 mutagenic agent Substances 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- OTUQSEPIIVBYEM-IHRRRGAJSA-N Arg-Asn-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OTUQSEPIIVBYEM-IHRRRGAJSA-N 0.000 description 2
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 2
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 2
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 2
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 2
- QJWLLRZTJFPCHA-STECZYCISA-N Arg-Tyr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QJWLLRZTJFPCHA-STECZYCISA-N 0.000 description 2
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 2
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 2
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 2
- OWUCNXMFJRFOFI-BQBZGAKWSA-N Asn-Gly-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OWUCNXMFJRFOFI-BQBZGAKWSA-N 0.000 description 2
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 2
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 2
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 2
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 2
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 2
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 2
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 2
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 2
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 2
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 2
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 2
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 2
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 2
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 2
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- 101000798402 Bacillus licheniformis Ornithine racemase Proteins 0.000 description 2
- 101710132601 Capsid protein Proteins 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108090000489 Carboxy-Lyases Proteins 0.000 description 2
- 102000004031 Carboxy-Lyases Human genes 0.000 description 2
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 2
- WZZGXXNRSZIQFC-VGDYDELISA-N Cys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N WZZGXXNRSZIQFC-VGDYDELISA-N 0.000 description 2
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 2
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 2
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 2
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 2
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 2
- SNFUTDLOCQQRQD-ZKWXMUAHSA-N Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SNFUTDLOCQQRQD-ZKWXMUAHSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- MCGNJCNXIMQCMN-DCAQKATOSA-N Glu-Met-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCC(O)=O MCGNJCNXIMQCMN-DCAQKATOSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 2
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 2
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 2
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 2
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 2
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 2
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- PCPOYRCAHPJXII-UWVGGRQHSA-N Gly-Lys-Met Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PCPOYRCAHPJXII-UWVGGRQHSA-N 0.000 description 2
- ZWRDOVYMQAAISL-UWVGGRQHSA-N Gly-Met-Lys Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCCN ZWRDOVYMQAAISL-UWVGGRQHSA-N 0.000 description 2
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 2
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 2
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 2
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 2
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 2
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 2
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 2
- CJGDTAHEMXLRMB-ULQDDVLXSA-N His-Arg-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CJGDTAHEMXLRMB-ULQDDVLXSA-N 0.000 description 2
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 2
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 2
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 2
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 2
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 2
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 2
- IXQGOKWTQPCIQM-YJRXYDGGSA-N His-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O IXQGOKWTQPCIQM-YJRXYDGGSA-N 0.000 description 2
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 2
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 2
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 2
- CCHSQWLCOOZREA-GMOBBJLQSA-N Ile-Asp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N CCHSQWLCOOZREA-GMOBBJLQSA-N 0.000 description 2
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 2
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 2
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 2
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 2
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 2
- BVRPESWOSNFUCJ-LKTVYLICSA-N Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 BVRPESWOSNFUCJ-LKTVYLICSA-N 0.000 description 2
- RWHRUZORDWZESH-ZQINRCPSSA-N Ile-Trp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RWHRUZORDWZESH-ZQINRCPSSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 2
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 2
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 2
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 2
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 2
- WEDDFMCSUNNZJR-WDSKDSINSA-N Met-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O WEDDFMCSUNNZJR-WDSKDSINSA-N 0.000 description 2
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 2
- PYUSHNKNPOHWEZ-YFKPBYRVSA-N N-formyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC=O PYUSHNKNPOHWEZ-YFKPBYRVSA-N 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 2
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 2
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 2
- AKJAKCBHLJGRBU-JYJNAYRXSA-N Phe-Glu-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AKJAKCBHLJGRBU-JYJNAYRXSA-N 0.000 description 2
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 2
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 2
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 2
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 2
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 2
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 2
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 2
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 2
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 2
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 2
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 2
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 2
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- 101710169459 Secreted protein ORF2 Proteins 0.000 description 2
- JJKSSJVYOVRJMZ-FXQIFTODSA-N Ser-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)CN=C(N)N JJKSSJVYOVRJMZ-FXQIFTODSA-N 0.000 description 2
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 2
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 2
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 2
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 2
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 2
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 2
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 2
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 2
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 2
- BONYBFXWMXBAND-GQGQLFGLSA-N Trp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BONYBFXWMXBAND-GQGQLFGLSA-N 0.000 description 2
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 2
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 2
- YBRHKUNWEYBZGT-WLTAIBSBSA-N Trp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-WLTAIBSBSA-N 0.000 description 2
- ZJPSMXCFEKMZFE-IHPCNDPISA-N Trp-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O ZJPSMXCFEKMZFE-IHPCNDPISA-N 0.000 description 2
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 2
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 2
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 2
- BODHJXJNRVRKFA-BZSNNMDCSA-N Tyr-Cys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BODHJXJNRVRKFA-BZSNNMDCSA-N 0.000 description 2
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 2
- JAQGKXUEKGKTKX-HOTGVXAUSA-N Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 2
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 2
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- -1 alanine amino acids Chemical class 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 229960002433 cysteine Drugs 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 108010054812 diprotin A Proteins 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000004459 forage Substances 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 229960003136 leucine Drugs 0.000 description 2
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010034507 methionyltryptophan Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 229960002429 proline Drugs 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 229960001153 serine Drugs 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- ALBODLTZUXKBGZ-JUUVMNCLSA-N (2s)-2-amino-3-phenylpropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1 ALBODLTZUXKBGZ-JUUVMNCLSA-N 0.000 description 1
- UWOCFOFVIBZJGH-UHFFFAOYSA-N 2,3-dihydrodipicolinic acid Chemical compound OC(=O)C1CC=CC(C(O)=O)=N1 UWOCFOFVIBZJGH-UHFFFAOYSA-N 0.000 description 1
- BOWUOGIPSRVRSJ-UHFFFAOYSA-N 2-aminohexano-6-lactam Chemical compound NC1CCCCNC1=O BOWUOGIPSRVRSJ-UHFFFAOYSA-N 0.000 description 1
- CXABZTLXNODUTD-UHFFFAOYSA-N 3-fluoropyruvic acid Chemical compound OC(=O)C(=O)CF CXABZTLXNODUTD-UHFFFAOYSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 1
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 1
- QYLJIYOGHRGUIH-CIUDSAMLSA-N Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N QYLJIYOGHRGUIH-CIUDSAMLSA-N 0.000 description 1
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 1
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 1
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 1
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- OQMGSMNZVHYDTQ-ZKWXMUAHSA-N Asp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N OQMGSMNZVHYDTQ-ZKWXMUAHSA-N 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 1
- 241000186248 Corynebacterium callunae Species 0.000 description 1
- 241001134763 Corynebacterium flavescens Species 0.000 description 1
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 1
- 241000133018 Corynebacterium melassecola Species 0.000 description 1
- 241000337023 Corynebacterium thermoaminogenes Species 0.000 description 1
- UFOBYROTHHYVGW-CIUDSAMLSA-N Cys-Cys-His Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O UFOBYROTHHYVGW-CIUDSAMLSA-N 0.000 description 1
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 1
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 1
- BIHMNDPWRUROFZ-JYJNAYRXSA-N Glu-His-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BIHMNDPWRUROFZ-JYJNAYRXSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 1
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 1
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- WVWZIPOJECFDAG-AVGNSLFASA-N Glu-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N WVWZIPOJECFDAG-AVGNSLFASA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 1
- PAZQYODKOZHXGA-SRVKXCTJSA-N Glu-Pro-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O PAZQYODKOZHXGA-SRVKXCTJSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 1
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 1
- SDTPKSOWFXBACN-GUBZILKMSA-N His-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O SDTPKSOWFXBACN-GUBZILKMSA-N 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 1
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 1
- DLTCGJZBNFOWFL-LKTVYLICSA-N His-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N DLTCGJZBNFOWFL-LKTVYLICSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- KTGFOCFYOZQVRJ-ZKWXMUAHSA-N Ile-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-ZKWXMUAHSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- UWBDLNOCIDGPQE-GUBZILKMSA-N Ile-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN UWBDLNOCIDGPQE-GUBZILKMSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- JDCQDJVYUXNCGF-SPOWBLRKSA-N Ile-Ser-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JDCQDJVYUXNCGF-SPOWBLRKSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- HODVZHLJUUWPKY-STECZYCISA-N Ile-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=C(O)C=C1 HODVZHLJUUWPKY-STECZYCISA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- 229930064664 L-arginine Natural products 0.000 description 1
- 235000014852 L-arginine Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- 229930182844 L-isoleucine Natural products 0.000 description 1
- 235000019454 L-leucine Nutrition 0.000 description 1
- 239000004395 L-leucine Substances 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- DUBAVOVZNZKEQQ-AVGNSLFASA-N Leu-Arg-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCN=C(N)N DUBAVOVZNZKEQQ-AVGNSLFASA-N 0.000 description 1
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- IGRMTQMIDNDFAA-UWVGGRQHSA-N Lys-His Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UWVGGRQHSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- NROQVSYLPRLJIP-PMVMPFDFSA-N Lys-Trp-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NROQVSYLPRLJIP-PMVMPFDFSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 1
- IYXDSYWCVVXSKB-CIUDSAMLSA-N Met-Asn-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IYXDSYWCVVXSKB-CIUDSAMLSA-N 0.000 description 1
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- DYTWOWJWJCBFLE-IHRRRGAJSA-N Met-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CNC=N1 DYTWOWJWJCBFLE-IHRRRGAJSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- 241000144155 Microbacterium ammoniaphilum Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 101100205189 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-5 gene Proteins 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- CPTJPDZTFNKFOU-MXAVVETBSA-N Phe-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N CPTJPDZTFNKFOU-MXAVVETBSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 1
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- QVIZLAUEAMQKGS-GUBZILKMSA-N Pro-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 QVIZLAUEAMQKGS-GUBZILKMSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- OCYROESYHWUPBP-CIUDSAMLSA-N Pro-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 OCYROESYHWUPBP-CIUDSAMLSA-N 0.000 description 1
- TYMBHHITTMGGPI-NAKRPEOUSA-N Pro-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 TYMBHHITTMGGPI-NAKRPEOUSA-N 0.000 description 1
- FJLODLCIOJUDRG-PYJNHQTQSA-N Pro-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FJLODLCIOJUDRG-PYJNHQTQSA-N 0.000 description 1
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 1
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 1
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- SBMNPABNWKXNBJ-BQBZGAKWSA-N Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO SBMNPABNWKXNBJ-BQBZGAKWSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 1
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- PEEAINPHPNDNGE-JQWIXIFHSA-N Trp-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 PEEAINPHPNDNGE-JQWIXIFHSA-N 0.000 description 1
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 1
- HHPSUFUXXBOFQY-AQZXSJQPSA-N Trp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O HHPSUFUXXBOFQY-AQZXSJQPSA-N 0.000 description 1
- FBHHJGOJWXHGDO-TUSQITKMSA-N Trp-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC=3C4=CC=CC=C4NC=3)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 FBHHJGOJWXHGDO-TUSQITKMSA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- IJUTXXAXQODRMW-KBPBESRZSA-N Tyr-Gly-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O IJUTXXAXQODRMW-KBPBESRZSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009697 arginine Nutrition 0.000 description 1
- 229960003121 arginine Drugs 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- LYQFWZFBNBDLEO-UHFFFAOYSA-M caesium bromide Chemical compound [Br-].[Cs+] LYQFWZFBNBDLEO-UHFFFAOYSA-M 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000001530 fumaric acid Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 1
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229910001410 inorganic ion Inorganic materials 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 229960003966 nicotinamide Drugs 0.000 description 1
- 235000005152 nicotinamide Nutrition 0.000 description 1
- 239000011570 nicotinamide Substances 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- KHPXUQMNIQBQEV-UHFFFAOYSA-L oxaloacetate(2-) Chemical compound [O-]C(=O)CC(=O)C([O-])=O KHPXUQMNIQBQEV-UHFFFAOYSA-L 0.000 description 1
- 238000010979 pH adjustment Methods 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 229960005190 phenylalanine Drugs 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- BZQWDGWNCKYCHR-DYNCTKRQSA-M sodium;(6r,7r)-3-[[[5-(dimethylamino)naphthalen-1-yl]sulfonylamino]methyl]-8-oxo-7-[(2-thiophen-2-ylacetyl)amino]-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylate Chemical compound [Na+].N([C@H]1[C@@H]2N(C1=O)C(=C(CS2)CNS(=O)(=O)C1=C2C=CC=C(C2=CC=C1)N(C)C)C([O-])=O)C(=O)CC1=CC=CS1 BZQWDGWNCKYCHR-DYNCTKRQSA-M 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000001384 succinic acid Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229960004441 tyrosine Drugs 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1217—Phosphotransferases with a carboxyl group as acceptor (2.7.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/08—Lysine; Diaminopimelic acid; Threonine; Valine
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
A találmány tárgyát egy korineform baktérium képezi, amely olyanaszpartokinázt hordoz, amely aszpartokinázban az L-lizin és L-treoninokozta visszacsatolásos gátlással szembeni érzékenység lényegesen levan csökkentve, és amely baktérium tartalmaz egy, dihidrodipikolinát-reduktázt kódoló, fokozott aktivitású DNS-szekvenciát, egydihidrodipikolinát-szintázt kódoló, fokozott aktivitású DNS-szekvenciát, egy, diamino-pimelát-dekarboxilázt kódoló, fokozottaktivitású DNS-szekvenciát és egy, aszpartát-amino-transzferáztkódoló, fokozott aktivitású DNS- szekvenciát. A találmány tárgyátképezi továbbá eljárás L-lizin termelésére, amely során az említettkorineform baktériumot megfelelő tápközegben tenyésztik, ami lehetővéteszi L-lizin termelődését és felhalmozódását a baktériumsejt-tenyészetben, majd az L-lizint a tenyészetből kinyerik. A találmánytárgyát képezi egy rekombináns DNS is, amely alkalmas találmányszerinti korineform baktériumok előállítására. A találmány szerintimegoldás alkalmas L-lizin ipari méretekben történő előállítására.
Description
A találmány tárgya eljárás L-lizin előállítására egy mikroorganizmus tenyésztése révén, amely mikroorganizmus előállítása egy, aminosavak vagy rokon vegyületek fermentációs előállítására alkalmas korineform baktérium módosításával, génsebészeti módszereken alapuló eljárásokkal történt. A találmány tárgyát képezik továbbá az említett módosított korineform baktériumok, valamint L-lizin-bioszintézisgéneket tartalmazó rekombináns DNS-ek, amelyek segítségével az említett módosítás megtörtént.
A találmány szerinti megoldás előnyösen alkalmazható L-lizin ipari előállítására fermentációs módszerekkel.
A takarmánydúsítóként használt L-lizint általában egy, a korineform baktériumok közé tartozó L-lizin-termelő mutáns törzs alkalmazásával állítják elő fermentációs módszerekkel. A jelenleg ismert különböző L-lizin-termelő baktériumokat mesterséges mutációval állították elő a korineform baktériumokhoz tartozó vad típusú törzsekből kiindulva.
Ami a korineform baktériumokat illeti, eddig feltártak egy, baktériumsejtekben autonóm módon replikálódni képes plazmidvektort, amely drogrezisztencia-markergéneket hordoz [4 514 502-es számú amerikai egyesült államokbeli szabadalmi leírás], valamint egy eljárást gének baktériumsejtekbe történő bejuttatására [például 2-207791-es számú közzétett japán szabadalmi bejelentés]. Feltártak továbbá egy lehetőséget arra, hogy L-treonint és L-izoleucint termelő baktériumokat a fent leírt módszerekkel tenyésszenek [4452890-es és 4442208-as számú amerikai egyesült államokbeli szabadalmi bejelentés], L-lizin-termelő baktérium tenyésztésére ismert egy eljárás, amely során egy, az L-lizin bioszintézisében szerepet játszó gént építenek be egy plazmidvektorba annak érdekében, hogy baktériumsejtekben amplifikálják a gént [például 56-160997-es számú közzétett japán szabadalmi bejelentés].
Az L-lizin bioszintézisében szerepet játszó ismert gének például a dihidropikolinát reduktázgénje [7-75578-as számú közzétett japán szabadalmi bejelentés] és az aszpartát-amino transzferázgénje [6-102028-as számú japán közzétételi irat], ahol egy, az L-lizin bioszintézisében részt vevő gént klónoztak, továbbá a foszfoenol-piruvát karboxilázgénje [60-87788-as számú közzétett japán szabadalmi bejelentés], a dihidrodipikolinát szintázgénje [6-55149-es számú japán szabadalmi bejelentés] és a diamino-pimelát dekarboxilázgénje [60-62994-es számú közzétett japán szabadalmi bejelentés], ahol gén amplifikálása hat az L-lizin termelékenységére.
Ismeretes olyan eset is, ahol az L-lizin bioszintézisében részt vevő egyik enzim vad típusára visszacsatolásos gátlás jellemző. Ebben az esetben az L-lizin-előállítás termelékenységét egy olyan enzimgén bejuttatásával növelték meg, amely a visszacsatoló gátlásra való érzékenységet megszüntető mutációt tartalmazott. Ilyen gén például az aszpartokinázgén [WO 94/25605-ös számú nemzetközi közzétételi irat].
A fent leírtak szerint sikert értek el az L-lizin bioszintetikus rendszerének génjei amplifikálása, illetve mutáns gének bevitele révén. Egy olyan mutáns aszpartokináz génjét tartalmazó korineform baktérium például, amely aszpartokináznak csökkent az érzékenysége lizin és treonin együttes gátlóhatásával szemben, számottevő mennyiségű L-lizint termel (kb. 25 g/L-t). Ennek a baktériumnak azonban a szaporodási sebessége kisebb, mint amelyik a vad típusú aszpartokinázgént hordozza. Azt is közölték, hogy az L-lizin előállításának termelékenysége tovább javítható azzal, hogy a mutáns aszpartokináz génjének bevitele mellett dihidropikolinát szintázgént is visznek be [Applied and Environmental Microbiology, 57 (6), 1746, (1991)]. Egy ilyen baktérium növekedési sebessége azonban tovább csökken.
Ami a dihidropikolinát reduktázgénjét illeti, kimutatták, hogy egy olyan korineform baktériumban, amelybe a gént bejuttatták, a dihidropikolinát reduktázaktivitása megnövekedett. Arra nézve azonban nem közöltek semmit, hogy ez hogyan hat az L-lizin termelékenységére [7-75578-as számú japán szabadalmi bejelentés].
Jelen körülmények között a korineform baktériumokat tekintve egy eset sem ismeretes, ahol az L-lizin-termelés jelentős javítása az L-lizin bioszintézisgénjei közül többnek a kombinálásával ne okozta volna a szaporodás sebességének csökkenését. Eddig nem közöltek még olyan esetet, amelyben egy, az L-lizin bioszintetikus rendszer részét képező gén aktivitásának fokozása mellett a baktérium szaporodási sebességét is növelni szándékozták volna.
A találmány szerinti megoldás célja L-lizin-termelés javítása korineform baktériumban az alább felsorolt enzimeket kódoló DNS-szekvenciájú genetikai anyagok alkalmazásával: aszpartokináz (amit a leírásban a továbbiakban „ΑΚ’’-val jelölünk, azzal a feltétellel, hogy egy AK-fehérjét kódoló gént a továbbiakban „lysC”-vel jelölünk, ha szükséges); dihidrodipikolinát-reduktáz (amit a leírásban a továbbiakban „DDPR”-rel jelölünk, azzal a feltétellel, hogy egy DDPR-fehérjét kódoló gént a továbbiakban „dapB”-vel jelölünk, ha szükséges); dihidrodipikolinát-szintáz (amit a leírásban a továbbiakban „DDPS”-sel jelölünk, azzal a feltétellel, hogy egy DDPS-fehérjét kódoló gént a továbbiakban „dapA”-val jelölünk, ha szükséges); diamino-pimelát-dekarboxiláz (amit a leírásban a továbbiakban „DDC”-vel jelölünk, azzal a feltétellel, hogy egy DDC-fehérjét kódoló gént a továbbiakban „lysA”-val jelölünk, ha szükséges); valamint az aszpartát-amino-transzferáz (amit a leírásban a továbbiakban „AAT”-nek jelölünk, azzal a feltétellel, hogy egy AAT-fehérjét kódoló gént a továbbiakban „aspC”-vel jelölünk, ha szükséges). A fenti enzimek korineform baktériumok sejtjeiben az L-lizin bioszintézisének fontos enzimjei.
A találmány szerinti megoldás elve azon a felismerésen alapul, hogy az L-lizin-termelést javítani lehet L-lizin és L-treonin együttes gátlóhatásával szemben lecsökkenteti érzékenységű mutáns AK-t (amit a leírásban a továbbiakban szükség esetén „mutáns AK”-ként jelölünk) kódoló mutáns lysC (amit a leírásban a továbbiakban szükség esetén „mutáns lysC”-ként jelölünk), dapA, dapB, lysA és aspC aktivitásának fokozásával, a géneket kombinálva.
HU 224 492 Β1
A találmány tárgyát képezi tehát egy, korineform baktériumok sejtjeiben autonóm módon replikálódni képes rekombináns DNS, amely tartalmaz egy olyan aszpartokinázt kódoló DNS-szekvenciát, amely aszpartokinázban az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenységet lényegesen lecsökkentettük, továbbá dihidrodipikolinát-reduktázt kódoló DNS-szekvenciát, dihidrodipikolinát-szintázt kódoló DNS-szekvenciát, diamino-pimelát-dekarboxilázt kódoló DNS-szekvenciát és aszpartát-amino-transzferázt kódoló DNS-szekvenciát.
A találmány egy másik szempontja szerint a találmány tárgyát képezi egy, L-lizin és L-treonin okozta visszacsatolásos gátlás tekintetében lényegesen lecsökkentett érzékenységű aszpartokináz génjét hordozó korineform baktérium, amely tartalmaz továbbá egy, dihidrodipikolinát-reduktázt kódoló fokozott aktivitású DNS-szekvenciát, egy, dihidrodipikolinát-szintázt kódoló fokozott aktivitású DNS-szekvenciát, egy, diamino-pimelát-dekarboxilázt kódoló fokozott aktivitású DNS-szekvenciát és egy, aszpartát-amino-transzferázt kódoló fokozott aktivitású DNS-szekvenciát.
A találmány egy további szempontja szerint a találmány tárgyát képezi egy eljárás L-lizin előállítására, azzal jellemezve, hogy a több lépésből álló eljárás során a fent leírt korineform baktériumok közül bármelyiket megfelelő tápközegben tenyésztjük, és így L-lizin termelődését és felhalmozódását váltjuk ki a baktériumsejt-tenyészetben, majd az L-lizint kinyerjük a tenyészetből.
A találmány tárgyát képezi továbbá egy, a szekvencialistában a 31-es azonosító számon megadott aminosavszekvenciát tartalmazó fehérjét kódoló DNS. Erre a DNS-re példa egy, a szekvencialistában a 30-as azonosító számon megadott nukleotidszekvencia 879. nukleotidjától a 2174. nukleotidjáig terjedő nukleotidszekvenciát tartalmazó DNS.
A találmány tárgyát képezi továbbá egy vektor, a pVK7, amelyik autonóm módon replikálódni képes Escherichia coli és Brevibacterium lactofermentum sejtjeiben, és tartalmaz egy többszörös klónozóhelyet, valamint lacZ'-t.
A korineform baktériumok a találmányi leírásban a mikroorganizmusok egy olyan csoportját jelentik - összhangban a Berge’s Manual of Determinative Bacteriology, 8. kiad. 559, (1974) meghatározásával -, amelyek aerob, Gram-pozitív, savnak nem ellenálló, pálcika alakú baktériumok, és amelyek nem képesek spórák képzésére. A korineform baktériumok magukban foglalják a Corynebacterium nemzetségbe tartozó baktériumokat, azokat a mind ez ideig a Brevibacterium nemzetségbe sorolt baktériumokat, amelyeket jelenleg a Corynebacterium nemzetségbe tartozó baktériumokkal együvé soroltak be, valamint a Corynebacterium nemzetségbe tartozó baktériumokkal közeli rokonságban levő Brevibacterium nemzetségbe tartozó baktériumokat.
A találmány szerinti megoldás megvalósítása révén a korineform baktérium L-lizin-termelő képességét és a termelt L-lizin mennyiségét növelni lehet.
Az alábbiakban röviden ismertetjük a leíráshoz csatolt ábrákat.
Az 1. ábra bemutatja a mutáns lysC-t tartalmazó p399AK9B és p399AKYB plazmidok elkészítésének folyamatát.
A 2. ábra bemutatja a dapB-t és a Brevi. ori.-t (Brevibacterium-eredetü replikációs origó) tartalmazó pDPRB plazmid elkészítésének folyamatát.
A 3. ábra bemutatja a dapA-t és a Brevi. ori.-t tartalmazó pDPSB plazmid elkészítésének folyamatát.
A 4. ábra bemutatja a lysA-t tartalmazó p299LYSA plazmid elkészítésének folyamatát.
Az 5. ábra bemutatja a lysA-t és a Brevi. ori.-t tartalmazó pLYSAB plazmid elkészítésének folyamatát.
A 6. ábra bemutatja a lysC-t, a dapB-t és a Brevi.
ori.-t tartalmazó pCRCAB plazmid elkészítésének folyamatát.
A 7. ábra bemutatja a lysC-t és a dapB-t tartalmazó pCB plazmid elkészítésének folyamatát.
A 8. ábra bemutatja a dapA-t, a dapB-t és a Brevi.
ori.-t tartalmazó pAB plazmid elkészítésének folyamatát.
A 9. ábra bemutatja a lysC-t, a dapA-t, a dapB-t és a Brevi. ori.-t tartalmazó pCAB plazmid elkészítésének folyamatát.
A 10. ábra bemutatja a lysC-t, a dapA-t, a dapB-t, a lysA-t és a Brevi. ori.-t tartalmazó pCABL plazmid elkészítésének folyamatát.
A 11. ábra bemutatja a korineform baktériumokhoz használható új klónozóvektorok, a pVK6 és a pVK7 elkészítésének folyamatát.
A 12. ábra bemutatja az aspC-t tartalmazó pOm plazmid elkészítésének folyamatát.
A 13. ábra bemutat két ORF-et egy ATCC13869ből származó kromoszomális DNS-fragmensen.
A 14. ábra bemutatja a pORF1 elkészítésének folyamatát.
1. Az L-lizin-bioszintézis találmány szerinti megoldásban alkalmazott génjeinek előállítása
Az L-lizin-bioszintézis találmány szerinti megoldásban alkalmazott génjeit a következő lépések során nyertük: baktériumból mint DNS-donorból kromoszomális DNS-t tisztítottunk, kromoszomális DNS-könyvtárat készítettünk plazmidvektor vagy hasonló alkalmazásával, kiválasztottunk egy, a kívánt gént hordozó törzset, majd a kiválasztott törzsből kinyertük a rekombináns DNS-t, amelybe a gént inszertáltuk. A DNS-donor, amelyből a találmány szerinti megoldásban alkalmazott L-lizin-bioszintézisgén származik, bármi lehet, feltéve, hogy a kiválasztott L-lizin-bioszintézisgén olyan enzimet kódol, amely korineform baktériumsejtekben működőképes. A DNS-donor azonban előnyösen egy korineform baktérium.
HU 224 492 Β1
A korineform baktériumból származó lysC-, dapA-, dapB- és a lysA-gének mindegyikének szekvenciája ismert. Ennek megfelelően előállíthatjuk őket a polimeráz-láncreakció (PCR) [White, T. J. és munkatársai, Trends. Génét. 5, 185, (1989)] módszerével amplifikálást végezve.
A találmány szerinti megoldásban alkalmazott L-lizin-bioszintézisgének mindegyike előállítható az alábbiakban példaképpen bemutatott módszerek valamelyikével.
(1) Mutáns lysC előállítása
A mutáns lysC-t tartalmazó DNS-fragmenst előállíthatjuk egy olyan mutáns törzsből, amelyben az AK L-lizin és L-treonin okozta szinergikus visszacsatolásos gátlással szembeni érzékenységet lényegesen lecsökkentettük [WO 94/25605-ös számú nemzetközi közzétételi irat]. Egy ilyen mutáns törzset úgy kaphatunk, hogy például egy korineform baktérium vad típusú törzse sejtjeinek egy csoportját mutációt okozó kezelésnek vetünk alá. Ilyen szokványos mutációs kezelés például az ultraibolya fénnyel történő besugárzás vagy egy mutációt okozó szer, például az N-metil-N’-nitro-N-nitrozoguanidin (NTG) alkalmazása. Az AK-aktivitást Miyajima és munkatársai által leírt módszer szerint végezhetjük [Journal of Biochemistry 63(2), 139, (1968)]. Ilyen mutáns törzsként legelőnyösebben egy L-lizin-termelő baktériumot, az AJ3445-öt (FERM P-1944) alkalmazhatjuk, amelyet a Brevibacterium lactofermentum ATT 0,13869 (amelynek jelenlegi, megváltozott neve Corynebacterium glutamicum) vad típusú törzsének mutációs kezelésével hozhatunk létre.
Egy másik lehetőség mutáns lysC előállítására az, hogy a plazmid-DNS-t, ami a vad típusú lysC-t tartalmazza, in vitro mutációs kezelésnek vetjük alá. Más szempontból ugyanis pontosan ismerjük a mutációt, ami az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenységet lényegesen lecsökkenti [WO 94/25605-ös számú nemzetközi közzétételi irat]. Ennek megfelelően a mutáns lysC-t előállíthatjuk a vad típusú lysC-ből ennek az ismeretnek az alapján például a helyspecifikus mutagenezis módszerével.
Egy, lysC-t tartalmazó fragmenst izolálhatunk egy korineform baktériumból úgy, hogy kromoszomális DNS-t állítunk elő Saito és Kimura módszerével például [Biochem. Biophys. Acta, 72, 619, (1963)], majd a lysC-t a PCR-módszerrel amplifikáljuk [White, T. J. és munkatársai, Trends. Génét. 5, 185, (1989)].
A DNS-láncindítókra példák a szekvencialistában az 1-es és a 2-es azonosító számon megadott 23 és 21 tagú nukleotidszekvenciák. Ezekkel például a Corynebacterium glutamicum ismert lysC-szekvenciájából 1643 bp-nyit lehet amplifikálni [Molecular Microbiology 5(5), 1197, (1991); Mól. Gén. Génét., 224, 317, (1990)]. A DNS-t szokványos módszerrel, például az .Applied Biosystems model 380B” DNS-szintetizáló készülékét alkalmazva szintetizálhatjuk meg [Tetrahedron Letters 22, 1859, (1981)]. A PCR-t elvégezhetjük egy „DNA Thermal Cycler Model PJ2000” PCR-készüléket (Takara Shuzo) alkalmazva Taq DNS-polimeráz segítségével, a forgalmazó cég által javasolt módszer alapján.
A PCR segítségével amplifikált lysC-t előnyösen olyan vektor-DNS-sel ligáljuk, amelyik autonóm módon replikálódni képes E. coli és/vagy valamely korineform baktérium sejtjeiben. így tehát rekombináns DNS-t készítünk, amelyet visszajuttatunk az E. co//-sejtekbe. Ezek az előkészületek megkönnyítik a soron következő műveleteket. Az E. co/í-sejtekben autonóm módon replikálódni képes vektor előnyösen egy plazmidvektor, amelyik előnyösen autonóm módon replikálódni képes olyan gazdasejtekbe, amelyek például a következő plazmidokat hordozzák: pUC19, pUC18, pBR322, pHSG299, pHSG399, pHSG398, RSF1010.
Ha egy olyan DNS-fragmenst inszertálunk ezekbe a vektorokba, amely képessé teszi őket korineform baktériumban való autonóm módon történő replikálódásra, úgynevezett átviteli („shuttle) vektorként alkalmazható vektorokhoz jutunk, amelyek autonóm módon replikálódni képesek mind E. coliban, mind korineform baktériumban.
Ilyen átviteli vektorok az alábbiak. A vektorokat hordozó mikroorganizmusokat és azok nyilvántartási számait nemzetközi deponálási hatóságoknál (zárójelben) szintén feltüntetjük.
pHC4: Escherichia coli AJ12617 (FERM BP-3532) pAJ655: Escherichia coli AJ 11882 (FERM BP-136)
Corynebacterium glutamicum SR8201 (ATCC39135) pAJ1844: Escherichia coli AJ11883 (FERM BP-137) Corynebacterium glutamicum SR8202 (ATCC39136) pAJ611: Escherichia coli AJ11884 (FERM BP-138) pAJ3148: Corynebacterium glutamicum SR8203 (ATCC39137) pAJ440: Bacillus subtilis AJ11901 (FERM BP-140) Ezek a vektorok az alább leírtak szerint nyerhetők ki a deponált mikroorganizmusokból. A növekedésük logaritmikus fázisában összegyűjtött sejteket lizozim és SDS jelenlétében feltárjuk, majd a feltárt sejteket 30 000 g-vel lecentrifugáljuk. A felülúszóhoz polietilénglikolt adunk, majd cézium-bromidos egyensúlyi sűrűséggradiens-centrifugálással frakcionáljuk és tisztítjuk etidium-bromid jelenlétében.
Az E. coli-sejteket transzformálhatjuk például plazmid bejuttatásával, amit végezhetünk például D. L. Morrison módszerével [Methods in Enzymology, 68, 326, (1970)], vagy egy másik módszerrel, ahol a befogadó sejtet kalcium-kloriddal kezeljük, hogy a DNS-sel szembeni áteresztőképességét megnöveljük [M. Mandel és A. Higa, J. Mól. Bioi., 53, 159, (1970)].
A vad típusú lysC-t egy, AK-ra nézve vad típusú törzsből kaphatjuk meg lysC a fent leírtak szerinti izolálásával, a mutáns lysC-t pedig úgy, hogy egy, AK-ra nézve mutáns törzsből izolálunk lysC-t, ugyancsak a fentiek alapján.
A vad típusú lysC-t tartalmazó DNS-fragmens nukleotidszekvenciájára példa a szekvencialistában a 3-as azonosító számon megadott szekvencia. A vad típusú AK-fehérje α-alegységének nukleotidszekvenciából származtatott aminosavszekvenciáját a DNS-szekvenciával együtt mutatja a szekvencialistában a 4-es azo4
HU 224 492 Β1 nősítő számon megadott szekvencia. Az aminosavszekvenciát önmagában a szekvencialistában az 5-ös azonosító számon megadott szekvencia mutatja. A vad típusú AK-fehérje β-alegységének nukleotidszekvenciából származtatott aminosavszekvenciáját a DNS-szekvenciával együtt mutatja a szekvencialistában a 6-os azonosító számon megadott szekvencia. Az aminosavszekvenciát önmagában a szekvencialistában a 7-es azonosító számon megadott szekvencia mutatja. Az alegységek mindegyikében GTG a kezdőkodon, itt azonban az ennek megfelelő aminosav a metionin. Az ennek a kodonnak megfelelő aminosav lehet mindazonáltal metionin, valin és formil-metionin egyaránt.
A találmány szerinti megoldásban alkalmazott mutáns lysC bármilyen lehet, feltéve, hogy olyan AK-t kódol, ahol az L-lizin és L-treonin okozta szinergikus visszacsatolásos gátlással szembeni érzékenység lényegesen le van csökkentve. A mutáns lysC-re példa azonban az, amely olyan AK-t kódol, ahol az aminosavak közül a vad típusú AK α-alegységének N-terminálisától számított 279. alaninnak megfelelő aminosav más, de nem savas aminosavra van kicserélve, és a β-alegységének N-terminálisától számított 30. alaninnak megfelelő aminosav más, de nem savas aminosavra van kicserélve. A vad típusú AK a-alegységének aminosavszekvenciája a szekvencialistában az 5-ös azonosító számon megadott szekvencia, míg a β-alegységének aminosavszekvenciája a szekvencialistában a 7-es azonosító számon megadott szekvencia.
A nem savas, alanintól különböző aminosavak előnyösen például a következők lehetnek: treonin, arginin, cisztein, fenil-alanin, prolin, szerin, tirozin és valin.
A helyettesítő aminosavnak megfelelő kodon nem csupán egyféle lehet, de az adott aminosavat kell kódolnia. Megjósolható, hogy a vad típusú AK-k aminosavszekvenciái kismértékben eltérhetnek egymástól baktériumfajonként és baktériumtörzsenként. Azok az AK-k, amelyeken egy vagy több helyen mutációt hajtottak végre, és így egy vagy több aminosavat például szubsztituáltak, deletáltak vagy inszertáltak, de ez a fentiekkel egybehangzóan nem volt hatással az enzim aktivitására, szintén alkalmazhatók a találmány szerinti megoldás megvalósítása során. Spontán mutációt tartalmazó AK-t kódoló DNS-t olyan DNS izolálásával nyerhetünk, amelyik képes hibridizálni például a szekvencialistában a 3-as azonosító számon megadott nukleotidszekvencia egy részével sztringens körülmények között. A leírásban használt „sztringens körülmények” alatt olyan körülményeket értünk, amelyek között a kívánt specifikus hibrid keletkezik, de más nemspecifikus hibridizáció nem következik be. Nem könnyű ezeket a körülményeket számértékekkel világosan kifejezni. Ilyenekre példaképpen megemlíthetünk azonban olyan körülményeket, amelyek közepette nagymértékű homológiát mutató nukleinsavak, például nem kevesebb mint 90%-ban homológ DNS-ek hibridizálnak egymással, és ennél kisebb homológiát mutató nukleinsavak nem hibridizálnak egymással, vagy olyan körülményeket, ahol a hőmérséklet egy teljesen összeilleszkedett hibrid olvadási hőmérséklete, és annál 30 °C-kal alacsonyabb hőmérséklet között, előnyösen az olvadási hőmérséklet és annál 20 °C-kal alacsonyabb hőmérséklet között van, a sókoncentráció pedig megfelel 1*SSC-nek, előnyösen pedig 0,1*SSC-nek.
Egyéb AK-kat, amelyeken mesterséges mutációt végzünk, például egy vagy több aminosav szubsztitúcióját, delécióját vagy inszercióját, szintén alkalmazhatunk, feltéve, hogy a mutáció nem fejt ki lényeges befolyást az AK-aktivitásra, és az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenység lecsökkentett mivoltára. Mesterséges mutációt hordozó, AK-t kódoló DNS-t úgy kaphatunk, hogy a nukleotidszekvenciát szubsztitúcióval, delécióval vagy inszercióval egy adott helyen módosítjuk például helyspecifikus mutagenezissel. Hasonlóképpen, mutációt hordozó lysC-t valamilyen ismert, mutációt okozó kezelési módszerrel (mutagén kezeléssel) állíthatunk elő. Ilyen módszer például a lysC-t tartalmazó DNS in vitro kezelése hidroxil-aminnal vagy hasonlóval, például a lysC-t tartalmazó DNS-t hordozó mikroorganizmus kezelése mutagénekkel, mint például az ultraibolya-besugárzás vagy a szokványos mesterséges mutagenezis során alkalmazott mutagén szer, mint például az N-metil-N-nitro-N-nitrozoguanidin (NTG), vagy a salétromsav. A mutagén kezelés után a mutált helyet meghatározhatjuk úgy, hogy kiválasztunk egy DNS-t vagy mikroorganizmust, amely olyan AK-aktivitással rendelkező AK-t kódol vagy termel, amely AK aminosavszekvenciáját megváltoztattuk a mutagén kezelésnek alávetett DNS által kódolt vagy mikroorganizmus által termelt AK-hoz képest. A bejuttatott mutáció helye bármi lehet, feltéve, hogy az AK-aktivitásra és az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenység lényegesen lecsökkenteti mivoltára nincs lényeges hatása. A mutációk száma és minősége a helytől és a megváltoztatott aminosav minőségétől, illetve a fehérje térszerkezetében elfoglalt helyétől függően változó, és nem korlátozza más, csupán az a feltétel, hogy ne legyen lényeges hatása az AK-aktivitásra és az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenység lényegesen lecsökkented mivoltára. A mutációk száma általában 1—20-ig terjedhet, előnyösen 1-10-ig.
A fent leírt mutációt hordozó AK aminosavszekvenciájában a fentiekben körülírt alaninnak megfelelő aminosav meghatározása szakember számára nem jelent nehézséget.
A p399AK9B lysC-ben mutáns plazmid AJ12036 törzsbe (FERM BP-734) mint vad típusú Brevibacterium lactofermentum törzsbe történt bejuttatásával kapott AJ12691-es törzset 1992. április 10-én helyeztük letétbe FERM P-12918 nyilvántartási számon a „National Institute of Bioscience and Humán Technology of Agency of Industrial Science and Technology of Ministry of International Trade and Industry” Intézetnél (1-3, Higashi 1-chome, Tsukuba-shi, Ibaraki-ken, 305 Japan), majd 1995. február 10-én a Budapesti Egyezménynek megfelelően is letétbe helyeztük a FERM ΒΡ-4999-es nyilvántartási számon.
HU 224 492 Β1 (2) dapB előállítása
Egy, dapB-t tartalmazó DNS-fragmenst korineform baktérium kromoszómájából PCR segítségével állíthatunk elő. DNS-donorként bármilyen törzs választható, a leírásban példaképpen a Brevibacterium lactofermentum ATCC13869-es törzs szerepel.
A DDPR-t kódoló gén DNS-szekvenciája a Brevibacterium lactofermentum esetében ismert [Journal of Bacteriology 175(9), 2743, (1993)J, ennek alapján pedig PCR-láncindítók készíthetők. Ilyen PCR-láncindítók például azok a 23 bázispárból álló DNS-szakaszok, amelyek a szekvencialistában a 8-as, valamint a 9-es azonosító számon vannak megadva. A DNS szintézise, a PCR, valamint a kapott dapB-t tartalmazó plazmid előállítása ugyanúgy végezhető el, mint azt fent a lysC esetében leírtuk.
A dapB-t tartalmazó DNS-fragmens nukleotidszekvenciája, valamint a nukleotidszekvencia által kódolt származtatott aminosavszekvencia a szekvencialistában a 10-es azonosító számon van megadva, az aminosavszekvencia önmagában pedig a 11-es azonosító számon. Az ezeket az aminosavszekvenciákat kódoló DNS-fragmenseken kívül a találmány szerinti megoldásban alkalmazhatunk a szekvencialistában a 11-es azonosító számon megadott szekvenciával lényegében azonos aminosavszekvenciákat kódoló DNS-fragmenseket is, nevezetesen olyan aminosavszekvenciákat, amelyekben egy vagy több aminosavat szubsztituáltunk, deletáltunk vagy inszertáltunk, feltéve, hogy ennek nem volt lényeges hatása a DDPR-aktivitásra. Spontán vagy mesterséges mutációt tartalmazó dapB-t ugyanolyan módon kaphatunk, mint spontán vagy mesterséges mutációt tartalmazó AK-t kódoló DNS-t, amelyben a mutációnak nincs hatása az AK aktivitására és az L-lizin és L-treonin okozta szinergikus visszacsatolásos gátlással szembeni érzékenység lényegesen lecsökkentett mivoltára.
A dapB-t tartalmazó, az alábbiakban példában leírt módon kapott pCRDAPB plazmid E. coli JM109 törzsbe történt bejuttatásával kapott AJ13107-es törzset 1995. május 26-án helyeztük letétbe FERM BP-5114 nyilvántartási számon a „National Institute of Bioscience and Humán Technology of Agency of Industrial Science and Technology of Ministry of International Trade and Industry” Intézetnél (1-3, Higashi 1-chome, Tsukuba-shi, Ibaraki-ken, 305 Japan), a Budapesti Egyezménynek megfelelően.
(3) dapA előállítása
Egy, dapA-t tartalmazó DNS-fragmenst korineform baktérium kromoszómájából PCR segítségével állíthatunk elő. DNS-donorként bármilyen törzs választható, a leírásban példaképpen a Brevibacterium lactofermentum ATCC13869-es törzs szerepel.
A DDPS-t kódoló gén DNS-szekvenciája Corynebacterium glutamícum esetében ismert [Nucleic Acids. Rés., 18(21), 6421, (1990); EMBL nyilvántartási szám: X53993], ennek alapján pedig PCR-láncindítók készíthetők. Ilyen PCR-láncindítók például azok a 23 bázispárból álló DNS-szakaszok, amelyek a szekvencialistában a 12-es, valamint a 13-as azonosító számon vannak megadva. A DNS szintézise, a PCR, valamint a kapott dapA-t tartalmazó plazmid előállítása ugyanúgy végezhető el, mint azt fent a lysC esetében leírtuk.
A dapA-t tartalmazó DNS-fragmens nukleotidszekvenciája, valamint a nukleotidszekvencia által kódolt származtatott aminosavszekvencia a szekvencialistában a 14-es azonosító számon van megadva, az aminosavszekvencia önmagában pedig a 15-ös azonosító számon. Az ezeket az aminosavszekvenciákat kódoló DNS-fragmenseken kívül a találmány szerinti megoldásban alkalmazhatunk a szekvencialistában a 15-ös azonosító számon megadott szekvenciával lényegében azonos aminosavszekvenciákat kódoló DNS-fragmenseket is, nevezetesen olyan aminosavszekvenciákat, amelyekben egy vagy több aminosavat szubsztituáltunk, deletáltunk vagy inszertáltunk, feltéve, hogy ennek nem volt lényeges hatása a DDPS-aktivitásra. Spontán vagy mesterséges mutációt tartalmazó dapA-t ugyanolyan módon kaphatunk, mint spontán vagy mesterséges mutációt tartalmazó AK-t kódoló DNS-t, amelyben a mutációnak nincs hatása az AK aktivitására és az L-lizin és L-treonin okozta szinergikus visszacsatolásos gátlással szembeni érzékenység lényegesen lecsökkentett mivoltára.
A dapA-t tartalmazó, az alábbiakban példában leírt módon kapott pCRDAPA plazmid E. coli JM109 törzsbe történt bejuttatásával kapott AJ13106-os törzset 1995. május 26-án helyeztük letétbe FERM BP-5113 nyilvántartási számon a „National Institute of Bioscience and Humán Technology of Agency of Industrial Science and Technology of Ministry of International Trade and Industry” Intézetnél (1-3, Higashi 1-chome, Tsukuba-shi, Ibaraki-ken, 305 Japan), a Budapesti Egyezménynek megfelelően.
(4) lysA előállitása
Egy, lysA-t tartalmazó DNS-fragmenst korineform baktérium kromoszómájából PCR segítségével állíthatunk elő. DNS-donorként bármilyen törzs választható, a leírásban példaképpen a Brevibacterium lactofermentum ATCC13869-es törzs szerepel.
A korineform baktériumokban a lysA és az argS (arginil-tRNS-szintáz génje) egy operont alkot. A lysA expresszióját az argS-től 5’-irányban elhelyezkedő promoter irányítja [Journal of Bactriology, nov., 7356 (1993)]. Ezen gének DNS-szekvenciái a Corynebacterium glutamícum esetében ismertek [Molecular Microbiology 4(11), 1819, (1990); Molecular and General Genetics, 212, 112 (1988)], ennek alapján pedig PCR-láncindítók készíthetők. Ilyen PCR-láncindítók például azok a 23 bázispárból álló DNS-szakaszok, amelyek a szekvencialistában a 16-os, valamint azok, amelyek a 17-es azonosító számon vannak megadva. Előbbiek megfelelnek a Molecular Microbiology alábbi cikkében a 11-es és a 33-as számon megadott oligonukleotidoknak [Molecular Microbiology 4(11), 1819, (1990)], utóbbiak (a 17-es azonosító számon megadottak) megfelelnek a Molecular and General Genetics alábbi cikkében az 1370-es és az 1392-es számon megadott oligonukleotidoknak [Molecular and General Genetics, 212, 112 (1988)]. A DNS szintézise, a PCR,
HU 224 492 Β1 valamint a kapott lysA-t tartalmazó plazmid előállítása ugyanúgy végezhető el, mint azt fent a lysC esetében leírtuk.
Az alábbiakban leírt példában egy promotert, az argS-t és lysA-t tartalmazó DNS-fragmenst alkalmaztuk a lysA aktivitásának fokozására. Az argS azonban nem képezi a találmány szerinti megoldás nélkülözhetetlen elemét. Alkalmazhatunk egy olyan DNS-fragmenst is, amelyben a lysA-t közvetlenül a promoter közelébe ligáltuk, tőle 3’-irányban.
Az argS-t és a lysA-t tartalmazó DNS-fragmens nukleotidszekvenciája, valamint a nukleotidszekvencia által kódolt származtatott aminosavszekvencia a szekvencialistában a 18-as azonosító számon van megadva, egy argS által kódolt aminosavszekvencia példaképpen a 19-es azonosító számon, továbbá egy lysA által kódolt aminosavszekvencia példaképpen a 20-as azonosító számon. Az ezeket az aminosavszekvenciákat kódoló DNS-fragmenseken kívül a találmány szerinti megoldásban alkalmazhatunk a szekvencialistában a 20-as azonosító számon megadott szekvenciával lényegében azonos aminosavszekvenciákat kódoló DNS-fragmenseket is, nevezetesen olyan aminosavszekvenciákat, amelyekben egy vagy több aminosavat szubsztituáltunk, deletáltunk vagy inszertáltunk, feltéve, hogy ennek nem volt lényeges hatása a DDC-aktivitásra. Spontán vagy mesterséges mutációt tartalmazó lysA-t ugyanolyan módon kaphatunk, mint spontán vagy mesterséges mutációt tartalmazó AK-t kódoló DNS-t, amelyben a mutációnak nincs hatása az AK aktivitására és az L-lizin és L-treonin okozta szinergikus visszacsatolásos gátlással szembeni érzékenység lényegesen lecsökkentett mivoltára.
(5) aspC előállítása
Az aspC-t tartalmazó DNS-fragmenst olyan mikroorganizmus kromoszómájából készített génkönyvtárból lehet előállítani, mint például a korineform baktériumok vagy az Escherichia nemzetséghez tartozó baktériumok, kimutatásra egy AAT-hiányos törzs auxotróf sajátságával szembeni komplementaritást kihasználva. DNS-donorként választható bármilyen korineform baktériumtörzs, a leírásban példaképpen a Brevibacterium lactofermentum ATCC13869-es törzs szerepel. Választható továbbá DNS-donorként bármilyen E. coli-törzs is, a leírásban példaképpen az E. co//'-JM109-es törzs szerepel.
Előnyösen korineform baktériumból származó aspC előállítására ismert egy eljárás [6-102028-as számú japán szabadalmi irat], amely eljárással aspC előállítható.
AAT-t kódoló DNS-szekvencia ismert az E. coli esetében [Kuramitsu, S. és munkatársai, Journal of Biochemistry, 97(4), 1259, (1985)], ennek alapján pedig PCR-láncindítók készíthetők. Ilyen PCR-láncindítók például azok a 20 bázispárból álló DNS-szakaszok, amelyek a szekvencialistában a 21-es, valamint a 22-es azonosító számon vannak megadva. A DNS szintézise, a PCR, valamint a kapott dapA-t tartalmazó plazmid előállítása ugyanúgy végezhető el, mint azt fent a lysC esetében leírtuk.
Az aspC-t tartalmazó DNS-fragmens nukleotidszekvenciája, valamint a nukleotidszekvencia által kódolt származtatott aminosavszekvencia a szekvencialistában a 23-as azonosító számon van megadva, az aminosavszekvencia önmagában pedig a 24-es azonosító számon. Egy további, aspC-t tartalmazó DNS-fragmens nukleotidszekvenciája, valamint a nukleotidszekvencia által kódolt származtatott aminosavszekvencia a szekvencialistában a 30-as azonosító számon van megadva, az aminosavszekvencia önmagában pedig a 31-es azonosító számon. Az ezeket az aminosavszekvenciákat kódoló DNS-fragmenseken kívül a találmány szerinti megoldásban alkalmazhatunk a szekvencialistában a 24-es vagy 31-es azonosító számon megadott szekvenciával lényegében azonos aminosavszekvenciákat kódoló DNS-fragmenseket is, nevezetesen olyan aminosavszekvenciákat, amelyekben egy vagy több aminosavat szubsztituáltunk, deletáltunk vagy inszertáltunk, feltéve, hogy ennek nem volt lényeges hatása a AAT-aktivitásra. Spontán vagy mesterséges mutációt tartalmazó aspC-t ugyanolyan módon kaphatunk, mint spontán vagy mesterséges mutációt tartalmazó AK-t kódoló DNS-t, amelyben a mutációnak nincs hatása az AK aktivitására és az L-lizin és L-treonin okozta szinergikus visszacsatolásos gátlással szembeni érzékenység lényegesen lecsökkentett mivoltára.
A szekvencialistában a 30-as azonosító számon megadott nukleotidszekvencia a Corynebacterium lactofermentumböl származik, és első előállítása a 9. példában alább leírt, találmány szerinti eljárással történt. A találmány tárgyát képezi tehát egy, a szekvencialista 31-es azonosító számán megadott aminosavszekvenciát tartalmazó fehérjét kódoló DNS. Ilyen DNS például egy, a szekvencialistában a 30-as azonosító számon megadott nukleotidszekvencia 879. és 2174. nukleotidja közötti nukleotidszekvenciát tartalmazó DNS.
2. A találmány szerinti rekombináns DNS és korineform baktérium
A találmány szerinti korineform baktérium hordoz egy aszpartokinázt (mutáns AK), amely AK-ban az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenységet lényegesen lecsökkentettük, továbbá benne a dihidrodipikolinát-reduktázt kódoló DNS-szekvencia, a dihidrodipikolinát-szintázt kódoló DNS-szekvencia, a diamino-pimelinát-dekarboxilázt kódoló DNS-szekvencia és az aszpartát-amino-transzferázt kódoló DNS-szekvencia aktivitása fokozott.
A „fokozott aktivitású” a leírásban használt értelemben azt jelenti, hogy a DNS által kódolt enzim intracelluláris aktivitása megnövekedett, például a gén kópiaszámának növelése, erős promoter alkalmazása, nagy specifikus aktivitású enzimet kódoló gén alkalmazása vagy ezen módszerek kombinálása révén.
A mutáns AK-t hordozó korineform baktérium termelheti a mutáns aszpartokinázt mutáció eredményeképpen, vagy lehet olyan is, amely a mutáns lysC bejuttatásával van transzformálva.
HU 224 492 Β1
A fent leírt DNS bejuttatására alkalmas korineform baktériumokra szolgáljanak példaként az alábbi lizintermelő vad típusú törzsek:
Corynebacterium acetoacidophilum ATCC13870; Corynebacteríum acetoglutamicum ATCC15806; Corynebacterium callunae ATCC15991; Corynebacterium glutamicum ATCC13032; (Brevibacterium divaricatum) ATCC14020; (Brevibacterium lactofermentum) ATCC13869; (Corynebacterium lilium) ATCC15990; (Corynebacterium flavum) ATCC14067; Corynebacterium melassecola ATCC17965; Brevibacterium saccharolyticum ATCC14066; Brevibacterium immariophilum ATCC14068; Brevibacterium roseum ATCC13825;
Brevibacterium thiogenitalis ATCC19240; Microbacterium ammoniaphilum ATCC15354; Corynebacterium thermoaminogenes AJ 12340 (FERIM BP-1539).
A fenti baktériumtörzseken kívül mások is alkalmazhatók gazdaként, ilyenek lehetnek például L-lizin termelésére képes mutáns törzsek, amelyek a korábban említett törzsek leszármazottai. Ilyen mesterséges mutáns törzsek például a következők: S-(2-aminometilj-ciszteinnel (a továbbiakban „AEC) szemben rezisztens mutáns törzsek, ilyen például a Brevibacterium lactofermentum AJ11087 (NRRL B—1147) (56-1914-es, 56-1915-ös, 57-14157-es, 57-14158-as, 57-30474-es, 58-10075-ös, 59-4993-as, 61-35840-es, 62-24074-es, 62-36673-as, 5-11958-as, 7-112437-es és 7-112438-as számú japán közzétételi iratok); mutáns törzsek, amelyek növekedéséhez aminosavak, például L-homoszerin szükségesek (48-28078-as és 56-6499-es számú japán szabadalmi bejelentések); mutáns törzsek, amelyek AEC-vel szemben rezisztensek és növekedésükhöz aminosavak, például L-leucin, L-homoszerin, L-prolin, L-szerin, L-arginin, L-alanin és L-valin szükségesek (3708395-ös és 3825472-es számú amerikai egyesült államokbeli szabadalmi bejelentés); L-lizint termelő mutáns törzsek, amelyek DL-a-amino-kaprolaktámmal, a-amino-lauril-laktámmal, aszpartátanalógokkal, „szulfa”-hatóanyagokkal, kinoidokkal és N-lauril-leucinnel szemben ellenállóak;); L-lizint termelő mutáns törzsek, amelyek oxálacetát-dekarboxiláz és a légzőrendszer enzimjeinek inhibitoraival szemben ellenállóak (50-53588-as, 50-31093-as, 52-102498-as, 53-9394-es, 53-86089-es, 55-9783-as,
55- 9759-es, 56-32995-ös és 56-39778-as számú közzétett japán szabadalmi bejelentések, és 53-43591-es és 53-1833-as számú japán közzétételi iratok); L-lizint termelő mutáns törzsek, amelyek növekedéséhez inozitol vagy ecetsav szükséges (55-9784-es és
56- 8692-es számú közzétett japán szabadalmi bejelentések); L-lizint termelő mutáns törzsek, amelyek érzékenységet mutatnak fluor-pirosszőlősavval és 34 °C-nál nem alacsonyabb hőmérséklettel szemben (55-9783-as és a 53-86090-es számú közzétett japán szabadalmi bejelentés); valamint a Brevibacterium és a Corynebacterium nemzetségekhez tartozó mutáns törzsek, amelyek etilénglikollal szemben rezisztensek és
L-lizint termelnek (4411997-es számú amerikai egyesült államokbeli szabadalmi leírás).
A találmány egy konkrét megvalósítási módja szerint annak érdekében, hogy - amint azt fent leírtuk egy gazdasejtben fokozzuk az L-lizin bioszintetikus rendszere génjeinek aktivitását, a géneket plazmidvektor, transzpozon, fágvektor vagy hasonló alkalmazásával bejuttatjuk a gazdasejtbe. A bejuttatásától azt várjuk, hogy még kis kópiaszámú vektorok esetén is génaktivitást fokozó hatása legyen. Előnyösen azonban nagy kópiaszámú vektort alkalmazunk. A vektorok lehetnek például plazmidvektorok, mint például a fent leírt pAJ655, pAJ1844, pAJ611, pAJ3148, pAJ440. Lehetnek emellett transzpozonok is, mint amelyek például a következő hivatkozásokban szerepelnek: W002/02627-es és WO93/18151-es számú nemzetközi közzétételi iratok; 445385-ös számú európai szabadalmi leírás; 6-46867-es számú közzétett japán szabadalmi leírás; Vertes, A. A. és munkatársai, Mól. Microbiol., 11, 739-746 (1994); Bonamy, C. és munkatársai, Mól. Microbiol., 14, 571-581 (1994); Vertes, A. A. és munkatársai, Mól. Gén. Génét., 245, 397-405, (1994); Jagar, W. és munkatársai, FEMS Microbiology Letters, 126, 1-6 (1995); 7-107976-os és 7-327680-as számú közzétett japán szabadalmi bejelentések, valamint hasonlók.
A találmány szerinti megoldás megvalósítása során nem az az egyetlen lehetőség, hogy a mutáns lysC aktivitását fokozzuk. Alkalmazhatunk olyan törzseket is, ahol a kromoszomális DNS-en elhelyezkedő lysC tartalmaz mutációt, vagy amelyben a mutáns lysC be van építve a kromoszomális DNS-be. Egy másik lehetőség, hogy a mutáns lysC-t plazmidvektor alkalmazásával juttatjuk be. Másfelől előnyösen a dapA, a dapB, a lysA és az aspC aktivitását fokozzuk a hatékony L-lizin-termelés érdekében.
A dapA-, a dapB-, a lysA- és az aspC-gének mindegyikét egymást követően bejuttathatjuk a gazdasejtbe, sorrendben különböző vektorokat alkalmazva. Más megközelítésben, két- vagy háromféle gén egyetlen vektor alkalmazásával kombinálva is bejuttatható. Amennyiben különböző vektorokat alkalmazunk, a gének bármely sorrendben bejuttathatok, előnyösen azonban olyan vektorokat alkalmazunk, amelyek stabilan fennmaradnak és replikálódnak a gazdasejtben, és amelyek képesek egymás mellett párhuzamosan létezni.
A találmány egy előnyös megvalósítási módja szerint korineform baktériumhoz, aspC bejuttatására, vektorként előnyösen alkalmazható a pVK7 vektor. A találmány tárgyát képező pVK7 vektor egy, korineform baktériumokhoz használható klónozóvektor, amely autonóm módon replikálódni képes Escherichia coli és Brevibacterium lactofermentum sejtjeiben egyaránt, tartalmaz egy többszörös klónozóhelyet, valamint lacZ’-t. A pVK7 vektor elkészíthető a 8. példában alább leírt eljárással.
Mutáns AK-t hordozó korineform baktériumot, amelyik a fokozott aktivitású dapB-t, dapA-t, lysA-t és aspC-t is tartalmazza, úgy kaphatunk, hogy például egy korineform baktériumba mint gazdasejtbe mutáns
HU 224 492 Β1 lysC-t, dapB-t, dapA-t, lysA-t és aspC-t tartalmazó, korineform baktériumok sejtjeiben autonóm módon replikálódó rekombináns DNS-t juttatunk.
A fent említett rekombináns DNS-eket úgy kaphatjuk meg például, hogy minden egyes - L-lizin bioszintézisében részt vevő - gént egy vektorba (például plazmid-, transzpozon- vagy fágvektorba) inszertálunk a fent leírtak szerint.
Amennyiben plazmidot alkalmazunk vektorként, a rekombináns DNS-t bejuttathatjuk a gazdasejtbe elektromos pulzus módszerével [Sugimoto és munkatársai, 2-207791-es számú közzétett japán szabadalmi bejelentés]. Gén amplifikálását transzpozonnal úgy végezhetjük el, hogy egy, plazmidot hordozó transzpozont juttatunk be a gazdasejtbe, és indukáljuk a transzpozon átugrását.
A találmány szerinti megoldásban alkalmazott korineform baktériumban a fent említett géneken kívül az L-lizin-bioszintézisben részt vevő egyéb gének aktivitása is fokozott lehet, úgymint például DNS-szekvenciák, amelyek foszfoenol-piruvát-karboxilázt, illetve diamino-pimelát-dekarboxilázt kódolnak.
3. Eljárás L-lizin termelésére
L-lizint hatékonyan termelhetünk úgy, hogy a fent leírtak szerint a fokozott aktivitású, L-lizin bioszintéziséhez szükséges géneket hordozó korineform baktériumot megfelelő tápközegben tenyésztjük így lehetővé téve L-lizin termelődését és felhalmozódását a baktériumsejt-kultúrában, majd az L-lizint kinyerjük a kultúrából.
Az alkalmazható tápközeg lehet például egy közönséges tápközeg, amelyik szénforrást, nitrogénforrást, szervetlen ionokat és nem kötelezően egyéb szerves komponenseket tartalmaz.
Szénforrásként cukrokat, mint például glükózt, fruktózt, szacharózt, melaszt és keményítőhidrolizátumot alkalmazhatunk, valamint szerves savakat, mint például fumársavat, citromsavat és borostyánkősavat.
Nitrogénforrásként alkalmazhatunk ammóniumsókat, mint például az ammónium-szulfát, ammónium-klorid, ammónium-foszfát; szerves eredetű nitrogént, például szójabab-hidrolizátumot; ammóniagázt vagy vizes ammóniát.
Szerves, nyomnyi mennyiségben szükséges anyagokat biztosító tápanyagforrásként kívánatos például Brvitamint, L-homoszerint, élesztőkivonatot vagy hasonlót alkalmazni megfelelő mennyiségben. A fentiek mellett kálium-foszfátot, magnézium-szulfátot, vas- és magnéziumiont stb. adunk kis mennyiségben a tápközeghez, ha szükséges.
A tenyésztést előnyösen aerob körülmények között végezzük 30-90 órán keresztül. A tenyésztési hőmérsékletet előnyösen 25 °C és 90 °C közé állítjuk be, a pH-t pedig 5 és 8 közé. Szerves vagy szervetlen, savas vagy bázikus anyagok, ammóniagáz vagy hasonlók egyaránt alkalmazhatók a pH-beállítás során. Az L-lizint kinyerhetjük a tenyészetből a szokványos ioncsere módszerének, kicsapási módszereknek, valamint egyéb módszerek kombinálásával.
Az alábbiakban példák segítségével a találmány szerinti megoldást közelebbről is ismertetjük.
1. példa: Vad típusú és mutáns lysC-gén előállítása Brevibacterium lactofermentumöó/ (1) Vad típusú és mutáns lysC-gének, valamint az őket tartalmazó plazmidok előállítása
A Brevibacterium lactofermentum ATCC13869 és egy, az ATCC13869-es törzsből kiindulva mutációs kezeléssel kapott L-lizin-termelő törzs, az AJ3445 (FERM P-1944) szolgáltak kromoszomális DNS donorjaként. Az AJ3445-ÖS törzset mutációnak vetettük alá, aminek során a lysC-t megváltoztattuk úgy, hogy az AK-ban az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenységet lényegesen lecsökkentettük [Journal of Biochemistry, 68, 701, (1970)].
A lysC-t tartalmazó DNS-fragmenst kromoszomális DNS-ből amplifikáltuk PCR-módszerrel [„polimerase chain reaction”, polimeráz-láncreakció, lásd White, T. J. és munkatársai, Trends. Génét., 5, 185, (1989)]. Az amplifikáláshoz használt DNS-láncindítókként a szekvencialistában az 1-es és 2-es azonosító számon megadott szekvenciájú 23 tagú egyes szálú DNS-eket szintetizáltuk meg, hogy velük egy kb. 1643 bp hosszúságú, a lysC-t kódoló régiót amplifikáljuk a Corynebacterium glutamicum esetében ismert szekvencia alapján [Molecular Microbiology 5(5), 1197, (1991); Mól. Gén. Génét., 224, 317, (1990)]. A DNS-t a szokványos módon szintetizáltuk meg egy „model 380B” (Applied Biosystems) szintetizálókészüléket és a foszforamidit-módszert alkalmazva [Tetrahedron Letters 22, 1859, (1981)].
A gén PCR-rel történő amplifikálását egy „DNA Thermal Cycler Model PJ2000” készülékkel (Takara Shuzo) végeztük, Taq-polimerázt alkalmazva a forgalmazó utasításai szerint. Az 1643 bp hosszúságú génfragmens amplifikálásának sikeres mivoltáról agaróz-gélelektroforézis segítségével győződtünk meg. Ezután a gélből kivágott fragmenst a szokványos módszerrel tisztítottuk, majd Nrul (Takara Shuzo) és EcoRI (Takara Shuzo) restrikciós enzimekkel megemésztettük.
A génfragmens számára klónozóvektorként a pHSG399-et [Takeshita, S. és munkatársai, Gene, 61, 63-74 (1987)] alkalmaztuk. A pHSG399-et Smal (Takara Shuzo) és EcoRI restrikciós enzimekkel megemésztettük, és az amplifikált lysC-fragmenssel ligáltuk. A DNS ligálását a „DNA ligation kit” (Takara Shuzo) segítségével végeztük el a feltüntetett módszer alapján. Ilyenformán olyan plazmidokat állítottunk elő, amelyekben a Brevibacterium lactofermentum kromoszómáiból amplifikált lysC-fragmenseket pHSG399-cel ligáltuk. Az ATCC13869-ből (vad típusú törzs) származó lysC-t tartalmazó plazmidot p399AKY-nak jelöltük, azt a plazmidot pedig, amelyik az AJ3463-ból származó (L-lizin-termelő baktérium) plazmidot tartalmazta, p399AK9-nek.
A p399AKY-ba és a p399AK9-be olyan DNS-fragmenst inszertáltunk, ami egy plazmidot képessé tesz autonóm módon replikálódni Corynebacterium nemzetséghez tartozó baktériumokban (a leírásban használt értelemben a „Brevi.-ori. ilyen DNS-fragmenst jelöl), így rendre olyan lysC-t tartalmazó plazmidokat állítva elő,
HU 224 492 Β1 amelyek képesek autonóm módon replikálódni Corynebacterium nemzetséghez tartozó baktériumokban. A Brevi.-ori.-t a pHK4 plazmidvektorból állítottuk elő, ami tartalmazza a Brevi.-ori.-t, és autonóm módon replikálódik mind Escherichia coli, mind a Corynebacteríum nemzetséghez tartozó baktériumok sejtjeiben. A pHK4-et a pHC4 Kpnl-gyel (Takara Shuzo) és BamHl-gyel (Takara Shuzo) végzett emésztésével, a Brevi.-ori.-fragmens extrahálásával és az előzőleg szintén Kpnl-gyel és BamHI-gyel megemésztett pHSG298-cal [5-7491-es számú közzétett japán szabadalmi leírás] való ligálással állítottuk elő. A pHK4 a gazdasejtet ellenállóvá teszi kamamicinnel szemben. A pHK4-et hordozó Escherichia coli törzset Escherichia coli AJ13136-nak jelöltük, és 1995. augusztus 1-jén helyeztük letétbe FERM BP-5186-os nyilvántartási számon a „National Institute of Bioscience and Humán Technology of Agency of Industrial Science and Technology of Ministry of International Trade and Industry” Intézetnél (1-3, Higashi 1-chome, Tsukuba-shi, Ibaraki-ken, 305 Japan).
A pHK4-et Kpnl és BamHI restrikciós enzimekkel megemésztettük, és a hasított végeket tompa végűvé tettük. A tompa végek kialakítását „DNA Blunting kit” reagenskészlet (Takara Shuzo) alkalmazásával végeztük el a feltüntetett módszer szerint. A tompa vég kialakítása után foszforilált BamHI-linkert (Takara Shuzo) ligáltunk a tompa végekhez, ezzel a módosítással elérve azt, hogy a Brevi.-őri.-szakasznak megfelelő DNS-fragmens pHK4-ből csupán BamHI-gyel végzett emésztéssel is kivágható legyen. Ez utóbbi plazmidot emésztettük BamHI-gyel, és a kapott Brevi.-őri. DNS-fragmenst ligáltuk az előzőleg rendre szintén BamHI-gyel emésztett p399AKY-nal és p399AK9-cel. így a lysC-t tartalmazó és Corynebacteríum nemzetséghez tartozó baktériumsejtekben autonóm módon replikálódni képes plazmidokat hoztunk létre.
A vad típusú lysC-gént tartalmazó, p399AKY-ból származó plazmidot p399AKYB-nek, a p399AK9-ből származót p399AK9B-nek jelöltük. A p399AKYB és a p399AK9B létrehozásának folyamatát az 1. ábra szemlélteti. A mutáns lysC-t tartalmazó p399AK9B-nek a vad típusú Brevibacterium lactofermentumba (AJ 12036-os törzs, FERM BP-734) történt bejuttatásával kapott AJ12691-es törzset 1992. április 10-én helyeztük letétbe FERM P-12918 nyilvántartási számon a „National Institute of Bioscience and Humán Technology of Agency of Industrial Science and Technology of Ministry of International Trade and Industry Intézetnél (1-3, Higashi 1-chome, Tsukuba-shi, Ibaraki-ken, 305 Japan), majd 1995. február 10-én a Budapesti Egyezménynek megfelelően is letétbe helyeztünk a FERM ΒΡ-4999-es nyilvántartási számon.
(2) A Brevibacterium lactofermentumőó/ származó vad típusú és a mutáns lysC nukleotidszekvenciájának meghatározása
A vad típusú lysC-t tartalmazó p399AKY és a mutáns lysC-t tartalmazó p399AK9 plazmidokat a megfelelő transzformánsokból tisztítottuk a vad típusú és a mutáns lysC nukleotidszekvenciájának meghatározása érdekében. A nukleotidszekvencia meghatározását Sanger és munkatársai módszerével végeztük [Sanger, F. és munkatársai, Proc. Natl. Acad. Sci. 74, 5463 (1977)].
A vad típusú lysC p399AKY által kódolt nukleotidszekvenciáját a szekvencialistában a 3-as azonosító számon adtuk meg. Másfelől, a mutáns lysC p399AK9 által kódolt nukleotidszekvenciája csupán egy nukleotidban tartalmaz mutációt, nevezetesen az 1051. G A-ra változott a szekvencialistában a 3-as azonosító számon megadott, vad típusú lysC-nek megfelelő szekvenciához képest. Ismert, hogy a Corynebacteríum glutamicum lysC-génjének terméke két alegységből áll (a és β), amelyek azonos DNS-szálon azonos leolvasási fázisban vannak kódolva [Kalinowsky, J. és munkatársai, Molecular Microbiology 5(5), 1197 (1991)]. A homológjából ítélve feltételezhetjük, hogy a találmány szerinti génszekvencia szintén két alegységet kódol (a és β), amelyek kódolórégiói azonos DNS-szálon azonos leolvasási fázisban helyezkednek el.
A vad típusú AK-fehérje α-alegysége DNS-ének nukleotidszekvenciájából származtatott aminosavszekvenciát a szekvencialistában a 4-es azonosító számon adtuk meg a DNS-szekvenciával együtt. Az aminosavszekvenciát önmagában a szekvencialistában az 5-ös azonosító számon adtuk meg. A vad típusú AK-fehérje β-alegysége DNS-ének nukleotidszekvenciájából származtatott aminosavszekvenciát a szekvencialistában a 6-os azonosító számon adtuk meg a DNS-szekvenciával együtt. Az aminosavszekvenciát önmagában a szekvencialistában a 7-es azonosító számon adtuk meg. Az alegységek mindegyikében GTG a kezdőkodon, itt azonban az ennek megfelelő aminosav a metionin. Az ennek a kodonnak megfelelő aminosav lehet mindazonáltal metionin, valin és formil-metionin egyaránt.
Másfelől, a mutáns lysC szekvenciájában a mutáció egy olyan szubsztitúciót jelent, ahol a mutáns lysC olyan AK-t kódol, amelyben a vad típusú AK a-alegységének N-terminálisától számított 279. alanin treoninra van kicserélve, és a β-alegység N-terminálisától számított 30. alanin treoninra van kicserélve. (A szekvencialistában az 5-ös és a 7-es azonosító számon megadott szekvenciák.)
2. példa: dapB előállítása Brevibacterium lactofermentumőó/ (1) dapB előállítása és a dapB-t tartalmazó plazmid elkészítése
A vad típusú Brevibacterium lactofermentum ATCC13869-es törzset használtuk a kromoszomális DNS donorjaként. A kromoszomális DNS-t az ATCC13869-es törzsből a szokványos módon állítottuk elő. A dapB-t tartalmazó DNS-fragmenst a kromoszomális DNS-ből PCR segítségével amplifikáltuk. DNS-láncindítókként azok a 23 bázispárból álló DNS-szakaszok szolgáltak, amelyek a szekvencialistában a 8-as, valamint a 9-es azonosító számon vannak megadva. Ezekkel amplifikáltunk egy kb. 2,0 kb hosszúságú régiót, amely a Brevibacterium lactofermentum esetében ismert szekvenciája alapján a DDPR-t kódolja [Journal of Bacteriology, 175(9), 2743, (1993)]. A DNS szintézisét és a PCR-t az 1. példában leírtak szerint vé10
HU 224 492 Β1 geztük el. A 2001 bp hosszúságú amplifikált génfragmenshez klónozóvektorként a pCR-Script-vektort (Invitrogen) használtuk, ezt ligáltuk az amplifikált dapB-fragmenssel. így tehát egy olyan plazmidot készítettünk, amelyben a Brevibacterium lactofermentum kromoszómájából amplifikált 2001 bp hosszúságú dapB-fragmenst a pCR-Scripttel ligáltuk. A fent leírt plazmidot, amelyben a dapB az ATCC13869-ből származott, pCRDAPB-nek jelöltük. A pCRDAPB E. coli JM109-es törzsbe történt bejuttatásával kapott AJ13107-es törzset 1995. május 26-án helyeztük letétbe nemzetközileg a Budapesti Egyezménynek megfelelően a FERM BP-5114 nyilvántartási számon a „National Institute of Bioscience and Humán Technology of Agency of Industrial Science and Technology of Ministry of International Trade and Industry Intézetnél (1-3, Higashi
I- chome, Tsukuba-shi, Ibaraki-ken, 305 Japan).
Egy, a DDPR-struktúrgént tartalmazó 1101 bp hosszúságú fragmenst úgy kaptunk meg, hogy a pCRDAPB-t emésztettük EcoRV-tel és Sphl-gyel. Ezt a fragmenst ligáltuk az előzőleg Hincll-vel és Sphl-gyel megemésztett pHSG399-be, ezzel újabb plazmidot kapva, amelyet p399DPR-nek jelöltünk.
Annak érdekében, hogy a korineform baktériumban autonóm módon replikálódni képes, dapB-t tartalmazó plazmidot kapjunk, Brevi.-ori.-t juttattunk be az elkészített p399DPR plazmidba. A pHK4-et megemésztettük Kpnl restrikciós enzimmel (Takara Shuzo), majd a hasított végeket tompa végekké tettük. A tompa végek kialakítását „DNA Blunting kit reagenskészlet (Takara Shuzo) alkalmazásával végeztük el a feltüntetett módszer szerint. A tompa végek kialakítása után egy foszforilált BmaHI-linkert (Takara Shuzo) ligáltunk hozzájuk, hogy ezzel a módosítással a Brevi.-ori.-szakasznak megfelelő DNS-fragmens a pHK4-ből BamHI-gyel kívághatóvá váljék. Ezt a plazmidot emésztettük BamHI-gyel, és a kapott Brevi.-ori. DNS-fragmenst az előzőleg szintén BamHI-gyel megemésztett p399DPR plazmiddal ligáltuk, hogy korineform baktériumban autonóm módon replikálódni képes dapB-t tartalmazó plazmidhoz jussunk. Ezt a plazmidot jelöltük pDPRB-nek. A pDPRB elkészítésének folyamatát mutatja be a 2. ábra.
(2) Brevibacterium lactofermentumbó/ származó dapB nukleotidszekvenciájának meghatározása
A p399DPR-t hordozó AJ13107-es törzsből plazmid-DNS-t állítottunk elő, majd az 1. példában leírttal azonos módon meghatároztuk a nukleotidszekvenciáját. A meghatározott nukleotidszekvenciát és a belőle származtatott aminosavszekvenciát a szekvencialistában a 10-es azonosító számon adtuk meg. Az aminosavszekvenciát önmagában a szekvencialistában a
II- es azonosító számon adtuk meg.
3. példa: dapA előállítása Brevibacterium lactofermentumbó/ (1) dapA előállítása és a dapA-t tartalmazó plazmid elkészítése
A vad típusú Brevibacterium lactofermentum ATCC13869-es törzset használtuk a kromoszomális DNS donorjaként. A kromoszomális DNS-t az
ATCC13869-es törzsből a szokványos módon állítottuk elő. A dapA-t tartalmazó DNS-fragmenst a kromoszomális DNS-ből PCR segítségével amplifikáltuk. DNS-láncindítókként azok a 23 bázispárból álló DNS-szakaszok szolgáltak, amelyek a szekvencialistában a 12-es, valamint a 13-as azonosító számon vannak megadva. Ezekkel amplifikáltunk egy kb. 1,5 kb hosszúságú régiót, amely a Corynebacteríum glutamicum esetében ismert szekvencia alapján megállapíthatóan a DDPS-t kódolja [Nucleic Acids. Rés., 18(21), 6421, (1990); EMBL nyilvántartási szám: X53993]. A DNS szintézisét és a PCR-t az 1. példában leírtak szerint végeztük el. A pCR1000 plazmidot [Invitrogen, lásd még Bio/Technology 9, 657 (1991)] alkalmaztuk az 1,411 bp hosszúságú amplifikált génfragmens klónozóvektoraként, és ezt ligáltuk az amplifikált dapA-fragmenssel. A DNS ligálását a „DNA ligation kit reagenskészlet (Takara Shuzo) segítségével végeztük el a feltüntetett módszer alapján. így tehát egy olyan plazmidot készítettünk, amelyben a Brevibacterium lactofermentum kromoszómájából amplifikált 1,411 bp hosszúságú dapA-fragmenst a pCR1000-rel ligáltuk. A fent leírt plazmidot, amelyben a dapA az ATCC13869-ből származott, pCRDAPA-nak jelöltük.
A pCRDAPA E. coli JM109-es törzsbe történt bejuttatásával kapott AJ13106-os törzset 1995. május 26-án helyeztük letétbe nemzetközileg a Budapesti Egyezménynek megfelelően a FERM BP-5113 nyilvántartási számon a „National Institute of Bioscience and Humán Technology of Agency of Industrial Science and Technology of Ministry of International Trade and Industry Intézetnél (1-3, Higashi 1-chome, Tsukuba-shi, Ibaraki-ken, 305 Japan).
A Brevi.-ori.-t bejuttattuk az elkészített pCRDAPA plazmidba, ezzel az így létrehozott plazmid képessé vált autonóm módon replikálódni korineform baktériumsejtekben. A pHK4-et Kpnl és BamHI restrikciós enzimekkel (Takara Shuzo) emésztettük, a hasított végeket pedig tompa végekké tettük. A tompa végek kialakítását „DNA Blunting kit” reagenskészlet (Takara Shuzo) alkalmazásával végeztük el a feltüntetett módszer szerint. A tompa végek kialakítása után egy foszforilált Smal-linkert (Takara Shuzo) ligáltunk hozzájuk, hogy ezzel a módosítással a Brevi.-ori.-szakasznak megfelelő DNS-fragmens a pHKI-ből csupán Smal-gyel is kivághatóvá váljék. Ezt a plazmidot emésztettük Smal-gyel, és a kapott Brevi.-ori. DNS-fragmenst az előzőleg szintén Smal-gyel megemésztett pCRDAPA plazmiddal ligáltuk, hogy korineform baktériumban autonóm módon replikálódni képes dapA-t tartalmazó plazmidhoz jussunk. Ezt a plazmidot jelöltük pDPSB-nek. A pDPSB(Kmr) elkészítésének folyamatát mutatja be a 3. ábra.
(2) Brevibacterium lactofermentumbó/ származó dapA nukleotidszekvenciájának meghatározása
A pCRDAPA-t hordozó AJ 13106-os törzsből plazmid-DNS-t állítottunk elő, majd az 1. példában leírttal azonos módon meghatároztuk a nukleotidszekvenciáját. A meghatározott nukleotidszekvenciát és a belőle származtatott aminosavszekvenciát a szekvencialistában a 14-es azonosító számon adtuk meg. Az amino11
HU 224 492 Β1 savszekvenciát önmagában a szekvencialistában a 15-ös azonosító számon adtuk meg.
4. példa: lysA előállítása Brevibacteríum lactofermentumbó/ (1) lysA előállítása és a lysA-t tartalmazó plazmid elkészítése
A Brevibacteríum lactofermentum ATCC13869-es vad típusú törzset alkalmaztuk kromoszomális DNS-donorként. A kromoszomális DNS-t az ATCC13869-es törzsből nyertük a szokványos módon. Az argS-t, lysA-t és az őket tartalmazó operon egy promoterét a kromoszomális DNS-ből amplifikáltuk PCR segítségével. Amplifikáláshoz használt DNS-láncindítókként azok a 23 bázispárból álló DNS-szakaszok szolgáltak, amelyek a szekvencialistában a 16-os, valamint a 17-es azonosító számon vannak megadva. Ezekkel amplifikáltunk egy kb. 3,6 kb hosszúságú régiót, amely a Corynebacterium glutamicum esetében ismert szekvencia alapján megállapíthatóan az arginil-tRNS-szintázt és a DDC-t kódolja [Molecular Microbiology 4(11), 1819, (1990) Molecular and General Genetics, 212, 112 (1988)]. A DNS szintézise és a PCR ugyanúgy végezhető el, mint azt fent az 1. példában leírtuk. A pontosan 3579 bp hosszúságú génfragmens amplifikálásához a pHSG399-et használtuk. A pHSG399-et Smal restrikciós enzimmel (Takara Shuzo) emésztettük, majd az amplifikált lysA-t tartalmazó DNS-fragmenssel ligáltuk. Az így kapott plazmidot, amely tartalmazta az ATCC13869-ből származó lysA-t, p399LYSA-nak jelöltük.
A lysA-t tartalmazó DNS-fragmenst a p399LYSA Kpnl-gyel (Takara Shuzo) végzett emésztése során kaptuk meg. Ezt a DNS-fragmenst a pHSG299-be ligáltuk, amelyet előzőleg Kpnl-gyel és BamHI-gyel emésztettünk meg. A kapott plazmidot p299LYSA-nak jelöltük. A p299LYSA elkészítésének folyamatát a 4. ábra mutatja be.
A Brevi.-ori.-t beépítettük a kapott p299LYSA plazmidba, ezáltal egy, lysA-t tartalmazó, korineform baktériumban autonóm módon replikálódni képes plazmidot hoztunk létre. A pHK4-et Kpnl és BamHI enzimekkel emésztettük, majd a hasított végeket tompa végűvé tettük. A tompa végek kialakítását a „DNA Blunting kit” reagenskészlet (Takara Shuzo) segítségével végeztük a feltüntetett módszer alkalmazásával. A tompa vég kialakítása után foszforilált Kpnl-linkert (Takara Shuzo) ligáltunk a tompa végekhez, ezzel a módosítással elérve azt, hogy a Brevi.-őri.-szakasznak megfelelő DNS-fragmens pHK4-ből csupán Kpnl-gyel végzett emésztéssel is kivágható legyen. Ez utóbbi plazmidot emésztettük Kpnl-gyel, és a kapott Brevi.-ori. DNS-fragmenst ligáltuk az előzőleg szintén Kpnl-gyel emésztett p299LYSA-val, ezzel egy, lysA-t tartalmazó, korineform baktériumsejtekben autonóm módon replikálódni képes plazmidot nyerve. A kapott plazmidot pLYSAB-nak jelöltük. A pLYSAB elkészítésének folyamatát az 5. ábra mutatja be.
(2) A Brevibacteríum lactofermentumbó/ származó lysA nukleotidszekvenciájának meghatározása
A p299LYSA plazmid-DNS-t izoláltuk, és nukleotidszekvenciáját meghatároztuk az 1. példában leírtakkal azonos módon. A meghatározott nukleotidszekvenciát és a nukleotidszekvencia által kódolt aminosavszekvenciát a szekvencialistában a 18-as azonosító számon adtuk meg. A nukleotidszekvencia részét képező gének, az argS, illetve a lysA által kódolt aminosavszekvenciákat a szekvencialistában rendre a 19-es és a 20-as azonosító számon adtuk meg.
5. példa: Escherichia colibó/ származó aspC előállítása és aspC-t tartalmazó plazmid elkészítése
Escherichia coli JM109-es törzset alkalmaztunk kromoszomális DNS-donorként. A kromoszomális DNS-t az Escherichia coli JM109-es törzsből nyertük a szokványos módon. Az aspC-t tartalmazó fragmenst kromoszomális DNS-ből amplifikáltuk PCR segítségével. Amplifikáláshoz használt DNS-láncindítókként azok a 20 bázispárból álló DNS-szakaszok szolgáltak, amelyek a szekvencialistában a 21-es, valamint a 22-es azonosító számon vannak megadva. Ezen láncindítók tervezésénél az E. coli esetében ismert szekvenciát vettük alapul [J. Biochem., 97(4), 1259 (1985)]. A DNS szintézise és a PCR ugyanúgy végezhető el, mint azt fent az 1. példában leírtuk. A pontosan 3579 bp hosszúságú amplifikált fragmenst a pCR1000 TA-klónozó vektorba klónoztuk. A kapott plazmidot pCRASPC-ként jelöltük.
Az aspC-t tartalmazó amplifikált DNS nukleotidszekvenciáját és a nukleotidszekvencia által kódolt származtatott aminosavszekvenciát a szekvencialistában a 23-as azonosító számon adtuk meg. Az aminosavszekvenciát önmagában a szekvencialistában a 24-es azonosító számon adtuk meg.
1. összehasonlító példa: Mutáns lysC-t és dapA-t kombinálva tartalmazó plazmid elkészítése
Egy mutáns lysC-t, dapA-t és korineform baktériumokban működőképes replikációs origót tartalmazó plazmidot készítettünk a dapA-t tartalmazó pCRDAPA plazmidból és a mutáns lysC-t, valamint a Brevi.-ori.-t tartalmazó p399AK9B plazmidból kiindulva. A p399AK9B-t teljesen megemésztettük Sall-gyel, majd a végeket tompává tettük. Egy EcoRI-linkert ligáltunk hozzájuk egy olyan plazmid létrehozása érdekében, ahol a Sall-helyet EcoRI-hellyé alakítottuk át. A kapott plazmidot p399AK9BSE-nek jelöltük. A mutáns lysC-t és a Brevi.-ori.-t egy fragmensként kivágtuk EcoRI-gyel részlegesen emésztve a p399AK9BSE-t. Ezt a fragmenst ligáltuk az előzetesen EcoRI-gyel emésztett pCRDAPA-val. A kapott plazmidot pCRCAB-nek jelöltük. Ez a plazmid autonóm módon replikálódni képes E. coliban és korineform baktériumokban, a gazdasejtnek kanamicinrezisztenciát biztosít, továbbá a mutáns lysC-t és a dapA-t kombinálva tartalmazza. A pCRCAB elkészítésének folyamatát a
6. ábra mutatja be.
2. összehasonlító példa: Mutáns lysC-t és dapB-t kombinálva tartalmazó plazmid elkészítése
A mutáns lysC-t és a dapB-t tartalmazó plazmidot a mutáns lysC-t tartalmazó p399AK9 és a dapB-t tartal12
HU 224 492 Β1 mazó p399DPR plazmidokból kiindulva készítettük el. A p399DPR plazmid EcoRV-tel és Sphl-gyel történt emésztésével a DDPR struktúrgénjét tartalmazó 1101 bp hosszúságú fragmenst nyertünk. Ezt a fragmenst ligáltuk az előzőleg Sall-gyel megemésztett, tompa végűvé tett és Sphl-gyel tovább emésztett p399AK9-cel, hogy olyan plazmidot készíthessünk, amelyik a mutáns lysC-t és a dapB-t kombinálva tartalmazza. Ezt a plazmidot jelöltük p399AKDDPR-nek.
Ezután bejuttattuk a Brevi.-ori.-t a kapott p399AKDDPR-be. A Brevi.-ori.-t tartalmazó pHK4 plazmidot Kpnl restrikciós enzimmel emésztettük (Takara Shuzo), a hasított végeket pedig tompa végekké tettük. A tompa végek kialakítását „DNA Blunting kit reagenskészlet (Takara Shuzo) alkalmazásával végeztük el a feltüntetett módszer szerint. A tompa végek kialakítása után egy foszforilált BamHI-linkert (Takara Shuzo) ligáltunk hozzájuk, hogy ezzel a módosítással a Brevi.-őri.-szakasznak megfelelő DNS-fragmens a pHK4-ből BamHI-gyel kivághatóvá váljék. Ezt a plazmidot emésztettük BamHI-gyel, és a kapott Brevi.-ori. DNS-fragmenst az előzőleg szintén BamHI-gyel megemésztett p399AKDDPR plazmiddal ligáltuk, hogy korineform baktériumban autonóm módon replikálódni képes mutáns lysC-t és dapB-t tartalmazó plazmidhoz jussunk. Ezt a plazmidot jelöltük pCB-nek. A pCB elkészítésének folyamatát mutatja be a 7. ábra.
3. összehasonlító példa: dapA-t és dapB-t kombinálva tartalmazó plazmid elkészítése
A dapA-t tartalmazó pCRDAPA plazmidot Kpnl-gyel és EcoRI-gyel emésztettük, egy dapA-t tartalmazó DNS-fragmenshez jutva így. Ezt a fragmenst ligáltuk az előzőleg Kpnl-gyel és EcoRI-gyel megemésztett pHSG399 vektorplazmiddal. A kapott plazmidot p399DPS-nek jelöltük.
Másrészről a dapB-t tartalmazó pCRDAPB plazmidot Sacll-vel és EcoRI-gyel emésztettük, egy 2,0 kb hosszúságú, DDPR-t kódoló régiót tartalmazó DNS-fragmenshez jutva így. Ezt a fragmenst ligáltuk az előzőleg Sacll-vel és EcoRI-gyel megemésztett p399DPS plazmiddal. A kapott, dapA-t és dapB-t kombinálva tartalmazó plazmidot p399AB-nek jelöltük.
Ezután bejuttattuk a Brevi.-ori.-t a kapott p399AB-be. A Brevi.-ori.-t tartalmazó pHK4 plazmidot BamHI restrikciós enzimmel emésztettük (Takara Shuzo), a hasított végeket pedig tompa végekké tettük. A tompa végek kialakítását „DNA Blunting kit” reagenskészlet (Takara Shuzo) alkalmazásával végeztük el a feltüntetett módszer szerint. A tompa végek kialakítása után egy foszforilált Kpnl-linkert (Takara Shuzo) ligáltunk hozzájuk, hogy ezzel a módosítással a Brevi.-ori.-szakasznak megfelelő DNS-fragmens a pHK4-ből csupán Kpnl-gyel is kivághatóvá váljék. Ezt a plazmidot emésztettük Kpnl-gyel, és a kapott Brevi.-ori. DNS-fragmenst az előzőleg szintén Kpnl-gyel megemésztett p399AB plazmiddal ligáltuk, hogy korineform baktériumban autonóm módon replikálódni képes dapA-t és dapB-t tartalmazó plazmidhoz jussunk. Ezt a plazmidot jelöltük pAB-nek. A pAB elkészítésének folyamatát mutatja be a 8. ábra.
6. példa: Mutáns lysC-t, dapA-t és dapB-t kombinálva tartalmazó plazmid elkészítése
A p399DPS plazmidot EcoRI-gyel és Sphl-gyel emésztettük és tompa végűvé tettük, majd a dapA-génfragmenst kinyertük. Ezt a fragmenst ligáltuk az előzőleg Sall-gyel megemésztett és tompa végűvé tett p399AK9-cel, a mutáns lysC-t és a dapA-t együttesen tartalmazó p399CA plazmidot kapva így.
A dapB-t tartalmazó pCRDAPB plazmidot EcoRl-gyel emésztettük és tompa végűvé tettük, majd egy, 2,0 kb hosszúságú, dapB-t tartalmazó DNS-fragmens kinyerése érdekében Sacl-gyel megemésztettük. A mutáns lysC-t és dapA-t tartalmazó p399CA plazmidot Spel-gyel megemésztettük és tompa végűvé tettük, majd Sacl-gyel is megemésztettük és a kapott dapB-fragmenssel ligáltuk. így tehát egy, mutáns lysC-t, dapA-t és dapB-t tartalmazó plazmidot nyertünk. Ezt a plazmidot jelöltük p399CAB-nek.
Ezután bejuttattuk a Brevi.-ori.-t a kapott p399CAB-be. A Brevi.-ori.-t tartalmazó pHK4 plazmidot BamHI restrikciós enzimmel emésztettük (Takara Shuzo), a hasított végeket pedig tompa végekké tettük. A tompa végek kialakítását „DNA Blunting kit” reagenskészlet (Takara Shuzo) alkalmazásával végeztük el a feltüntetett módszer szerint. A tompa végek kialakítása után egy foszforilált Kpnl-linkert (Takara Shuzo) ligáltunk hozzájuk, hogy ezzel a módosítással a Brevi.-ori.-szakasznak megfelelő DNS-fragmens a pHK4-ből csupán Kpnl-gyel is kivághatóvá váljék. Ezt a plazmidot emésztettük Kpnl-gyel, és a kapott Brevi.-ori. DNS-fragmenst az előzőleg szintén Kpnl-gyel megemésztett p399CAB plazmiddal ligáltuk, hogy korineform baktériumban autonóm módon replikálódni képes mutáns lysC-t, dapA-t és dapB-t tartalmazó plazmidhoz jussunk. Ezt a plazmidot jelöltük pCAB-nek. A pCAB elkészítésének folyamatát mutatja be a 9. ábra.
7. példa: Mutáns lysC-t, dapA-t, dapB-t és lysA-t kombinálva tartalmazó plazmid elkészítése
A lysA-t tartalmazó p299LYSA plazmidot Kpnl-gyel és BamHI-gyel emésztettük, majd a lysA-génfragmenst kinyertük. Ezt a fragmenst ligáltuk az előzőleg Hpal-gyel (Takara Shuzo) megemésztett és tompa végűvé tett pCAB-vel, ily módon egy, mutáns lysC-t, dapA-t, dapB-t és lysA-t kombinálva tartalmazó, korineform baktériumsejtekben autonóm módon replikálódni képes plazmidot kapva. Az így elkészített plazmidot jelöltük pCABL-nek. A pCABL elkészítésének folyamatát mutatja be a
10. ábra. Megjegyezzük, hogy noha a Hpal hasítóhely, amelyre a lysA-gént inszertáltuk, a dapB-gént tartalmazó DNS-fragmensen belül helyezkedik el a pCALB-ben, a dapB-gén nem kapcsolódik ki, ugyanis a Hpal-hely a dapB-gén promoterrégiójától 5'-irányban helyezkedik el (a szekvencialistában a 10-es azonosító számon megadott szekvencia 611. és 616. nukleotidja között).
8. példa: Egy aspC-t tartalmazó plazmid elkészítése
Vektorként aspC bejuttatására korineform baktériumba egy újonnan elkészített korineform baktériumokhoz használható klónozóvektort, a pVK7-et használtuk.
HU 224 492 Β1
A pVK7-et úgy készítettük el, hogy pHSG299-et, egy E. colihoz használható vektort [Kmr; Takeshita, S. és munkatársai, Gene, 61, 63 (1987)] ligáltunk pAM330-cal, egy Brevibacteríum lactofermentumhoz használható kriptikus plazmiddal az alábbiak szerint. A pAM330-at a Brevibacteríum lactofermentum ATCC13869-es törzsből állítottuk elő. A pHSG299-et egy, pusztán egyetlen helyen hasító restrikciós enzimmel, az Avall-vel emésztettük (Takara Shuzo), T4-DNS-polimeráz alkalmazásával tompa végűvé tettük, valamint az előzőleg Hindlll-mal emésztett (Takara Shuzo) és T4-polimeráz alkalmazásával tompa végűvé tett pAM330-cal ligáltuk. A pHSG299-be inszertált pAM330 orientációjától függően a két kapott plazmidot pVK6-nak és pVK7-nek jelöltük. A további kísérletekben a pVK7-et használtuk. A pVK7 E. coli és Brevibacteríum lactofermentum sejtjeiben egyaránt autonóm módon replikálódni képes, és lacZ’-t és a pHSG299-ből származó többszörös klónozóhelyet tartalmaz. A pVK6 és a pVK7 elkészítésének folyamatát a 11. ábra mutatja be.
Az elkészített átviteli vektorral, a pVK7-tel aspC-t ligáltunk. A pCRASPC plazmidot EcoRI restrikciós enzimmel (Takara Shuzo) emésztettük, és az előzőleg szintén EcoRI-gyel megemésztett pVK7-tel ligáltuk. A ligálást a „DNA Ligation kit” reagenskészlettel (Takara Shuzo) végeztük el. Az aspC pVK7-tel végzett ligálásával kapott plazmidok közül egy olyat, amelyikben az inszertált aspC-fragmens orientációja megfelelt a lac-promoter pVK7-beli transzkripciós orientációjának, pOm-nek jelöltünk. A pOm elkészítésének folyamatát mutatja be a 12. ábra.
9. példa: aspC előállítása Brevibacteríum lactofermentumóó/ (1) Brevibacteríum lactofermentum-eredefű aspC előállítása
A Corynebacterium nemzetséghez tartozó, aszparaginsavra nézve auxotróf 102-7 törzset, amit az aspC-aktivitás (AAT-aktivitás) hiánya tett aszparaginsavra nézve auxotróffá [I. Shiio és K. Ujikawa, J. Biochem., 84, 647, (1978)], transzformáltunk egy génkönyvtár bejuttatásával [WO95/23224-es számú nemzetközi közzétételi irat], amely génkönyvtárat úgy készítettünk el, hogy a Brevibacteríum lactofermentum vad típusú ATCC13869-es kromoszomális DNS-ének különböző fragmenseit ligáltuk egy, a Corynebacterium nemzetséghez tartozó baktériumok sejtjeiben működőképes vektorral.
A kapott transzformánsokat összegyűjtöttük és desztillált vízzel kétszer mostuk. Néhány tízezernyi transzformánst szélesztettünk minimális tápközeggel, az ammónián kívül más nitrogénforrást nem tartalmazó „Médium 10”-zel [I. Shiio és K. Ujikawa, J. Bíochem., 84, 647, (1978)] készült agarlemezen, hogy megkaphassuk azokat a transzformánsokat, amelyek megszűntek aszparaginsavra nézve auxotrófnak lenni, és kitűnően nőttek a lemezen. A kapott, aszparaginsav-auxotrófiát kiküszöbölt törzsből plazmid-DNS-t állítottunk elő, és a kapott plazmidot pAC-nek jelöltük. Amikor a vad típusú Brevibacteríum lactofermentum ATCC13869-es törzset pAC-vel transzformáltuk, a transzformáns aspC aktivitása megnövekedett (1. táblázat). Az aktivitás meghatározása ismert módszerrel történt [Sizer, I. W., Jenkins, W. T„ Meth. Enzymol., 5, 677 (1962)].
Az eredmények alátámasztják, hogy a plazmidDNS-ben elhelyezkedő, ATCC13869-es törzs kromoszomális DNS-éből származó 2,5 kb hosszúságú fragmens tartalmazta a Brevibacteríum lactofermentumból származó aspC-t.
1. táblázat
Törzs/plazmid | aspC-aktivitás (relatív érték) |
ATCC13869 | 1,0 |
ATCC13869/pCABL | 8,9 |
(2) Brevibacteríum lactofermentum-eredefű aspC analízise
A 2,5 kb hosszúságú fragmens nukleotidszekvenciáját a dideoximódszerrel határoztuk meg Sanger és munkatársai szerint [Proc. Natl. Acad. Sci., 74, 5463, (1977)]. A meghatározott nukleotidszekvenciát a szekvencialistában a 25-ös azonosító számon adtuk meg. A nukleotidszekvenciát a „GENETYX-MAC Version 7.3” programmal (Software Kaihatsu KK) analizáltuk. Az ORF-ek („Open Reading Frame”, nyílt leolvasási fázis) után kutatva két ORF-et találtunk, amelyek egymással ellentétes irányban átfedtek, amint az a 13. ábrán látható. Azt a 432 vagy 436 aminosav hosszúságú ORF-et, amelyet a szekvencialistában a 25-ös azonosító számon megadott szekvencia 879-881-ig vagy a 897-899-ig terjedő ATG nukleotidok, mint iniciációs kodon és a 2175-2177-ig terjedő TGA nukleotidok, mint terminációs kodon közötti szakasz nukleotidszekvenciája normális orientációban kódol, ORF1-nek neveztük el. Azt a 393 aminosav hosszúságú ORF-et, amelyet a szekvencialistában a 25-ös azonosító számon megadott szekvencia 2163-2165-ig terjedő CAC nukleotidokkal komplementer GTG nukleotidok, mint iniciációs kodon és a 984-986-ig terjedő TCA nukleotidokkal komplementer TGA nukleotidok, mint terminációs kodon közötti szakasz nukleotidszekvenciája fordított orientációban kódol, ORF2-nek neveztük el.
(3) Az aspC-t kódoló ORF meghatározása
Egy, az ORF1-et teljes hosszúságban, de az ORF2-t csupán részlegesen tartalmazó DNS-fragmenst amplifikáltunk PCR segítségével a pAC plazmidból, hogy meggyőződjünk arról, vajon melyik ORF kódolja az AAT-fehérjét a kettő közül. Amplifikáláshoz használt DNS-láncindítókként azok a 23 bázispárból álló, a szekvencialistában a 25-ös azonosító számon megadott szekvencia alapján alkalmazott szintetikus DNS-szakaszok szolgáltak, amelyek a szekvencialistában a 26-os, valamint a 27-es azonosító számon vannak megadva. A DNS szintézisét és a PCR-t ugyanúgy végeztük el, mint azt fent az 1. példában leírtuk. A szekvencialistában a 25-ös azonosító számon megadott szekvencia 126. nukleotidjától a 2187. nukleotidig
HU 224 492 Β1 terjedő, 2062 bp hosszúságú amplifikált fragmenst a pCR2.1 TA-klónozó vektorba (Invitrogen) klónoztuk. Az így elkészített plazmidot pCRORF1-nek jelöltük.
Ugyanezen a módon egy, szekvencialistában a 25-ös azonosító számon megadott szekvencia 975. nukleotidjától a 2517. nukleotidig terjedő, 1543 bp hosszúságú, ORF2-t kódoló génfragmenst amplifikáltunk és klónoztunk. Az így elkészített plazmidot pCRORF2-nek jelöltük.
Annak érdekében, hogy a klónozott DNS-fragmenst Corynebacterium nemzetséghez tartozó baktériumsejtekbe juttathassuk be, a DNS-fragmenseket a 8. példában leírt átviteli vektorral ligáltuk. A pCRORF1-et EcoRI restrikciós enzimmel (Takara Shuzo) emésztettük, majd előzőleg szintén EcoRI-gyel emésztett pVK7-tel ligáltuk. A ligálást a „DNA Ligation kit” reagenskészlettel (Takara Shuzo) végeztük el. Az így elkészített plazmidot pORF1-nek jelöltük. A pORF1 elkészítésének folyamatát mutatja be a 14. ábra.
A pORF2-t ugyanígy készítettük el pCRORF2-ből és pVK7-ből.
Az előállított pORF1-et és pORF2-t vad típusú Brevibacterium lactofermentum ATCC13869 sejtekbe juttattuk be a 9. példában leírtakkal azonos módon. Az ATCC13869 és a kapott plazmid bejuttatásával nyert ATCC13869/ORF1 és ATCC13869/ORF2 törzsek aspC-aktivitásait meghatároztuk. Az aktivitás meghatározását ugyanúgy végeztük, amint azt az 1. példában leírtuk. Amint az a 2. táblázatban látható, az aspC aktivitásának növekedése csupán az ATCC13869/pORF1 esetében figyelhető meg, jelezve, hogy az aspC-t az ORF1 kódolja.
A Brevibacterium lactofermentumból származó aspC, a fenti kísérletekben meghatározott nukleotidszekvenciáját és a nukleotidszekvencia által kódolt származtatott aminosavszekvenciát a szekvencialistában a 30-as azonosító számon adtuk meg. Az aminosavszekvencia önmagában a szekvencialistában a 31-es azonosító számon van megadva. A „GENEBANK”-ben homológiakutatást végezve nem találtunk homológiát semmilyen ismert aminosavszekvenciával, beleértve a más élőlényekből származó AAT-fehérjéket is.
2. táblázat
Törzs/plazmid | aspC-aktivitás (relatív érték) |
ATCC 13869 | 1,0 |
ATCC13869/pORF1 | 10,1 |
ATCC13869/pORF2 | 1,2 |
10. példa: Az L-lizin bioszintézisének génjeit tartalmazó plazmidok bejuttatása a Brevibacterium lactofermentum L-lizin-termelő baktériumba
A 7. példában leírt módon elkészített pCABL(Cmr) plazmidot a Brevibacterium lactofermentum AJ 11087 (NRRL B—11470) L-lizin-termelő baktériumtörzsbe juttattuk be. Az AJ11082-es törzs AEC-rezisztens. A plazmidokat elektromospulzus-módszerrel [Sugomoto és munkatársai, 2-207791-es számú közzétett japán szabadalmi bejelentés] juttattuk be. A transzformánsokat a plazmid drogrezisztencia-markerei alapján szelektáltuk. A transzformánsok szelekcióját 5 pg/ml klór-amfenikolt tartalmazó teljes tápközegben végeztük, amennyiben klór-amfenikol-rezisztenciagént tartalmazó plazmidot juttattunk be a sejtekbe, olyan esetben pedig, amikor a bejuttatott plazmid kanamicinrezisztencia-gént tartalmazott, 25 pg/ml kanamicint tartalmazó tápközegben.
A fent leírt módon nyert AJ11082/pCABL transzformánst Escherichia coliból származó aspC-t tartalmazó pOm(Kmr) plazmiddal vagy Brevibacterium lactofermentumból származó aspC-t tartalmazó pORF1(Kmr) plazmiddal transzformáltuk. Mivel a pCABL a pHM1519 replikációs origóját használja Brevibacterium lactofermenfum-sejtekben, a Km-rezisztenciagént pedig markerként, továbbá a pOm a pAM330 replikációs origóját használja Brevibacterium lactofermentum-sefiekben, a Km-rezisztenciagént pedig markerként, mindkét plazmid stabilan fennmarad Brevibacterium lactofermentum-sejtekben. így tehát az AJ11082/pCABL/pOm és az AJ11082/pCABL/pORF1 törzseket kaptuk, amelyek tartalmaznak egy, L-lizin bioszintézisében részt vevő gént tartalmazó és egy aspC-t tartalmazó plazmidot.
A fent leírttal azonos módon a p399AK9B-t (Cmr), a pDPSB-t (Cmr), a pDPRB-t (Cmr), a pLYSAB-t (Cmr), a pOm-et, a pCRCAB-t (Kmr), a pAB-t (Cmr), a pCB-t (Cmr) és a pCAB-t (Cmr) is bejuttattuk az AJ 11087 törzsbe, hogy olyan transzformánsokat kapjunk, amelyekben a mutáns lysC, a dapA, a dapB, a lysA vagy az aspC aktivitása külön-külön, illetve két vagy három géné kombinálva, fokozott.
11. példa: A transzformánsok aspC-aktivitásának meghatározása
Meghatároztuk az AJ11082/pCABL, az AJ 11082/pCABL/pOm és az AJ11082/pCABL/pORF1 transzformánsok aspC-aktivitását. Az aktivitás meghatározását a 9. példában leírtakkal azonos módon végeztük. Amint az a 3. táblázatban látható, azt figyeltük meg, hogy a pOm-vektorban elhelyezkedő lac-promoter Brevibacterium lactofermentumban is működőképes volt, és az AJ11082/pCABL/pOm aspC-aktivitása körülbelül háromszorosára nőtt. Az aspC-aktivitás további, körülbelül kilencszeres növekedése volt megfigyelhető az AJ11082/pCABL/pORF1 esetében.
3. táblázat
Törzs/plazmid | aspC-aktivitás (relatív érték) |
AJ11082 | 1,0 |
AJ11082/pOm | 3,2 |
AJ11082/pORF1 | 10,1 |
AJ11082/pCABL | 0,9 |
AJ 11082/pCABL/pOm | 2,9 |
AJ11082/pCABL/pORF1 | 11,5 |
HU 224 492 Β1
12. példa: L-lizin termelése
A 10. példában leírt, előállított transzformánsok mindegyikét L-lizin termelésére alkalmas tápközegben végeztük, hogy az L-lizin-termelő képességet számszerűen is jellemezni tudjuk. Az L-lizin termelésére al- 5 kalmas tápközegnek az alábbiakban adjuk meg az összetételét és előállításának módját.
Az alábbi komponenseket (kalcium-karbonát kivételével) feloldottuk (1 L-ben), és a pH-t 8,0-ra állítottuk be KOH-dal. A tápközeget 115 °C-on sterilizáltuk 15 per- 10 cig, a szárított kalcium-karbonátot (50 g), amit előzőleg külön sterilizáltunk forró levegővel, ezután adtuk hozzá.
Glükóz | 100 g |
(NH4)2SO4 | 55 g |
kh2po4 | ig |
MgSO4.7H2O | ig |
Biotin | 500 pg |
Tiamin | 2000 pg |
FeSO4.7H2O | 0,01 g |
MnSO4.7H2O | 0,01 g |
Nikotinamid | 5 mg |
Fehérjehidrolizátum (Mamenou) | 30 ml |
Kalcium-karbonát | 50 g |
A különböző típusú transzformánsok mindegyikét, valamint a kiindulási törzseket a fent leírt összetételű tápközegbe oltottuk le, és 31,5 °C-on, himbán rázatva tenyésztettük őket. A tenyésztés ideje 40, illetve 72 óra volt, a termelt L-lizin mennyiségét a különböző esetekben az 1. táblázatban tüntettük fel. A táblázatban lysC* mutáns lysC-t jelent. A sejttömeg-növekedést mennyiségileg is meghatároztuk 101-szeres hígítás után 562 nm-en mérve az OD-t.
4. táblázat
L-lizin felhalmozódása 40, illetve 72 órás tenyésztés után
Baktériumtörzs/ plazmid | Bejuttatott gén | A termelt L-lizin koncentrációja (g/L) | Sejttömeg-növekedés ODseyiOI | |
40 óra múlva | 72 óra múlva | |||
AJ11082 | 22,0 | 29,8 | 0,450 | |
AJ11082/p399AK9B | lysC* | 16,8 | 34,5 | 0,398 |
AJ11082/pDPSB | dapA | 18,7 | 33,8 | 0,410 |
AJ11082/pDPRB | dapB | 19,9 | 29,9 | 0,445 |
AJ11082/pLYSAB | lysA | 19,8 | 32,5 | 0,356 |
AJ11082/pOm | aspC(£)1 | 21,8 | 30,9 | 0,457 |
AJ11082/pOm | aspC/BJ2 | 21,5 | 31,2 | 0,450 |
AJ11082/pCRCAB | lysC*, dapA | 19,7 | 36,5 | 0,360 |
AJ11082/pAB | dapA, dapB | 19,0 | 34,8 | 0,390 |
AJ11082/pCB | lysC*, dapB | 23,3 | 35,0 | 0,440 |
AJ11082/pCAB | lysC*, dapA, dapB | 23,0 | 45,0 | 0,425 |
AJ 11082/pCABL | lysC*, dapA, dapB, lysA | 26,2 | 46,5 | 0,379 |
AJ11082/pCABL/ pOm | lysC*, dapA, dapB, lysA, aspCfEJ | 26,7 | 47,6 | 0,415 |
AJ 11082/pCABL/ pORF1 | lysC*, dapA, dapB, lysA, aspC(BJ | 27,1 | 48,8 | 0,410 |
1: Escherichia coliból származó aspC
2: Brevibacterium lactofermentumból származó aspC
Amint az látható, amikor a mutáns lysC-, dapA-, dapB-, lysA- vagy aspC-gének aktivitását külön-külön 55 fokoztuk, a termelt L-lizin mennyisége megnövekedett vagy nem változott a kiindulási törzs által termelt mennyiséghez képest 72 órás tenyésztés után, 40 órás tenyésztés után azonban a termelt L-lizin mennyisége kisebb volt, mint a kiindulási törzs által termelt mennyi- 60 ség. Az L-lizin-termelődés sebessége tehát csökkent a rövid idejű tenyésztés során. Hasonlóképpen, amikor a mutáns lysC és a dapA, vagy a dapA és a dapB aktivitását őket kombinálva fokoztuk, a termelt L-lizin mennyisége nagyobb volt a kiindulási törzs által termelt mennyiségnél 72 órás tenyésztés után, 40 órás tenyésztés után azonban a termelt L-lizin mennyisége ki16
HU 224 492 Β1 sebb volt, mint a kiindulási törzs által termelt mennyiség. Rövid idejű tenyésztés után tehát az L-lizin-termelés sebessége csökkent.
Ezzel szemben annak a törzsnek az esetében, ahol a dapB és a mutáns lysC aktivitását, a lysC, a dapA és 5 a dapB aktivitását a géneket kombinálva fokoztuk, valamint annak a törzsnek az esetében, ahol a lysC-t, a dapA-t, a dapB-t és a lysA-t kombinálva fokoztuk az aktivitásukat, a rövid idejű tenyésztés és a hosszú idejű tenyésztés során is nőtt a felhalmozódott L-lizin mennyisége. Annak a két törzsnek az esetében, ahol a mutáns lysC, a dapA, a dapB, a lysA és az Escherichia coliból származó aspC aktivitását, illetve a mutáns lysC, a dapA, a dapB a lysA és a Brevibacterium lactofermentumból származó aspC aktivitását őket kombinálva fokoztuk, az L-lizin-termelő képesség tovább javult, mindkét tenyésztési periódusban. A második esetben a javulás nagyobb volt, mint az elsőben.
SZEKVENCIALISTA
AZ 1. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁSA: /desc=„szintetikus DNS”
ANTISZENSZ: nem
AZ 1. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
TCGCGAAGTA GCACCTGTCA CTT
A 2. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI: A SZEKVENCIA JELLEMZŐI:
HOSSZA: 21 bázis TÍPUSA: nukleinsav HÁNY SZÁLÚ: egy TOPOLÓGIÁJA: lineáris MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁSA: /desc=„szintetikus DNS ANTISZENSZ: igen
A 2. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
ACGGAATTCA ATCTTACGGC C
A 3. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI: A SZEKVENCIA JELLEMZŐI:
HOSSZA: 1643 bázis TÍPUSA: nukleinsav HÁNY SZÁLÚ: kettős TOPOLÓGIÁJA: lineáris MOLEKULATÍPUS: gemomi DNS EREDETI FORRÁS:
(A) ÉLŐLÉNY: Brevibacterium lactofermentum (B) TÖRZS: ATCC 13869
A 3. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
TCGCGAAGTA GCACCTGTCA CTTTTGTCTC ΑΑΑΤΑΤΤΑΆΑ TCGAATATCA ATATACGGTC 60 TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT 120 GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG 180 GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAGGTGG CCCTGGTCGT ACAGAAATAT 240 GGCGGTTCCT CGCTTGAGAG TGCGGAACGC ATTAGAAACG TCGCTGAACG GATCGTTGCC 300 ACCAAGAAGG CTGGAAATGA TGTCGTGGTT GTCTGCTCCG CAATGGGAGA CACCACGGAT 360 GAACTTCTAG AACTTGCAGC GGCAGTGAAT CCCGTTCCGC CAGCTCGTGA AATGGATATG 420 CTCCTGACTG CTGGTGAGCG TATTTCTAAC GCTCTCGTCG CCATGGCTAT TGAGTCCCTT 480 GGCGCAGAAG CTCAATCTTT CACTGGCTCT CAGGCTGGTG TGCTCACCAC CGAGCGCCAC 540 GGAAACGCAC GCATTGTTGA CGTCACACCG GGTCGTGTGC GTGAAGCACT CGATGAGGGC 600 AAGATCTGCA TTGTTGCTGG TTTTCAGGGT GTTAATAAAG AAACCCGCGA TGTCACCACG 660 TTGGGTCGTG GTGGTTCTGA CACCACTGCA GTTGCGTTGG CAGCTGCTTT GAACGCTGAT 720 GTGTGTGAGA TTTACTCGGA CGTTGACGGT GTGTATACCG CTGACCCGCG CATCGTTCCT 780 AATGCACAGA AGCTGGAAAA GCTCAGCTTC GAAGAAATGC TGGAACTTGC TGCTGTTGGC 840
HU 224 492 Β1
TCCAAGATTT TGGTGCTGCG CAGTGTTGAA TACGCTCGTG CATTCAATGT GCCACTTCGC 900 GTACGCTCGT CTTATAGTAA TGATCCCGGC ACTTTGATTG CCGGCTCTAT GGAGGATATT 960 CCTGTGGAAG AAGCAGTCCT TACCGGTGTC GCAACCGACA AGTCCGAAGC CAAAGTAACC 1020 GTTCTGGGTA TTTCCGATAA GCCAGGCGAG GCTGCCAAGG TTTTCCGTGC GTTGGCTGAT 1080 GCAGAAATCA ACATTGACAT GGTTCTGCAG AACGTCTCCT CTGTGGAAGA CGGCACCACC 1140 GACATCACGT TCACCTGCCC TCGCGCTGAC GGACGCCGTG CGATGGAGAT CTTGAAGAAG 1200 CTTCAGGTTC AGGGCAACTG GACCAATGTG CTTTACGACG ACCAGGTCGG CAAAGTCTCC 1260 CTCGTGGGTG CTGGCATGAA GTCTCACCCA GGTGTTACCG CAGAGTTCAT GGAAGCTCTG 1320 CGCGATGTCA ACGTGAACAT CGAATTGATT TCCACCTCTG AGATCCGCAT TTCCGTGCTG 1380 ATCCGTGAAG ATGATCTGGA TGCTGCTGCA CGTGCATTGC ATGAGCAGTT CCAGCTGGGC 1440 GGCGAAGACG AAGCCGTCGT TTATGCAGGC ACCGGACGCT AAAGTTTTAA AGGAGTAGTT 1500 TTACAATGAC CACCATCGCA GTTGTTGGTG CAACCGGCCA GGTCGGCCAG GTTATGCGCA 1560 CCCTTTTGGA AGAGCGCAAT TTCCCAGCTG ACACTGTTCG TTTCTTTGCT TCCCCGCGTT 1620 CCGCAGGCCG TAAGATTGAA TTC 1643
A 4. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 1643 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: kettős
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: genomi DNS
EREDETI FORRÁS:
(A) ÉLŐLÉNY: (A) ÉLŐLÉNY: Brevibacterium lactofermentum (B) TÖRZS: ATCC 13869
SAJÁTSÁG:
(A) NÉV/KULCS: CDS (B) ELHELYEZKEDÉS: 217-1482
A 4. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
TCGCGAAGTA GCACCTGTCA CTTTTGTCTC ΑΑΆΤΑΤΤΑΑΑ TCGAATATCA ATATACGGTC 60
TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT 120
GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG 180
GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAG | GTG Met 1 | GCC Alá | CTG Leu | GTC Val | GTA Val 5 | CAG Gin | 234 |
AAA TAT GGC GGT TCC TCG CTT GAG AGT GCG | GAA | CGC | ATT | AGA | AAC | GTC | 282 |
Lys Tyr Gly Gly Ser Ser Leu Glu Ser Alá | Glu | Arg | Ile | Arg | Asn | Val | |
10 15 | 20 | ||||||
GCT GAA CGG ATC GTT GCC ACC AAG AAG GCT | GGA | AAT | GAT | GTC | GTG | GTT | 330 |
Alá Glu Arg Ile Val Alá Thr Lys Lys Alá | Gly | Asn | Asp | Val | Val | Val | |
25 30 | 35 | ||||||
GTC TGC TCC GCA ATG GGA GAC ACC ACG GAT | GAA | CTT | CTA | GAA | CTT | GCA | 378 |
Val Cys Ser Alá Met Gly Asp Thr Thr Asp | Glu | Leu | Leu | Glu | Leu | Alá | |
40 45 | 50 | ||||||
GCG GCA GTG AAT CCC GTT CCG CCA GCT CGT | GAA | ATG | GAT | ATG | CTC | CTG | 426 |
Alá Alá Val Asn Pro Val Pro Pro Alá Arg | Glu | Met | Asp | Met | Leu | Leu | |
55 60 | 65 | 70 | |||||
ACT GCT GGT GAG CGT ATT TCT AAC GCT CTC | GTC | GCC | ATG | GCT | ATT | GAG | 474 |
Thr Alá Gly Glu Arg Ile Ser Asn Alá Leu | Val | Alá | Met | Alá | Ile | Glu | |
75 80 | 85 | ||||||
TCC CTT GGC GCA GAA GCT CAA TCT TTC ACT | GGC | TCT | CAG | GCT | GGT | GTG | 522 |
Ser Leu Gly Alá Glu Alá Gin Ser Phe Thr | Gly | Ser | Gin | Alá | Gly | Val |
95 100
HU 224 492 Β1
CTC Leu | ACC Thr | ACC Thr 105 | GAG Glu | CGC Arg | CAC His | GGA Gly | AAC Asn 110 | GCA Alá | CGC ATT | GTT Val | GAC Asp 115 | GTC Val | ACA Thr | CCG Pro | 570 | |
Arg | Ile | |||||||||||||||
GGT | CGT | GTG | CGT | GAA | GCA | CTC | GAT | GAG | GGC | AAG | ATC | TGC | ATT | GTT | GCT | 618 |
Gly | Arg | Val | Arg | Glu | Alá | Leu | Asp | Glu | Gly | Lys | Ile | Cys | Ile | Val | Alá | |
120 | 125 | 130 | ||||||||||||||
GGT | TTT | CAG | GGT | GTT | AAT | AAA | GAA | ACC | CGC | GAT | GTC | ACC | ACG | TTG | GGT | 666 |
Gly | Phe | Gin | Gly | Val | Asn | Lys | Glu | Thr | Arg | Asp | Val | Thr | Thr | Leu | Gly | |
135 | 140 | 145 | 150 | |||||||||||||
CGT | GGT | GGT | TCT | GAC | ACC | ACT | GCA | GTT | GCG | TTG | GCA | GCT | GCT | TTG | AAC | 714 |
Arg | Gly | Gly | Ser | Asp | Thr | Thr | Alá | Val | Alá | Leu | Alá | Alá | Alá | Leu | Asn | |
155 | 160 | 165 | ||||||||||||||
GCT | GAT | GTG | TGT | GAG | ATT | TAC | TCG | GAC | GTT | GAC | GGT | GTG | TAT | ACC | GCT | 762 |
Alá | Asp | Val | Cys | Glu | Ile | Tyr | Ser | Asp | Val | Asp | Gly | Val | Tyr | Thr | Alá | |
170 | 175 | 180 | ||||||||||||||
GAC | CCG | CGC | ATC | GTT | CCT | AAT | GCA | CAG | AAG | CTG | GAA | AAG | CTC | AGC | TTC | 810 |
Asp | Pro | Arg | Ile | Val | Pro | Asn | Alá | Gin | Lys | Leu | Glu | Lys | Leu | Ser | Phe | |
185 | 190 | 195 | ||||||||||||||
GAA | GAA | ATG | CTG | GAA | CTT | GCT | GCT | GTT | GGC | TCC | AAG | ATT | TTG | GTG | CTG | 858 |
Glu | Glu | Met | Leu | Glu | Leu | Alá | Alá | Val | Gly | Ser | Lys | Ile | Leu | Val | Leu | |
200 | 205 | 210 | ||||||||||||||
CGC | AGT | GTT | GAA | TAC | GCT | CGT | GCA | TTC | AAT | GTG | CCA | CTT | CGC | GTA | CGC | 906 |
Arg | Ser | Val | Glu | Tyr | Alá | Arg | Alá | Phe | Asn | Val | Pro | Leu | Arg | Val | Arg | |
215 | 220 | 225 | 230 | |||||||||||||
TCG | TCT | TAT | AGT | AAT | GAT | CCC | GGC | ACT | TTG | ATT | GCC | GGC | TCT | ATG | GAG | 954 |
Ser | Ser | Tyr | Ser | Asn | Asp | Pro | Gly | Thr | Leu | Ile | Alá | Gly | Ser | Met | Glu | |
235 | 240 | 245 | ||||||||||||||
GAT | ATT | CCT | GTG | GAA | GAA | GCA | GTC | CTT | ACC | GGT | GTC | GCA | ACC | GAC | AAG | 1002 |
Asp | Ile | Pro | Val | Glu | Glu | Alá | Val | Leu | Thr | Gly | Val | Alá | Thr | Asp | Lys | |
250 | 255 | 260 | ||||||||||||||
TCC | GAA | GCC | AAA | GTA | ACC | GTT | CTG | GGT | ATT | TCC | GAT | AAG | CCA | GGC | GAG | 1050 |
Ser | Glu | Alá | Lys | Val | Thr | Val | Leu | Gly | Ile | Ser | Asp | Lys | Pro | Gly | Glu | |
265 | 270 | 275 | ||||||||||||||
GCT | GCC | AAG | GTT | TTC | CGT | GCG | TTG | GCT | GAT | GCA | GAA | ATC | AAC | ATT | GAC | 1098 |
Alá | Alá | Lys | Val | Phe | Arg | Alá | Leu | Alá | Asp | Alá | Glu | Ile | Asn | Ile | Asp | |
280 | 285 | 290 | ||||||||||||||
ATG | GTT | CTG | CAG | AAC | GTC | TCC | TCT | GTG | GAA | GAC | GGC | ACC | ACC | GAC | ATC | 1146 |
Met | Val | Leu | Gin | Asn | Val | Ser | Ser | Val | Glu | Asp | Gly | Thr | Thr | Asp | Ile | |
295 | 300 | 305 | 310 | |||||||||||||
ACG | TTC | ACC | TGC | CCT | CGC | GCT | GAC | GGA | CGC | CGT | GCG | ATG | GAG | ATC | TTG | 1194 |
Thr | Phe | Thr | Cys | Pro | Arg | Alá | Asp | Gly | Arg | Arg | Alá | Met | Glu | Ile | Leu | |
315 | 320 | 325 | ||||||||||||||
AAG | AAG | CTT | CAG | GTT | CAG | GGC | AAC | TGG | ACC | AAT | GTG | CTT | TAC | GAC | GAC | 1242 |
Lys | Lys | Leu | Gin | Val | Gin | Gly | Asn | Trp | Thr | Asn | Val | Leu | Tyr | Asp | Asp | |
330 | 335 | 340 |
HU 224 492 Β1
CAG Gin | GTC Val | GGC AAA GTC | TCC Ser | CTC Leu | GTG Val 350 | GGT Gly | GCT Alá | GGC ATG Gly Met | AAG Lys 355 | TCT Ser | CAC His | CCA Pro | 1290 | |||
Gly 345 | Lys | Val | ||||||||||||||
GGT | GTT | ACC | GCA | GAG | TTC | ATG | GAA | GCT | CTG | CGC | GAT | GTC | AAC | GTG | AAC | 1338 |
Gly | Val | Thr | Alá | Glu | Phe | Met | Glu | Alá | Leu | Arg | Asp | Val | Asn | Val | Asn | |
360 | 365 | 370 | ||||||||||||||
ATC | GAA | TTG | ATT | TCC | ACC | TCT | GAG | ATC | CGC | ATT | TCC | GTG | CTG | ATC | CGT | 1386 |
Ile | Glu | Leu | Ile | Ser | Thr | Ser | Glu | Ile | Arg | Ile | Ser | Val | Leu | Ile | Arg | |
375 | 380 | 385 | 390 | |||||||||||||
GAA | GAT | GAT | CTG | GAT | GCT | GCT | GCA | CGT | GCA | TTG | CAT | GAG | CAG | TTC | CAG | 1434 |
Glu | Asp | Asp | Leu | Asp | Alá | Alá | Alá | Arg | Alá | Leu | His | Glu | Gin | Phe | Gin | |
395 | 400 | 405 | ||||||||||||||
CTG | GGC | GGC | GAA | GAC | GAA | GCC | GTC | GTT | TAT | GCA | GGC | ACC | GGA | CGC | TAA | 1482 |
Leu | Gly | Gly | Glu | Asp | Glu | Alá | Val | Val | Tyr | Alá | Gly | Thr | Gly | Arg | ||
410 | 415 | 420 | ||||||||||||||
AGTTTTAAAG ' | GAGTAGTTTT ACAATGACCA CCATCGCAGT | TGTTGGTGCA ACCGGCCAGG | 1542 | |||||||||||||
TCGGCCAGGT ' | TATGCGCACC CTTTTGGAAG AGCGCAATTT | CCCAGCTGAC ACTGTTCGTT | 1602 | |||||||||||||
TCTTTGCTTC i | CCCGCGTTCC GCAGGCCGTA AGATTGAATT | C | 1643 |
AZ 5. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI: A SZEKVENCIA JELLEMZŐI:
HOSSZA: 421 aminosav TÍPUSA: aminosav TOPOLÓGIÁJA: lineáris MOLEKULATÍPUS: fehérje
AZ 5. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
Met 1 | Alá | Leu | Val | Val 5 | Gin | Lys | Tyr | Gly | Gly 10 | Ser | Ser | Leu | Glu | Ser 15 | Alá |
Glu | Arg | Ile | Arg | Asn | Val | Alá | Glu | Arg | Ile | Val | Alá | Thr | Lys | Lys | Alá |
20 | 25 | 30 | |||||||||||||
Gly | Asn | Asp | Val | Val | Val | Val | Cys | Ser | Alá | Met | Gly | Asp | Thr | Thr | Asp |
35 | 40 | 45 | |||||||||||||
Glu | Leu | Leu | Glu | Leu | Alá | Alá | Alá | Val | Asn | Pro | Val | Pro | Pro | Alá | Arg |
50 | 55 | 60 | |||||||||||||
Glu | Met | Asp | Met | Leu | Leu | Thr | Alá | Gly | Glu | Arg | Ile | Ser | Asn | Alá | Leu |
65 | 70 | 75 | 80 | ||||||||||||
Val | Alá | Met | Alá | Ile | Glu | Ser | Leu | Gly | Alá | Glu | Alá | Gin | Ser | Phe | Thr |
85 | 90 | 95 | |||||||||||||
Gly | Ser | Gin | Alá | Gly | Val | Leu | Thr | Thr | Glu | Arg | His | Gly | Asn | Alá | Arg |
100 | 105 | 110 | |||||||||||||
Ile | Val | Asp | Val | Thr | Pro | Gly | Arg | Val | Arg | Glu | Alá | Leu | Asp | Glu | Gly |
115 | 120 | 125 | |||||||||||||
Lys | Ile | Cys | Ile | Val | Alá | Gly | Phe | Gin | Gly | Val | Asn | Lys | Glu | Thr | Arg |
130 | 135 | 140 | |||||||||||||
Asp | Val | Thr | Thr | Leu | Gly | Arg | Gly | Gly | Ser | Asp | Thr | Thr | Alá | Val | Alá |
145 | 150 | 155 | 160 |
HU 224 492 Β1
Leu Alá Alá Alá | Leu 165 | Asn | Alá Asp Val | Cys 170 | Glu | Ile | Tyr | Ser | Asp 175 | Val | |||||
Asp | Gly | Val | Tyr | Thr | Alá | Asp | Pro | Arg | Ile | Val | Pro | Asn | Alá | Gin | Lys |
180 | 185 | 190 | |||||||||||||
Leu | Glu | Lys | Leu | Ser | Phe | Glu | Glu | Met | Leu | Glu | Leu | Alá | Alá | Val | Gly |
195 | 200 | 205 | |||||||||||||
Ser | Lys | Ile | Leu | Val | Leu | Arg | Ser | Val | Glu | Tyr | Alá | Arg | Alá | Phe | Asn |
210 | 215 | 220 | |||||||||||||
Val | Pro | Leu | Arg | Val | Arg | Ser | Ser | Tyr | Ser | Asn | Asp | Pro | Gly | Thr | Leu |
225 | 230 | 235 | 240 | ||||||||||||
Ile | Alá | Gly | Ser | Met | Glu | Asp | Ile | Pro | Val | Glu | Glu | Alá | Val | Leu | Thr |
245 | 250 | 255 | |||||||||||||
Gly | Val | Alá | Thr | Asp | Lys | Ser | Glu | Alá | Lys | Val | Thr | Val | Leu | Gly | Ile |
260 | 265 | 270 | |||||||||||||
Ser | Asp | Lys | Pro | Gly | Glu | Alá | Alá | Lys | Val | Phe | Arg | Alá | Leu | Alá | Asp |
275 | 280 | 285 | |||||||||||||
Alá | Glu | Ile | Asn | Ile | Asp | Met | Val | Leu | Gin | Asn | Val | Ser | Ser | Val | Glu |
290 | 295 | 300 | |||||||||||||
Asp | Gly | Thr | Thr | Asp | Ile | Thr | Phe | Thr | Cys | Pro | Arg | Alá | Asp | Gly | Arg |
305 | 310 | 315 | 320 | ||||||||||||
Arg | Alá | Met | Glu | Ile | Leu | Lys | Lys | Leu | Gin | Val | Gin | Gly | Asn | Trp | Thr |
325 | 330 | 335 | |||||||||||||
Asn | Val | Leu | Tyr | Asp | Asp | Gin | Val | Gly | Lys | Val | Ser | Leu | Val | Gly | Alá |
340 | 345 | 350 | |||||||||||||
Gly | Met | Lys | Ser | His | Pro | Gly | Val | Thr | Alá | Glu | Phe | Met | Glu | Alá | Leu |
355 | 360 | 365 | |||||||||||||
Arg | Asp | Val | Asn | Val | Asn | Ile | Glu | Leu | Ile | Ser | Thr | Ser | Glu | Ile | Arg |
370 | 375 | 380 | |||||||||||||
Ile | Ser | Val | Leu | Ile | Arg | Glu | Asp | Asp | Leu | Asp | Alá | Alá | Alá | Arg | Alá |
385 | 390 | 395 | 400 | ||||||||||||
Leu | His | Glu | Gin | Phe | Gin | Leu | Gly | Gly | Glu | Asp | Glu | Alá | Val | Val | Tyr |
405 | 410 | 415 |
Alá Gly Thr Gly Arg 420
A 6. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 1643 bázis TÍPUSA: nukleinsav HÁNY SZÁLÚ: kettős TOPOLÓGIÁJA: lineáris MOLEKULATÍPUS: genomi DNS EREDETI FORRÁS:
(A) ÉLŐLÉNY: (A) ÉLŐLÉNY: Brevibacterium lactofermentum
HU 224 492 Β1 (B) TÖRZS: ATCC 13869
SAJÁTSÁG:
(A) NÉV/KULCS: CDS (B) ELHELYEZKEDÉS: 964-1482
A 6. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
TCGCGAAGTA GCACCTGTCA CTTTTGTCTC AAATATTAAA TCGAATATCA ATATACGGTC 60
TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT 120
GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG 180
GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAGGTGG CCCTGGTCGT ACAGAAATAT 240
GGCGGTTCCT CGCTTGAGAG TGCGGAACGC ATTAGAAACG TCGCTGAACG GATCGTTGCC 300
ACCAAGAAGG CTGGAAATGA TGTCGTGGTT GTCTGCTCCG CAATGGGAGA CACCACGGAT 360
GAACTTCTAG AACTTGCAGC GGCAGTGAAT CCCGTTCCGC CAGCTCGTGA AATGGATATG 420
CTCCTGACTG CTGGTGAGCG TATTTCTAAC GCTCTCGTCG CCATGGCTAT TGAGTCCCTT 480
GGCGCAGAAG CTCAATCTTT CACTGGCTCT CAGGCTGGTG TGCTCACCAC CGAGCGCCAC 540
GGAAACGCAC GCATTGTTGA CGTCACACCG GGTCGTGTGC GTGAAGCACT CGATGAGGGC 600
AAGATCTGCA TTGTTGCTGG TTTTCAGGGT GTTAATAAAG AAACCCGCGA TGTCACCACG 660
TTGGGTCGTG GTGGTTCTGA CACCACTGCA GTTGCGTTGG CAGCTGCTTT GAACGCTGAT 720
GTGTGTGAGA TTTACTCGGA CGTTGACGGT GTGTATACCG CTGACCCGCG CATCGTTCCT 780
AATGCACAGA AGCTGGAAAA GCTCAGCTTC GAAGAAATGC TGGAACTTGC TGCTGTTGGC 840
TCCAAGATTT TGGTGCTGCG CAGTGTTGAA TACGCTCGTG CATTCAATGT GCCACTTCGC 900
GTACGCTCGT CTTATAGTAA TGATCCCGGC ACTTTGATTG CCGGCTCTAT GGAGGATATT 960
CCT GTG GAA GAA GCA GTC CTT ACC GGT GTC GCA ACC GAC AAG TCC GAA 1008
Met Glu Glu Alá Val Leu Thr Gly Val Alá Thr Asp Lys Ser Glu 15 10 15
GCC | AAA | GTA | ACC | GTT | CTG | GGT | ATT | TCC | GAT |
Alá | Lys | Val | Thr | Val 20 | Leu | Gly | Ile | Ser | Asp 25 |
AAG | GTT | TTC | CGT | GCG | TTG | GCT | GAT | GCA | GAA |
Lys | Val | Phe | Arg 35 | Alá | Leu | Alá | Asp | Alá 40 | Glu |
CTG | CAG | AAC | GTC | TCC | TCT | GTG | GAA | GAC | GGC |
Leu | Gin | Asn 50 | Val | Ser | Ser | Val | Glu 55 | Asp | Gly |
ACC | TGC | CCT | CGC | GCT | GAC | GGA | CGC | CGT | GCG |
Thr | Cys 65 | Pro | Arg | Alá | Asp | Gly 70 | Arg | Arg | Alá |
CTT | CAG | GTT | CAG | GGC | AAC | TGG | ACC | AAT | GTG |
Leu 80 | Gin | Val | Gin | Gly | Asn 85 | Trp | Thr | Asn | Val |
GGC | AAA | GTC | TCC | CTC | GTG | GGT | GCT | GGC | ATG |
Gly | Lys | Val | Ser | Leu 100 | Val | Gly | Alá | Gly | Met 105 |
ACC | GCA | GAG | TTC | ATG | GAA | GCT | CTG | CGC | GAT |
Thr | Alá | Glu | Phe 115 | Met | Glu | Alá | Leu | Arg 120 | Asp |
TTG | ATT | TCC | ACC | TCT | GAG | ATC | CGC | ATT | TCC |
Leu | Ile | Ser 130 | Thr | Ser | Glu | Ile | Arg 135 | Ile | Ser |
GAT | CTG | GAT | GCT | GCT | GCA | CGT | GCA | TTG | CAT |
Asp | Leu 145 | Asp | Alá | Alá | Alá | Arg 150 | Alá | Leu | His |
AAG CCA GGC GAG GCT GCC 1056
Lys Pro Gly Glu Alá Alá
ATC AAC ATT GAC ATG GTT 1104
Ile Asn Ile Asp Met Val
ACC ACC GAC ATC ACG TTC 1152
Thr Thr Asp Ile Thr Phe
ATG GAG ATC TTG AAG AAG 1200
Met Glu Ile Leu Lys Lys
CTT TAC GAC GAC CAG GTC 1248
Leu Tyr Asp Asp Gin Val
95
AAG TCT CAC CCA GGT GTT 1296
Lys Ser His Pro Gly Val
110
GTC AAC GTG AAC ATC GAA 1344
Val Asn Val Asn Ile Glu
125
GTG CTG ATC CGT GAA GAT 1392
Val Leu Ile Arg Glu Asp
140
GAG CAG TTC CAG CTG GGC 1440
Glu Gin Phe Gin Leu Gly
155
HU 224 492 Β1
GGC GAA GAC GAA GCC GTC GTT TAT GCA GGC ACC GGA CGC TAAAGTTTTAA 1490
Gly Glu Asp Glu Alá Val Val Tyr Alá Gly Thr Gly Arg 160 165 170
AGGAGTAGTT TTACAATGAC CACCATCGCA GTTGTTGGTG CAACCGGCCA GGTCGGCCAG 1550
GTTATGCGCA CCCTTTTGGA AGAGCGCAAT TTCCCAGCTG ACACTGTTCG TTTCTTTGCT 1610
TCCCCGCGTT CCGCAGGCCG TAAGATTGAA TTC 1643
A 7. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI: A SZEKVENCIA JELLEMZŐI:
HOSSZA: 172 aminosav
TÍPUSA: aminosav
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: fehérje
A 7. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
Met 1 | Glu | Glu Alá Val 5 | Leu | Thr | Gly | Val | Alá 10 | Thr | Asp | Lys | Ser | Glu 15 | Alá | ||
Lys | Val | Thr | Val | Leu | Gly | Ile | Ser | Asp | Lys | Pro | Gly | Glu | Alá | Alá | Lys |
20 | 25 | 30 | |||||||||||||
Val | Phe | Arg | Alá | Leu | Alá | Asp | Alá | Glu | Ile | Asn | Ile | Asp | Met | Val | Leu |
35 | 40 | 45 | |||||||||||||
Gin | Asn | Val | Ser | Ser | Val | Glu | Asp | Gly | Thr | Thr | Asp | Ile | Thr | Phe | Thr |
50 | 55 | 60 | |||||||||||||
Cys | Pro | Arg | Alá | Asp | Gly | Arg | Arg | Alá | Met | Glu | Ile | Leu | Lys | Lys | Leu |
65 | 70 | 75 | 80 | ||||||||||||
Gin | Val | Gin | Gly | Asn | Trp | Thr | Asn | Val | Leu | Tyr | Asp | Asp | Gin | Val | Gly |
85 | 90 | 95 | |||||||||||||
Lys | Val | Ser | Leu | Val | Gly | Alá | Gly | Met | Lys | Ser | His | Pro | Gly | Val | Thr |
100 | 105 | 110 | |||||||||||||
Alá | Glu | Phe | Met | Glu | Alá | Leu | Arg | Asp | Val | Asn | Val | Asn | Ile | Glu | Leu |
115 | 120 | 125 | |||||||||||||
Ile | Ser | Thr | Ser | Glu | Ile | Arg | Ile | Ser | Val | Leu | Ile | Arg | Glu | Asp | Asp |
130 | 135 | 140 | |||||||||||||
Leu | Asp | Alá | Alá | Alá | Arg | Alá | Leu | His | Glu | Gin | Phe | Gin | Leu | Gly | Gly |
145 | 150 | 155 | 160 | ||||||||||||
Glu | Asp | Glu | Alá | Val | Val | Tyr | Alá | Gly | Thr | Gly | Arg |
165 170
A 8. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁSA: /desc=„szintetikus DNS”
ANTISZENSZ: nem
A 8. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GTGGAGCCGA CCATTCCGCG AGG 23
HU 224 492 Β1
A 9. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁSA: /desc=„szintetikus DNS
ANTISZENSZ: igen
A 9. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
CGGTTCATCG CCAAGTTTTT CTT 23
A 10. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 2001 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: kettős
TOPOLÓGIÁJA: lineáris
MOLEKULATiPUS: genomi DNS
EREDETI FORRÁS:
(A) ÉLŐLÉNY: Brevibacterium lactofermentum (B) TÖRZS: ATCC 13869
SAJÁTSÁG:
(A) NÉV/KULCS: CDS (B) ELHELYEZKEDÉS: 730-1473
A 10. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GGATCCCCAA TCGATACCTG GAACGACAAC CTGATCAGGA TATCCAATGC CTTGAATATT 60
GACGTTGAGG AAGGAATCAC CAGCCATCTC AACTGGAAGA CCTGACGCCT GCTGAATTGG 120
ATCAGTGGCC CAATCGACCC ACCAACCAGG TTGGCTATTA CCGGCGATAT CAAAAACAAC 180
TCGCGTGAAC GTTTCGTGCT CGGCAACGCG GATGCCAGCG ATCGACATAT CGGAGTCACC 240
AACTTGAGCC TGCTGCTTCT GATCCATCGA CGGGGAACCC AACGGCGGCA AAGCAGTGGG 300
GGAAGGGGAG TTGGTGGACT CTGAATCAGT GGGCTCTGAA GTGGTAGGCG ACGGGGCAGC 360
ATCTGAAGGC GTGCGAGTTG TGGTGACCGG GTTAGCGGTT TCAGTTTCTG TCACAACTGG 420
AGCAGGACTA GCAGAGGTTG TAGGCGTTGA GCCGCTTCCA TCACAAGCAC TTAAAAGTAA 480
AGAGGCGGAA ACCACAAGCG CCAAGGAACT ACCTGCGGAA CGGGCGGTGA AGGGCAACTT 540
AAGTCTCATA TTTCAAACAT AGTTCCACCT GTGTGATTAA TCTCCAGAAC GGAACAAACT 600
GATGAACAAT CGTTAACAAC ACAGACCAAA ACGGTCAGTT AGGTATGGAT ATCAGCACCT 660
TCTGAATGGG TACGTCTAGA CTGGTGGGCG TTTGAAAAAC TCTTCGCCCC ACGAAAATGA 720
AGGAGCATA ATG GGA ATC AAG GTT GGC GTT CTC GGA GCC AAA GGC CGT 768
Met Gly Ile Lys Val Gly Val Leu Gly Alá Lys Gly Arg
10
GTT Val | GGT Gly 15 | CAA Gin | ACT Thr | ATT Ile | GTG Val | GCA Alá 20 | GCA Alá | GTC Val | AAT Asn | GAG Glu | TCC Ser 25 | GAC Asp | GAT Asp | CTG Leu | GAG Glu | 816 |
CTT | GTT | GCA | GAG | ATC | GGC | GTC | GAC | GAT | GAT | TTG | AGC | CTT | CTG | GTA | GAC | 864 |
Leu | Val | Alá | Glu | Ile | Gly | Val | Asp | Asp | Asp | Leu | Ser | Leu | Leu | Val | Asp | |
30 | 35 | 40 | 45 | |||||||||||||
AAC | GGC | GCT | GAA | GTT | GTC | GTT | GAC | TTC | ACC | ACT | CCT | AAC | GCT | GTG | ATG | 912 |
Asn | Gly | Alá | Glu | Val | Val | Val | Asp | Phe | Thr | Thr | Pro | Asn | Alá | Val | Met | |
50 | 55 | 60 | ||||||||||||||
GGC | AAC | CTG | GAG | TTC | TGC | ATC | AAC | AAC | GGC | ATT | TCT | GCG | GTT | GTT | GGA | 960 |
Gly | Asn | Leu | Glu | Phe | Cys | Ile | Asn | Asn | Gly | Ile | Ser | Alá | Val | Val | Gly | |
65 | 70 | 75 |
HU 224 492 Β1
1008
ACC Thr | ACG Thr | GGC Gly 80 | TTC Phe | GAT Asp | GAT Asp | GCT Alá | CGT Arg 85 | TTG Leu | GAG Glu | CAG Gin | GTT Val | CGC Arg 90 | GCC Alá | TGG Trp | CTT Leu |
GAA | GGA | AAA | GAC | AAT | GTC | GGT | GTT | CTG | ATC | GCA | CCT | AAC | TTT | GCT | ATC |
Glu | Gly | Lys | Asp | Asn | Val | Gly | Val | Leu | Ile | Alá | Pro | Asn | Phe | Alá | Ile |
95 | 100 | 105 | |||||||||||||
TCT | GCG | GTG | TTG | ACC | ATG | GTC | TTT | TCC | AAG | CAG | GCT | GCC | CGC | TTC | TTC |
Ser | Alá | Val | Leu | Thr | Met | Val | Phe | Ser | Lys | Gin | Alá | Alá | Arg | Phe | Phe |
110 | 115 | 120 | 125 | ||||||||||||
GAA | TCA | GCT | GAA | GTT | ATT | GAG | CTG | CAC | CAC | ccc | AAC | AAG | CTG | GAT | GCA |
Glu | Ser | Alá | Glu | Val | Ile | Glu | Leu | His | His | Pro | Asn | Lys | Leu | Asp | Alá |
130 | 135 | 140 | |||||||||||||
CCT | TCA | GGC | ACC | GCG | ATC | CAC | ACT | GCT | CAG | GGC | ATT | GCT | GCG | GCA | CGC |
Pro | Ser | Gly | Thr | Alá | Ile | His | Thr | Alá | Gin | Gly | Ile | Alá | Alá | Alá | Arg |
145 | 150 | 155 | |||||||||||||
AAA | GAA | GCA | GGC | ATG | GAC | GCA | CAG | CCA | GAT | GCG | ACC | GAG | CAG | GCA | CTT |
Lys | Glu | Alá | Gly | Met | Asp | Alá | Gin | Pro | Asp | Alá | Thr | Glu | Gin | Alá | Leu |
160 | 165 | 170 | |||||||||||||
GAG | GGT | TCC | CGT | GGC | GCA | AGC | GTA | GAT | GGA | ATC | CCA | GTT | CAC | GCA | GTC |
Glu | Gly | Ser | Arg | Gly | Alá | Ser | Val | Asp | Gly | Ile | Pro | Val | His | Alá | Val |
175 | 180 | 185 | |||||||||||||
CGC | ATG | TCC | GGC | ATG | GTT | GCT | CAC | GAG | CAA | GTT | ATC | TTT | GGC | ACC | CAG |
Arg | Met | Ser | Gly | Met | Val | Alá | His | Glu | Gin | Val | Ile | Phe | Gly | Thr | Gin |
190 | 195 | 200 | 205 | ||||||||||||
GGT | CAG | ACC | TTG | ACC | ATC | AAG | CAG | GAC | TCC | TAT | GAT | CGC | AAC | TCA | TTT |
Gly | Gin | Thr | Leu | Thr | Ile | Lys | Gin | Asp | Ser | Tyr | Asp | Arg | Asn | Ser | Phe |
210 | 215 | 220 | |||||||||||||
GCA | CCA | GGT | GTC | TTG | GTG | GGT | GTG | CGC | AAC | ATT | GCA | CAG | CAC | CCA | GGC |
Alá | Pro | Gly | Val | Leu | Val | Gly | Val | Arg | Asn | Ile | Alá | Gin | His | Pro | Gly |
225 | 230 | 235 | |||||||||||||
CTA | GTC | GTA | GGA | CTT | GAG | CAT | TAC | CTA | GGC | CTG | TAAAGGCTCA TTTCAGCAGC | ||||
Leu | Val | Val | Gly | Leu | Glu | His | Tyr | Leu | Gly | Leu |
240 245
1056
1104
1152
1200
1248
1296
1344
1392
1440
1493
GGGTGGAATT TTTTAAAAGG AGCGTTTAAA GGCTGTGGCC GAACAAGTTA AATTGAGCGT GGAGTTGATA GCGTGCAGTT CTTTTACTCC ACCCGCTGAT GTTGAGTGGT CAACTGATGT TGAGGGCGCG GAAGCACTCG TCGAGTTTGC GGGTCGTGCC TGCTACGAAA CTTTTGATAA GCCGAACCCT CGAACTGCTT CCAATGCTGC GTATCTGCGC CACATCATGG AAGTGGGGCA CACTGCTTTG CTTGAGCATG CCAATGCCAC GATGTATATC CGAGGCATTT CTCGGTCCGC GACCCATGAA TTGGTCCGAC ACCGCCATTT TTCCTTCTCT CAACTGTCTC AGCGTTTCGT GCACAGCGGA GAATCGGAAG TAGTGGTGCC CACTCTCATC GATGAAGATC CGCAGTTGCG TGAACTTTTC ATGCACGCCA TGGATGAGTC TCGGTTCGCT TTCAATGAGC TGCTTAATGC GCTGGAAGAA AAACTTGGCG ATGAACCG
A 11. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 248 aminosav
TÍPUSA: aminosav
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: fehérje
1553
1613
1673
1733
1793
1853
1913
1973
2001
HU 224 492 Β1
A 11. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
Met 1 | Gly | Ile | Lys | Val 5 | Gly | Val | Leu | Gly |
Thr | Ile | Val | Alá 20 | Alá | Val | Asn | Glu | Ser 25 |
Glu | Ile | Gly 35 | Val | Asp | Asp | Asp | Leu 40 | Ser |
Glu | Val 50 | Val | Val | Asp | Phe | Thr 55 | Thr | Pro |
Glu 65 | Phe | Cys | Ile | Asn | Asn 70 | Gly | Ile | Ser |
Phe | Asp | Asp | Alá | Arg 85 | Leu | Glu | Gin | Val |
Asp | Asn | Val | Gly 100 | Val | Leu | Ile | Alá | Pro 105 |
Leu | Thr | Met 115 | Val | Phe | Ser | Lys | Gin 120 | Alá |
Glu | Val 130 | Ile | Glu | Leu | His | His 135 | Pro | Asn |
Thr 145 | Alá | Ile | His | Thr | Alá 150 | Gin | Gly | Ile |
Gly | Met | Asp | Alá | Gin 165 | Pro | Asp | Alá | Thr |
Arg | Gly | Alá | Ser 180 | Val | Asp | Gly | Ile | Pro 185 |
Gly | Met | Val 195 | Alá | His | Glu | Gin | Val 200 | Ile |
Leu | Thr 210 | Ile | Lys | Gin | Asp | Ser 215 | Tyr | Asp |
Val 225 | Leu | Val | Gly | Val | Arg 230 | Asn | Ile | Alá |
Gly | Leu | Glu | His | Tyr | Leu | Gly | Leu |
245
A 12. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI: A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis TÍPUSA: nukleinsav HÁNY SZÁLÚ: egy TOPOLÓGIÁJA: lineáris MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁSA: /desc=,.szintetikus DNS”
ANTISZENSZ: nem
A 12. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GTCGACGGAT CGCAAATGGC AAC
Lys Gly Arg Val Gly Gin 15
Asp Leu Glu Leu Val Alá 30
Leu Val Asp Asn Gly Alá 45
Alá Val Met Gly Asn Leu 60
Val Val Gly Thr Thr Gly 75 80
Alá Trp Leu Glu Gly Lys 95
Phe Alá Ile Ser Alá Val 110
Arg Phe Phe Glu Ser Alá 125
Leu Asp Alá Pro Ser Gly 140
Alá Alá Arg Lys Glu Alá 155 160
Gin Alá Leu Glu Gly Ser 175
His Alá Val Arg Met Ser 190
Gly Thr Gin Gly Gin Thr 205
Asn Ser Phe Alá Pro Gly 220
His Pro Gly Leu Val Val 235 240
HU 224 492 Β1
A 13. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁSA: /desc=„szintetikus DNS
ANTISZENSZ: nem
A 13. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GGATCCTTGA GCACCTTGCG CAG 23
A 14. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 1411 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: kettős
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: genomi DNS
EREDETI FORRÁS:
(A) ÉLŐLÉNY: Brevibacterium lactofermentum (B) TÖRZS: ATCC 13869
SAJÁTSÁG:
(A) NÉV/KULCS: cds (B) ELHELYEZKEDÉS: 311...1213
A 14. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
CTCTCGATAT CGAGAGAGAA GCAGCGCCAC GGTTTTTCGG TGATTTTGAG ATTGAAACTT 60
TGGCAGACGG ATCGCAAATG GCAACAAGCC CGTATGTCAT GGACTTTTAA CGCAAAGCTC 120
ACACCCACGA GCTAAAAATT CATATAGTTA AGACAACATT TTTGGCTGTA AAAGACAGCC 180
GTAAAAACCT CTTGCTCATG TCAATTGTTC TTATCGGAAT GTGGCTTGGG CGATTGTTAT 240
GCAAAAGTTG TTAGGTTTTT TGCGGGGTTG TTTAACCCCC AAATGAGGGA AGAAGGTAAC 300
CTTGAACTCT ATG AGC ACA GGT TTA ACA GCT AAG ACC GGA GTA GAG CAC 349
Met Ser Thr Gly Leu Thr Alá Lys Thr Gly Val Glu His
10
TTC Phe | GGC ACC | GTT Val | GGA GTA Gly Val | GCA ATG | GTT ACT | CCA Pro | TTC Phe 25 | ACG Thr | GAA Glu | TCC Ser | GGA Gly | 397 | ||||
Gly 15 | Thr | Alá 20 | Met | Val | Thr | |||||||||||
GAC | ATC | GAT | ATC | GCT | GCT | GGC | CGC | GAA | GTC | GCG | GCT | TAT | TTG | GTT | GAT | 445 |
Asp | Ile | Asp | Ile | Alá | Alá | Gly | Arg | Glu | Val | Alá | Alá | Tyr | Leu | Val | Asp | |
30 | 35 | 40 | 45 | |||||||||||||
AAG | GGC | TTG | GAT | TCT | TTG | GTT | CTC | GCG | GGC | ACC | ACT | GGT | GAA | TCC | CCA | 493 |
Lys | Gly | Leu | Asp | Ser | Leu | Val | Leu | Alá | Gly | Thr | Thr | Gly | Glu | Ser | Pro | |
50 | 55 | 60 | ||||||||||||||
ACG | ACA | ACC | GCC | GCT | GAA | AAA | CTA | GAA | CTG | CTC | AAG | GCC | GTT | CGT | GAG | 541 |
Thr | Thr | Thr | Alá | Alá | Glu | Lys | Leu | Glu | Leu | Leu | Lys | Alá | Val | Arg | Glu | |
65 | 70 | 75 | ||||||||||||||
GAA | GTT | GGG | GAT | CGG | GCG | AAC | GTC | ATC | GCC | GGT | GTC | GGA | ACC | AAC | AAC | 589 |
Glu | Val | Gly | Asp | Arg | Alá | Asn | Val | Ile | Alá | Gly | Val | Gly | Thr | Asn | Asn | |
80 | 85 | 90 | ||||||||||||||
ACG | CGG | ACA | TCT | GTG | GAA | CTT | GCG | GAA | GCT | GCT | GCT | TCT | GCT | GGC | GCA | 637 |
Thr | Arg | Thr | Ser | Val | Glu | Leu | Alá | Glu | Alá | Alá | Alá | Ser | Alá | Gly | Alá | |
95 | 100 | 105 |
HU 224 492 Β1
GAC Asp 110 | GGC Gly | CTT Leu | TTA Leu | GTT Val | GTA ACT | CCT Pro | TAT Tyr | TAC Tyr | TCC Ser 120 | AAG Lys | CCG AGC | CAA GAG | 685 | |||
Val 115 | Thr | Pro | Ser | Gin | Glu 125 | |||||||||||
GGA | TTG | CTG | GCG | CAC | TTC | GGT | GCA | ATT | GCT | GCA | GCA | ACA | GAG | GTT | CCA | 733 |
Gly | Leu | Leu | Alá | His | Phe | Gly | Alá | Ile | Alá | Alá | Alá | Thr | Glu | Val | Pro | |
130 | 135 | 140 | ||||||||||||||
ATT | TGT | CTC | TAT | GAC | ATT | CCT | GGT | CGG | TCA | GGT | ATT | CCA | ATT | GAG | TCT | 781 |
Ile | Cys | Leu | Tyr | Asp | He | Pro | Gly | Arg | Ser | Gly | Ile | Pro | Ile | Glu | Ser | |
145 | 150 | 155 | ||||||||||||||
GAT | ACC | ATG | AGA | CGC | CTG | AGT | GAA | TTA | CCT | ACG | ATT | TTG | GCG | GTC | AAG | 829 |
Asp | Thr | Met | Arg | Arg | Leu | Ser | Glu | Leu | Pro | Thr | Ile | Leu | Alá | Val | Lys | |
160 | 165 | 170 | ||||||||||||||
GAC | GCC | AAG | GGT | GAC | CTC | GTT | GCA | GCC | ACG | TCA | TTG | ATC | AAA | GAA | ACG | 877 |
Asp | Alá | Lys | Gly | Asp | Leu | Val | Alá | Alá | Thr | Ser | Leu | Ile | Lys | Glu | Thr | |
175 | 180 | 185 | ||||||||||||||
GGA | CTT | GCC | TGG | TAT | TCA | GGC | GAT | GAC | CCA | CTA | AAC | CTT | GTT | TGG | CTT | 925 |
Gly | Leu | Alá | Trp | Tyr | Ser | Gly | Asp | Asp | Pro | Leu | Asn | Leu | Val | Trp | Leu | |
190 | 195 | 200 | 205 | |||||||||||||
GCT | TTG | GGC | GGA | TCA | GGT | TTC | ATT | TCC | GTA | ATT | GGA | CAT | GCA | GCC | CCC | 973 |
Alá | Leu | Gly | Gly | Ser | Gly | Phe | Ile | Ser | Val | Ile | Gly | His | Alá | Alá | Pro | |
210 | 215 | 220 | ||||||||||||||
ACA | GCA | TTA | CGT | GAG | TTG | TAC | ACA | AGC | TTC | GAG | GAA | GGC | GAC | CTC | GTC | 1021 |
Thr | Alá | Leu | Arg | Glu | Leu | Tyr | Thr | Ser | Phe | Glu | Glu | Gly | Asp | Leu | Val | |
225 | 230 | 235 | ||||||||||||||
CGT | GCG | CGG | GAA | ATC | AAC | GCC | AAA | CTA | TCA | CCG | CTG | GTA | GCT | GCC | CAA | 1069 |
Arg | Alá | Arg | Glu | Ile | Asn | Alá | Lys | Leu | Ser | Pro | Leu | Val | Alá | Alá | Gin | |
240 | 245 | 250 | ||||||||||||||
GGT | CGC | TTG | GGT | GGA | GTC | AGC | TTG | GCA | AAA | GCT | GCT | CTG | CGT | CTG | CAG | 1117 |
Gly | Arg | Leu | Gly | Gly | Val | Ser | Leu | Alá | Lys | Alá | Alá | Leu | Arg | Leu | Gin | |
255 | 260 | 265 | ||||||||||||||
GGC | ATC | AAC | GTA | GGA | GAT | CCT | CGA | CTT | CCA | ATT | ATG | GCT | CCA | AAT | GAG | 1165 |
Gly | Ile | Asn | Val | Gly | Asp | Pro | Arg | Leu | Pro | Ile | Met | Alá | Pro | Asn | Glu | |
270 | 275 | 280 | 285 | |||||||||||||
CAG | GAA | CTT | GAG | GCT | CTC | CGA | GAA | GAC | ATG | AAA | AAA | GCT | GGA | GTT | CTA | 1213 |
Gin | Glu | Leu | Glu | Alá | Leu | Arg | Glu | Asp | Met | Lys | Lys | Alá | Gly | Val | Leu | |
290 | 295 | 300 | ||||||||||||||
TAAATATGAA TGATTCCCGA AATCGCGGCC | : GGAAGGTTAC | CCGCAAGGCG GCCCACCAGA | 1273 | |||||||||||||
AGCTGGTCAG GAAAACCATC TGGATACCCC | ; TGTCTTTCAG | GCACCAGATG CTTCCTCTAA | 1333 | |||||||||||||
CCAGAGCGCT GTAAAAGCTG AGACCGCCGG | í AAACGACAAT | CGGGATGCTG CGCAAGGTGC | 1393 |
TCAAGGATCC CAACATTC 1411
A 15. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 301 aminosav
TÍPUSA: aminosav
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: fehérje
HU 224 492 Β1
A 15. AZONOSÍTÓ SZÁMÚ SZEKVENCIA | LEÍRÁSA: | ||||||||||||||
Met 1 | Ser | Thr | Gly | Leu 5 | Thr | Alá | Lys | Thr | Gly 10 | Val | Glu | His | Phe | Gly 15 | Thr |
Val | Gly | Val | Alá | Met | Val | Thr | Pro | Phe | Thr | Glu | Ser | Gly | Asp | Ile | Asp |
20 | 25 | 30 | |||||||||||||
Ile | Alá | Alá | Gly | Arg | Glu | Val | Alá | Alá | Tyr | Leu | Val | Asp | Lys | Gly | Leu |
35 | 40 | 45 | |||||||||||||
Asp | Ser | Leu | Val | Leu | Alá | Gly | Thr | Thr | Gly | Glu | Ser | Pro | Thr | Thr | Thr |
50 | 55 | 60 | |||||||||||||
Alá | Alá | Glu | Lys | Leu | Glu | Leu | Leu | Lys | Alá | Val | Arg | Glu | Glu | Val | Gly |
65 | 70 | 75 | 80 | ||||||||||||
Asp | Arg | Alá | Asn | Val | Ile | Alá | Gly | Val | Gly | Thr | Asn | Asn | Thr | Arg | Thr |
85 | 90 | 95 | |||||||||||||
Ser | Val | Glu | Leu | Alá | Glu | Alá | Alá | Alá | Ser | Alá | Gly | Alá | Asp | Gly | Leu |
100 | 105 | 110 | |||||||||||||
Leu | Val | Val | Thr | Pro | Tyr | Tyr | Ser | Lys | Pro | Ser | Gin | Glu | Gly | Leu | Leu |
115 | 120 | 125 | |||||||||||||
Alá | His | Phe | Gly | Alá | Ile | Alá | Alá | Alá | Thr | Glu | Val | Pro | Ile | Cys | Leu |
130 | 135 | 140 | |||||||||||||
Tyr | Asp | Ile | Pro | Gly | Arg | Ser | Gly | Ile | Pro | Ile | Glu | Ser | Asp | Thr | Met |
145 | 150 | 155 | 160 | ||||||||||||
Arg | Arg | Leu | Ser | Glu | Leu | Pro | Thr | Ile | Leu | Alá | Val | Lys | Asp | Alá | Lys |
165 | 170 | 175 | |||||||||||||
Gly | Asp | Leu | Val | Alá | Alá | Thr | Ser | Leu | Ile | Lys | Glu | Thr | Gly | Leu | Alá |
180 | 185 | 190 | |||||||||||||
Trp | Tyr | Ser | Gly | Asp | Asp | Pro | Leu | Asn | Leu | Val | Trp | Leu | Alá | Leu | Gly |
195 | 200 | 205 | |||||||||||||
Gly | Ser | Gly | Phe | Ile | Ser | Val | Ile | Gly | His | Alá | Alá | Pro | Thr | Alá | Leu |
210 | 215 | 220 | |||||||||||||
Arg | Glu | Leu | Tyr | Thr | Ser | Phe | Glu | Glu | Gly | Asp | Leu | Val | Arg | Alá | Arg |
225 | 230 | 235 | 240 | ||||||||||||
Glu | Ile | Asn | Alá | Lys | Leu | Ser | Pro | Leu | Val | Alá | Alá | Gin | Gly | Arg | Leu |
245 | 250 | 255 | |||||||||||||
Gly | Gly | Val | Ser | Leu | Alá | Lys | Alá | Alá | Leu | Arg | Leu | Gin | Gly | Ile | Asn |
260 | 2S5 | 270 | |||||||||||||
Val | Gly | Asp | Pro | Arg | Leu | Pro | Ile | Met | Alá | Pro | Asn | Glu | Gin | Glu | Leu |
275 | 280 | 285 | |||||||||||||
Glu | Alá | Leu | Arg | Glu | Asp | Met | Lys | Lys | Alá | Gly | Val | Leu | |||
290 | 295 | 300 |
HU 224 492 Β1
A 16. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁS: /desc=„szintetikus DNS”
ANTISZENSZ: nem
A 16. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GTGGAGCCGA CCATTCCGCG AGG 23
A 17. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁS: /desc=„szintetikus DNS”
ANTISZENSZ: igen
A 17. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
CCAAAACCGC CCTCCACGGC GAA 23
A 18. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 3579 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: kettős
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: genomi DNS
EREDETI FORRÁS:
(A) ÉLŐLÉNY: Brevibacterium lactofermentum (B) ELHELYEZKEDÉS: ATCC 13869
SAJÁTSÁG:
(A) NÉV/KULCS: cds (B) ELHELYEZKEDÉS: 533...2182
SAJÁTSÁG:
(A) NÉV/KULCS: cds (B) ELHELYEZKEDÉS: 2188...3522
A 18. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GTGGAGCCGA CCATTCCGCG AGGCTGCACT GCAACGAGGT CGTAGTTTTG GTACATGGCT 60
TCTGGCCAGT TCATGGATTG GCTGCCGAAG AAGCTATAGG CATCGCACCA GGGCCACCGA 120
GTTACCGAAG ATGGTGCCGT GCTTTTCGCC TTGGGCAGGG ACCTTGACAA AGCCCACGCT 180
GATATCGCCA AGTGAGGGAT CAGAATAGTG CATGGGCACG TCGATGCTGC CACATTGAGC 240
GGAGGCAATA TCTACCTGAG GTGGGCATTC TTCCCAGCGG ATGTTTTCTT GCGCTGCTGC 300
AGTGGGCATT GATACCAAAA AGGGGCTAAG CGCAGTCGAG GCGGCAAGAA CTGCTACTAC 360
CCTTTTTATT GTCGAACGGG GCATTACGGC TCCAAGGACG TTTGTTTTCT GGGTCAGTTA 420
CCCCAAAAAG CATATACAGA GACCAATGAT TTTTCATTAA AAAGGCAGGG ATTTGTTATA 480
AGTATGGGTC GTATTCTGTG CGACGGGTGT ACCTCGGCTA GAATTTCTCC CC ATG 535
Met
ACA CCA GCT GAT CTC GCA ACA TTG ATT AAA GAG ACC GCG GTA GAG GTT Thr Pro Alá Asp Leu Alá Thr Leu Ile Lys Glu Thr Alá Val Glu Val
TTG ACC TCC CGC GAG CTC GAT ACT TCT GTT CTT CCG GAG CAG GTA GTT Leu Thr Ser Arg Glu Leu Asp Thr Ser Val Leu Pro Glu Gin Val Val
583
631
HU 224 492 Β1
GTG Val | GAG Glu 35 | CGT Arg | CCG Pro | CGT Arg | AAC Asn | CCA GAG | CAC His | GGC Gly | GAT Asp | TAC Tyr 45 | GCC Alá | ACC Thr | AAC Asn | ATT Ile | 679 | |
Pro 40 | Glu | |||||||||||||||
GCA | TTG | CAG | GTG | GCT | AAA | AAG | GTC | GGT | CAG | AAC | CCT | CGG | GAT | TTG | GCT | 727 |
Alá | Leu | Gin | Val | Alá | Lys | Lys | Val | Gly | Gin | Asn | Pro | Arg | Asp | Leu | Alá | |
50 | 55 | 60 | 65 | |||||||||||||
ACC | TGG | CTG | GCA | GAG | GCA | TTG | GCT | GCA | GAT | GAC | GCC | ATT | GAT | TCT | GCT | 775 |
Thr | Trp | Leu | Alá | Glu | Alá | Leu | Alá | Alá | Asp | Asp | Alá | Ile | Asp | Ser | Alá | |
70 | 75 | 80 | ||||||||||||||
GAA | ATT | GCT | GGC | CCA | GGC | TTT | TTG | AAC | ATT | CGC | CTT | GCT | GCA | GCA | GCA | 823 |
Glu | Ile | Alá | Gly | Pro | Gly | Phe | Leu | Asn | Ile | Arg | Leu | Alá | Alá | Alá | Alá | |
85 | 90 | 95 | ||||||||||||||
CAG | GGT | GAA | ATT | GTG | GCC | AAG | ATT | CTG | GCA | CAG | GGC | GAG | ACT | TTC | GGA | 871 |
Gin | Gly | Glu | Ile | Val | Alá | Lys | Ile | Leu | Alá | Gin | Gly | Glu | Thr | Phe | Gly | |
100 | 105 | 110 | ||||||||||||||
AAC | TCC | GAT | CAC | CTT | TCC | CAC | TTG | GAC | GTG | AAC | CTC | GAG | TTC | GTT | TCT | 919 |
Asn | Ser | Asp | His | Leu | Ser | His | Leu | Asp | Val | Asn | Leu | Glu | Phe | Val | Ser | |
115 | 120 | 125 | ||||||||||||||
GCA | AAC | CCA | ACC | GGA | CCT | ATT | CAC | CTT | GGC | GGA | ACC | CGC | TGG | GCT | GCC | 967 |
Alá | Asn | Pro | Thr | Gly | Pro | Ile | His | Leu | Gly | Gly | Thr | Arg | Trp | Alá | Alá | |
130 | 135 | 140 | 145 | |||||||||||||
GTG | GGT | GAC | TCT | TTG | GGT | CGT | GTG | CTG | GAG | GCT | TCC | GGC | GCG | AAA | GTG | 1015 |
Val | Gly | Asp | Ser | Leu | Gly | Arg | Val | Leu | Glu | Alá | Ser | Gly | Alá | Lys | Val | |
150 | 155 | 160 | ||||||||||||||
ACC | CGC | GAA | TAC | TAC | TTC | AAC | GAT | CAC | GGT | CGC | CAG | ATC | GAT | CGT | TTC | 1063 |
Thr | Arg | Glu | Tyr | Tyr | Phe | Asn | Asp | His | Gly | Arg | Gin | Ile | Asp | Arg | Phe | |
165 | 170 | 175 | ||||||||||||||
GCT | TTG | TCC | CTT | CTT | GCA | GCG | GCG | AAG | GGC | GAG | CCA | ACG | CCA | GAA | GAC | 1111 |
Alá | Leu | Ser | Leu | Leu | Alá | Alá | Alá | Lys | Gly | Glu | Pro | Thr | Pro | Glu | Asp | |
180 | 185 | 190 | ||||||||||||||
GGT | TAT | GGC | GGC | GAA | TAC | ATT | AAG | GAA | ATT | GCG | GAG | GCA | ATC | GTC | GAA | 1159 |
Gly | Tyr | Gly | Gly | Glu | Tyr | Ile | Lys | Glu | Ile | Alá | Glu | Alá | Ile | Val | Glu | |
195 | 200 | 205 | ||||||||||||||
AAG | CAT | CCT | GAA | GCG | TTG | GCT | TTG | GAG | CCT | GCC | GCA | ACC | CAG | GAG | CTT | 1207 |
Lys | His | Pro | Glu | Alá | Leu | Alá | Leu | Glu | Pro | Alá | Alá | Thr | Gin | Glu | Leu | |
210 | 215 | 220 | 225 | |||||||||||||
TTC | CGC | GCT | GAA | GGC | GTG | GAG | ATG | ATG | TTC | GAG | CAC | ATC | AAA | TCT | TCC | 1255 |
Phe | Arg | Alá | Glu | Gly | Val | Glu | Met | Met | Phe | Glu | His | Ile | Lys | Ser | Ser | |
230 | 235 | 240 | ||||||||||||||
CTG | CAT | GAG | TTC | GGC | ACC | GAT | TTC | GAT | GTC | TAC | TAC | CAC | GAG | AAC | TCC | 1303 |
Leu | His | Glu | Phe | Gly | Thr | Asp | Phe | Asp | Val | Tyr | Tyr | His | Glu | Asn | Ser | |
245 | 250 | 255 | ||||||||||||||
CTG | TTC | GAG | TCC | GGT | GCG | GTG | GAC | AAG | GCC | GTG | CAG | GTG | CTG | AAG | GAC | 1351 |
Leu | Phe | Glu | Ser | Gly | Alá | Val | Asp | Lys | Alá | Val | Gin | Val | Leu | Lys | Asp | |
260 | 265 | 270 |
HU 224 492 Β1
AAC Asn | GGC Gly 275 | AAC Asn | CTG Leu | TAC Tyr | GAA AAC Glu Asn 280 | GAG Glu | GGC Gly | GCT Alá | TGG Trp | TGG Trp 285 | CTG Leu | CGT Arg | TCC Ser | ACC Thr | 1399 | |
GAA | TTC | GGC | GAT | GAC | AAA | GAC | CGC | GTG | GTG | ATC | AAG | TCT | GAC | GGC | GAC | 1447 |
Glu | Phe | Gly | Asp | Asp | Lys | Asp | Arg | Val | Val | Ile | Lys | Ser | Asp | Gly | Asp | |
290 | 295 | 300 | 305 | |||||||||||||
GCA | GCC | TAC | ATC | GCT | GGC | GAT | ATC | GCG | TAC | GTG | GCT | GAT | AAG | TTC | TCC | 1495 |
Alá | Alá | Tyr | Ile | Alá | Gly | Asp | Ile | Alá | Tyr | Val | Alá | Asp | Lys | Phe | Ser | |
310 | 315 | 320 | ||||||||||||||
CGC | GGA | CAC | AAC | CTA | AAC | ATC | TAC | ATG | TTG | GGT | GCT | GAC | CAC | CAT | GGT | 1543 |
Arg | Gly | His | Asn | Leu | Asn | Ile | Tyr | Met | Leu | Gly | Alá | Asp | His | His | Gly | |
325 | 330 | 335 | ||||||||||||||
TAC | ATC | GCG | CGC | CTG | AAG | GCA | GCG | GCG | GCG | GCA | CTT | GGC | TAC | AAG | CCA | 1591 |
Tyr | Ile | Alá | Arg | Leu | Lys | Alá | Alá | Alá | Alá | Alá | Leu | Gly | Tyr | Lys | Pro | |
340 | 345 | 350 | ||||||||||||||
GAA | GGC | GTT | GAA | GTC | CTG | ATT | GGC | CAG | ATG | GTG | AAC | CTG | CTT | CGC | GAC | 1639 |
Glu | Gly | Val | Glu | Val | Leu | Ile | Gly | Gin | Met | Val | Asn | Leu | Leu | Arg | Asp | |
355 | 360 | 365 | ||||||||||||||
GGC | AAG | GCA | GTG | CGT | ATG | TCC | AAG | CGT | GCA | GGC | ACC | GTG | GTC | ACC | CTA | 1687 |
Gly | Lys | Alá | Val | Arg | Met | Ser | Lys | Arg | Alá | Gly | Thr | Val | Val | Thr | Leu | |
370 | 375 | 380 | 385 | |||||||||||||
GAT | GAC | CTC | GTT | GAA | GCA | ATC | GGC | ATC | GAT | GCG | GCG | CGT | TAC | TCC | CTG | 1735 |
Asp | Asp | Leu | Val | Glu | Alá | Ile | Gly | Ile | Asp | Alá | Alá | Arg | Tyr | Ser | Leu | |
390 | 395 | 400 | ||||||||||||||
ATC | CGT | TCC | TCC | GTG | GAT | TCT | TCC | CTG | GAT | ATC | GAT | CTC | GGC | CTG | TGG | 1783 |
Ile | Arg | Ser | Ser | Val | Asp | Ser | Ser | Leu | Asp | Ile | Asp | Leu | Gly | Leu | Trp | |
405 | 410 | 415 | ||||||||||||||
GAA | TCC | CAG | TCC | TCC | GAC | AAC | CCT | GTG | TAC | TAC | GTG | CAG | TAC | GGA | CAC | 1831 |
Glu | Ser | Gin | Ser | Ser | Asp | Asn | Pro | Val | Tyr | Tyr | Val | Gin | Tyr | Gly | His | |
420 | 425 | 430 | ||||||||||||||
GCT | CGT | CTG | TGC | TCC | ATC | GCG | CGC | AAG | GCA | GAG | ACC | TTG | GGT | GTC | ACC | 1879 |
Alá | Arg | Leu | Cys | Ser | Ile | Alá | Arg | Lys | Alá | Glu | Thr | Leu | Gly | Val | Thr | |
435 | 440 | 445 | ||||||||||||||
GAG | GAA | GGC | GCA | GAC | CTA | TCT | CTA | CTG | ACC | CAC | GAC | CGC | GAA | GGC | GAT | 1927 |
Glu | Glu | Gly | Alá | Asp | Leu | Ser | Leu | Leu | Thr | His | Asp | Arg | Glu | Gly | Asp | |
450 | 455 | 460 | 465 | |||||||||||||
CTC | ATC | CGC | ACA | CTC | GGA | GAG | TTC | CCA | GCA | GTG | GTG | AAG | GCT | GCC | GGT | 1975 |
Leu | Ile | Arg | Thr | Leu | Gly | Glu | Phe | Pro | Alá | Val | Val | Lys | Alá | Alá | Alá | |
470 | 475 | 480 | ||||||||||||||
GAC | CTA | CGT | GAA | CCA | CAC | CGC | ATT | GCC | CGC | TAT | GCT | GAG | GAA | TTA | GCT | 2023 |
Asp | Leu | Arg | Glu | Pro | His | Arg | Ile | Alá | Arg | Tyr | Alá | Glu | Glu | Leu | Alá | |
485 | 490 | 495 | ||||||||||||||
GGA | ACT | TTC | CAC | CGC | TTC | TAC | GAT | TCC | TGC | CAC | ATC | CTT | CCA | AAG | GTT | 2071 |
Gly | Thr | Phe | His | Arg | Phe | Tyr | Asp | Ser | Cys | His | Ile | Leu | Pro | Lys | Val | |
500 | 505 | 510 |
HU 224 492 Β1
GAT Asp | GAG Glu 515 | GAT Asp | ACG Thr | GCA Alá | CCA ATC | CAC ACA GCA | CGT Arg | CTG Leu 525 | GCA Alá | CTT Leu | GCA Alá | GCA Alá | 2119 | ||
Pro | Ile 520 | His | Thr Alá | ||||||||||||
GCA | ACC | CGC | CAG | ACC | CTC | GCT | AAC | GCC CTG | CAC | CTG | GTT | GGC | GTT | TCC | 2167 |
Alá | Thr | Arg | Gin | Thr | Leu | Alá | Asn | Alá Leu | His | Leu | Val | Gly | Val | Ser | |
530 | 535 | 540 | 545 | ||||||||||||
GCA | CCG | GAG | AAG | ATG | TAACA ATG GCT ACA GTT GAA AAT TTC AAT GAA | 2214 | |||||||||
Alá | Pro | Glu | Lys | Met | Met Alá Thr Val Glu Asn Phe Asn Glu | ||||||||||
550 | 1 | 5 | |||||||||||||
CTT | CCC | GCA | CAC | GTA | TGG | CCA | CGC | AAT GCC | GTG | CGC | CAA | GAA | GAC | GGC | 2262 |
Leu | Pro | Alá | His | Val | Trp | Pro | Arg | Asn Alá | Val | Arg | Gin | Glu | Asp | Gly | |
10 | 15 | 20 | 25 | ||||||||||||
GTT | GTC | ACC | GTC | GCT | GGT | GTG | CCT | CTG CCT | GAC | CTC | GCT | GAA | GAA | TAC | 2310 |
Val | Val | Thr | Val | Alá | Gly | Val | Pro | Leu Pro | Asp | Leu | Alá | Glu | Glu | Tyr | |
30 | 35 | 40 | |||||||||||||
GGA | ACC | CCA | CTG | TTC | GTA | GTC | GAC | GAG GAC | GAT | TTC | CGT | TCC | CGC | TGT | 2358 |
Gly | Thr | Pro | Leu | Phe | Val | Val | Asp | Glu Asp | Asp | Phe | Arg | Ser | Arg | Cys | |
45 | 50 | 55 | |||||||||||||
CGC | GAC | ATG | GCT | ACC | GCA | TTC | GGT | GGA CCA | GGC | AAT | GTG | CAC | TAC | GCA | 2406 |
Arg | Asp | Met | Alá | Thr | Alá | Phe | Gly | Gly Pro | Gly | Asn | Val | His | Tyr | Alá | |
60 | 65 | 70 | |||||||||||||
TCT | AAA | GCG | TTC | CTG | ACC | AAG | ACC | ATT GCA | CGT | TGG | GTT | GAT | GAA | GAG | 2454 |
Ser | Lys | Alá | Phe | Leu | Thr | Lys | Thr | Ile Alá | Arg | Trp | Val | Asp | Glu | Glu | |
75 | 80 | 85 | |||||||||||||
GGG | CTG | GCA | CTG | GAC | ATT | GCA | TCC | ATC AAC | GAA | CTG | GGC | ATT | GCC | CTG | 2502 |
Gly | Leu | Alá | Leu | Asp | Ile | Alá | Ser | Ile Asn | Glu | Leu | Gly | Ile | Alá | Leu | |
90 | 95 | 100 | 105 | ||||||||||||
GCC | GCT | GGT | TTC | CCC | GCC | AGC | CGT | ATC ACC | GCG | CAC | GGC | AAC | AAC | AAA | 2550 |
Alá | Alá | Gly | Phe | Pro | Alá | Ser | Arg | Ile Thr | Alá | His | Gly | Asn | Asn | Lys | |
110 | 115 | 120 | |||||||||||||
GGC | GTA | GAG | TTC | CTG | CGC | GCG | TTG | GTT CAA | AAC | GGT | GTG | GGA | CAC | GTG | 2598 |
Gly | Val | Glu | Phe | Leu | Arg | Alá | Leu | Val Gin | Asn | Gly | Val | Gly | His | Val | |
125 | 130 | 135 | |||||||||||||
GTG | CTG | GAC | TCC | GCA | CAG | GAA | CTA | GAA CTG | TTG | GAT | TAC | GTT | GCC | GCT | 2646 |
Val | Leu | Asp | Ser | Alá | Gin | Glu | Leu | Glu Leu | Leu | Asp | Tyr | Val | Alá | Alá | |
140 | 145 | 150 | |||||||||||||
GGT | GAA | GGC | AAG | ATT | CAG | GAC | GTG | TTG ATC | CGC | GTA | AAG | CCA | GGC | ATC | 2694 |
Gly | Glu | Gly | Lys | Ile | Gin | Asp | Val | Leu Ile | Arg | Val | Lys | Pro | Gly | Ile | |
155 | 160 | 165 | |||||||||||||
GAA | GCA | CAC | ACC | CAC | GAG | TTC | ATC | GCC ACT | AGC | CAC | GAA | GAC | CAG | AAG | 2742 |
Glu | Alá | His | Thr | His | Glu | Phe | Ile | Alá Thr | Ser | His | Glu | Asp | Gin | Lys | |
170 | 175 | 180 | 185 | ||||||||||||
TTC | GGA | TTC | TCC | CTG | GCA | TCC | GGT | TCC GCA | TTC | GAA | GCA | GCA | AAA | GCC | 2790 |
Phe | Gly | Phe | Ser | Leu | Alá | Ser | Gly | Ser Alá | Phe | Glu | Alá | Alá | Lys | Alá | |
190 | 195 | 200 |
HU 224 492 Β1
GCC Alá | AAC Asn | AAC Asn | GCA Alá 205 | GAA Glu | AAC Asn | CTG Leu | AAC Asn | CTG Leu 210 | GTT Val | GGC Gly | CTG Leu | CAC His | TGC Cys 215 | CAC His | GTT Val | 2838 |
GGT | TCC | CAG | GTG | TTC | GAC | GCC | GAA | GGC | TTC | AAG | CTG | GCA | GCA | GAA | CGC | 2886 |
Gly | Ser | Gin | Val | Phe | Asp | Alá | Glu | Gly | Phe | Lys | Leu | Alá | Alá | Glu | Arg | |
220 | 225 | 230 | ||||||||||||||
GTG | TTG | GGC | CTG | TAC | TCA | CAG | ATC | CAC | AGC | GAA | CTG | GGC | GTT | GCC | CTT | 2934 |
Val | Leu | Gly | Leu | Tyr | Ser | Gin | Ile | His | Ser | Glu | Leu | Gly | Val | Alá | Leu | |
235 | 240 | 245 | ||||||||||||||
CCT | GAA | CTG | GAT | CTC | GGT | GGC | GGA | TAC | GGC | ATT | GCC | TAT | ACC | GCA | GCT | 2982 |
Pro | Glu | Leu | Asp | Leu | Gly | Gly | Gly | Tyr | Gly | Ile | Alá | Tyr | Thr | Alá | Alá | |
250 | 255 | 260 | 265 | |||||||||||||
GAA | GAA | CCA | CTC | AAC | GTC | GCA | GAA | GTT | GCC | TCC | GAC | CTG | CTC | ACC | GCA | 3030 |
Glu | Glu | Pro | Leu | Asn | Val | Alá | Glu | Val | Alá | Ser | Asp | Leu | Leu | Thr | Alá | |
270 | 275 | 280 | ||||||||||||||
GTC | GGA | AAA | ATG | GCA | GCG | GAA | CTA | GGC | ATC | GAC | GCA | CCA | ACC | GTG | CTT | 3078 |
Val | Gly | Lys | Met | Alá | Alá | Glu | Leu | Gly | Ile | Asp | Alá | Pro | Thr | Val | Leu | |
285 | 290 | 295 | ||||||||||||||
GTT | GAG | CCC | GGC | CGC | GCT | ATC | GCA | GGC | CCC | TCC | ACC | GTG | ACC | ATC | TAC | 3126 |
Val | Glu | Pro | Gly | Arg | Alá | Ile | Alá | Gly | Pro | Ser | Thr | Val | Thr | Ile | Tyr | |
300 | 305 | 310 | ||||||||||||||
GAA | GTC | GGC | ACC | ACC | AAA | GAC | GTC | CAC | GTA | GAC | GAC | GAC | AAA | ACC | CGC | 3174 |
Glu | Val | Gly | Thr | Thr | Lys | Asp | Val | His | Val | Asp | Asp | Asp | Lys | Thr | Arg | |
315 | 320 | 325 | ||||||||||||||
CGT | TAC | ATC | GCC | GTG | GAC | GGA | GGC | ATG | TCC | GAC | AAC | ATC | CGC | CCA | GCA | 3222 |
Arg | Tyr | Ile | Alá | Val | Asp | Gly | Gly | Met | Ser | Asp | Asn | Ile | Arg | Pro | Alá | |
330 | 335 | 340 | 345 | |||||||||||||
CTC | TAC | GGC | TCC | GAA | TAC | GAC | GCC | CGC | GTA | GTA | TCC | CGC | TTC | GCC | GAA | 3270 |
Leu | Tyr | Gly | Ser | Glu | Tyr | Asp | Alá | Arg | Val | Val | Ser | Arg | Phe | Alá | Glu | |
350 | 355 | 360 | ||||||||||||||
GGA | GAC | CCA | GTA | AGC | ACC | CGC | ATC | GTG | GGC | TCC | CAC | TGC | GAA | TCC | GGC | 3318 |
Gly | Asp | Pro | Val | Ser | Thr | Arg | Ile | Val | Gly | Ser | His | Cys | Glu | Ser | Gly | |
365 | 370 | 375 | ||||||||||||||
GAT | ATC | CTG | ATC | AAC | GAT | GAA | ATC | TAC | CCA | TCT | GAC | ATC | ACC | AGC | GGC | 3366 |
Asp | Ile | Leu | Ile | Asn | Asp | Glu | Ile | Tyr | Pro | Ser | Asp | Ile | Thr | Ser | Gly | |
380 | 385 | 390 | ||||||||||||||
GAC | TTC | CTT | GCA | CTC | GCA | GCC | ACC | GGC | GCA | TAC | TGC | TAC | GCC | ATG | AGC | 3414 |
Asp | Phe | Leu | Alá | Leu | Alá | Alá | Thr | Gly | Alá | Tyr | Cys | Tyr | Alá | Met | Ser | |
395 | 400 | 405 | ||||||||||||||
TCC | CGC | TAC | AAC | GCC | TTC | ACA | CGG | CCC | GCC | GTC | GTG | TCC | GTC | CGC | GCT | 3462 |
Ser | Arg | Tyr | Asn | Alá | Phe | Thr | Arg | Pro | Alá | Val | Val | Ser | Val | Arg | Alá | |
410 | 415 | 420 | 425 | |||||||||||||
GGC | AGC | TCC | CGC | CTC | ATG | CTG | CGC | CGC | GAA | ACG | CTC | GAC | GAC | ATC | CTC | 3510 |
Gly | Ser | Ser | Arg | Leu | Met | Leu | Arg | Arg | Glu | Thr | Leu | Asp | Asp | Ile | Leu | |
430 | 435 | 440 |
HU 224 492 Β1
TCA CTA GAG GCA TAACGCTTTT CGACGCCTGA CCCCGCCCTT CACCTTCGCC Ser Leu Glu Alá
445
GTGGAGGGCG GTTTTGG
A 19. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 550 aminosav
TÍPUSA: aminosav
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: fehérje
3562
3579
A 19. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA: | Alá | Val 15 | Glu | ||||||||||||
Met 1 | Thr | Pro | Alá | Asp 5 | Leu | Alá | Thr | Leu | Ile 10 | Lys | Glu | Thr | |||
Val | Leu | Thr | Ser | Arg | Glu | Leu | Asp | Thr | Ser | Val | Leu | Pro | Glu | Gin | Val |
20 | 25 | 30 | |||||||||||||
Val | Val | Glu | Arg | Pro | Arg | Asn | Pro | Glu | His | Gly | Asp | Tyr | Alá | Thr | Asn |
35 | 40 | 45 | |||||||||||||
Ile | Alá | Leu | Gin | Val | Alá | Lys | Lys | Val | Gly | Gin | Asn | Pro | Arg | Asp | Leu |
50 | 55 | 60 | |||||||||||||
Alá | Thr | Trp | Leu | Alá | Glu | Alá | Leu | Alá | Alá | Asp | Asp | Alá | Ile | Asp | Ser |
65 | 70 | 75 | 80 | ||||||||||||
Alá | Glu | Ile | Alá | Gly | Pro | Gly | Phe | Leu | Asn | Ile | Arg | Leu | Alá | Alá | Alá |
85 | 90 | 95 | |||||||||||||
Alá | Gin | Gly | Glu | Ile | Val | Alá | Lys | Ile | Leu | Alá | Gin | Gly | Glu | Thr | Phe |
100 | 105 | 110 | |||||||||||||
Gly | Asn | Ser | Asp | His | Leu | Ser | His | Leu | Asp | Val | Asn | Leu | Glu | Phe | Val |
115 | 120 | 125 | |||||||||||||
Ser | Alá | Asn | Pro | Thr | Gly | Pro | Ile | His | Leu | Gly | Gly | Thr | Arg | Trp | Alá |
130 | 135 | 140 | |||||||||||||
Alá | Val | Gly | Asp | Ser | Leu | Gly | Arg | Val | Leu | Glu | Alá | Ser | Gly | Alá | Lys |
145 | 150 | 155 | 160 | ||||||||||||
Val | Thr | Arg | Glu | Tyr | Tyr | Phe | Asn | Asp | His | Gly | Arg | Gin | Ile | Asp | Arg |
165 | 170 | 175 | |||||||||||||
Phe | Alá | Leu | Ser | Leu | Leu | Al a | Alá | Alá | Lys | Gly | Glu | Pro | Thr | Pro | Glu |
180 | 185 | 190 | |||||||||||||
Asp | Gly | Tyr | Gly | Gly | Glu | Tyr | Ile | Lys | Glu | Ile | Alá | Glu | Alá | Ile | Val |
195 | 200 | 205 | |||||||||||||
Glu | Lys | His | Pro | Glu | Alá | Leu | Alá | Leu | Glu | Pro | Alá | Alá | Thr | Gin | Glu |
210 | 215 | 220 | |||||||||||||
Leu | Phe | Arg | Alá | Glu | Gly | Val | Glu | Met | Met | Phe | Glu | His | Ile | Lys | Ser |
225 | 230 | 235 | 240 | ||||||||||||
Ser | Leu | His | Glu | Phe | Gly | Thr | Asp | Phe | Asp | Val | Tyr | Tyr | His | Glu | Asn |
245 | 250 | 255 |
HU 224 492 Β1
Ser | Leu | Phe | Glu 260 | Ser | Gly Alá Val Asp 265 | Lys | Alá | Val | Gin | Val 270 | Leu | Lys |
Asp | Asn | Gly | Asn | Leu | Tyr Glu Asn Glu | Gly | Alá | Trp | Trp | Leu | Arg | Ser |
275 | 280 | 285 | ||||||||||
Thr | Glu | Phe | Gly | Asp | Asp Lys Asp Arg | Val | Val | Ile | Lys | Ser | Asp | Gly |
290 | 295 | 300 | ||||||||||
Asp | Alá | Alá | Tyr | Ile | Alá Gly Asp Ile | Alá | Tyr | Val | Alá | Asp | Lys | Phe |
305 | 310 | 315 | 320 | |||||||||
Ser | Arg | Gly | His | Asn | Leu Asn Ile Tyr | Met | Leu | Gly | Alá | Asp | His | His |
325 | 330 | 335 | ||||||||||
Gly | Tyr | Ile | Alá | Arg | Leu Lys Alá Alá | Alá | Alá | Alá | Leu | Gly | Tyr | Lys |
340 | 345 | 350 | ||||||||||
Pro | Glu | Gly | Val | Glu | Val Leu Ile Gly | Gin | Met | Val | Asn | Leu | Leu | Arg |
355 | 360 | 365 | ||||||||||
Asp | Gly | Lys | Alá | Val | Arg Met Ser Lys | Arg | Alá | Gly | Thr | Val | Val | Thr |
370 | 375 | 380 | ||||||||||
Leu | Asp | Asp | Leu | Val | Glu Alá Ile Gly | Ile | Asp | Alá | Alá | Arg | Tyr | Ser |
385 | 390 | 395 | 400 | |||||||||
Leu | Ile | Arg | Ser | Ser | Val Asp Ser Ser | Leu | Asp | Ile | Asp | Leu | Gly | Leu |
405 | 410 | 415 | ||||||||||
Trp | Glu | Ser | Gin | Ser | Ser Asp Asn Pro | Val | Tyr | Tyr | Val | Gin | Tyr | Gly |
420 | 425 | 430 | ||||||||||
His | Alá | Arg | Leu | Cys | Ser Ile Alá Arg | Lys | Alá | Glu | Thr | Leu | Gly | Val |
435 | 440 | 445 | ||||||||||
Thr | Glu | Glu | Gly | Alá | Asp Leu Ser Leu | Leu | Thr | His | Asp | Arg | Glu | Gly |
450 | 455 | 460 | ||||||||||
Asp | Leu | Ile | Arg | Thr | Leu Gly Glu Phe | Pro | Alá | Val | Val | Lys | Alá | Alá |
465 | 470 | 475 | 480 | |||||||||
Alá | Asp | Leu | Arg | Glu | Pro His Arg Ile | Alá | Arg | Tyr | Alá | Glu | Glu | Leu |
485 | 490 | 495 | ||||||||||
Alá | Gly | Thr | Phe | His | Arg Phe Tyr Asp | Ser | Cys | His | Ile | Leu | Pro | Lys |
500 | 505 | 510 | ||||||||||
Val | Asp | Glu | Asp | Thr | Alá Pro Ile His | Thr | Alá | Arg | Leu | Alá | Leu | Alá |
515 | 520 | 525 | ||||||||||
Alá | Alá | Thr | Arg | Gin | Thr Leu Alá Asn | Alá | Leu | His | Leu | Val | Gly | Val |
530 | 535 | 540 | ||||||||||
Ser | Alá | Pro | Glu | Lys | Met | |||||||
545 | 550 | |||||||||||
A 20. | AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI: | |||||||||||
A SZEKVENCIA JELLEMZŐI: | ||||||||||||
HOSSZA: 445 aminosav |
HU 224 492 Β1
TÍPUSA: aminosav TOPOLÓGIÁJA: lineáris MOLEKULATÍPUS: fehérje
A 20. Met 1 | AZONOSÍTÓ SZÁMÚ SZEKVENCIA | LEÍRÁSA: | Leu 10 | Pro | Ala | His | Val | Trp 15 | Pro | |||||
Ala Thr | Val | Glu 5 | Asn | Phe | Asn | Glu | ||||||||
Arg | Asn Ala | Val | Arg | Gin | Glu | Asp | Gly | Val | Val | Thr | Val | Ala | Gly | Val |
20 | 25 | 30 | ||||||||||||
Pro | Leu Pro | Asp | Leu | Ala | Glu | Glu | Tyr | Gly | Thr | Pro | Leu | Phe | Val | Val |
35 | 40 | 45 | ||||||||||||
Asp | Glu Asp | Asp | Phe | Arg | Ser | Arg | Cys | Arg | Asp | Met | Ala | Thr | Ala | Phe |
50 | 55 | 60 | ||||||||||||
Gly | Gly Pro | Gly | Asn | Val | His | Tyr | Ala | Ser | Lys | Ala | Phe | Leu | Thr | Lys |
65 | 70 | 75 | 80 | |||||||||||
Thr | Ile Ala | Arg | Trp | Val | Asp | Glu | Glu | Gly | Leu | Ala | Leu | Asp | Ile | Ala |
85 | 90 | 95 | ||||||||||||
Ser | Ile Asn | Glu | Leu | Gly | Ile | Ala | Leu | Ala | Ala | Gly | Phe | Pro | Ala | Ser |
100 | 105 | 110 | ||||||||||||
Arg | Ile Thr | Ala | His | Gly | Asn | Asn | Lys | Gly | Val | Glu | Phe | Leu | Arg | Ala |
115 | 120 | 125 | ||||||||||||
Leu | Val Gin | Asn | Gly | Val | Gly | His | Val | Val | Leu | Asp | Ser | Ala | Gin | Glu |
130 | 135 | 140 | ||||||||||||
Leu | Glu Leu | Leu | Asp | Tyr | Val | Ala | Ala | Gly | Glu | Gly | Lys | Ile | Gin | Asp |
145 | 150 | 155 | 160 | |||||||||||
Val | Leu Ile | Arg | Val | Lys | Pro | Gly | Ile | Glu | Ala | His | Thr | His | Glu | Phe |
165 | 170 | 175 | ||||||||||||
Ile | Ala Thr | Ser | His | Glu | Asp | Gin | Lys | Phe | Gly | Phe | Ser | Leu | Ala | Ser |
180 | 185 | 190 | ||||||||||||
Gly | Ser Ala | Phe | Glu | Ala | Ala | Lys | Ala | Ala | Asn | Asn | Ala | Glu | Asn | Leu |
195 | 200 | 205 | ||||||||||||
Asn | Leu Val | Gly | Leu | His | Cys | His | Val | Gly | Ser | Gin | Val | Phe | Asp | Ala |
210 | 215 | 220 | ||||||||||||
Glu | Gly Phe | Lys | Leu | Ala | Ala | Glu | Arg | Val | Leu | Gly | Leu | Tyr | Ser | Gin |
225 | 230 | 235 | 240 | |||||||||||
Ile | His Ser | Glu | Leu | Gly | Val | Ala | Leu | Pro | Glu | Leu | Asp | Leu | Gly | Gly |
245 | 250 | 255 | ||||||||||||
Gly | Tyr Gly | Ile | Ala | Tyr | Thr | Ala | Ala | Glu | Glu | Pro | Leu | Asn | Val | Ala |
260 | 265 | 270 | ||||||||||||
Glu | Val Ala | Ser | Asp | Leu | Leu | Thr | Ala | Val | Gly | Lys | Met | Ala | Ala | Glu |
275 | 280 | 285 | ||||||||||||
Leu | Gly Ile | Asp | Ala | Pro | Thr | Val | Leu | Val | Glu | Pro | Gly | Arg | Ala | Ile |
290 | 295 | 300 |
HU 224 492 Β1
Alá 305 | Gly | Pro | Ser | Thr Val 310 | Thr | Ile | Tyr | Glu | Val 315 | Gly | Thr | Thr | Lys | Asp 320 | |
Val | His | Val | Asp | Asp | Asp | Lys | Thr | Arg | Arg | Tyr | Ile | Alá | Val | Asp | Gly |
325 | 330 | 335 | |||||||||||||
Gly | Met | Ser | Asp | Asn | Ile | Arg | Pro | Alá | Leu | Tyr | Gly | Ser | Glu | Tyr | Asp |
340 | 345 | 350 | |||||||||||||
Alá | Arg | Val | Val | Ser | Arg | Phe | Alá | Glu | Gly | Asp | Pro | Val | Ser | Thr | Arg |
355 | 360 | 365 | |||||||||||||
Ile | Val | Gly | Ser | His | Cys | Glu | Ser | Gly | Asp | Ile | Leu | Ile | Asn | Asp | Glu |
370 | 375 | 380 | |||||||||||||
Ile | Tyr | Pro | Ser | Asp | Ile | Thr | Ser | Gly | Asp | Phe | Leu | Alá | Leu | Alá | Alá |
385 | 390 | 395 | 400 | ||||||||||||
Thr | Gly | Alá | Tyr | Cys | Tyr | Alá | Met | Ser | Ser | Arg | Tyr | Asn | Alá | Phe | Thr |
405 | 410 | 415 | |||||||||||||
Arg | Pro | Alá | Val | Val | Ser | Val | Arg | Alá | Gly | Ser | Ser | Arg | Leu | Met | Leu |
420 | 425 | 430 | |||||||||||||
Arg | Arg | Glu | Thr | Leu | Asp | Asp | Ile | Leu | Ser | Leu | Glu | Alá | |||
435 | 440 | 445 |
A 21. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 20 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁS: /desc=„színtetikus DNS”
ANTISZENSZ: nem
A 21. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GTCGACGGAT CGCAAATGGC AAC 23
A 22. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 20 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁS: /desc=„szintetikus DNS”
ANTISZENSZ: igen
A 22. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
CCGGCCTACA AAATCGTGCA 20
A 23. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 1331 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: kettős
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: genomi DNS
EREDETI FORRÁS:
(A) ÉLŐLÉNY: Escherichia coli
HU 224 492 Β1 (B) TÖRZS: JM109
SAJÁTSÁG:
(A) NÉV/KULCS: cds (B) ELHELYEZKEDÉS: 10...1197
A 23. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
AACCTCGTC ATG TTT GAG AAC ATT ACC GCC GCT CCT GCC GAC CCG ATT 48
Met Phe Glu Asn Ile Thr Alá Alá Pro Alá Asp Pro Ile
10
CTG Leu | GGC Gly 15 | CTG Leu | GCC Alá | GAT Asp | CTG Leu | TTT Phe 20 | CGT Arg | GCC Alá | GAT Asp | GAA Glu | CGT Arg 25 | CCC Pro | GGC Gly | AAA Lys | ATT Ile | 96 |
AAC | CTC | GGG | ATT | GGT | GTC | TAT | AAA | GAT | GAG | ACG | GGC | AAA | ACC | CCG | GTA | 144 |
Asn | Leu | Gly | Ile | Gly | Val | Tyr | Lys | Asp | Glu | Thr | Gly | Lys | Thr | Pro | Val | |
30 | 35 | 40 | 45 | |||||||||||||
CTG | ACC | AGC | GTG | AAA | AAG | GCT | GAA | CAG | TAT | CTG | CTC | GAA | AAT | GAA | ACC | 192 |
Leu | Thr | Ser | Val | Lys | Lys | Alá | Glu | Gin | Tyr | Leu | Leu | Glu | Asn | Glu | Thr | |
50 | 55 | 60 | ||||||||||||||
ACC | AAA | AAT | TAC | CTC | GGC | ATT | GAC | GGC | ATC | CCT | GAA | TTT | GGT | CGC | TGC | 240 |
Thr | Lys | Asn | Tyr | Leu | Gly | Ile | Asp | Gly | Ile | Pro | Glu | Phe | Gly | Arg | Cys | |
65 | 70 | 75 | ||||||||||||||
ACT | CAG | GAA | CTG | CTG | TTT | GGT | AAA | GGT | AGC | GCC | CTG | ATC | AAT | GAC | AAA | 288 |
Thr | Gin | Glu | Leu | Leu | Phe | Gly | Lys | Gly | Ser | Alá | Leu | Ile | Asn | Asp | Lys | |
80 | 85 | 90 | ||||||||||||||
CGT | GCT | CGC | ACG | GCA | CAG | ACT | CCG | GGG | GGC | ACT | GGC | GCA | CTA | CGC | GTG | 336 |
Arg | Alá | Arg | Thr | Alá | Gin | Thr | Pro | Gly | Gly | Thr | Gly | Alá | Leu | Arg | Val | |
95 | 100 | 105 | ||||||||||||||
GCT | GCC | GAT | TTC | CTG | GCA | AAA | AAT | ACC | AGC | GTT | AAG | CGT | GTG | TGG | GTG | 384 |
Alá | Alá | Asp | Phe | Leu | Alá | Lys | Asn | Thr | Ser | Val | Lys | Arg | Val | Trp | Val | |
110 | 115 | 120 | 125 | |||||||||||||
AGC | AAC | CCA | AGC | TGG | CCG | AAC | CAT | AAG | AGC | GTC | TTT | AAC | TCT | GCA | GGT | 432 |
Ser | Asn | Pro | Ser | Trp | Pro | Asn | His | Lys | Ser | Val | Phe | Asn | Ser | Alá | Gly | |
130 | 135 | 140 | ||||||||||||||
CTG | GAA | GTT | CGT | GAA | TAC | GCT | TAT | TAT | GAT | GCG | GAA | AAT | CAC | ACT | CTT | 480 |
Leu | Glu | Val | Arg | Glu | Tyr | Alá | Tyr | Tyr | Asp | Alá | Glu | Asn | His | Thr | Leu | |
145 | 150 | 155 | ||||||||||||||
GAC | TTC | GAT | GCA | CTG | ATT | AAC | AGC | CTG | AAT | GAA | GCT | CAG | GCT | GGC | GAC | 528 |
Asp | Phe | Asp | Alá | Leu | Ile | Asn | Ser | Leu | Asn | Glu | Alá | Gin | Alá | Gly | Asp | |
160 | 165 | 170 | ||||||||||||||
GTA | GTG | CTG | TTC | CAT | GGC | TGC | TGC | CAT | AAC | CCA | ACC | GGT | ATC | GAC | CCT | 576 |
Val | Val | Leu | Phe | His | Gly | Cys | Cys | His | Asn | Pro | Thr | Gly | Ile | Asp | Pro | |
175 | 180 | 185 | ||||||||||||||
ACG | CTG | GAA | CAA | TGG | CAA | ACA | CTG | GCA | CAA | CTC | TCC | GTT | GAG | AAA | GGC | 624 |
Thr | Leu | Glu | Gin | Trp | Gin | Thr | Leu | Alá | Gin | Leu | Ser | Val | Glu | Lys | Gly | |
190 | 195 | 200 | 205 | |||||||||||||
TGG | TTA | CCG | CTG | TTT | GAC | TTC | GCT | TAC | CAG | GGT | TTT | GCC | CGT | GGT | CTG | 672 |
Trp | Leu | Pro | Leu | Phe | Asp | Phe | Alá | Tyr | Gin | Gly | Phe | Alá | Arg | Gly | Leu | |
210 | 215 | 220 |
HU 224 492 Β1
GAA Glu | GAA Glu | GAT Asp | GCT Alá 225 | GAA Glu | GGA Gly | CTG Leu | CGC Arg | GCT Alá 230 | TTC Phe | GCG Alá | GCT Alá | ATG Met | CAT His 235 | AAA Lys | GAG Glu | 720 |
CTG | ATT | GTT | GCC | AGT | TCC | TAC | TCT | AAA | AAC | TTT | GGC | CTG | TAC | AAC | GAG | 768 |
Leu | Ile | Val | Alá | Ser | Ser | Tyr | Ser | Lys | Asn | Phe | Gly | Leu | Tyr | Asn | Glu | |
240 | 245 | 250 | ||||||||||||||
CGT | GTT | GGC | GCT | TGT | ACT | CTG | GTT | GCT | GCC | GAC | AGT | GAA | ACC | GTT | GAT | 816 |
Arg | Val | Gly | Alá | Cys | Thr | Leu | Val | Alá | Alá | Asp | Ser | Glu | Thr | Val | Asp | |
255 | 260 | 265 | ||||||||||||||
CGC | GCA | TTC | AGC | CAA | ATG | AAA | GCG | GCG | ATT | CGC | GCT | AAC | TAC | TCT | AAC | 864 |
Arg | Alá | Phe | Ser | Gin | Met | Lys | Alá | Alá | Ile | Arg | Alá | Asn | Tyr | Ser | Asn | |
270 | 275 | 280 | 285 | |||||||||||||
CCA | CCA | GCA | CAC | GGC | GCT | TCT | GTT | GTT | GCC | ACC | ATC | CTG | AGC | AAC | GAT | 912 |
Pro | Pro | Alá | His | Gly | Alá | Ser | Val | Val | Alá | Thr | Ile | Leu | Ser | Asn | Asp | |
290 | 295 | 300 | ||||||||||||||
GCG | TTA | CGT | GCG | ATT | TGG | GAA | CAA | GAG | CTG | ACT | GAT | ATG | CGC | CAG | CGT | 960 |
Alá | Leu | Arg | Alá | Ile | Trp | Glu | Gin | Glu | Leu | Thr | Asp | Met | Arg | Gin | Arg | |
305 | 310 | 315 | ||||||||||||||
ATT | CAG | CGT | ATG | CGT | CAG | TTG | TTC | GTC | AAT | ACG | CTG | CAG | GAA | AAA | GGC | 1008 |
Ile | Gin | Arg | Met | Arg | Gin | Leu | Phe | Val | Asn | Thr | Leu | Gin | Glu | Lys | Gly | |
320 | 325 | 330 | ||||||||||||||
GCA | AAC | CGC | GAC | TTC | AGC | TTT | ATC | ATC | AAA | CAG | AAC | GGC | ATG | TTC | TCC | 1056 |
Alá | Asn | Arg | Asp | Phe | Ser | Phe | Ile | Ile | Lys | Gin | Asn | Gly | Met | Phe | Ser | |
335 | 340 | 345 | ||||||||||||||
TTC | AGT | GGC | CTG | ACA | AAA | GAA | CAA | GTG | CTG | CGT | CTG | CGC | GAA | GAG | TTT | 1104 |
Phe | Ser | Gly | Leu | Thr | Lys | Glu | Gin | Val | Leu | Arg | Leu | Arg | Glu | Glu | Phe | |
350 | 355 | 360 | 365 | |||||||||||||
GGC | GTA | TAT | GCG | GTT | GCT | TCT | GGT | CGC | GTA | AAT | GTG | GCC | GGG | ATG | ACA | 1152 |
Gly | Val | Tyr | Alá | Val | Alá | Ser | Gly | Arg | Val | Asn | Val | Alá | Gly | Met | Thr | |
370 | 375 | 380 | ||||||||||||||
CCA | GAT | AAC | ATG | GCT | CCG | CTG | TGC | GAA | GCG | ATT | GTG | GCA | GTG | CTG | 1197 | |
Pro | Asp | Asn | Met | Alá | Pro | Leu | Cys | Glu | Alá | Ile | Val | Alá | Val | Leu | ||
385 | 390 | 395 |
TAAGCATTAA AAACAATGAA CGCGCTGAAA AGCGGGCTGA GACTGATGAC AAACGCAACA 1257
TTGCCTGATG GCTACGCTTA TCAGGCCTAC GCGTCCCCTG CAATATTTTG AATTTGCACG 1317
ATTTTGTAGG CCGG 1331
A 24. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 396 aminosav
TÍPUSA: aminosav
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: fehérje
A 24. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
Met Phe Glu Asn Ile Thr Alá Alá Pro Alá Asp Pro Ile Leu Gly Leu 15 10 15
Alá Asp Leu Phe Arg Alá Asp Glu Arg Pro Gly Lys Ile Asn Leu Gly 20 25 30
HU 224 492 Β1
Ile Gly Val Tyr Lys Asp Glu Thr Gly Lys Thr Pro Val Leu Thr Ser 35 40 45
Val Lys Lys Alá Glu Gin Tyr Leu Leu Glu Asn Glu Thr Thr Lys Asn 50 55 60
Tyr Leu Gly Ile Asp Gly Ile Pro Glu Phe Gly Arg Cys Thr Gin Glu 65 70 75 80
Leu Leu Phe Gly Lys Gly Ser Alá Leu Ile Asn Asp Lys Arg Alá Arg 85 90 95
Thr Alá Gin Thr Pro Gly Gly Thr Gly Alá Leu Arg Val Alá Alá Asp 100 105 110
Phe Leu Alá Lys Asn Thr Ser Val Lys Arg Val Trp Val Ser Asn Pro 115 120 125
Ser Trp Pro Asn His Lys Ser Val Phe Asn Ser Alá Gly Leu Glu Val 130 135 140
Arg Glu Tyr Alá Tyr Tyr Asp Alá Glu Asn His Thr Leu Asp Phe Asp
145 150 155 160
Alá Leu Ile Asn Ser Leu Asn Glu Alá Gin Alá Gly Asp Val Val Leu
165 170 175
Phe His Gly Cys Cys His Asn Pro Thr Gly Ile Asp Pro Thr Leu Glu 180 185 190
Gin Trp Gin Thr Leu Alá Gin Leu Ser Val Glu Lys Gly Trp Leu Pro 195 200 205
Leu Phe Asp Phe Alá Tyr Gin Gly Phe Alá Arg Gly Leu Glu Glu Asp 210 215 220
Alá Glu Gly Leu Arg Alá Phe Alá Alá Met His Lys Glu Leu Ile Val
225 230 235 240
Alá Ser Ser Tyr Ser Lys Asn Phe Gly Leu Tyr Asn Glu Arg Val Gly
245 250 255
Alá Cys Thr Leu Val Alá Alá Asp Ser Glu Thr Val Asp Arg Alá Phe 260 265 270
Ser Gin Met Lys Alá Alá Ile Arg Alá Asn Tyr Ser Asn Pro Pro Alá 275 280 285
His Gly Alá Ser Val Val Alá Thr Ile Leu Ser Asn Asp Alá Leu Arg 290 295 300
Alá Ile Trp Glu Gin Glu Leu Thr Asp Met Arg Gin Arg Ile Gin Arg
305 310 315 320
Met Arg Gin Leu Phe Val Asn Thr Leu Gin Glu Lys Gly Alá Asn Arg
325 330 335
Asp Phe Ser Phe Ile Ile Lys Gin Asn Gly Met Phe Ser Phe Ser Gly 340 345 350
HU 224 492 Β1
Leu Thr Lys Glu Gin Val Leu Arg Leu Arg Glu Glu Phe Gly Val Tyr 355 360 365
Alá Val Alá Ser Gly Arg Val Asn Val Alá Gly Met Thr Pro Asp Asn 370 375 380
Met Alá Pro Leu Cys Glu Alá Ile Val Alá Val Leu
385 390 395
A 25. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 2517 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: kettős
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: genomi DNS
EREDETI FORRÁS:
(A) ÉLŐLÉNY: Brevibacterium lactofermentum
A 25. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GATCAGCTTC GGGTGTTGAA GGGGCCGAAT AAGGAACTCG CGCAGTTGGG TCGTAGTTTG 60
TTTAAACGAC TTGGTGATGT GTTGGCGTAT TTCGATGTTG GTGTCTCCAA CGGTCCGGTC 120
GAAGCGATCA ACGGACGGTT GGAGCATTTG CGTGGGATTG CTCTAGGTTT CCGTAATTTG 180
AACCACTACA TTCTGCGGTG CCTTATCCAT TCAGGGCAGT TGGTCCATAA GATCAATGCA 240
CTCTAAAACA GGAAGAGCCC CTTTACAAGC GGCAAGACCA AACTGGGTGA CCGAAAATCT 300
TCAGGCCAAT CAGTTTTGGT CATATGGGAT GGTTTTTAGA CCTCGAAACC ATCCCATATG 360
ACCGAAGCCC GCGAAACTCT GTGTTCGTTG GTCGCCTGGT TCGGTCTCAA TGCCTTGCCG 420
AAACCACAAC GCCCCGAAAC CCAAAACTCC CCAATACATG AAAAAACCAG CTTCCCACCG 480
AAGTGAGAAG CTGGTTTAGT TTGCGGAGGA TAGGGGATTT GAACCCCTGA GGGATTGCTC 540
CCAACCCGCG TTCCAGGCGA GCGACATAGG CCGCTAGTCG AATCCTCCAG CTAGAACGGC 600
TGCAACGCAT GGCTGCTTTG TTCTGGGGAT TAGATTACAC AAAAGTCGTT TAGAAACTCA 660
AATCCGCTCG CAGTTGGCGT TTTCTGGGGC GGTTCAGCTA GAGTTATGCG AAGGATCCCG 720
TGCGGCGTTT ATCTTGTGAA CTCCCCCAGG GCAGGAATGC AGCAAGGGTC AGCGAGCTCT 780
GACGGGTGCG CGGGGTCCCC TAAAACGTCT AGAGTAGTGG CTTGAGGTCA CTGCTCTTTT 840
TTTGTGCCCT TTTTTTGGTC CGTCTATTTT GCCACCACAT GCGGAGGTAC GCAGTTATGA 900
GTTCAGTTTC GCTGCAGGAT TTTGATGCAG AGCGAATTGG TCTGTTCCAC GAGGACATTA 960
AACGCAAGTT TGATGAGCTC AAGTCAAAAA ATCTGAAGCT GGATCTTACT CGCGGTAAGC 1020
CTTCGTCGGA GCAGTTGGAT TTCGCTGATG AGCTGTTGGC GTTGCCTGGT AAGGGCGATT 1080
TCAAGGCTGC GGATGGTACT GATGTCCGTA ACTATGGCGG GCTGGATGGC ATTGTTGATA 1140
TTCGTCAGAT TTGGGCGGAT TTGCTGGGTG TTCCTGTGGA GCAGGTGCTG GCGGGGGATG 1200
CTTCGAGCTT GAACATCATG TTTGATGTGA TCAGCTGGTC GTACATTTTT GGTAACAATG 1260
ATTCGGTTCA GCCTTGGTCG AAGGAAGAAA CTGTTAAGTG GATTTGTCCT GTTCCGGGAT 1320
ATGATCGCCA TTTCTCCATC ACGGAGCGTT TCGGCTTTGA GATGATTTCT GTGCCAATGA 1380
ATGAAGACGG CCCTGATATG GATGCTGTTG AGGAATTGGT CAAGGATCCG CAGGTTAAGG 1440
GCATGTGGGT TGTGCCGGTA TTTTCTAACC CGACTGGTTT CACGGTGTCG GAGGACGTCG 1500
CAAAGCGTCT GAGCACGATG GAAACTGCGG CGCCGGACTT CCGCGTGGTG TGGGATAACG 1560
CTTACGCCGT TCATACTCTG ACCGATGAGT TCCCTGAGGT CATCGACATC GTTGGGCTTG 1620
GTGAGGCGGC GGGTAACCCG AACCGTTTCT GGGCGTTCAC TTCTACTTCG AAGATCACTC 1680
TCGCGGGTGC GGGCGTGTCC TTCTTCATGA CTTCTGCGGA GAACCGTAAG TGGTACTCCG 1740
GTCATGCGGG TATCCGTGGC ATTGGCCCTA ACAAGGTCAA TCAGTTGGCT CATGCGCGTT 1800
ACTTTGGCGA TGCTGAGGGA GTGCGCGCGG TGATGCGTAA GCATGCTGCG TCGTTGGCTC 1860
CGAAGTTCAA CAAGGTTCTG GAGATCCTGG ATTCTCGCCT TGCTGAGTAC GGTGTCGCGC 1920
AGTGGACTGT CCCTGCGGGC GGTTACTTCA TTTCCCTTGA TGTGGTTCCT GGTACGGCAT 1980
CTCGTGTGGC TGAGTTGGCT AAGGAAGCCG GCATTGCGTT GACGGGTGCG GGTTCTTCTT 2040
ACCCGCTGCG TCAGGATCCG GAGAACAAGA ACCTCCGTTT GGCGCCTTCT CTGCCTCCTG 2100
TTGAGGAACT TGAGGTTGCC ATGGATGGCG TGGCTACGTG TGTTTTGCTG GCAGCTGCGG 2160
AGCACTACGC TAGCTAGAGT GAATACCGCG GAAACTGCAC ATTGGATTAA CCGTTTGCTG 2220
CCGGGTCAGC CGGAGTTTCA CCAGGTTGGC GCGTTTAAAG TGGCGGGTTA CACGCTTGAT 2280
GATGAGTCAA TTGCGTGTTC TGTCAATTTC GGGCGCGTCA ACACGGGCCT GGTCACCGAG 2340
ACAGGCGCGG AAACCGTCGA TGTGCGAAGT GAGATTTTGA GCCTGGCCAG GGCCGACGTG 2400
HU 224 492 Β1
TCCGTGCCTG GGCGCGCCGT CGGCGCTGCT GCAACAATGC TTCTCGACGC CTCCCTCTCC 2460
TTCAAATCCG CCACCGATTC CAGTGTCACT CCCATGCATG CCCAACCGGG ACAGATC 2517
A 26. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁS: /desc=„szintetikus DNS”
ANTISZENSZ: nem
A 26. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GATCAACGGA CGGTTGGAGC ATT 23
A 27. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁS: /desc=„szintetikus DNS”
ANTISZENSZ: igen
A 27. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GGTATTCACT CTAGCTAGCG TAG 23
A 28. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁS: /desc=„szintetikus DNS”
ANTISZENSZ: nem
A 28. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GAGCTCAAGT CAAAAAATCT GAA 23
A 29. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 23 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: egy
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: egyéb nukleinsav (A) LEÍRÁS: /desc=„szintetikus DNS”
ANTISZENSZ: igen
A 29. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GATCTGTCCC GGTTGGGCAT GCA 23
A 30. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 2517 bázis
TÍPUSA: nukleinsav
HÁNY SZÁLÚ: kettős
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: genomi DNS
EREDETI FORRÁS:
(A) ÉLŐLÉNY: Brevibacteríum lactofermentum
HU 224 492 Β1 (B) TÖRZS: ATCC 13869
SAJÁTSÁG:
(A) NÉV/KULCS: cds (B) ELHELYEZKEDÉS: 879-2174
A 30. AZONOSÍTÓ SZÁMÚ SZEKVENCIA LEÍRÁSA:
GATCAGCTTC | GGGTGTTGAA | GGGGCCGAAT | AAGGAACTCG CGCAGTTGGG TCGTAGTTTG | 60 |
TTTAAACGAC | TTGGTGATGT | GTTGGCGTAT | TTCGATGTTG GTGTCTCCAA CGGTCCGGTC | 120 |
GAAGCGATCA | ACGGACGGTT | GGAGCATTTG | CGTGGGATTG CTCTAGGTTT CCGTAATTTG | 180 |
AACCACTACA | TTCTGCGGTG | CCTTATCCAT | TCAGGGCAGT TGGTCCATAA GATCAATGCA | 240 |
CTCTAAAACA | GGAAGAGCCC | CTTTACAAGC | GGCAAGACCA AACTGGGTGA CCGAAAATCT | 300 |
TCAGGCCAAT | CAGTTTTGGT | CATATGGGAT | GGTTTTTAGA CCTCGAAACC ATCCCATATG | 360 |
ACCGAAGCCC | GCGAAACTCT | GTGTTCGTTG | GTCGCCTGGT TCGGTCTCAA TGCCTTGCCG | 420 |
AAACCACAAC | GCCCCGAAAC | CCAAAACTCC | CCAATACATG AAAAAACCAG CTTCCCACCG | 480 |
AAGTGAGAAG | CTGGTTTAGT | TTGCGGAGGA | TAGGGGATTT GAACCCCTGA GGGATTGCTC | 540 |
CCAACCCGCG | TTCCAGGCGA | GCGACATAGG | CCGCTAGTCG AATCCTCCAG CTAGAACGGC | 600 |
TGCAACGCAT | GGCTGCTTTG | TTCTGGGGAT | TAGATTACAC AAAAGTCGTT TAGAAACTCA | 660 |
AATCCGCTCG | CAGTTGGCGT | TTTCTGGGGC | GGTTCAGCTA GAGTTATGCG AAGGATCCCG | 720 |
TGCGGCGTTT | ATCTTGTGAA | CTCCCCCAGG | GCAGGAATGC AGCAAGGGTC AGCGAGCTCT | 780 |
GACGGGTGCG | CGGGGTCCCC | TAAAACGTCT | AGAGTAGTGG CTTGAGGTCA CTGCTCTTTT | 840 |
TTTGTGCCCT | TTTTTTGGTC | CGTCTATTTT | GCCACCAC ATG CGG AGG TAC GCA | 893 |
Met Arg Arg Tyr Alá 1 5
GTT ATG AGT | TCA Ser | GTT Val 10 | TCG Ser | CTG Leu | CAG Gin | GAT Asp | TTT Phe 15 | GAT Asp | GCA Alá | GAG Glu | CGA Arg | ATT Ile 20 | GGT Gly | 941 | ||
Val | Met | Ser | ||||||||||||||
CTG | TTC | CAC | GAG | GAC | ATT | AAA | CGC | AAG | TTT | GAT | GAG | CTC | TAG | TCA | AAA | 989 |
Leu | Phe | His | Glu | Asp | Ile | Lys | Arg | Lys | Phe | Asp | Glu | Leu | Lys | Ser | Lys | |
25 | 30 | 35 | ||||||||||||||
AAT | CTG | AAG | CTG | GAT | CTT | ACT | CGC | GGT | AAG | CCT | TCG | TCG | GAG | CAG | TTG | 1037 |
Asn | Leu | Lys | Leu | Asp | Leu | Thr | Arg | Gly | Lys | Pro | Ser | Ser | Glu | Gin | Leu | |
40 | 45 | 50 | ||||||||||||||
GAT | TTC | GCT | GAT | GAG | CTG | TTG | GCG | TTG | CCT | GGT | AAG | GGC | GAT | TTC | AAG | 1085 |
Asp | Phe | Alá | Asp | Glu | Leu | Leu | Alá | Leu | Pro | Gly | Lys | Gly | Asp | Phe | Lys | |
55 | 60 | 65 | ||||||||||||||
GCT | GCG | GAT | GGT | ACT | GAT | GTC | CGT | AAC | TAT | GGC | GGG | CTG | GAT | GGC | ATT | 1133 |
Alá | Alá | Asp | Gly | Thr | Asp | Val | Arg | Asn | Tyr | Gly | Gly | Leu | Asp | Gly | Ile | |
70 | 75 | 80 | 85 | |||||||||||||
GTT | GAT | ATT | CGT | CAG | ATT | TGG | GCG | GAT | TTG | CTG | GGT | GTT | CCT | GTG | GAG | 1181 |
Val | Asp | Ile | Arg | Gin | Ile | Trp | Alá | Asp | Leu | Leu | Gly | Val | Pro | Val | Glu | |
90 | 95 | 100 | ||||||||||||||
CAG | GTG | CTG | GCG | GGG | GAT | GCT | TCG | AGC | TTG | AAC | ATC | ATG | TTT | GAT | GTG | 1229 |
Gin | Val | Leu | Alá | Gly | Asp | Alá | Ser | Ser | Leu | Asn | Ile | Met | Phe | Asp | Val | |
105 | 110 | 115 | ||||||||||||||
ATC | AGC | TGG | TCG | TAC | ATT | TTT | GGT | AAC | AAT | GAT | TCG | GTT | CAG | CCT | TGG | 1277 |
Ile | Ser | Trp | Ser | Tyr | Ile | Phe | Gly | Asn | Asn | Asp | Ser | Val | Gin | Pro | Trp | |
120 | 125 | 130 | ||||||||||||||
TCG | AAG | GAA | GAA | ACT | GTT | AAG | TGG | ATT | TGT | CCT | GTT | CCG | GGA | TAT | GAT | 1325 |
Ser | Lys | Glu | Glu | Thr | Val | Lys | Trp | Ile | Cys | Pro | Val | Pro | Gly | Tyr | Asp | |
135 | 140 | 145 |
HU 224 492 Β1
CGC Arg 150 | CAT His | TTC Phe | TCC Ser | ATC Ile | ACG Thr 155 | GAG Glu | CGT Arg | TTC Phe | GGC Gly | TTT Phe 160 | GAG Glu | ATG Met | ATT Ile | TCT Ser | GTG Val 165 | 1373 |
CCA | ATG | AAT | GAA | GAC | GGC | CCT | GAT | ATG | GAT | GCT | GTT | GAG | GAA | TTG | GTC | 1421 |
Pro | Met | Asn | Glu | Asp | Gly | Pro | Asp | Met | Asp | Alá | Val | Glu | Glu | Leu | Val | |
170 | 175 | 180 | ||||||||||||||
AAG | GAT | CCG | CAG | GTT | AAG | GGC | ATG | TGG | GTT | GTG | CCG | GTA | TTT | TCT | AAC | 1469 |
Lys | Asp | Pro | Gin | Val | Lys | Gly | Met | Trp | Val | Val | Pro | Val | Phe | Ser | Asn | |
185 | 190 | 195 | ||||||||||||||
CCG | ACT | GGT | TTC | ACG | GTG | TCG | GAG | GAC | GTC | GCA | AAG | CGT | CTG | AGC | ACG | 1517 |
Pro | Thr | Gly | Phe | Thr | Val | Ser | Glu | Asp | Val | Alá | Lys | Arg | Leu | Ser | Thr | |
200 | 205 | 210 | ||||||||||||||
ATG | GAA | ACT | GCG | GCG | CCG | GAC | TTC | CGC | GTG | GTG | TGG | GAT | AAC | GCT | TAC | 1565 |
Met | Glu | Thr | Alá | Alá | Pro | Asp | Phe | Arg | Val | Val | Trp | Asp | Asn | Alá | Tyr | |
215 | 220 | 225 | ||||||||||||||
GCC | GTT | CAT | ACT | CTG | ACC | GAT | GAG | TTC | CCT | GAG | GTC | ATC | GAC | ATC | GTT | 1613 |
Alá | Val | His | Thr | Leu | Thr | Asp | Glu | Phe | Pro | Glu | Val | Ile | Asp | Ile | Val | |
230 | 235 | 240 | 245 | |||||||||||||
GGG | CTT | GGT | GAG | GCG | GCG | GGT | AAC | CCG | AAC | CGT | TTC | TGG | GCG | TTC | ACT | 1661 |
Gly | Leu | Gly | Glu | Alá | Alá | Gly | Asn | Pro | Asn | Arg | Phe | Trp | Alá | Phe | Thr | |
250 | 255 | 260 | ||||||||||||||
TCT | ACT | TCG | AAG | ATC | ACT | CTC | GCG | GGT | GCG | GGC | GTG | TCC | TTC | TTC | ATG | 1709 |
Ser | Thr | Ser | Lys | Ile | Thr | Leu | Alá | Gly | Alá | Gly | Val | Ser | Phe | Phe | Met | |
265 | 270 | 275 | ||||||||||||||
ACT | TCT | GCG | GAG | AAC | CGT | AAG | TGG | TAC | TCC | GGT | CAT | GCG | GGT | ATC | CGT | 1757 |
Thr | Ser | Alá | Glu | Asn | Arg | Lys | Trp | Tyr | Ser | Gly | His | Alá | Gly | Ile | Arg | |
280 | 285 | 290 | ||||||||||||||
GGC | ATT | GGC | CCT | AAC | AAG | GTC | AAT | CAG | TTG | GCT | CAT | GCG | CGT | TAC | T T T | 1805 |
Gly | Ile | Gly | Pro | Asn | Lys | Val | Asn | Gin | Leu | Alá | His | Alá | Arg | Tyr | Phe | |
295 | 300 | 305 | ||||||||||||||
GGC | GAT | GCT | GAG | GGA | GTG | CGC | GCG | GTG | ATG | CGT | AAG | CAT | GCT | GCG | TCG | 1853 |
Gly | Asp | Alá | Glu | Gly | Val | Arg | Alá | Val | Met | Arg | Lys | His | Alá | Alá | Ser | |
310 | 315 | 320 | 325 | |||||||||||||
TTG | GCT | CCG | AAG | TTC | AAC | AAG | GTT | CTG | GAG | ATC | CTG | GAT | TCT | CGC | CTT | 1901 |
Leu | Alá | Pro | Lys | Phe | Asn | Lys | Val | Leu | Glu | Ile | Leu | Asp | Ser | Arg | Leu | |
330 | 335 | 340 | ||||||||||||||
GCT | GAG | TAC | GGT | GTC | GCG | CAG | TGG | ACT | GTC | CCT | GCG | GGC | GGT | TAC | TTC | 1949 |
Alá | Glu | Tyr | Gly | Val | Alá | Gin | Trp | Thr | Val | Pro | Alá | Gly | Gly | Tyr | Phe | |
345 | 350 | 355 | ||||||||||||||
ATT | TCC | CTT | GAT | GTG | GTT | CCT | GGT | ACG | GCA | TCT | CGT | GTG | GCT | GAG | TTG | 1997 |
Ile | Ser | Leu | Asp | Val | Val | Pro | Gly | Thr | Alá | Ser | Arg | Val | Alá | Glu | Leu | |
360 | 365 | 370 | ||||||||||||||
GCT | AAG | GAA | GCC | GGC | ATT | GCG | TTG | ACG | GGT | GCG | GGT | TCT | TCT | TAC | CCG | 2045 |
Alá | Lys | Glu | Alá | Gly | Ile | Alá | Leu | Thr | Gly | Alá | Gly | Ser | Ser | Tyr | Pro | |
375 | 380 | 385 |
HU 224 492 Β1
CTG Leu 390 | CGT Arg | CAG Gin | GAT Asp | CCG Pro | GAG Glu 395 | AAC Asn | AAG Lys | AAC Asn | CTC Leu | CGT Arg 400 | TTG Leu | GCG Alá | CCT Pro | TCT Ser | CTG Leu 405 | 2093 |
CCT | CCT | GTT | GAG | GAA | CTT | GAG | GTT | GCC | ATG | GAT | GGC | GTG | GCT | ACG | TGT | 2141 |
Pro | Pro | Val | Glu | Glu | Leu | Glu | Val | Alá | Met | Asp | Gly | Val | Alá | Thr | Cys | |
410 | 415 | 420 | ||||||||||||||
GTT | TTG | CTG | GCA | GCT | GCG | GAG | CAC | TAC | GCT | AGC | TAGAGTGAAT , | ACCGCGGAAA | 2194 | |||
Val | Leu | Leu | Alá | Alá | Alá | Glu | His | Tyr | Alá | Ser | ||||||
425 | 430 |
CTGCACATTG GATTAACCGT TTGCTGCCGG GTCAGCCGGA GTTTCACCAG GTTGGCGCGT 2254
TTAAAGTGGC GGGTTACACG CTTGATGATG AGTCAATTGC GTGTTCTGTC AATTTCGGGC 2314
GCGTCAACAC GGGCCTGGTC ACCGAGACAG GCGCGGAAAC CGTCGATGTG CGAAGTGAGA 2374
TTTTGAGCCT GGCCAGGGCC GACGTGTCCG TGCCTGGGCG CGCCGTCGGC GCTGCTGCAA 2434
CAATGCTTCT CGACGCCTCC CTCTCCTTCA AATCCGCCAC CGATTCCAGT GTCACTCCCA 2494
TGCATGCCCA ACCGGGACAG ATC 2517
A 31. AZONOSÍTÓ SZÁMÚ SZEKVENCIA ADATAI:
A SZEKVENCIA JELLEMZŐI:
HOSSZA: 432 bázis
TÍPUSA: aminosav
TOPOLÓGIÁJA: lineáris
MOLEKULATÍPUS: protein
A 31. Met 1 | AZONOSÍTÓ SZÁMÚ SZEKVENCIA | LEÍRÁSA: | ||||||||||
Arg | Arg Tyr | Alá Val 5 | Met | Ser | Ser Val 10 | Ser | Leu | Gin | Asp | Phe 15 | Asp | |
Alá | Glu | Arg Ile 20 | Gly Leu | Phe | His | Glu Asp 25 | Ile | Lys | Arg | Lys 30 | Phe | Asp |
Glu | Leu | Lys Ser 35 | Lys Asn | Leu | Lys 40 | Leu Asp | Leu | Thr | Arg 45 | Gly | Lys | Pro |
Ser | Ser 50 | Glu Gin | Leu Asp | Phe 55 | Alá | Asp Glu | Leu | Leu 60 | Alá | Leu | Pro | Gly |
Lys 65 | Gly | Asp Phe | Lys Alá 70 | Alá | Asp | Gly Thr | Asp 75 | Val | Arg | Asn | Tyr | Gly 80 |
Gly | Leu | Asp Gly | Ile Val 85 | Asp | Ile | Arg Gin 90 | Ile | Trp | Alá | Asp | Leu 95 | Leu |
Gly | Val | Pro Val 100 | Glu Gin | Val | Leu | Alá Gly 105 | Asp | Alá | Ser | Ser 110 | Leu | Asn |
Ile | Met | Phe Asp 115 | Val Ile | Ser | Trp 120 | Ser Tyr | Ile | Phe | Gly 125 | Asn | Asn | Asp |
Ser | Val 130 | Gin Pro | Trp Ser | Lys 135 | Glu | Glu Thr | Val | Lys 140 | Trp | Ile | Cys | Pro |
Val 145 | Pro | Gly Tyr | Asp Arg 150 | His | Phe | Ser Ile | Thr 155 | Glu | Arg | Phe | Gly | Phe 160 |
Glu | Met | Ile Ser | Val Pro 165 | Met | Asn | Glu Asp 170 | Gly | Pro | Asp | Met | Asp 175 | Alá |
HU 224 492 Β1
Val | Glu | Glu | Leu 180 | Val | Lys | Asp | Pro | Gin 185 | Val | Lys | Gly | Met | Trp 190 | Val | Val |
Pro | Val | Phe | Ser | Asn | Pro | Thr | Gly | Phe | Thr | Val | Ser | Glu | Asp | Val | Alá |
195 | 200 | 205 | |||||||||||||
Lys | Arg | Leu | Ser | Thr | Met | Glu | Thr | Alá | Alá | Pro | Asp | Phe | Arg | Val | Val |
210 | 215 | 220 | |||||||||||||
Trp | Asp | Asn | Alá | Tyr | Alá | Val | His | Thr | Leu | Thr | Asp | Glu | Phe | Pro | Glu |
225 | 230 | 235 | 240 | ||||||||||||
Val | Ile | Asp | Ile | Val | Gly | Leu | Gly | Glu | Alá | Alá | Gly | Asn | Pro | Asn | Arg |
245 | 250 | 255 | |||||||||||||
Phe | Trp | Alá | Phe | Thr | Ser | Thr | Ser | Lys | Ile | Thr | Leu | Alá | Gly | Alá | Gly |
260 | 265 | 270 | |||||||||||||
Val | Ser | Phe | Phe | Met | Thr | Ser | Alá | Glu | Asn | Arg | Lys | Trp | Tyr | Ser | Gly |
275 | 280 | 285 | |||||||||||||
His | Alá | Gly | Ile | Arg | Gly | Ile | Gly | Pro | Asn | Lys | Val | Asn | Gin | Leu | Alá |
290 | 295 | 300 | |||||||||||||
His | Alá | Arg | Tyr | Phe | Gly | Asp | Alá | Glu | Gly | Val | Arg | Alá | Val | Met | Arg |
305 | 310 | 315 | 320 | ||||||||||||
Lys | His | Alá | Alá | Ser | Leu | Alá | Pro | Lys | Phe | Asn | Lys | Val | Leu | Glu | Ile |
325 | 330 | 335 | |||||||||||||
Leu | Asp | Ser | Arg | Leu | Alá | Glu | Tyr | Gly | Val | Alá | Gin | Trp | Thr | Val | Pro |
340 | 345 | 350 | |||||||||||||
Alá | Gly | Gly | Tyr | Phe | Ile | Ser | Leu | Asp | Val | Val | Pro | Gly | Thr | Alá | Ser |
355 | 360 | 365 | |||||||||||||
Arg | Val | Alá | Glu | Leu | Alá | Lys | Glu | Alá | Gly | Ile | Alá | Leu | Thr | Gly | Alá |
370 | 375 | 380 | |||||||||||||
Gly | Ser | Ser | Tyr | Pro | Leu | Arg | Gin | Asp | Pro | Glu | Asn | Lys | Asn | Leu | Arg |
385 | 390 | 395 | 400 | ||||||||||||
Leu | Alá | Pro | Ser | Leu | Pro | Pro | Val | Glu | Glu | Leu | Glu | Val | Alá | Met | Asp |
405 | 410 | 415 | |||||||||||||
Gly | Val | Alá | Thr | Cys | Val | Leu | Leu | Alá | Alá | Alá | Glu | His | Tyr | Alá | Ser |
420 425 430
Claims (9)
- SZABADALMI IGÉNYPONTOK1. Rekombináns DNS, amely korineform baktériumok sejtjeiben autonóm módon replikálódni képes, és 55 tartalmaz egy, aszpartokinázt kódoló DNS-szekvenciát, amely aszpartokinázban az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenység lényegesen le van csökkentve, valamint tartalmaz egy, dihidrodipikolinát-reduktázt kódoló DNS-szekven- 60 ciát, egy, dihidrodipikolinát-szintázt kódoló DNS-szekvenciát, egy, diamino-pimelát-dekarboxilázt kódoló DNS-szekvenciát és egy, aszpartát-amino-transzferázt kódoló DNS-szekvenciát.
- 2. Az 1. igénypont szerinti rekombináns DNS, amely L-lizin és L-treonin okozta visszacsatolásos gátlással szemben lényegesen lecsökkentett érzékenységű aszpartokinázt kódoló DNS-szekvenciaként korineform baktériumból származó mutáns aszpartokinázt kódol,HU 224 492 Β1 és amely aszpartokinázban az α-alegység N-terminálisától számított, a szekvencialistában az 5-ös azonosító számon megadott aminosavszekvencia szerinti 279., alaninnak megfelelő aminosav alanintól eltérő, nem savas aminosavra van kicserélve, és a β-alegység N-terminálisától számított, a szekvencialistában a 7-es azonosító számon megadott aminosavszekvencia szerinti 30., alaninnak megfelelő aminosav alanintól eltérő, nem savas aminosavra van kicserélve.
- 3. Az 1. igénypont szerinti rekombináns DNS, amely dihidrodipikolinát-reduktázt kódoló DNS-szekvenciaként a szekvencialistában a 11-es azonosító számon megadott aminosavszekvenciát kódoló DNSszekvenciát tartalmaz, vagy olyan aminosavszekvenciát kódoló DNS-t, amely aminosavszekvencia lényegében megegyezik a szekvencialistában a 11-es azonosító számon megadott aminosavszekvenciával.
- 4. Az 1. igénypont szerinti rekombináns DNS, amely dihidrodipikolinát-szintázt kódoló DNS-szekvenciaként a szekvencialistában a 15-ös azonosító számon megadott aminosavszekvenciát kódoló DNSszekvenciát tartalmaz, vagy olyan aminosavszekvenciát kódoló DNS-t, amely aminosavszekvencia lényegében megegyezik a szekvencialistában a 15-ös azonosító számon megadott aminosavszekvenciával.
- 5. Az 1. igénypont szerinti rekombináns DNS, amely diamino-pimelát-dekarboxilázt kódoló DNSszekvenciaként a szekvencialistában a 20-as azonosító számon megadott aminosavszekvenciát kódoló DNS-szekvenciát tartalmaz, vagy olyan aminosavszekvenciát kódoló DNS-t, amely aminosavszekvencia lényegében megegyezik a szekvencialistában a 20-as azonosító számon megadott aminosavszekvenciával.
- 6. Az 1. igénypont szerinti rekombináns DNS, amely aszpartát-amino-transzferázt kódoló DNS-szekvenciaként a szekvencialistában a 24-es vagy a 31-es azonosító számon megadott aminosavszekvenciát kódoló DNS-szekvenciát tartalmaz, vagy olyan aminosavszekvenciát kódoló DNS-t, amely aminosavszekvencia lényegében megegyezik a szekvencialistában a 24-es vagy a 31-es azonosító számon megadott aminosavszekvenciával.
- 7. Korineform baktérium, amely olyan aszpartokinázt hordoz, amely aszpartokinázban az L-lizin és L-treonin okozta visszacsatolásos gátlással szembeni érzékenység lényegesen le van csökkentve, és tartalmaz továbbá egy, dihidrodipikolinát-reduktázt kódoló, fokozott aktivitású DNS-szekvenciát, egy, dihidrodipikolinát-szintázt kódoló, fokozott aktivitású DNS-szekvenciát, egy, diamino-pimelát-dekarboxilázt kódoló, fokozott aktivitású DNS-szekvenciát és egy, aszpartát-amino-transzferázt kódoló, fokozott aktivitású DNS-szekvenciát.
- 8. A 7. igénypont szerinti korineform baktérium, amely 1. igénypont szerinti rekombináns DNS bejuttatása útján van transzformálva.
- 9. Eljárás L-lizin termelésére, azzal jellemezve, hogy 8. igénypont szerinti korineform baktériumot megfelelő tápközegben tenyésztünk, és így L-lizin termelődését és felhalmozódását váltjuk ki a baktériumsejt-tenyészetben, majd az L-lizint a tenyészetből kinyerjük.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32565996 | 1996-12-05 |
Publications (4)
Publication Number | Publication Date |
---|---|
HU9702360D0 HU9702360D0 (en) | 1998-03-02 |
HUP9702360A2 HUP9702360A2 (hu) | 1999-06-28 |
HUP9702360A3 HUP9702360A3 (en) | 2002-12-28 |
HU224492B1 true HU224492B1 (hu) | 2005-09-28 |
Family
ID=18179293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
HU9702360A HU224492B1 (hu) | 1996-12-05 | 1997-12-05 | Eljárás L-lizin előállítására |
Country Status (10)
Country | Link |
---|---|
US (1) | US6004773A (hu) |
EP (1) | EP0854189B1 (hu) |
CN (2) | CN1159443C (hu) |
BR (1) | BR9706059B1 (hu) |
DE (1) | DE69736698T2 (hu) |
DK (1) | DK0854189T3 (hu) |
ES (1) | ES2273355T3 (hu) |
HU (1) | HU224492B1 (hu) |
PL (1) | PL190430B1 (hu) |
SK (1) | SK285201B6 (hu) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU705550B2 (en) | 1995-06-07 | 1999-05-27 | Ajinomoto Co., Inc. | Method of producing L-lysine |
JP4075087B2 (ja) | 1996-12-05 | 2008-04-16 | 味の素株式会社 | L−リジンの製造法 |
DE19931317A1 (de) * | 1999-07-07 | 2001-01-11 | Degussa | L-Lysin produzierende coryneforme Bakterien und Verfahren zur Herstellung von L-Lysin |
JP2003135066A (ja) * | 1999-03-19 | 2003-05-13 | Ajinomoto Co Inc | L−リジンの製造法 |
MXPA01013123A (es) * | 1999-06-25 | 2002-06-21 | Basf Ag | Genes de corynebacterium glutamicum que codifican proteinas de via metabolica. |
JP2003169674A (ja) * | 1999-07-02 | 2003-06-17 | Ajinomoto Co Inc | L−リジンの製造法 |
JP2003159092A (ja) * | 1999-07-02 | 2003-06-03 | Ajinomoto Co Inc | L−アミノ酸の製造法 |
BR0012020A (pt) | 1999-07-02 | 2002-07-02 | Ajinomoto Kk | Proteìna, e, dna |
US20020086371A1 (en) | 1999-07-07 | 2002-07-04 | Degussa-Huls Aktiengesellschaft | L-lysine-producing corynebacteria and process for the preparation of L-lysine |
DE19931314A1 (de) * | 1999-07-07 | 2001-01-11 | Degussa | L-Lysin produzierende coryneforme Bakterien und Verfahren zur Herstellung von Lysin |
US6861246B2 (en) | 1999-07-07 | 2005-03-01 | Degussa Ag | L-lysine-producing corynebacteria and process for the preparation of lysine |
DE19943587A1 (de) | 1999-09-11 | 2001-03-15 | Degussa | Neue für das dapF-Gen codierende Nukleotidsequenzen |
WO2001020009A1 (de) | 1999-09-15 | 2001-03-22 | Basf Plant Science Gmbh | Pflanzen mit verändertem aminosäuregehalt und verfahren zu deren herstellung |
JP4306169B2 (ja) * | 1999-12-24 | 2009-07-29 | 味の素株式会社 | L−アミノ酸の製造法及び新規遺伝子 |
US6927046B1 (en) | 1999-12-30 | 2005-08-09 | Archer-Daniels-Midland Company | Increased lysine production by gene amplification using coryneform bacteria |
WO2002022666A2 (en) * | 2000-09-12 | 2002-03-21 | Degussa Ag | Nucleotide sequences which code for the gora gene |
MXPA03007089A (es) | 2001-02-08 | 2004-10-15 | Archer Daniels Midland Co | Construccion de polinucleotidos para produccion incrementada de lisina. |
DE10154292A1 (de) | 2001-11-05 | 2003-05-15 | Basf Ag | Gene die für Stoffwechselweg-Proteine codieren |
RU2244007C2 (ru) * | 2002-02-27 | 2005-01-10 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Способ получения l-треонина, штамм escherichia coli - продуцент треонина (варианты) |
EP2818556B1 (en) | 2004-10-07 | 2023-05-10 | Ajinomoto Co., Inc. | Method for producing a basic substance |
KR100628394B1 (ko) | 2005-01-04 | 2006-09-26 | 씨제이 주식회사 | 코리네박테리움의 알라닌 아미노트랜스퍼레이즈 유전자의결실을 통한 알라닌 요구주의 제작 및 이를 이용한엘-라이신의 생산방법 |
DE102006032634A1 (de) | 2006-07-13 | 2008-01-17 | Evonik Degussa Gmbh | Verfahren zur Herstellung von L-Aminosäuren |
EP1881076A1 (en) * | 2006-07-17 | 2008-01-23 | Evonik Degussa GmbH | Method for producing L-amino acids |
AU2007295159B2 (en) * | 2006-09-15 | 2012-09-13 | Cj Cheiljedang Corporation | A Corynebacteria having enhanced L-lysine productivity and a method of producing L-lysine using the same |
KR100830826B1 (ko) | 2007-01-24 | 2008-05-19 | 씨제이제일제당 (주) | 코리네박테리아를 이용하여 글리세롤을 포함한탄소원으로부터 발효산물을 생산하는 방법 |
US8048624B1 (en) | 2007-12-04 | 2011-11-01 | Opx Biotechnologies, Inc. | Compositions and methods for 3-hydroxypropionate bio-production from biomass |
US8932861B2 (en) | 2008-04-10 | 2015-01-13 | Cj Cheiljedang Corporation | Transformation vector comprising transposon, microorganisms transformed with the vector, and method for producing L-lysine using the microorganism |
KR101126041B1 (ko) | 2008-04-10 | 2012-03-19 | 씨제이제일제당 (주) | 트랜스포존을 이용한 형질전환용 벡터, 상기 벡터로형질전환된 미생물 및 이를 이용한 l-라이신 생산방법 |
DE102008001874A1 (de) | 2008-05-20 | 2009-11-26 | Evonik Degussa Gmbh | Verfahren zur Herstellung von L-Aminosäuren |
US9023622B2 (en) | 2009-02-10 | 2015-05-05 | Kyowa Hakko Bio Co., Ltd. | Method for producing L-amino acid using a microorganism with decreased aspartate aminotransferase activity |
WO2011038364A1 (en) | 2009-09-27 | 2011-03-31 | Opx Biotechnologies, Inc. | Method for producing 3-hydroxypropionic acid and other products |
US8809027B1 (en) | 2009-09-27 | 2014-08-19 | Opx Biotechnologies, Inc. | Genetically modified organisms for increased microbial production of 3-hydroxypropionic acid involving an oxaloacetate alpha-decarboxylase |
US9169502B2 (en) * | 2010-06-15 | 2015-10-27 | Paik Kwang Industrial Co., Ltd. | Method of producing L-lysine using a Corynebacterium glutamicum microorganism |
IN2015DN01858A (hu) | 2012-08-10 | 2015-05-29 | Opx Biotechnologies Inc | |
US20150057465A1 (en) | 2013-03-15 | 2015-02-26 | Opx Biotechnologies, Inc. | Control of growth-induction-production phases |
US9512057B2 (en) | 2013-03-15 | 2016-12-06 | Cargill, Incorporated | 3-hydroxypropionic acid compositions |
JP6603658B2 (ja) | 2013-07-19 | 2019-11-06 | カーギル インコーポレイテッド | 脂肪酸及び脂肪酸誘導体の製造のための微生物及び方法 |
US11408013B2 (en) | 2013-07-19 | 2022-08-09 | Cargill, Incorporated | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
EP2860256B1 (en) | 2013-10-11 | 2017-03-08 | CJ Cheiljedang Corporation | Method of producing l-amino acids |
EP2993228B1 (en) | 2014-09-02 | 2019-10-09 | Cargill, Incorporated | Production of fatty acid esters |
CN110494566A (zh) | 2017-02-02 | 2019-11-22 | 嘉吉公司 | 产生c6-c10脂肪酸衍生物的经遗传修饰的细胞 |
EP3456833A1 (en) * | 2017-09-18 | 2019-03-20 | Evonik Degussa GmbH | Method for the fermentative production of l-amino acids |
WO2020257395A1 (en) * | 2019-06-21 | 2020-12-24 | Inscripta, Inc. | Genome-wide rationally-designed mutations leading to enhanced lysine production in e. coli |
CN114540399B (zh) * | 2022-02-15 | 2024-05-03 | 宁夏伊品生物科技股份有限公司 | 一种制备l-缬氨酸的方法及其所用基因突变体和生物材料 |
CN114835783B (zh) * | 2022-06-01 | 2024-06-25 | 宁夏伊品生物科技股份有限公司 | NCgl2747基因突变体及其在制备L-赖氨酸中的应用 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5867699A (ja) * | 1981-10-16 | 1983-04-22 | Ajinomoto Co Inc | プラスミド |
US4861722A (en) * | 1983-08-24 | 1989-08-29 | Ajinomoto Company, Inc. | Coryneform bacteria carrying recombinant plasmids and their use in the fermentative production of L-lysine |
JPH0746994B2 (ja) * | 1984-10-04 | 1995-05-24 | 味の素株式会社 | 発酵法によるl−アミノ酸の製造法 |
JP3473042B2 (ja) * | 1992-04-28 | 2003-12-02 | 味の素株式会社 | 変異型アスパルトキナーゼ遺伝子 |
JPH07155184A (ja) * | 1993-12-08 | 1995-06-20 | Ajinomoto Co Inc | 発酵法によるl−リジンの製造法 |
AU705550B2 (en) * | 1995-06-07 | 1999-05-27 | Ajinomoto Co., Inc. | Method of producing L-lysine |
CA2180202A1 (en) * | 1995-06-30 | 1996-12-31 | Mika Moriya | Method of amplifying gene using artificial transposon |
-
1997
- 1997-12-03 SK SK1636-97A patent/SK285201B6/sk not_active IP Right Cessation
- 1997-12-05 BR BRPI9706059-3A patent/BR9706059B1/pt not_active IP Right Cessation
- 1997-12-05 PL PL97323546A patent/PL190430B1/pl unknown
- 1997-12-05 DE DE69736698T patent/DE69736698T2/de not_active Expired - Lifetime
- 1997-12-05 CN CNB971208204A patent/CN1159443C/zh not_active Expired - Lifetime
- 1997-12-05 DK DK97121443T patent/DK0854189T3/da active
- 1997-12-05 HU HU9702360A patent/HU224492B1/hu active IP Right Grant
- 1997-12-05 CN CNB031331319A patent/CN1273592C/zh not_active Expired - Lifetime
- 1997-12-05 EP EP97121443A patent/EP0854189B1/en not_active Expired - Lifetime
- 1997-12-05 ES ES97121443T patent/ES2273355T3/es not_active Expired - Lifetime
- 1997-12-05 US US08/985,908 patent/US6004773A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6004773A (en) | 1999-12-21 |
PL190430B1 (pl) | 2005-12-30 |
BR9706059B1 (pt) | 2012-02-22 |
DE69736698T2 (de) | 2007-09-20 |
HUP9702360A2 (hu) | 1999-06-28 |
HUP9702360A3 (en) | 2002-12-28 |
BR9706059A (pt) | 1999-10-05 |
PL323546A1 (en) | 1998-06-08 |
EP0854189A2 (en) | 1998-07-22 |
HU9702360D0 (en) | 1998-03-02 |
EP0854189A3 (en) | 2002-11-06 |
EP0854189B1 (en) | 2006-09-20 |
CN1524956A (zh) | 2004-09-01 |
CN1187540A (zh) | 1998-07-15 |
CN1159443C (zh) | 2004-07-28 |
SK285201B6 (sk) | 2006-08-03 |
ES2273355T3 (es) | 2007-05-01 |
SK163697A3 (en) | 1998-07-08 |
CN1273592C (zh) | 2006-09-06 |
DK0854189T3 (da) | 2007-01-15 |
DE69736698D1 (de) | 2006-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4168463B2 (ja) | L−リジンの製造法 | |
HU224492B1 (hu) | Eljárás L-lizin előállítására | |
JP4035855B2 (ja) | L−リジンの製造法 | |
JP4075087B2 (ja) | L−リジンの製造法 | |
US8183017B2 (en) | Method of producing L-lysine | |
JPH0970291A (ja) | 人工トランスポゾンを用いた遺伝子増幅方法 | |
WO2000053726A1 (fr) | Procede de production de l-lysine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
HFG4 | Patent granted, date of granting |
Effective date: 20050808 |