CZ369296A3 - Metody a geny virové resistence u rostlin - Google Patents
Metody a geny virové resistence u rostlin Download PDFInfo
- Publication number
- CZ369296A3 CZ369296A3 CZ963692A CZ369296A CZ369296A3 CZ 369296 A3 CZ369296 A3 CZ 369296A3 CZ 963692 A CZ963692 A CZ 963692A CZ 369296 A CZ369296 A CZ 369296A CZ 369296 A3 CZ369296 A3 CZ 369296A3
- Authority
- CZ
- Czechia
- Prior art keywords
- gene
- nucleotide
- plants
- plant
- sequence
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 257
- 238000000034 method Methods 0.000 title claims description 47
- 206010034133 Pathogen resistance Diseases 0.000 title description 7
- 241000196324 Embryophyta Species 0.000 claims abstract description 288
- 241000723873 Tobacco mosaic virus Species 0.000 claims abstract description 207
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 111
- 101710141454 Nucleoprotein Proteins 0.000 claims abstract description 42
- 244000061176 Nicotiana tabacum Species 0.000 claims abstract description 41
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims abstract description 36
- 108091026890 Coding region Proteins 0.000 claims abstract description 35
- 241001495644 Nicotiana glutinosa Species 0.000 claims abstract description 13
- 239000002773 nucleotide Substances 0.000 claims description 66
- 125000003729 nucleotide group Chemical group 0.000 claims description 66
- 150000007523 nucleic acids Chemical class 0.000 claims description 36
- 102000039446 nucleic acids Human genes 0.000 claims description 35
- 108020004707 nucleic acids Proteins 0.000 claims description 35
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 30
- 230000009261 transgenic effect Effects 0.000 claims description 29
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 25
- 241000208292 Solanaceae Species 0.000 claims description 20
- 230000002194 synthesizing effect Effects 0.000 claims description 14
- 241000208125 Nicotiana Species 0.000 claims description 10
- 241000894007 species Species 0.000 claims description 7
- 235000002566 Capsicum Nutrition 0.000 claims description 6
- 240000008574 Capsicum frutescens Species 0.000 claims description 2
- 239000001390 capsicum minimum Substances 0.000 claims description 2
- 230000001172 regenerating effect Effects 0.000 claims 3
- 239000002299 complementary DNA Substances 0.000 abstract description 35
- 241000700605 Viruses Species 0.000 abstract description 9
- 108020004414 DNA Proteins 0.000 description 57
- 235000001014 amino acid Nutrition 0.000 description 48
- 210000004027 cell Anatomy 0.000 description 48
- 235000018102 proteins Nutrition 0.000 description 45
- 229940024606 amino acid Drugs 0.000 description 43
- 150000001413 amino acids Chemical class 0.000 description 43
- 230000009610 hypersensitivity Effects 0.000 description 41
- 238000009396 hybridization Methods 0.000 description 36
- 239000013598 vector Substances 0.000 description 36
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 30
- 239000000523 sample Substances 0.000 description 28
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 24
- 230000014509 gene expression Effects 0.000 description 24
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 24
- 230000035772 mutation Effects 0.000 description 21
- 244000052769 pathogen Species 0.000 description 21
- 210000001519 tissue Anatomy 0.000 description 20
- 238000003780 insertion Methods 0.000 description 17
- 230000037431 insertion Effects 0.000 description 17
- 230000001717 pathogenic effect Effects 0.000 description 17
- 230000004044 response Effects 0.000 description 17
- 206010028851 Necrosis Diseases 0.000 description 16
- 239000012634 fragment Substances 0.000 description 16
- 230000017074 necrotic cell death Effects 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- 230000009466 transformation Effects 0.000 description 16
- 230000027455 binding Effects 0.000 description 15
- BWHMMNNQKKPAPP-UHFFFAOYSA-L potassium carbonate Substances [K+].[K+].[O-]C([O-])=O BWHMMNNQKKPAPP-UHFFFAOYSA-L 0.000 description 15
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 14
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000011081 inoculation Methods 0.000 description 13
- 238000010367 cloning Methods 0.000 description 12
- 108010050848 glycylleucine Proteins 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 241000589158 Agrobacterium Species 0.000 description 11
- 208000015181 infectious disease Diseases 0.000 description 11
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- 230000003902 lesion Effects 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 9
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 9
- 238000012300 Sequence Analysis Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 9
- 230000001419 dependent effect Effects 0.000 description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 9
- 230000019491 signal transduction Effects 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 8
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 8
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 8
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 8
- 108010025306 histidylleucine Proteins 0.000 description 8
- 238000003752 polymerase chain reaction Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- IYCZBJXFSZSHPN-DLOVCJGASA-N Ala-Cys-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IYCZBJXFSZSHPN-DLOVCJGASA-N 0.000 description 7
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 7
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 7
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- 240000003768 Solanum lycopersicum Species 0.000 description 7
- 238000002105 Southern blotting Methods 0.000 description 7
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 238000002955 isolation Methods 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 230000008929 regeneration Effects 0.000 description 7
- 238000011069 regeneration method Methods 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 108700020359 Drosophila Tl Proteins 0.000 description 6
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 6
- 102000019223 Interleukin-1 receptor Human genes 0.000 description 6
- 108050006617 Interleukin-1 receptor Proteins 0.000 description 6
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 6
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 6
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 210000000805 cytoplasm Anatomy 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 5
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 5
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 5
- JIVJQYNNAYFXDG-LKXGYXEUSA-N Cys-Thr-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JIVJQYNNAYFXDG-LKXGYXEUSA-N 0.000 description 5
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 5
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 5
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 5
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 5
- AZLASBBHHSLQDB-GUBZILKMSA-N Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C AZLASBBHHSLQDB-GUBZILKMSA-N 0.000 description 5
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 5
- 240000001140 Mimosa pudica Species 0.000 description 5
- 235000016462 Mimosa pudica Nutrition 0.000 description 5
- 108700005873 Nicotiana glutinosa N Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 5
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 102000030621 adenylate cyclase Human genes 0.000 description 5
- 108060000200 adenylate cyclase Proteins 0.000 description 5
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000001086 cytosolic effect Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 108010005942 methionylglycine Proteins 0.000 description 5
- 239000003642 reactive oxygen metabolite Substances 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 230000001131 transforming effect Effects 0.000 description 5
- 108700026215 vpr Genes Proteins 0.000 description 5
- 102100032534 Adenosine kinase Human genes 0.000 description 4
- 108020000543 Adenylate kinase Proteins 0.000 description 4
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 4
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 4
- BBYTXXRNSFUOOX-IHRRRGAJSA-N Arg-Cys-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BBYTXXRNSFUOOX-IHRRRGAJSA-N 0.000 description 4
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 4
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 4
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 4
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 4
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 4
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 4
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 4
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 4
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 4
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 4
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 4
- 241000701489 Cauliflower mosaic virus Species 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 208000035240 Disease Resistance Diseases 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 108700024394 Exon Proteins 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 241001200922 Gagata Species 0.000 description 4
- BUVMZWZNWMKASN-QEJZJMRPSA-N Glu-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 BUVMZWZNWMKASN-QEJZJMRPSA-N 0.000 description 4
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 4
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 4
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 4
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 4
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 4
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 4
- GULGDABMYTYMJZ-STQMWFEESA-N Gly-Trp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O GULGDABMYTYMJZ-STQMWFEESA-N 0.000 description 4
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 4
- YAEKRYQASVCDLK-JYJNAYRXSA-N His-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YAEKRYQASVCDLK-JYJNAYRXSA-N 0.000 description 4
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 4
- 108010025815 Kanamycin Kinase Proteins 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 4
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 4
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 4
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 4
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 4
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 4
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 239000006002 Pepper Substances 0.000 description 4
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 4
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 4
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- 241000722363 Piper Species 0.000 description 4
- 235000016761 Piper aduncum Nutrition 0.000 description 4
- 235000017804 Piper guineense Nutrition 0.000 description 4
- 235000008184 Piper nigrum Nutrition 0.000 description 4
- 102000015795 Platelet Membrane Glycoproteins Human genes 0.000 description 4
- 108010010336 Platelet Membrane Glycoproteins Proteins 0.000 description 4
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 4
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 4
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 4
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 4
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 4
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 4
- DTPWXZXGFAHEKL-NWLDYVSISA-N Trp-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DTPWXZXGFAHEKL-NWLDYVSISA-N 0.000 description 4
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 4
- BWVHQINTNLVWGZ-ZKWXMUAHSA-N Val-Cys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BWVHQINTNLVWGZ-ZKWXMUAHSA-N 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 230000000845 anti-microbial effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000005712 elicitor Substances 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 210000004901 leucine-rich repeat Anatomy 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010000761 leucylarginine Proteins 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 4
- 230000001338 necrotic effect Effects 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 210000001938 protoplast Anatomy 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000005030 transcription termination Effects 0.000 description 4
- 108010044292 tryptophyltyrosine Proteins 0.000 description 4
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 3
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 3
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 3
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 3
- 241000219194 Arabidopsis Species 0.000 description 3
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 3
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 3
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 3
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 3
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 description 3
- NZQFXJKVNUZYAG-BPUTZDHNSA-N Arg-Trp-Cys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 NZQFXJKVNUZYAG-BPUTZDHNSA-N 0.000 description 3
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 3
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 3
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 3
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 3
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 3
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 3
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 3
- WJHYGGVCWREQMO-GHCJXIJMSA-N Asp-Cys-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WJHYGGVCWREQMO-GHCJXIJMSA-N 0.000 description 3
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 3
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 3
- SAKCBXNPWDRWPE-BQBZGAKWSA-N Asp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N SAKCBXNPWDRWPE-BQBZGAKWSA-N 0.000 description 3
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 3
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 3
- 101710132601 Capsid protein Proteins 0.000 description 3
- 101710094648 Coat protein Proteins 0.000 description 3
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 3
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 3
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 3
- 102000004127 Cytokines Human genes 0.000 description 3
- 108090000695 Cytokines Proteins 0.000 description 3
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 3
- 108700040691 Drosophila chp Proteins 0.000 description 3
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 3
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 3
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 3
- YDJOULGWHQRPEV-SRVKXCTJSA-N Glu-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N YDJOULGWHQRPEV-SRVKXCTJSA-N 0.000 description 3
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 3
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 3
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 3
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 3
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 3
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 3
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 3
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 3
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 3
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 3
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 3
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 3
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 3
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 3
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 3
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 3
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 3
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 3
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 3
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 3
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 3
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 3
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 3
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 3
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 3
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 3
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 3
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 3
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 3
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 3
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 3
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 3
- 102000000589 Interleukin-1 Human genes 0.000 description 3
- 108010002352 Interleukin-1 Proteins 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 3
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 3
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 3
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 3
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 3
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 3
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 3
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 3
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 3
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 3
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 3
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 3
- 101710125418 Major capsid protein Proteins 0.000 description 3
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 3
- CTVJSFRHUOSCQQ-DCAQKATOSA-N Met-Arg-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTVJSFRHUOSCQQ-DCAQKATOSA-N 0.000 description 3
- NWBJYWHLCVSVIJ-UHFFFAOYSA-N N-benzyladenine Chemical compound N=1C=NC=2NC=NC=2C=1NCC1=CC=CC=C1 NWBJYWHLCVSVIJ-UHFFFAOYSA-N 0.000 description 3
- 108010057466 NF-kappa B Proteins 0.000 description 3
- 102000003945 NF-kappa B Human genes 0.000 description 3
- 241000208138 Nicotiana tomentosiformis Species 0.000 description 3
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 3
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 3
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 3
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 3
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 3
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 3
- 101710083689 Probable capsid protein Proteins 0.000 description 3
- 101150090155 R gene Proteins 0.000 description 3
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 3
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 3
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 3
- BRIZMMZEYSAKJX-QEJZJMRPSA-N Ser-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N BRIZMMZEYSAKJX-QEJZJMRPSA-N 0.000 description 3
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 3
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 3
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 3
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 3
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 3
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 3
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 3
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 3
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 3
- LDEBVRIURYMKQS-WISUUJSJSA-N Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO LDEBVRIURYMKQS-WISUUJSJSA-N 0.000 description 3
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 3
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 3
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 3
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 3
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 3
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 3
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 3
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 3
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 3
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 3
- NSOMQRHZMJMZIE-GVARAGBVSA-N Tyr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NSOMQRHZMJMZIE-GVARAGBVSA-N 0.000 description 3
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 3
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 3
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 3
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 3
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 3
- CJDZKZFMAXGUOJ-IHRRRGAJSA-N Val-Cys-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CJDZKZFMAXGUOJ-IHRRRGAJSA-N 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 244000052616 bacterial pathogen Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 239000013599 cloning vector Substances 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 108010004073 cysteinylcysteine Proteins 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 210000002257 embryonic structure Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 3
- 235000009973 maize Nutrition 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 230000003278 mimic effect Effects 0.000 description 3
- 239000006870 ms-medium Substances 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 239000002751 oligonucleotide probe Substances 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 244000000003 plant pathogen Species 0.000 description 3
- 108010079317 prolyl-tyrosine Proteins 0.000 description 3
- 230000004853 protein function Effects 0.000 description 3
- 230000004850 protein–protein interaction Effects 0.000 description 3
- 102000016914 ras Proteins Human genes 0.000 description 3
- 108010014186 ras Proteins Proteins 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000009885 systemic effect Effects 0.000 description 3
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 102000003390 tumor necrosis factor Human genes 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 244000052613 viral pathogen Species 0.000 description 3
- 108010027345 wheylin-1 peptide Proteins 0.000 description 3
- PRPINYUDVPFIRX-UHFFFAOYSA-N 1-naphthaleneacetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CC=CC2=C1 PRPINYUDVPFIRX-UHFFFAOYSA-N 0.000 description 2
- 102000021527 ATP binding proteins Human genes 0.000 description 2
- 108091011108 ATP binding proteins Proteins 0.000 description 2
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- 101100481706 Arabidopsis thaliana TMKL1 gene Proteins 0.000 description 2
- OKKMBOSPBDASEP-CYDGBPFRSA-N Arg-Ile-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O OKKMBOSPBDASEP-CYDGBPFRSA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 2
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 2
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 2
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- 208000035143 Bacterial infection Diseases 0.000 description 2
- PHEDXBVPIONUQT-UHFFFAOYSA-N Cocarcinogen A1 Natural products CCCCCCCCCCCCCC(=O)OC1C(C)C2(O)C3C=C(C)C(=O)C3(O)CC(CO)=CC2C2C1(OC(C)=O)C2(C)C PHEDXBVPIONUQT-UHFFFAOYSA-N 0.000 description 2
- 101150011813 DLL1 gene Proteins 0.000 description 2
- 108010016626 Dipeptides Proteins 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 102000030782 GTP binding Human genes 0.000 description 2
- 108091000058 GTP-Binding Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 2
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 2
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- SNFUTDLOCQQRQD-ZKWXMUAHSA-N Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SNFUTDLOCQQRQD-ZKWXMUAHSA-N 0.000 description 2
- UYPPAMNTTMJHJW-KCTSRDHCSA-N Gly-Ile-Trp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UYPPAMNTTMJHJW-KCTSRDHCSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 2
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 2
- NDKSHNQINMRKHT-PEXQALLHSA-N His-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N NDKSHNQINMRKHT-PEXQALLHSA-N 0.000 description 2
- 101001059454 Homo sapiens Serine/threonine-protein kinase MARK2 Proteins 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- QNBYCZTZNOVDMI-HGNGGELXSA-N Ile-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QNBYCZTZNOVDMI-HGNGGELXSA-N 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 2
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 2
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 2
- OBCRZLRPJFNLAN-DCAQKATOSA-N Met-His-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OBCRZLRPJFNLAN-DCAQKATOSA-N 0.000 description 2
- RMLWDZINJUDMEB-IHRRRGAJSA-N Met-Tyr-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RMLWDZINJUDMEB-IHRRRGAJSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- NSTPXGARCQOSAU-VIFPVBQESA-N N-formyl-L-phenylalanine Chemical compound O=CN[C@H](C(=O)O)CC1=CC=CC=C1 NSTPXGARCQOSAU-VIFPVBQESA-N 0.000 description 2
- 241000208136 Nicotiana sylvestris Species 0.000 description 2
- MIDZLCFIAINOQN-WPRPVWTQSA-N Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 MIDZLCFIAINOQN-WPRPVWTQSA-N 0.000 description 2
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 2
- LNIIRLODKOWQIY-IHRRRGAJSA-N Phe-Asn-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LNIIRLODKOWQIY-IHRRRGAJSA-N 0.000 description 2
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 108700001094 Plant Genes Proteins 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 102000015176 Proton-Translocating ATPases Human genes 0.000 description 2
- 108010039518 Proton-Translocating ATPases Proteins 0.000 description 2
- 241000589626 Pseudomonas syringae pv. tomato Species 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 2
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- COLJZWUVZIXSSS-CIUDSAMLSA-N Ser-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N COLJZWUVZIXSSS-CIUDSAMLSA-N 0.000 description 2
- YZMPDHTZJJCGEI-BQBZGAKWSA-N Ser-His Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 YZMPDHTZJJCGEI-BQBZGAKWSA-N 0.000 description 2
- BXLYSRPHVMCOPS-ACZMJKKPSA-N Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO BXLYSRPHVMCOPS-ACZMJKKPSA-N 0.000 description 2
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 2
- 102100028904 Serine/threonine-protein kinase MARK2 Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 244000061458 Solanum melongena Species 0.000 description 2
- 235000002597 Solanum melongena Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 2
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 2
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 2
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- CGCMNOIQVAXYMA-UNQGMJICSA-N Thr-Met-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CGCMNOIQVAXYMA-UNQGMJICSA-N 0.000 description 2
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- IJRXQJVGFBSKIV-ZFWWWQNUSA-N Trp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N IJRXQJVGFBSKIV-ZFWWWQNUSA-N 0.000 description 2
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 2
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 2
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 2
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 2
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000000680 avirulence Effects 0.000 description 2
- 208000022362 bacterial infectious disease Diseases 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 229960004261 cefotaxime Drugs 0.000 description 2
- GPRBEKHLDVQUJE-VINNURBNSA-N cefotaxime Chemical compound N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C(O)=O)=O)C(=O)/C(=N/OC)C1=CSC(N)=N1 GPRBEKHLDVQUJE-VINNURBNSA-N 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000007123 defense Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 101150023643 hrpS gene Proteins 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000007479 molecular analysis Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 230000009871 nonspecific binding Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- PHEDXBVPIONUQT-RGYGYFBISA-N phorbol 13-acetate 12-myristate Chemical compound C([C@]1(O)C(=O)C(C)=C[C@H]1[C@@]1(O)[C@H](C)[C@H]2OC(=O)CCCCCCCCCCCCC)C(CO)=C[C@H]1[C@H]1[C@]2(OC(C)=O)C1(C)C PHEDXBVPIONUQT-RGYGYFBISA-N 0.000 description 2
- -1 phytoalexins Chemical class 0.000 description 2
- 230000008659 phytopathology Effects 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000010802 sludge Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 230000021918 systemic acquired resistance Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 239000005723 virus inoculator Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102000011767 Acute-Phase Proteins Human genes 0.000 description 1
- 108010062271 Acute-Phase Proteins Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- 101100165929 Arabidopsis thaliana CRK6 gene Proteins 0.000 description 1
- 101100037317 Arabidopsis thaliana RLK5 gene Proteins 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- BMNVSPMWMICFRV-DCAQKATOSA-N Arg-His-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CN=CN1 BMNVSPMWMICFRV-DCAQKATOSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- IQTUDDBANZYMAR-WDSKDSINSA-N Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O IQTUDDBANZYMAR-WDSKDSINSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- IAMNNSSEBXDJMN-CIUDSAMLSA-N Asp-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N IAMNNSSEBXDJMN-CIUDSAMLSA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 108050004290 Cecropin Proteins 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108091027551 Cointegrate Proteins 0.000 description 1
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 1
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 1
- MXZYQNJCBVJHSR-KATARQTJSA-N Cys-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O MXZYQNJCBVJHSR-KATARQTJSA-N 0.000 description 1
- YYLBXQJGWOQZOU-IHRRRGAJSA-N Cys-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N YYLBXQJGWOQZOU-IHRRRGAJSA-N 0.000 description 1
- VRJZMZGGAKVSIQ-SRVKXCTJSA-N Cys-Tyr-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VRJZMZGGAKVSIQ-SRVKXCTJSA-N 0.000 description 1
- IMXSCCDUAFEIOE-UHFFFAOYSA-N D-Octopin Natural products OC(=O)C(C)NC(C(O)=O)CCCN=C(N)N IMXSCCDUAFEIOE-UHFFFAOYSA-N 0.000 description 1
- LMKYZBGVKHTLTN-NKWVEPMBSA-N D-nopaline Chemical compound NC(=N)NCCC[C@@H](C(O)=O)N[C@@H](C(O)=O)CCC(O)=O LMKYZBGVKHTLTN-NKWVEPMBSA-N 0.000 description 1
- IMXSCCDUAFEIOE-RITPCOANSA-N D-octopine Chemical compound [O-]C(=O)[C@@H](C)[NH2+][C@H](C([O-])=O)CCCNC(N)=[NH2+] IMXSCCDUAFEIOE-RITPCOANSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 238000007900 DNA-DNA hybridization Methods 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108010002069 Defensins Proteins 0.000 description 1
- 102000000541 Defensins Human genes 0.000 description 1
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 1
- 108700003861 Dominant Genes Proteins 0.000 description 1
- 241000701832 Enterobacteria phage T3 Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- YUXIEONARHPUTK-JBACZVJFSA-N Glu-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YUXIEONARHPUTK-JBACZVJFSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- GTFYQOVVVJASOA-ACZMJKKPSA-N Glu-Ser-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N GTFYQOVVVJASOA-ACZMJKKPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- VGYOLSOFODKLSP-IHPCNDPISA-N His-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 VGYOLSOFODKLSP-IHPCNDPISA-N 0.000 description 1
- SGLXGEDPYJPGIQ-ACRUOGEOSA-N His-Phe-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N SGLXGEDPYJPGIQ-ACRUOGEOSA-N 0.000 description 1
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 1
- DLTCGJZBNFOWFL-LKTVYLICSA-N His-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N DLTCGJZBNFOWFL-LKTVYLICSA-N 0.000 description 1
- 101001038321 Homo sapiens Leucine-rich repeat protein 1 Proteins 0.000 description 1
- 101000979342 Homo sapiens Nuclear factor NF-kappa-B p105 subunit Proteins 0.000 description 1
- 101000801109 Homo sapiens Transmembrane protein 131 Proteins 0.000 description 1
- CISBRYJZMFWOHJ-JBDRJPRFSA-N Ile-Ala-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N CISBRYJZMFWOHJ-JBDRJPRFSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- KTGFOCFYOZQVRJ-ZKWXMUAHSA-N Ile-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-ZKWXMUAHSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- VUEXLJFLDONGKQ-PYJNHQTQSA-N Ile-His-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N VUEXLJFLDONGKQ-PYJNHQTQSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 101150062031 L gene Proteins 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 235000019687 Lamb Nutrition 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 1
- 102100040249 Leucine-rich repeat protein 1 Human genes 0.000 description 1
- 108700012133 Lycopersicon Pto Proteins 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- VPRLICVDSGMIKO-UHFFFAOYSA-N Mannopine Natural products NC(=O)CCC(C(O)=O)NCC(O)C(O)C(O)C(O)CO VPRLICVDSGMIKO-UHFFFAOYSA-N 0.000 description 1
- VIZLHGTVGKBBKO-AVGNSLFASA-N Met-Arg-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VIZLHGTVGKBBKO-AVGNSLFASA-N 0.000 description 1
- UKUMISIRZAVYOG-CIUDSAMLSA-N Met-Glu-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O UKUMISIRZAVYOG-CIUDSAMLSA-N 0.000 description 1
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 1
- PBOUVYGPDSARIS-IUCAKERBSA-N Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C PBOUVYGPDSARIS-IUCAKERBSA-N 0.000 description 1
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 1
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 1
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 1
- CULGJGUDIJATIP-STQMWFEESA-N Met-Tyr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 CULGJGUDIJATIP-STQMWFEESA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 101100153500 Nicotiana glutinosa N gene Proteins 0.000 description 1
- 102100023050 Nuclear factor NF-kappa-B p105 subunit Human genes 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 101710096342 Pathogenesis-related protein Proteins 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 1
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 1
- NAOVYENZCWFBDG-BZSNNMDCSA-N Phe-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 NAOVYENZCWFBDG-BZSNNMDCSA-N 0.000 description 1
- HTXVATDVCRFORF-MGHWNKPDSA-N Phe-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N HTXVATDVCRFORF-MGHWNKPDSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 1
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- IHPVFYLOGNNZLA-UHFFFAOYSA-N Phytoalexin Natural products COC1=CC=CC=C1C1OC(C=C2C(OCO2)=C2OC)=C2C(=O)C1 IHPVFYLOGNNZLA-UHFFFAOYSA-N 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- XSXABUHLKPUVLX-JYJNAYRXSA-N Pro-Ser-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O XSXABUHLKPUVLX-JYJNAYRXSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589615 Pseudomonas syringae Species 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241001633102 Rhizobiaceae Species 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- PZHJLTWGMYERRJ-SRVKXCTJSA-N Ser-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O PZHJLTWGMYERRJ-SRVKXCTJSA-N 0.000 description 1
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- OUUQCZGPVNCOIJ-UHFFFAOYSA-M Superoxide Chemical compound [O-][O] OUUQCZGPVNCOIJ-UHFFFAOYSA-M 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 1
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- FDQXPJCLVPFKJW-KJEVXHAQSA-N Thr-Met-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O FDQXPJCLVPFKJW-KJEVXHAQSA-N 0.000 description 1
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004380 Transcription factor RelB Human genes 0.000 description 1
- 108090000952 Transcription factor RelB Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 102100033700 Transmembrane protein 131 Human genes 0.000 description 1
- OHGNSVACHBZKSS-KWQFWETISA-N Trp-Ala Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](C)C([O-])=O)=CNC2=C1 OHGNSVACHBZKSS-KWQFWETISA-N 0.000 description 1
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 1
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 1
- ULHASJWZGUEUNN-XIRDDKMYSA-N Trp-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O ULHASJWZGUEUNN-XIRDDKMYSA-N 0.000 description 1
- ACGIVBXINJFALS-HKUYNNGSSA-N Trp-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ACGIVBXINJFALS-HKUYNNGSSA-N 0.000 description 1
- VUMCLPHXCBIJJB-PMVMPFDFSA-N Trp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N VUMCLPHXCBIJJB-PMVMPFDFSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- 101710100170 Unknown protein Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 239000003710 calcium ionophore Substances 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000002032 cellular defenses Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000004665 defense response Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- 208000031169 hemorrhagic disease Diseases 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 108700003621 insect attacin antibacterial Proteins 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 230000031146 intracellular signal transduction Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 230000001418 larval effect Effects 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- VPRLICVDSGMIKO-SZWOQXJISA-N mannopine Chemical compound NC(=O)CC[C@@H](C(O)=O)NC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO VPRLICVDSGMIKO-SZWOQXJISA-N 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 239000003226 mitogen Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 230000013271 negative regulation by symbiont of host defense-related programmed cell death Effects 0.000 description 1
- 231100001222 nononcogenic Toxicity 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 239000000280 phytoalexin Substances 0.000 description 1
- 150000001857 phytoalexin derivatives Chemical class 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000006862 quantum yield reaction Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008261 resistance mechanism Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 108091006024 signal transducing proteins Proteins 0.000 description 1
- 102000034285 signal transducing proteins Human genes 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8283—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for virus resistance
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/04—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H17/00—Compounds containing heterocyclic radicals directly attached to hetero atoms of saccharide radicals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
- C12N5/12—Fused cells, e.g. hybridomas
- C12N5/14—Plant cells
-
- D—TEXTILES; PAPER
- D01—NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
- D01H—SPINNING OR TWISTING
- D01H5/00—Drafting machines or arrangements ; Threading of roving into drafting machine
- D01H5/02—Gill boxes or other drafting machines employing fallers or like pinned bars
- D01H5/12—Details
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Botany (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Mechanical Engineering (AREA)
- Textile Engineering (AREA)
- Virology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Description
METODY A GENY VIROVÉ RESISTENCE U ROSTLIN
Ob 1 at vyn á 1 v z u
Předkládaný vynález se týká metod a materiálů pro zlepšení kontroly rostliných patogenů. Přesněji se předkládaný vynález týká sekvence nukleovych kyselin, které kódují N genový protein, rekombinantních polynukleových molekul obsahujících sekvence a jejich užití, zejména užití pro transformaci rostlin z rodiny Solanaceae tak, aby byly resistentní na virus tabákové mozaiky.
Dijsavadn 1. stav techniky
Většina ztrát výnosu plodin a kvanty muže oyt výsledkem infekce plodin rostlinými patogeny včetně virů, bakterií a hub. Virus tabákové mozaiky (TMV) infikuje komerčně významné rostliny včetně tabáku a příbuzných rostlin jako jsou rajčata a pepř. Ačkoliv není letální, poškozuje TMV růst a produktivitu těchto rostlin. Virový patogen se šíří mezi rostlinami ve dvou krocích. Za prvé, virová infekce se vyskytne v místě, kde je virus zaveden do buněk hostitelské rostliny. Za druhé, virová replikace se vyskytne tam, kde se virus znásobuje uvnitř buněk rostliny.
Rostliny mají množství mechanismů, které poskytují přirozenou resistenci na atak patogena. Tyto zahrnují vytvořené struktury a chemické bariery a mechanismy aktivní resistence. Resistence rostlin na choroby způsobené velkým počtem patogenů je kontrolována jednotlivými komplementárními geny v rostlině a patogenů. Geny rostlin jsou nazývány geny resistence a geny patogenů jsou nazývány avirulentními geny. Rostliny nesoucí gen resistence jsou účině chráněny před chorobou způsobenou patogenem nesoucím korespondující avirulentní gen.
Dominantní N lokus tabáku uděluje resistenči na TMV a zprostředkovává lokalizovanou hypersensitivní odpověď (HR) v místě virové infekce a indukci systémové odpovědi získané resistence (SAR) v buňkách sousedících s místem infekce a v celé rostlině. Heterozygotní rostliny tabáku nebo homozygoti pro N lokus jsou resistentní na chorobu způsobenou TMV. HR je komplexní, aktivní odpověď resistence, která je indukována v rostlině v odpovědi na atak patogena po selhání předem vytvořených mechanismů resistence (Keen et al., Biotechnology in Plant Disease Control, Wiley-Liss, lne., str. 65-88 (1993)). HR je charakterizována smrtí buněk (nekrosou) v místě vstupu patogena.
Ačkoliv nekrosa per se nemůže být odpovědná za resistenci na vnikajícího patogena, konkomitantní syntesa antimikrobiálních sloučenin, proteinů týkajících se patogenese, které charakterizují SAR odpověď a ustanovení strukturálních barier je považováno za hlavní úlohu v zabránění šíření patogena. Interakce rostlina-patogen, jejichž výsledkem je resistence, jsou nazývány inkompatibilní, zatímco ty, které vedou k rozvoji choroby, jsou nazývány kompatibilní.
Byly provedeny studie mechanismů, kterými rostliny nesoucí geny resistence na chorobu zjistí přítomnost pronikajícího patogenu a vyvolají HR a SAR. V mnoha případech je HR řízena gene for gene interakcí mezi inkompatibilní rostlinou a kombinacemi patogenu. Model genu, jak navrhl Flor (Journal of Agricultural Research 74:241-262 (1947)) předpokládá, že resistence na chorobu a avirulence patogenu (produkce elicitoru) jsou dominantními rysy. Proto se bude resistence vyskytovat pouze v případech, kde rostlina vlastní specifický gen resistence (R-gen) a patogen vlastní korespondující gen avirulence (Avr gen). Některé Avr geny byly klonovány z bakterií, hub a virů (viz Gabriel et Rolfe, Annual Rev. Phytopathology 28:365-391 (1990) a Keen, Annual Rev. Genet.
24:447-463 (1990)), a v některých případech byla definována přirozená molekula elicitoru (viz. Keen Plant Molecular Biology 19:109-122 (1992)). Gen resistence kukuřice na houby, HMI, (Johal and Briggs, Science 258:985-987 (1992)) a gen resistence rajčat na bakterie, Pto, (G.Martin et al., Science 262: 1432-1436 (1993)) byly popsány. Žádný přirozený gen rostlině resistence na viry nebyl doposud popsán.
Jednoduché genetické vztahy mezi R-geny a jejich korespondujícími Avr geny vedly ke spekulacím o způsobu akce produktů R genu. Jeden model předpokládá, že R geny leží v signální cestě, která je schopná rozpoznat patogen a iniciovat následující signální transdukční kaskádu vedoucí k resistenci (Lamb, Cell 76:419-422 (1994)). Druhý model předpokládá, že produkty R genu jsou transmembránové iontové kanály, které zprostředkují buněčnou smrt nezávislou na jiných událostech v buňce. Nedávné klonování Pto z rajčete, který uděluje resistenci na bakteriální patogen Pseudomonas syringae pathovar tomato (Martin et al., Science 262:1432-1436 (1993)), napovídá, že alespoň první model může být fungující v rostlinách. Sekvenční analýza Pto indikuje, že kóduje serin/threonin kinásu. Je teorie, že tato serin/threonin kinása interaguje přímo nebo nepřímo s molekulou elicitoru a pak fosforyluje následující modulátor odpovědi resistence, a tak iniciuje signál transdukční kaskády.
Byly zmíněny podobnosti mezi hypersensitivní odpovědí resistence rostlin a vrozenou imunitní odpovědí zvířat. Společným tematem je rychlá produkce reaktivních typů kyslíku (ROS), známá jako oxidativní vzplanutí. Příklady ROS jsou superoxidový aniont (0 “) a peroxid vodíku (H202). Tyto molekuly mohou mít přímý antimikrobiální efekt a jiné protektivní efekty jako je překřížení strukturálních proteinů ve stěně rostlině buňky. Důležité je, že ROS mohou aktivovat expresi obrany se týkajících genů u zvířat a rostlin (Schreck and Baurle, Trends in Cell Biology . 1:39-42 (1991), Chen et al., Science 262:1883-1886 (1993)). U savců jsou ROS silně implikovány jako druhý posel pro cytokiny jako je tumor nekrosis faktor (TNF) a Interleukin 1 (IL-1) ve dráze, kde transkripční faktor NF-kB reguluje expresi imunoglobulinů, interleukinů, a jiných proteinů. Drosophila transkripční faktor (Dif) homologní k NF-kB také aktivuje transkripci antibakteriálních proteinů včetně cecropinů, attacinů, defensinů a lysozymů (Levine and Hultmark, Trends in Genetics, 9:178-183 (1993)). Paralelně je u rostlin indukce patogenese se týkajících proteinů a syntesa antimikrobiálních sloučenin jako jsou phytoalexiny, které mohou být indukovány exogení aplikací H202.
Důležitým modelem systému pro studium odpovědi resistence u rostlin je systém genu resistence Ν. N lokus je složen z jednotlivých dominantních genů, které zprostředkují indukci nekrotického typu odpovědi a SAR v odpovědi na infekci TMV (Holmes, Phytopatology 28:553-561 (1938)). To bylo původně identifikováno v Nicotiana glutinosa, a bylo to vneseno do N.tabacum. N-gen zprostředkuje hypersensitivní odpověď, která je charakterizována formováním lokálních lézí, ve kterých je lokalizován virus tabákové mozaiky. Toto je ukázáno na Obr.
1A. Tabákové kultivary bez N genu dovolují viru tabákové mozaiky šířit se systémově a vyvinout mozaikové symptomy charakterizované intermitentními oblastmi světle a tmavě zelené tkáně listů (Obr. IB).
Rekombinantní DNA technologie nabízí potenciál pro získání rostlin s geny resistence na patogén k udělení resistence . Tomuto přístupu bránila nedostupnost klonovaných genů přirozené resistence rostlin a neznalost mechanismu resistence.Dosud, nicméně, byly klonované geny resistence nedosažitelné díky nedostupnosti techniky k izolování rostliných genů, pro které není dosažitelná žádná informace týkající se genu nebo jeho produktu. Nedávno byly vyvinuty pro rostliny dvě techniky, a nejsou závislé na znalosti genu nebo biochemické znalosti proteinu, které dovolují izolaci genu těmito technikami. Těmito technikami jsou poziční klonování a transposon tagging (Baker , Schell, Fedoroff, Proceedings of National Academy of Science, USA 83:4844-4848 (1986)).
Podsta ta vyn<41 ezu
Předkládaný vynález zahrnuje DNA sekvence v izolované a purifikované formě, které kódují N-genový protein, kde tento protein zprostředkuje resistenci na TMV v rostlinách syntetizujících N-genový protein. Genomová a cDNA sekvence kódující jednotlivý N-genový protein jsou zde specificky doloženy příklady. Do rozsahu předkládaného vynálezu jsou zahrnuty DNA sekvence kódující N genový protein příklady doložených aminokyselinových sekvencí. DNA sekvence, které specificky hybridizují s N gen kódující sekvencí nebo jejím komplementem za standartních podmínek a které kódují proteiny N genu, jejichž funkcí je zprostředkování resistence na TMV jsou také obsaženy předkládaným vynálezem.
Dalším aspektem vynálezu je zajištění rekombinantní molekuly nukleové kyseliny obsahující sekvenci kódující protein N genu. Taková molekula zahrnuje, například, rekombinantní vektory, jako je klonující, expresní, nebo transformační vektor, které obsahují DNA sekvenci kódující protein N genu.
Dalším aspektem vynálezu je zajištění buněk, které jsou transformovány výše zmíněnými vektory nebo DNA sekvencemi.
Jednotlivým využitím vynálezu je poskytnutí rostlin nebo rostliných buněk transformovaných N gen kódující sekvencí k poskytnutí rostlin majících resistenci na TMV.
Dalším aspektem vynálezu je poskytnutí oligonukleotidových prob schopných detekce N genu nebo jeho funkčního ekvivalentu v rostlinách z rodiny Solanaceae a užití prob k izolování DNA sekvencí kódujících N gen nebo jeho funkční ekvivalent. DNA sekvence, které specificky hybridizují s probami a které kódují funkční protein N genu jsou obsaženy v předkládaném vynálezu.
Užití sekvence N genu usnadňuje izolaci homologních genů z příbuzných a nepříbuzných hostitelů k získání genů, které chrání hostitelské rostliny proti příbuzným virovým patogenům a nepříbuzným patogenům.
V souladu s tímto objevem je předmětem vynálezu poskytnutí genových konstruktů obsahujících DNA sekvenci, která kóduje protein N genu, jehož funkcí je zprostředkovat resistenci na TMV u rostlin syntetizujících protein N genu.
Je také předmětem vynálezu poskytnutí transformujících vektorů obsahujících N genový konstrukt, kde jsou tyto vektory efektivní pro stabilní zavedení N genového konstruktu do rostliny.
Jiným předmětem vynálezu je poskytnutí transgenních rostlin majících resistenci na TMV, kde je tato resistence výsledkem exprese N genového konstruktů.
Jiné objekty nebo výhody tohoto vynálezu se stanou jasnými z následujícího popisu.
PODROBNÝ POPIS OBRÁZKŮ
Obr.l ukazuje fenotyp tabákových listů po inokulaci TMV. Obr.lA ukazuje list z rostliny nesoucí funkční N gen. Obr.lB ukazuje list z rostliny citlivé na TMV. Obr.lC ukazuje list z rostliny vykazující oblasti nekrosy na podkladě citlivosti na TMV(sektorovaný fenotyp). Obr.ID ukazuje list z SRÍ tabáku citlivého na TMV transformovaného pTG38 T-DNA konstruktem.
Obr. 2A-2C ilustrují Southern blot hybridizanční analýzu proby Ntl RFLP markéru a Ac k Dlll populaci. 0br.2A ukazuje výsledky hybridizace Nt-1 proby na genomovou DNA izolovanou z Nicotiana species glutinosa, tomentosiformis, a sylvestris, a kultivarů tabáku Samsun NN a SR 1. Obr. 2B ukazuje výsledky Nt-1 hybridizace na genomovou DNA zpětného křížení rodičů segregující Nt-1 (G) N-navázaný RFLP markér. Obr.2C ukazuje hybridizaci 5-Ac proby na stejnou DNA jako na 0br.2B.
0br.3A ukazuje mapu restrikčních enzymů části divokého typu N-genu a Ac inserčně mutovaný N gen. Obr. 3B-C ukazují Southern blot hybridizační analýzu DNA izolované z rodičovské Nicotiana species a z Ac mutovaných rostlin, sektorovaných rostlin a mutantů nesoucích Ac inserci v divokém typu (WT)
N genu, a gíerminálni revertanty. 0br.3B ukazuje hybridizaci N genové proby N-5 na selektovanou rostlinou DNA.
0br.4A a 4B sumarizují organizaci N genu. 0br.4A ilustruje organizaci N genu s ohledem na relativní posice intronů a exonů, a Obr.4B poskytuje restrikční mapu tří genomových klonů, kde každý obsahuje kompletní délku N genu. Tato mapa byla odvozena ze sekvenční analýzy cDNA klonů C7, C16, a C18 a G38 genomového klonu a ze restrikční digestivní analýzy tří genomových klonů. cDNA C7, nezobrazená, byla identická s cl8 s tou výjimkou, že C7 obsahuje intron II a jeví se částečně zpracovanou zprávou. C18 postrádá 753 bp na 5-konci. Dohromady určují otevřený čtecí rámeček o 3432 párech baží kódující 1144 aminokyselinových polypeptidů. C16 kóduje 652 aminokyselinových proteinů díky tomu, že je do něj započten 70 bp alternativní exon, který mění čtecí rámeček. Všechny tři cDNA klony byly identické ve svých 3-koncích, ale pouze C7 a C16 byly identické v 5-koncích. Obr.4B: genomové kmeny byly tráveny Eco RI(E), Bam Hl(B) a Xho I(X). X indikuje, že tyto Xho I místa byla poskytnuta polylinkerem lambda Gem 11 klonujícího vektoru.
Obr.5 je modelem pro N proteinem zprostředkovaný signál transdukce v odpovědi na TMV infekci.
DETAILNÍ POPIS VYNÁLEZU
O dominantních genech resistence na choroby u rostlin se soudí, že kódují proteiny, které rozpoznají jednotlivé patogeny nebo druhy patogenů a iniciují signální transdukční kaskádu, která vede k expresi resistence na chorobu. TMV vstupuje do rostliny prostřednictvím mechanického poškození rostlině tkáně. Po vstupu do buňky není jeho distribuce a lokalizace uvnitř buňky pochopena. V rostlinách tabáku obsahujících N je předpokládáno, že N protein interaguje přímo nebo nepřímo s některou komponentou TMV. Tato komponenta TMV nebyla doposud definována, ale soudí se, že zahrnuje replikasu (Padgett and Beachy, Plant Cell 5:577-586 (1993)). Při rozpoznání TMV iniciuje N odpověď resistence, která vede k formování lokální lése a indukci vzdálené systémové získané resistence.
předkládaném objevu soudíme, že je první zprávou o klonování, sekvencování a zprostředkování transgenní resistence na virus tabákové mozaiky pro N gen Nicotiana.
Jak je zde definováno označuje protein N genu protein mající schopnost zprostředkovat resistenci na TMV u rostlin syntetizujících protein N genu. N gen obsahuje genomovou sekvenci, která kóduje protein N genu a která přímo reguluje transkripční a translační expresi N kódující sekvence.
Příklady doložené produkty N genu mají předpokládanou molekulární hmotnost okolo 131 kDa a předpokládaná aminokyselinová sekvence je dána SEQ ID NO:4 a Tabulkou 7A. Příklady doložená genomová DNA sekvence, která obsahuje kódující sekvenci pro tento produkt N genu je poskytnuta SEQ ID NO:1. Kompletní cDNA sekvence (z klonu C18) a zeslabená cDNA sekvence (z klonu C16) jsou dány SEQ ID NO:3 a SEQ ID NO:5 v příslušném pořadí.
Degenerace genetického kódu je v oboru dobře známa; proto synonymní kódující sekvence s jednou nebo více substitucemi kodonů bude snadno odborníkem určena. Synonymní kódující sekvence se liší od příklady doložených sekvencí, ale kódují proteiny stejné aminokyselinové sekvence jako ty, které jsou zde specificky poskytnuty.
Specifické provedení nukleotidových sekvencí, které kódují protein N genu, jehož funkcí je zprostředkování resistence na TMV, jsou dána SEQ ID NO:1, 3, a 5.
cDNA sekvence obsahující kompletní N gen je dána SEQ ID No.3. cDNA sekvence je dlouhá 3760 bp. Výsledný otevřený čtecí rámeček (kódující část), začínající básí 60 a končící básí 3494 kóduje protein dlouhý 1144 aminokyselin. Kódovaný protein je popsán v Tabulce 7A a v Příkladu 5.
cDNA sekvence kódující zeslabený protein N genu vztažený k proteinu Tabulky 7A je dána SEQ ID NO:5. Tato cDNA je 3830 bp dlouhá a kóduje protein o 652 aminokyselinách (viz.SEQ ID NO:6).
Genomová DNA sekvence obsahující kompletní N gen ja dána SEQ ID N0:l. Genomová DNA je 7400 bp dlouhá, nukleotidová sekvenční analýza ukazuje pět exonů, které dohromady korespondují s kódující sekvencí v SEQ ID N0:3. Sekvence kódovaného N proteinu je dána SEQ ID NO:2 a SEQ ID N0:4.
Analýza sekvence N proteinu a srovnání s jinými sekvencemi proteinů ukazuje signifikantní sekvenční similaritu k jistým proteinům, které se účastní signální transdukce (viz.také Tabulku 7A a Příklad 5). Protein N genu obsahuje tři funkční domény: signální doménu, ATP/GTP vazebné místo (P-smyčka), a region bohatý na leucin. Takové domény jsou přítomné v proteinech s úlohou v signální transdukci.
Region bohatý na leucin (LRR) je u N složen ze 13 opakujících se sekvencí a nej častěji obsaženou opakující se sekvencí je sekvence LXXLXXLXL (nebo podobná sekvence). Kromě leucinových residuí je dominantním rysem LRR přítomnost prolinu. Námi definované LRR jsou průměrně 25 aminokyselin dlouhé. Prolin byl arbitrážně projektován tak, aby byl první aminokyselinou v každé opakující se sekvenci. Tabulka 7G ukazuje primární strukturu N genu na leucin bohatých opakujících se sekvencí (aminokyseliny (aa) 590-928) a srovnání jeho konsensuální sekvence s LRR konsensem kvasinkové adenylát cyklásy, Drosophila Toll, lidského řetězce Iba glykoproteinu membrány destiček, Htrk, Drosophila Chaoptin, Arabidopsis receptor-like transmembránové kinasy (TMK1) a TMKL1.
O LRR se soudí, že zprostředkují protein-protein interakce ve velkém rozsahu proteinů. Význam LRR ve funkci některých proteinů byl určen mutagenesí nebo izolací mutací podle mutantního fenotypu. U kvasinkové adenylát cyklasy zruší mutace jako je delece dvou aminokyselin v 1 z 26 LRR schopnost být aktivován Ras (Suzuki et al., (1990) Proceedings of the
National Academy of Science USA 87:8711-8715) . Aminokyselinová substituce A156-V v jednom z 6 LRR alfa podjednotky lidského destičkového glykoproteinu lb vede ke krvácivým poruchám (Ware et al., (1993) J.Clin. Invest. 92:1213-1220).
LRR se soudí, že je velmi důležitý v řízení specifických protein- protein interakcí. Bez záměru vazby na jakoukoliv jednotlivou teorii, LRR může interagovat s komponentou TMV. Protože malé změny ve struktuře LRR vedou k drastickým změnám ve funkci proteinu, je možné, že LRR zprotředkuje specifické interakce mezi TMV a N proteinem. Navíc, malé změny v aminokyselinových sekvencích mohou také vést k novým specificitám, které by, z pohledu vývoje, mohly být velmi prospěšné pro rostliny ve vývoji nové resistence k věčně se měnící patogení populaci. Jiná možná role pro LRR je interakce se specifickou efektorovou molekulou jako je kinasa nebo fosfatasa na TMV rozpoznání.
Předpokládaná aminokyselinová sekvence N obsahuje motiv
P-smyček (Tabulka 7A). Sekvence GMGGVGKT (aa 216 až 223 SEQ ID
NO:4) odpovídá konsensuální sekvenci P-smyčky (A/G)XXXXGK(S/T) nalezeně v různých ATP- nebo GTP-vazebných proteinech (Tabulka 7A). Rodina proteinů obsahujících P-smyčku zahrnuje adenylát kinásy, ras rodinu proteinů, elongační faktory, b-podjednotku ATP syntásy, thymidin kinásy a fosfoglycerát kinásy (Saraste, (1990) Trends in Biochemical Sciences 15:430-434). P-smyčka není pravděpodobně zahrnuta v GTP vazbě, protože konsensuální sekvence, DXXG a NXKD, nutné pro GTP vazbu navíc k P-smyčce, nejsou přítomny (Dever et al., (1987) Proceedings of the National Academy of Science USA 84: 1814-1818).
Navíc k P-smyčce se jeví být dva jiné segmenty zahrnuty v ATP vazbě v adenylát kinase a Fl-ATPase (Fry et al., (1986)
Proceedings of the National Academy of Science USA
83:907-911). Inspekce N sekvence napovídá, že tyto segmenty jsou přítomny a ve vlastním rozmístění (podtržená aminokyselinová residua v Tabulce 7A). Segment 2 obsahuje dipeptid (I,A,L,V)(V,I) a N má sekvenci AI v posici 228 a 229 v příslušném pořadí. V 80-100 aminokyselinách z P smyčky byl segment 3 definován jako Glycin (G) následovaný řetězcem 5 hydrofobních aminokyselin a aspartatu (D) . N protein má sekvenci VLIVLDD v aminokyselinách 296-302. Z aminokyselinové sekvence nelze předpovědět, za jakých podmínek je ATP navázána nebo hydrolyzována.
Aminoterminální aminokyseliny (8 až 150) N proteinu jsou podobné jako u cytoplasmatických (signální) domén Drosophila Toll proteinu a lidského receptorů pro interleukin 1 (IL-1R). Seřazení je ukázáno na Tabulce 7B. Orámečkované aminokyseliny indikují regiony, kde byla identifikována sekvence nebo kde byla pozorována substituce. N sekvence obsahuje některé z konzervovaných aminokyselin, které jsou požadovány pro transmisi z cytopiasrny do nukleolu u Toll a ILl-r regulační dráhy (Schneider et al., (1991) Genes and Devolopment
5:797-807, Heguy et al. (1992) J.of Biological Chemistry
267:2605-2609) .
Podobnosti sekvencí mezi aminokoncovým regionem N proteinu a cytoplasmatickou doménou Drosophila Toll a lidského IL-lR vedou ke spekulacím, že při TMV infekci může být N spouštěčem podobného typu intracelulární signální transdukční kaskády (Obr.5). Interakce velkého množství agens jako virů, cytokinů (IL-1, TNF) a mitogenů (phorbol 12-myristate 13-acetate, PMA), lektinů, a kalcium ianoforů s receptorem prointerleukin 1 (IL-lR) nebo percepce neznámého signálu extracelulární doménou Toll vede k aktivaci a translokaci Rel se týkajících transkripčních faktorů NfkB a dorsal respektivně z cytoplasmy do nukleolu. U savčí imunitní, zánětlivé a akutní fáze odpovědi aktivní transkripční komplex faktorů NF-kb indukuje nebo reprivuje syntesu množství obraných nebo signálních proteinů po vazbě na motiv dekamerické sekvence nazývané kb-vážící motiv (popsáno v Baeuerle, (1991) Biochimica et Biophysica Acta 1072:63-80). Tyto indukované proteiny iniciují všeobecné buněčné obrané mechanismy signalizací přítomnosti patogenů jiným buňkám (Baeuerle and Baltimore, (1988) Science 242:540-546 a Baeuerle , (1991) supra). Oproti tomu u embryí Drosophily reguluje vyšší koncentrace dorsálního proteinu v nukleolu transkripci zygotních genů požadovaných pro určení dorsoventrální polarity embrya (popsáno Johnston and Nusslein-Volhard, Cell 68:201-219 (1992)). Bodové mutace v signální (cytoplasmatické) doméně přirozených recesivních alel Toll (Schneider et al., (1991), supra) a místně řízené bodové mutace v signální doméně IL-lR (Heguy (1992) supra) vedou k selhání translokace jak dorsálního, tak NF-kb do nukleolu.
Nově byly popsány jiné rel-obsahující geny nazvané Dif (dorsal related imunity) zahrnuté v imunitní odpovědi Drosophily (Ip et al., Cell 75:753-763 (199)). Podobně jako
NFkb a dorsal je normálně Dif protein přítomen v cytoplasmě larválního tělesného tuku, při poškození nebo infekci se translokuje do nukleolu a specificky váže na kb-like motivy v promotorovém regionu různých antimikrobiálních genů (Sun et al., European Journal of Biochemistry, 196:247-254 (1991), Engstrom et al., Journal of Molecular Biology 232:327-333 (1993), a Kappler et al., EMBO J 12:1561-1568 (1993)).
Analogně k výše zmíněným imunitním a vývojovým odpovědím, a bez záměru vázat se na jednotlivou teorii, se produkt TMV (elicitor) váže na LRR nebo jiný region N proteinu (receptor) v cytoplasmě nebo na jiný neznámý protein ultimativně aktivující rel/kb podobný komplex transkripčních faktorů, který je vyžadován pro indukci patogenu se týkajících (PR) genů.
Jednou z primárních výhod vynálezu je to, že může poskytnout metodu pro indukci resistence na TMV u tabáku a příbuzných rostlin jako je rajče a pepř. To je výhodné proto, že N zprostředkovaná resistence na TMV je vysoce efektivní a nebyla dosud narušena běžnými kmeny TMV.
Klonovaný gen přirozané resistence N nabízí výhodu díky nově dostupným technikám pro ochranu rostlin proti TMV. Dva obecně užívané geny pro získání resistence vůči TMV jsou odvozeny od TMV plášťového proteinu (CP) nebo od polymerásového genu. Nevýhodami nové techniky ochrany před TMV jsou ty, že CP-zprostředkovaná resistence se může přerušit za určitou dobu nebo vysokou hladinou inokulace viru, a polymerasou zprostředkovaná resistence je velmi specifická pro virový kmen, ze kterého je polymerasový gen odvozen. Jiný velký nedostatek resistence odvozené od virového genu je riziko nebo možnost evoluce hyperkmenů virů díky rekombinaci mezi přirozenými kmeny a transgeny.Zavedení klonovaných rostlin s geny virové resistence do komerčních kultivarů transformací se vyhýbá výše zmíněným nedostatkům. N gen tabáku uděluje resistenci na všechny známé kmeny TMV s výjimkou j ednoho.
Klonovaný přirozený gen rezistence rostlin na viry také umožňuje fundamentální studie mechanismu resistence gen-patogen rozpoznání a signalizování indukce obrané odpovědi tak jako i identifikaci funkčních domén genu a usnadňuje tak tvorbu resistentních genů se širším spektrem resistence. Toto je první popsání genu rostlině resistence, jehož proteinová sekvence předpokládá putativní ATP/GTP motiv vazebného místa (P-smyčka), a na leucin bohatý region a signální doménu.
Klonování N genu bylo provedeno tranposon tagging s kukuřičnou transposon Ac v N.tabacum. Pozitivní selekce byla vyvinuta proto, aby se vyvinuly izoláty Ac indukovaných mutantů neschopných odpovědi na TMV s HR (HR-mutanty). Jeden z 36 Hr- mutantů nesoucích Ac měl nestabilní mutaci, která korelovala s přítomností jednoho Ac transposonu, označeného AclO. Genomické DNA sekvence doprovázející AclO byly užity k vyšetřování cDNA a genomových knihoven pro klony obsahující kompletní cDNA a genomové DNA N genu. Genomové kmeny obsahující N gen byly izolovány z N.glutinosa genomové knihovny pro použití k transformoání rostlin k vytvoření resistence na TMV. N gen byl klonován do vektoru a použit pro transformování na TMV citlivých rostlin.Transformované rostliny vykazovaly resistenci na TMV.
Jak je zde použito může být molekulou nukleové kyseliny DNA molekula, RNA molekula nebo DNA-RNA hybridní molekula. Přirozeně se nevyskytující molekula nukleové kyseliny je taková, která se nevyskytuje v přírodě. Přirozeně se nevyskytující molekuly nukleových kyselin zahrnují například DNA sekvence, v izolované a purifikované formě, rekombinatní molekuly nukleových kyselin mající heterologní region,což je identifikovatelný segment DNA, který není kovalentně navázán na N gen kódující sekvenci v přírodě, nebo mohou být takové přirozeně se nevyskytující molekuly konstruovány z částí, které byly chemicky syntetizovány; konstrukt, kde se kódující sekvence sama o sobě nevyskytuje v přírodě, například cDNA , kde genomová kódující sekvence obsahuje introny; nebo syntetické sekvence mající kodony, které se liší od kodonů nativního genu. Části z heterologních zdrojů mohou být spojeny prostředky v oboru známými, t.j. ligací in vitro. Alternativně mohou být části spojeny in vivo procesy jako je rekombinace, ale taková rekombinace bude řízena rukou člověka a požadované výsledky budou člověkem identifikovány.
Exemplárními DNA molekulami jsou Nicotiana glutinosa N genové cDNA identifikované nukleotidovou sekvencí danou SEQ ID NO:3 a nukleotidoou sekvencí SEQ ID NO:5. Genomová nukleotidová sekvence obsahující kompletní N.glutinosa N gen je daná SEQ ID No:l.
Vynález zahrnuje také molekuly nukleových kyselin obsahující N gen, které mají nukleotidovou sekvenci s alespoň 70% homologií nukleotidů se SEQ ID NO:1 od asi nukleotidu 1 do přibližně nukleotidu 7400 a kde N genový protein kódovaný molekulou má za funkci zprostředkování resistence na TMV u rostlin syntetizyjících protein N genu. Předkládaný vynález také zahrnuje molekuly nukleových kyselin obsahující protein N genu kódující sekvence , kde kódující sekvence má alespoň 70% homologií se SEQ ID NO:3 od nukleotidu 60 do nukleotidu 3494, kde kódovaný N protein má za funkci zprostředkování resistence na TMV u rostlin syntetizujících tento protein. Homologní sekvence zahrnuté ve vynálezu mohou být identifikovány Southern hybridizačním experimentem za použití podmínek, kde je hybridizace zprostředkována alespoň 70% homologií, v protikladu k nespecifické vazbě (viz. příklad 2 pro diskusy o přísných a nepřísných podmínkách). Homologie, jak je definována, znamená, že nukleotidy pasují po definované délce selektovaného regionu. Hybridizační podmínky jsou popsány v Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory (1989) a Ausubel et al., Current protocols in Molecular Biology, Current protocols (1989), které jsou zde uvedeny jako reference.
K identifikaci N genu z jiných Solanaceous species je genomová DNA z rostlin rodiny Solanaceae izolována tak, jak je popsáno. Izolovaná DNA je rozrušena jedním nebo více restrikčními enzymy klonovanými do lambda nebo jiných vhodných vektorů, elektroforesována, a blotován do nylonové membrány jako je Nytran. Bloty jsou probovány probami, které jsou zde popsány. Genomová knihovna vytvořená z těchto cDNA je vyšetřována užitím výše pojmenovaných prob k identifikaci N genu. Je hodnocena aktivita genu, určená exprivováním genu v rotlině druhu solanaceum a hodnocením resistence transformovaných rostlin na TMV, jak je detailně popsáno níže.
Oligonukleotidy derivované ze sekvence N genu mohou také být použity jako primery v polymerasové řetězové reakci (PCR). Tabák obsahuje jeden genomový region kódující N proteiny. Konservované regiony v N genu jsou užitečné v projektování primerů pro zprostředkování a znovuzískání funkčních N homologních genů v rostlinách solanaceum. Dále, protilátky namířené proti doménám N proteinu mohou být užity k vyšetřování expresních knihoven u jiných rostlin solanaceum.
DNA kódující sekvence proteinu N genu může být také připravena synteticky z degenerovaných oligonukleotidů, jejichž sekvence obsahuje kodony pro aminokyselinovou sekvenci proteinu N genu. Takové oligonukleotidy jsou připraveny standartními metodami a jsou shromážděny a použity k izolování požadovaného N genu.
Dostupnost molekul nukleových kyselin kódujících protein N genu tabáku dovolila získání N genové sekvence kódující protein N genu nebo funkčního homologu z jiných rostlin solanaceae.Tabáková genomová nebo cDNA sekvence nebo její části jsou použity jako oligonukleotidové proby k hybridizaci dalších genomových nebo cDNA sekvencí hybridizaci za standartních podmínek. Sekvence, které hybridizují specificky N genovou kódující sekvenci nebo její komplement jak je popsáno výše a které kódují protein N funkčního homologního genu, který zprostředkuje resistenci na TMV u rostlin rodiny Solanaceae jsou zahrnuty v tomto vynálezu. Takové proby zahrnují ty, které obsahují kompletní N gen a které obsahují jednu nebo více následujících domén: 5 a 3' netranslatované regiony, signální doménu (aa 8 až 150), opakující se region bohatý na leucin (aa 591-929) . Takové oligonukleotidy jsou připraveny standartními metodami a shromážděny procedurami známými v oboru. Délka využité proby musí být suficientní pro hybridizaci homologních regionů DNA, kde je hybridizace příslušící alespoň 70% homologii, v protikladu k nespecifické vazbě. Příklady DNA sekvence využitelné jako oligonukleotidové proby jsou dány v Příkladu 5, níže.
Specificky příklady doložený protein N genu Nicotiana glutinosa je charakterizován z hlediska jeho aminokyselinové sekvence v SEQ ID NO:4, a korespondující specificky příklady doložená kódující sekvence je poskytnuta SEQ ID NO:3, od nukleotidu 60 do nukleotidu 3494.
V biologických oborech je dobře známé, že určitá aminokyselinová substituce může existovat v proteinové sekvenci bez narušení funkce proteinu. Všeobecně, konservativní aminokyselinové substituce nebo substituce podobných aminokyselin jsou tolerovány bez narušení funkce proteinu. Podobnými aminokyselinami mohou být ty, které se podobají ve velikosti anebo náboji, například aspartát a glutamát a isoleucin a valin jsou oba páry podobných aminokyselin. Podobnosti mezi páry aminokyselin mohou být hodnoceny v oboru množstvím způsobů. Například Dayhoff et al., (1978) v Atlas of Protein Sequence and Structure, Vol.
5, Supplement 3, Kapitola 22, str 345-352, což je zde uvedeno jako odkaz, poskytuje tabulku frekvence aminokyselinových substitucí, které mohou být využité jako měřítko podobnosti aminokyselin. Dayhoffova tabulka frekvencí je založena na srovnání aminokyselinových sekvencí pro proteiny se stejnou funkcí z množství evolučně odlišných zdrojů.
Aminokyselinová sekvence proteinů může nebo nemusí být identická s aminokyselinovou sekvencí, která se vyskytuje přirozeně v rostlinách solanaceae. Identita proteinů N genu může být potvrzena jeho schopností zprostředkovat resistenci na TMV v rostlinách nebo rostliných buňkách syntetizujících protein N genu. Takový pokus je popsán v Příkladu 1, níže. Stručně, sekvence kódující protein N genu je transformována do rostliny nebo rostlinné buňky mající schopnost syntetizovat protein N genu ze zmíněné sekvence, t.j. do rostliny z rodiny Solanaceae. Transformovaná rostlina nebo rostlinná buňka je infikována TMV. U rostliny je pozorována hypersensitivní odpověď. Jestliže je pozorována resistence, má protein schopnost zprostředkovat resistenci na TMV. Navíc mohou být zahrnuty arteficiální mutace, pokud nepoškozují aktivitu. Mutovaný N protein označuje protein, který má tuto aktivitu, ale který je derivován mutací DNA kódující N protein. Termínem derivován mutací je míněna jak přímá fyzikální derivace od DNA kódující počáteční materiál proteinu N genu, za použití, například, místně specifické mutagenese nebo nepřímá derivace prostřednictvím syntesy DNA mající sekvenci příbuznou, ale záměrně odlišnou, od sekvence N genu. Prostředky pro konstrukci oligonukleotidů požadované délky jsou dosažitelné, takové DNA mohou být konstruovány cele nebo částečně z jejich jednotlivých základních nukleotidů.
Jak bylo zmíněno výše, dostupnost sekvencí kódujících protein N genu tabáku zpřístupnila funkční homology N genu z jiných rostlin solanaceae, což jest gen, který má část kódující N-like protein, a je definován jako polypeptid, který má funkci zprostředkovat resistenci na virové patogeny rostlin, jako je TMV. Tyto N-like geny mohou být identifikovány a izolovány díky jejich podobnosti DNA sekvence (homologii) s N kódující sekvencí tabáku, která je zde poskytnutá. cDNA a/nebo genomové knihovny mohou být vyšetřovány hybridizací pro signifikantně homologní sekvence. Tyto sekvence mohou pak být sekvenovány pro potvrzení přítomnosti kompletních otevřených čtecích forem, klonovány do vektorů tak, aby byly exprivovatelné v rostlinách a tkáně rostlin mohly být transformovány. Transgení rostliny mohou být připraveny užitím v oboru známých technik, a tyto transgení rostliny mohou být testovány pro potvrzení toho, že byla získána resistence na patogen díky zavedení kódující sekvence pro N-like protein. N-like geny zahrnují L gen z pepře, Tm2 a Tm2a z rajčete, a N z Nicotiana sylvestris.
Jiným aspektem vynálezu jsou genetickým inženýrstvím zpracované rekombinatní molekuly nukleových kyselin, preferovaně DNA, obsahující část kódující protein N genu nebo funkční homolog N genu, který má za funkci zprostředkování resistence na TMV v rostlinách syntetizujících N gen nebo funkční homolog, respektive. Rekombinantní DNA molekuly označují hybridní DNA sekvence obsahující alespoň dvě DNA sekvence, kde první sekvence není normálně nacházena v přírodě spolu s druhou. Takové molekuly mohou být získány manipulací s genetickým materiálem užitím restrikcních enzymů, ligás, a podobných rekombinantních technik, které popsal například Sambrook et al., supra., Ausubel et al., supra, a DNA Cloning: A Practical Approach, Volumes I and II (ed.D.N.Glover) IRL Press, Oxford, 1985. Příklady zahrnují rekombinantí vektory, jako jsou klonující nebo expresní vektory, které obsahují DNA sekvenci kódující protein N genu, který je v 5-3(sense) orientaci nebo ve 3-5x (antisense) orientaci. Příklad 7, níže, popisuje přípravu N gen rekombinantní DNA molekuly. Rekombinantní jak je použito v předkládané aplikaci, neoznačuje přirozeně se vyskytující genetické rekombinace.
Prostředky genetického inženýrství znamená, že výsledek je řízen rukou člověka. Rostlina zpracovaná prostředky genetického inženýrství tak, aby obsahovala jednotlivé DNA molekuly, je ta, do které byla zavedena DNA jakýmikoliv prostředky v oboru známými, včetně, ale ne pouze Agrobacterium - zprostředkované transformace, elektroporace, ostřelování částicemi a pod. Genetickým inženýrstvím zpracovaná DNA molekula je taková, která je produktem molekulárně biologických procesů včetně, ale ne pouze DNA ligace, in vitro mutagenese nebo podobně.
DNA sekvence předkládaného vynálezu jsou užitečné k přípravě rekombinantních DNA expresních molekul klonováním sekvence do jakéhokoliv vhodného expresního vektoru, který je schopný zavést cizorodý gen do heterologního hostitele jeko je bakterie, kvasinka, virus nebo jeho hostitelský organismus, nebo do rostlin. Rekombinantní vektor je konstruován tak, že kódující sekvence je umístěna ve vektoru se vhodnou kontrolní sekvencí a operativně s ní zde asociována, což znamená, že umístění a orientace N gen DNA kódující sekvence s ohledem na kontrolní sekvence je takové, že je kódující sekvence transkribována pod kontrolou kódující sekvence (t.j. RNA polymerasou, která se připevní na DNA molekulu v kontrolních sekvencích). Kontrolní sekvence mohou být ligovány do kódující sekvence před insercí do vektoru. Alternativně může být kódující sekvence klonována přímo do expresního vektoru, který už obsahuje kontrolní sekvenci a vhodné restrikční místo downstream od kontrolní sekvence. Vektor může být vybrán tak, aby měl promotor operabilní v hostitelské buňce, do která má být vektor insertován (to znamená, že promotor by měl být rozpoznán DNA polymerasou hostitelské buňky). Navíc by měl mít vektor region, který kóduje vazebné místo pro ribosom umístěné mezi promotorem a místem, ve kterém je DNA sekvence insertována tak, aby byl operativně asociován s N gen kódující sekvencí jednou připojenou. Vektor by měl být vybrán tak, aby poskytoval region, který kóduje vazebné místo pro ribozom rozpoznávané ribozomy hostitelské buňky, do které má být vektor insertován.
Rekombinantní DNA expresní molekula obsahující sekvenci, která kóduje protein N genu v 5'-3'orientaci je insertována do hostitelské buňky pro expresi proteinu N genu. Množství expresních systémů a hostitelů je známé v oboru produkce proteinů. Příkladem prokaryontního hostitele je E.coli. Velké množství rekombinantních systémů bylo vyvinuto pro expresy v eukaryontních hostitelích, včetně kvasinek, hmyzích buněk, savčích buněk, a rostliných buněk. Tyto systémy jsou dobře charakterizovány a vyžadují ligaci kódující sekvence pod kontrolou vhodného transkripčního iniciačního systému (promotoru) a , je-li to žádoucí terminační sekvence a enhancery. Pro produkci proteinu N genu jsou hostitelské buňky transformováné rekombinantní DNA expresní molekulou kultivovány a protein je izolován z hostitelské buňky.
Selekce vhodných kultivačních podmínek a metod získání je v rozsahu znalostí v oboru.
Dále je doložena příkladem exprese proteinu N genu v Escherichia coli. N gen DNA kódující sekvence je insertována do expresního vektoru jako je pRSET (Invitrogen Corp., CA) nebo pET (Novagen, WI). N gen protein kódující sekvence je pak exprivována pod kontrolou transkripčních a translačních signálů silného bakteriofágu T7.
Zejmena užitečné ve spojení s N geny předkládaného vynálezu jsou expresní systémy, které jsou operabilní v rostlinách. Kódující sekvence pro protein N genu a DNA , která representuje reversní transkript mRNA, který je následně translatován do proteinu N genu, může být zahrnut v expresním systému vhodném pro rostliny. Pro expresi v rostlinách bude rekombinantní expresní kazeta obsahovat navíc k N gen kódující sekvenci rostliný promotor region (jestliže ho sekvence postrádá), transkripční iniciační místo ( jestliže ho kódující sekvence, která má být transkribována postrádá), a transkripční terminační sekvenci. Terminační region může být získán ze stejného genu jako promotorové sekvence nebo může být získán z jiných genů. Jedinečná místa pro restrikční enzym v 5' a 3' koncích kazety jsou typicky zahrnuta, aby umožnila snadnou inserci do pre-existujícího vektoru. Rostlině expresní systémy mohou být systémy, které jsou pod kontrolou tkáňově specifického promotoru, stejně jako ty, které vyžadují promotory, které jsou operabilní ve všech rostliných tkáních.
Transkripční iniciační regiony, například, zahrnují různé opine iniciační regiony, jako je octopin, mannopin, nopalin a pod. Rostlině virové promotory mohou být také použity, jako je 35S promotor viru květákové mozaiky (CaMV). Navíc, rostlině promotory jako je ribulosa-1,3-difosfát karboxylasa, ovoce-specifické promotory, promotory tepelného šoku, semeno specifické promotory atd. mohou být také použity. Jednotlivé vybrané promotory by měly být schopné způsobit dostatečnou expresi, která by vedla k produkci efektivního množství proteinu N genu k navození resistence na infekci TMV u rostliných buněk a rostlin. CaMV 35S promotor vykazuje vysokou aktivitu v mnoha rostliných orgánech a během mnoha stupňů vývoje, je-li integrován do genomu transgeních rostlin. Tkáňově specifické promotory jsou také dobře známé.
Preferovaně jsou v molekulách řídících expresi TMV resistence cestou N genu transkripční terminační signály poskytnuty downstream a operativně navázané na kódující region proteinu N genu. Terminační signály mohou být ty, které jsou normálně přítomny v N genu, nebo může být jeden nebo více k heterologních transkripčních terminačních signálů poskytnut downstream od N kódujícího regionu. Množství transkripčních terminačních signálů je v oboru dobře známé, například ty z Agrobacterium tumefaciens T-DNA genů včetně, ale ne pouze nos.
Výsledný expresní systém nebo kazeta je ligován do nebo konstruována jiným způsobem tak, aby byl obsažen v rekombinantím vektoru, který je vhodný pro transformaci rostlin. Vektor bude také typicky obsahovat selektovatelný markerový gen, podle kterého mohou být transformované rostlině buňky identifikovány v kultuře. Obvykle bude markerový gen kodovat antibiotickou resistenci. Tyto markéry zahrnují resistenci na G418, hygromycin, bleomycin, kanamycin a gentamycin. Po transformování rostliných buněk budou buňky mající vektor identifikovány podle jejich schopnosti růst v mediu obsahujícím jednotlivá antibiotika. Replikační sekvence, bakteriálního nebo virového původu, jsou obyčejně také obsaženy, aby dovolily vektoru být klonován do bakteriálního nebo fágového hostitele, preferovaně je obsaženo široké hostitelské spektrum prokaryotního zdroje replikace. Selektovatelný markér pro bakterie by měl být také obsažen, aby dovolil selekci bakteriálních buněk nesoucích požadovaný konstrukt. Vhodné prokaryontní selektovatelné markéry také zahrnují resistenci na antibiotika jako je kanamycin nebo tetracyklin.
TMV resistence zprostředkovaná N proteinem byla demonstrována u transgeních rostlin, do kterých byl zaveden genomový N klon, kde tyto rostliny byly sensitivní na TMV před genetickou modifikací. Klonování cDNA kódující N protein může být také použito k udělení TMV resistence sensitivním rostlinám solanaceae. cDNA je klonovaná downstream a operativně navázaná na promotor funkční v rostliných buňkách a zavedena do rostliné tkáně a transgení rostliny jsou regenerovány užitím vektorů a technik snadno odborníkům dosažitelných. Virová resistence je potvrzena testem inokulace závažným virem, t.j. TMV. Je-li použita cDNA může být užitečné zavést jak kompletní (SEQ ID N0:3), tak zkrácené (SEQ ID NO:5) cDNA do rostliné tkáně po operativním navázání každé sekvence na transkripční kontrolní sekvence funkční v rostliných buňkách. Znovu je TMV resistence potvrzena testem inokulace TMV.
Jiné DNA sekvence kódující další funkce mohou být také přítomné ve vektoru, jak je v oboru známé. Například, v případě transformace Agrobacterium, budou T-DNA sekvence také zahrnuty pro následný transfer do rostliných chromosomů.
Je-li získán vhodný vektor, jsou připraveny transgení rostliny, které obsahují žádoucí expresní systém. Kódující sekvence proteinu N genu jsou insertovány do vhodného rostliného transformačního vektoru pro transformaci v požadovaném rostliném druhu, zejměna, rostlin rodiny Solanaceae, k navození resistence rostlin na TMV. Kromě tabáku (Nicotiana, t.j. N.tabacum a N.glutinosa) jsou v rodině Solanaceae významné potravinové plodiny. Tyto zahrnují rajče (Lysopersion, t.j. L.lysopersicum a L.esculentum), pepř (Capsicum), brambor (Solanum tuberosum, lilek (Solanum melongena).
V oboru je známo množství technik pro transformaci rostlin a rostliných buněk. Pro transformaci zprostředkovanou bakteriální infekcí jsou rostliné buňky infikovány
Agrobacterium tumefaciens nebo A.rhizogenes, které jsou dříve transformované DNA, která má být zavedena. Agrobacterium je representativní rod gram negativní rodiny Rhizobiaceae. Heterologní genetické sekvence mohou být zavedeny do vhodných rostliných buněk prostřednictvím Ti plasmidu A.tumefaciens nebo Ri plasmidu A.rhizogenes. Ti nebo Ri plasmid je přenesen do rostliných buněk infekcí Agrobacterium a je stabilně integrován do rostliného genomu (J.Schell, Science 237:1176-1183 (1987)). Ti a Ri plasmidy obsahují dva regiony, které jsou základní pro produkci transformovaných buněk.
Konstrukce rekombinantních Ti a Ri plasmidů obecně následuje metodu typicky používanou pro nejběžnější bakteriální vektory jako je pUC 19. Existují dvě třídy rekombinantních Ti a Ri plasmidových vektorových systémů, které se nyní používají. V jedné třídě, nazývané kointegrátní,je transportní vektor obsahující požadovaný gen insertován genetickou rekombinací do non-onkogeního Ti plasmidu, který obsahuje jak cis-účinkující , tak trans-účinkujíí elementy požadované pro transformaci rostlin, tak jako to je u pMLJl transportního vektoru DeBlocka et al., EMBO J 3:1681-1689 (1984) a neonkogeního Ti plasmidu pGV3850 popsaného Zambryski et al., EMBO J 2:2143-2150 (1983). Ve druhé třídě nebo binárním systému je požadovaný gen insertován do transportního vektoru obsahujícího cis-účinkující elementy požadované pro transformaci rostlin. Další nezbytné funkce jsou poskytnuty v trans neonkogením Ti plasmidem, jak je doloženo příkladem pBIN19 transportního vektoru, popsaného Bevanem, Nucleic Acid Research 12:8711-8721 (1984) a neonkogeního Ti plasmidu PAL4404 popsaného Hoekema et al., Nátuře 303:179-180 (1983)) . Některé z těchto vektorů jsou komerčně dostupné.
Existují dvě všeobecné cesty pro transformaci rostliných buněk AgrobacterieriT: kokultivace Agrobacteřium s kultivovanými izolovanými protojblasty a transformace in£áktních buněk nebo
2)5 tkání Agrobacterium. První vyžaduje ustanovený kultivační systém, který dovoluje kultivaci protoplastů a následnou regeneraci rostliny z kultivovaných protoplastů. Druhá metoda vyžaduje (a) aby intaktní rostlině tkáně, jako jsou kotyledony , mohly být transformovány Agrobacterium a (b) aby transformované buňky nebo tkáně mohly být indukovány k regeneraci celé rostliny. Nejběžnější druhy mohou být transformovány Agrobacterium,tak jako všechny druhy, které jsou přirozenými hostitely Agrobacterium jsou transformovatelné in vitro.
Jiný postup pro klonování a transormaci zahrnuje klonování N gen kódující sekvence do T-DNA vektoru pMDl mezi CaMV 35S promotor a NOS terminační region. Rostliny nesoucí germinální Ac excisní zásahy jsou transformovány podle Horsche et al., Science 227:1229-1231, (1985) s modifikací (Hehl, Molecular
General Genetics 217:53-59 (1989)). Tento postup je detailně popsán v Příkladu 1, níže.
Agrobacterium tumaficiens zprostředkovaná transformace je známá jako efektivní u členů rostlin rodiny Solanaceae a je zejména využitelná. Jiné transformační metody jako je elektroporace, mikroprojektilová nebo částicová technologie bombardování, liposomy, a chemikálie, které zvyšují vychytávání volné DNA mohou být také použity. Identifikace transformovaných rostlin nebo buněk je obyčejně provedena zavedením selektovatelného markéru do transformujícího vektoru, nebo získáním evidence úspěšné bakteriální infekce. Rostlině buňky, které byly transformovány, mohou také být regenerovány užitím známých technik.
Regenerace rostlin rodiny Solanaceae je detailně popsána Horschem et al., 1985, supra. Regeneraci rostlin z kultivovaných protoplastů popsal Evans et.al.,Handbook of Plant Cell Cultures, Vol.1:(MacMillan Publishing Co. New York, 1983), a Vasil I.R. (ed.), Cell Culture and Somatic Cell
Genetics of Plants, Acad.Press, Orlando, Vol. 1,1984, a Vol.II, 1986). Je známo, že prakticky všechny rostliny mohou být regenerovány z kultivovaných buněk nebo tkání.
Prostředky pro regeneraci se liší druh od druhu rostliny, ale obyčejně je nejprve poskytnuta suspense transformovaných protoplastů nebo petriho miska obsahující transformované explanty. Je formována tkáň kalu a mohou být indukovány výhonky z kalu a následně kořeny. Tato somatická embrya klíčí stejně jako přirozená embrya za formování rostlin. Kultivační medium bude obyčejně obsahovat různé aminokyseliny a rostlině hormony jako jsou auxiny a cytokiny. Dostatečná regenerace bude závislá na mediu, genotypu a na průběhu kultivace.Jestliže jsou tyto tři proměně kontrolovány ,je regenerace obvykle reproducibilní a opakovatelná. Regenerované rostliny jsou přesunuty do standartních půdních podmínek a kultivovány konvenčním způsobem.
Poté, co je expresní kazeta stabilně inkorporována do regenerované transgení rostliny, může být transferována do jiných rostlin pohlavním křížením. Může být použita jakákoliv z množství standartních množících technik, v závislosti na druhzích křížených rostlin. Rostliny jsou pak kultivovány a
Příklady provedení vynálezu
Následující příklady jsou míněny pouze jako další ilustrace vynálezu a nejsou míněny jako omezení rozsahu vynálezu jako nároky. Příklady využívají množství technik, odborníkům dobře známých a dosažitelných v oboru molekulární biologie, při manipulaci rekombinantní DNA v rostliných tkáních a při kultivaci a regeneraci transgeních rostlin. Enzymy jsou získány z komerčních zdrojů a jsou užity podle doporučení prodejce nebo jiné variace v oboru známé. Reagens, pufry a kultivační podmínky jsou také známé v oboru. Odkazy poskytující standartní molekulárně biologické postupy zahrnují Sambrook et al., (1989) Molecular Cloning, druhá edice, Cold Spring Harbor Laboratory, Plainview, NY, R. Wu (ed.) (1993) Methods in Enzymology 218, Wu et al., (eds.) Methods in Enzymology 100,101,Glover (ed.) (1985), DNA cloning, Vols. I a II, IRL Press Oxford, UK, a Hames and Higgins (eds.) (1985) Nucleic Acid Hybridization, IRL Press, Oxford, UK. Odkazy týkající se manipulace a transformace rostliných tkání zahrnují Kung and Arntzen (eds.) (1989) plant Biotechnology, Butterworths, Stoneham, MA, R. A. Dixon (ed.) (1985) Plant Cell Culture: A Practical Approach, IRL
Press, Oxford, UK, Schuler and Zielinski (1989) Methods in Plant Molecular Biology, Academie Press, San Diego, CA, Weisbach and Weisbach (eds.) (1988) Academie Press, San Diego, CA, I. Potrykus (1991) Ann. Rev. Plant Physiol.Plant Mol. biol. 42:205, Weising et al. (1988) Annu. Rev. Genet.
22:421, van Wordragen et al., (1992) Plant Mol. Biol. Rep.
19:12, Davey et al. (1989) Plant Mol. Biol. 13:273, Walden and Schel (1990) Eur. J. Biochem. 192:563, Joersbo and Brunsted (1991) Physiol. Plant. 81:256 a odkazy citované v těchto odkazech. Zkratky a nomenklatura, které byly použity jsou považovány v této oblasti za standartní a jsou všeobecně užívány v odborných časopisech jako jsou ty, které jsou zde citovány. Všechny odkazy, které jsou citovány v předkládaném vynálezu jsou zde výslovně uvedeny jako odkazy.
PŘÍKLAD 1
Tento příklad popisuje izolaci nestabilního HR-mutantu. Přesněji, byly izolovány mutace N lokusu transposon tagging za užití kukuřičného transposonu Ac. Poté byly mutanty neschopné vykázat TMV dependentní HR izolovány užitím schématu pozitivní selekce, která selektovala TMV infikované N nesoucí rostliny, které ztratily schopnost vykazovat TMV dependentní HR (HR- mutanty). Rostliny homozygotní pro jejich HR- mutace byly identifikovány a byla identifikována mutantní linie mající nestabilní HR-.
Ul kmen TMV (získán od M. Zaitlin) byl propagován do TMV citlivého (nn) tabákového kultivaru (cv) Petite Havana SRÍ, nazývaného SRÍ tabák. S výjimkou inokulace pro vyšetření mutantů (viz níže) byly inokulace TMV provedeny následovně: Inokulum bylo připraveno rozpuštěním mízy macerovaných, TMV infikovaných listů SRÍ tabáku 10 krát ve sterilní vodě. Hubka saturovaná roztokem mízy byla použita k potření horního povrchu listů na rostlinách ve stadiu šesti listů. U rostlin byly počítány po 48 hodinách lokální léze a v intervalech 1 týdne po inokulaci byly prohlíženy známky systémové infekce (mosaiky) a/nebo sektory nekrosy.
K izolaci transgeního tabáku nesoucího aktivní Ac transposony byl TMV resistentní tabák, cv. Samsun NN, transformován pGV3850 HPT::pKU3 (Baker et al., The EMBO Journal 6:1547-1554 (1987)) metodou podle Horsch et al., (Science 227:1229-1231 (1985)) použitím modifikované procedury (Hehl and Baker, Mol Gen. Genet. 217:53-59 (1989)). pGV3850 HPT::pKU3 transformační vektor nesoucí neomycin fosfotransferásu II (NPTII) přerušil Ac. Po zavedení pGV3850 HPT::pKU3 do tabáku, Ac excise z defektivního NPTII genu vedly k NPTII expresi a růstu transformantů na mediu obsahujícím kanamycin.
Stručně, listové disky byly připraveny ze sterilního 6 až 8 týdnů starého TMV resistentního tabáku , cv. Samsun NN rostlin kultivovaných na MS mediu. Listové disky byly inkubovány za přítomnosti Agrobacterium tumefacies obsahujícího pGV3850 HPT::pKU3 nebo kontrolního Ti plasmidového vektoru po 2 až 4 dny.Listové disky byly propláchnuty v MS mediu obsahuj i ím 3% sukrosu a 500 mg/1 Cefotaximu (CalbioChem, La Jolla, CA) a umístěny v MS mediu obsahujícím 3% sukrosu, 0.5 mg/1 BAP (6 benzylaminopurin) ,
0.1 mg/1 NAA (naftalen octová kyselina), 500mg/l Cefotaximu a 200 mg/1 kanamycinu nebo 20 mg/1 hygromycinu. Po 2 až 3 týdnech byly shoots následně znovu transferovány do stejného media obsahujícího 2 mg/1 BAP. Po 1 až 2 týdnech byly shoots znovu transferovány do stejného media, ale bez hormonů pro indukci výhonků. Rostliny byly přesunuty do půdy po 10-15 dnech. Transgení kaly byly regenerovány na 100 mg/1 kanamycinu pro selekci transgeních tkání nesoucích transposing Ac elementy (Baker et al., 1987, supra). Genomová DNA byla izolována z KnR primárně transgeních, nazývaných TO generace.
Ac byl stanoven jako velmi aktivní v rostlinách TO-3 (pGV3850 HPT: :pKU3 ) , vzhledem k resistenci na 100 mg/1 kanamycinu a nárůstu množství Ac kopií, jak bylo určeno Southern hybridizací. Rostliny TO-3 byly kříženy se Samsun NN. Tři TI potomstva vzešlá z křížení, Ti-9, 10, 13 o kterých bylo stanoveno, že mají transposing Ac elementy , byly kříženy s TMV citlivým (nn) tabákovým kultivarem Petite Havana SRÍ (SRÍ) pro generování tří F1 Nn::Ac populací pro vyšetření ztráty TMV dependentní hypersensitivní odpovědi.
Pro stanovení endogení instability N byla také generována Nn populace bez Ac křížením Samsun NN a SRÍ. SRÍ byl použit jako donor pylu ve všeh kříženích.
Pro izolování HR- muantů bylo zaseto přibližně 64000 Nn: :Ac a 29000 Nn semen (viz Tabulka 1) ve stupni asi 2000 semen / misku s hustotou asi 3 semenáčky/cm2. Osm týdnů staré semenáčky byly umístěny při 30°C a inokulovány suspensi TMV a Celíte (Fisher, Pittsburgh, PA) užitím vzdušného kartáče (artist air brush) (Paasche VL) (R. W. Fulton, Nicotiana: Procedures for Experimental Use strany 79-86 (1979)).
Koncentrace TMV byla dostatečná proto, aby dávala lokální léze ve zjevné densitě 1.0/cm2 na Samsun NN semenáčcích pěstovaných v hustotě -3/cm2 a udržované při 24°C. TMV byl izolován z infikovaných SRÍ listů podle Lané (Methods in Enzymology 118:687-691 (1986)).Třetí den po inokulaci (dpi) byly semenáčky přesunuty z 30°C do 2l°C. V 5 dpi byly semenáčky vyšetřovány na přežití, a pak začal druhý a třetí cyklus TMV inokulace a teplotních posunů k potvrzení 100% inokulace.
Tabulka 1 - Izolace HR-mutantů
| Křížení | vyšetřované rostliny | HR-mutanty | Frekvence*1 |
| Samsun NNxnn | 29000 | 11 | 3.8xl04 |
| Tl-9b,10to,13toxnn | 64000 | 36 | 5.6x10 |
| Celkem | 93000 | 47 | 5.0xl0“4 |
** rekvence je kalkulována dělením počtu HR rostlin celkovým množstvím FI rostlin vyšetřovaných pro každé křížení
Samsun NN rostliny nesoucí aktivní Ac transposony
Dvě bakterie patogení pro rostliny, Pseudomonas syringae pv. tomato (P.s.t.) kmen DC3000 a P.s. pv. phaseolicola (P.s.p.) kmen NP 53121, a nepatogení P.s.t. kmen DC 3000 hrpS::Tn5 (získán od B. Staskawicz) byly suspendovány ve dvojnásobně destilované H^O v koncentraci 1 x 10® buněk na ml. Jak bakteriální suspense, tak vodná kontrola byly injikovány 10 ml injekční stříkačkou a 20 kalibrovanou jehlou (Z.Klement, In Methods in Phytobacteriology (Ed. Klement et al.) Akdemiae Kiado, Budapest, Hungary, 101-102 (1990)) do čtyř míst na spodní straně jednotlivého listu. Byly použity tři rostliny od každého z následujících genotypů: Nt-lG/g vlastních semenáčků 9 HR- mutantů, dva TMV sensitivní (SRÍ a Xanthi) a dva TMV resistentní (Samsun NN Xanti nc) tabákové kultivary. Listy byly hodnoceny na jejich odpověď na čtyři odlišná ošetření 48 hodin po inokulaci.
Schéma pozitivní selekce dovoluje izolaci mutantů neschopných vykázat TMV dependentní HR mezi velkou populací Nn semenáčků. Schéma selekce mutantů využívá suprese HR exprese na N nesoucích rostlinách, jsou-li infikovány TMV a udržovány při teplotě vyšší než 28°C. Rostliny nesoucí funkční N gen nevytvářely při teplotě vyšší než 28 °C lokální léze a TMV se šířil v rostlině systémově. Suprese HR je reversibilní a TMV infikované rostliny nesoucí N -vytvářejí systémovou nekrosu (systémovou HR), je-li teplota snížena na permisivních 24°C. Toto je pozitivní selekce mutantů, protože pouze rostliny, které ztratily schopnost vytvářet TMV dependentní HR (HR- mutanty) by měly přežít.
Tak bylo izolováno 47 HR- mutantů z heterozygotních (Nn)
Fl semenáčků produkovaných čtyřmi nezávislými kříženími mezi Samsun NN nebo třemi NN::Ac rodiči a SR tabákem. TMV infikované HR- rostliny byly získány z celkového počtu 93,000 Fl semenáčků. Jedenáct mutantů bylo izolováno z 29,000 semenáčků ze Samsun NN kontrolního křížení, zatímco 36 mutantů bylo izolováno z 64,000 semenáčků ze tří NN::Ac křížení (Tabulka 1). Frekvence ztráty resistence na TMV byla podobná u NN potomků Samsun NN a NN: :Ac při hodnotách 3.8 x l0~4 a 5.6 χ 10-4, příslušně. Možnost získání HR- mutantů ve stejné frekvenci v Nn populaci s a bez Ac indikuje, že stupeň endogeních mutací N je velmi vysoký.
K určení, zda byly HR- mutanty defektní v obecné schopnosti vyjadřovat HR, byly potomci devíti mutantů, včetně C2-2, inokulovány dvěma bakteriálními patogeny, o kterých je známo, že indukují HR u tabáku. Patogení bakterie, Pseudomonas syringae pv. tomato (P.s.t.) kmen DC 3000 a P.s.pv. phaseolicola (P.s.p.) kmen NP 53121, indukovaly HR ve všech případech, zatímco nepatogen P.s.t. kmen DC 3000 hrpS::Tn5, a vodní kontrola nikoliv. Tyto výsledky indikují, še HRmutanty neztrácejí obecnou schopnost vyjadřovat HR na bakteriální patogeny a že HR- fenotyp byl pravděpodobně specifický k odpovědi resistence na TMV.
K identifikaci rostlin homozygotních pro jejich HR- mutace byly mezi sebou křížené potomky 15 mutantů vyšetřeny molekulárně. DNA byla izolována z 27-64 vlastních potomků každého mutantu, trávena EcoRI a hybridizována s N-vázanou RFLP probou (Hehl and Baker, The Plant Cell 27:709-721 (1990)). Nt-1 identifikující RFLP, Nt-IG, která je zavedena do TMV resistentního kultivaru tabáku Samsun NN z N.glutinosa. Nt-IG nahrazuje svůj Nt-IT homolog u Samsun NN a mapuje < 0.25 cM N lokusu. Bylo předpokládáno, že mutantní linie indikované v Tabulce 2 jsou homozygotní pro těsně navázaný Nt-IG markér a že jsou homozygotní pro deleci Nt-IG markéru.
Znamením Ac - indukovaných mutací je to, že jsou často nestabilní. Stabilita HR- fenotypu zkoumána v šelf-křížení potomků 15 homozygotních mutantních linií. Devadesát pět až 150 potomků každé linie bylo inokulováno TMV a prověřováno na jejich fenotyp. Semenáčky jedné mutantní linie, Dll-1, demonstrovaly nestabilitu HR- fenotypu ve vysoké frekvenci. Z 145 prověřovaných Dll-1 rostlin bylo 20 TMV resistentních (TMVR) a 68 bylo TMV citlivých (TMVS) . Zajímavé je, že 57 rostlin vykazovalo sektory nekrosy podkladě citlivosti na TMV (TMVR/S) fenotyp) (Tabulka 2) . Lése mimických mutantů také vykazovaly sektory nekrosy. Nekrosa na lézích mimických mutantů je obyčejně exprivována spontálně za absence abiotických nebo biotických faktorů, které indukují nekrotickou odpověď (V. Walbot et al., Genetic Engineering of Plants str. 431-442 (1983)). Sektory nekrosy pozorované v Dll-1 potomcích a jiných populacích užívaných ve studiích zde popsaných jsou odlišitelné od leze mimického fenotypu, protože jsou závislé na infekci TMV. Identifikace TMVR a TMVR/S individuí v této populaci indikuje, že HR- mutace je nestabilní. TMVR a TMVR/S fenotypy nebyly pozorovány v semenáčcích jiných 14 mutantních linií (Tabulka 2) .
$
Tabulka 2. Identifikace nestabilní HR- mutantní linie
| liniea | mutant rodič13 | Fenotyp0 | |||
| TMVR | TMVR/S | TMV® C | !ELKEMa | ||
| D2-2 | C3-2 | 0 | 0 | 144 | 144 |
| D6-2 | C3-6 | 0 | 0 | 126 | 126 |
| D9-2 | C1-1 | 0 | 0 | 125 | 125 |
| D11-1 | C2-2 | 20 | 57 | 68 | 145 |
| D12-6 | C2-3 | 0 | 0 | 134 | 134 |
| D13-3 | • C2-5 | 0 | 0 | 149 | 149 |
| Ď15-3 | C2-7 | 0 | 0 | 133 | 133 |
| D16-3 | C2-9 | 0 | 0 | 134 | 134 |
| D17-2 | C2-10 | 0 | 0 | 143 | 143 |
| D21-1 | C2-16 | 0 | 0 | 95 | 95 |
| D23-5 | C2-19 | 0 | 0 | 148 | 148 |
| D24-2 | C2-20 | 0 | 0 | 111 | 111 |
| D26-2 | C2-21 | 0 | 0 | 144 | 144 |
| D27-2 | C2-22 | 0 | 0 | 150 | 150 |
| D28-2 | C2-23 | 0 | o | 150 | 150 |
| Samsun NN na | 150 | 0 | 0 | 150 | |
| SR1 | na | 0 | 0 | 150 | 150 |
| na = | není aplikovatelný | ||||
| s linie testované | v tomto | experimentu byly vlastním potomstvem | |||
| Fl, Nn, | mutantů. Tytc | i rostliny jsou | homozygotní | pro N-vázaný | |
| Nt-IG RFLP | |||||
| to Fl | mutant progenitor. Cl | -X je | z TI-9 x SRÍ, | C3 je z Tl-10 x | |
| SRÍ a C2 | !-X jsou z TI- | 13 x SRÍ |
° Vlastní potomstvo každé homozygotní mutantní linie bylo germinováno v políčkách po 50 semenáčcích. Semenáčky byly přibližně v 6 týdnech věku inokulovány U1 kmenem TMV a skorovány • po 48 hodinách a následně v intervalu 1 týdne po inokulaci na fenotyp. Samsun NN a SR jsou použity jako kontrola pro TMVR a TMVS fenotypy, respektive. Fenotypy jsou označeny následovně: TMVR(TMV resistentní), TMV® (TMV citlivý), TMVR/S (TMV dependentní sektory nekrosy na podkladě citlivosti na TMV) .
Λ Celkové množství semenáčků inokulovaných a skorovaných na jejich fenotyp z každé mutantní linie.
Jak je ukázáno na Obr.l, existují tři odlišné fenotypy pozorované v této nestabilní mutantní linii (Dll-1 potomstvo) po inokulaci TMV. List na Obr. 1A vytváří TMV resistentní rostlina a vykazuje charakteristické leze TMV resistentního (HR+) divokého typu nebo revertantních rostlin. List na Obr. 1B vytváří TMV citlivá rostlina a vykazuje oblasti světlé a tmavé zeleně (mozaiky) . List na Obr. ÍC vykazuje TMVR/S fenotyp, který je definován oblastmi nekrozy a mozaiky. Oproti TMVR listu nejsou nekrozy TMVR/S listu omezené na diskrétní léze. Zde ukázaný TMVR/B list vykazuje malé nekrotické oblasti, nicméně, rostliny byly prohlíženy na to, jestli může nekrosa zaujmout půlky listů, celé listy a šířit se po kmeni. Pozorování TMVR a TMVR/s fenotypů v potomstvu Dll-1 demonstrovalo, že HR- mutace v této mutantní linii je nestabilní.
PŘÍKLAD 2
Tento příklad popisuje test pro určení toho, je-li TMVR/S fenotyp způsoben dvěma Ac transposony, které kosegregují s N-vázaným RFLP markérem Nt-IG.
Pokud není zmíněno jinak, pro DNA - DNA hybridizaci je cílová DNA purifikována a trávena jednou nebo více restrikčními endonukleásami. Natrávená DNA je pak frakcionována podle velikosti agarosovou gelovou elektroforesou, a blotována do Nytran membrány (Schleicher & Schuell, Keene, NH). Hybridizační primery jsou připraveny užitím náhodných hexamerových primerů a značeny [32P]-dCTP a Klenow polymerasou. Standartní podmínky pro přísnou hybridizaci byly hybridizace při 42°C za přítomnosti 50% formamidu, 5 x SSC, 5 x Denhardtův roztok s promýváním při 65°C užitím 0.1 x SSC, 1% (w/v) dodecyl sulfátu sodného (SDS) .
Standartní podmínky pro ne-přísnou hybridizaci byly hybridizace při 35°C za přítomnosti 50% formamidu, 5 x SSC, x Denhardtův roztok s promýváním při 50°C užitím 0.1 x SSC, 1% SDS.
Pro izolaci N-vázaného Nt-IG RFLP byly užity DNA fragmenty izolované jako inserční místa transposovaných Ac elementů z SRÍ pro RFLP analýzu (Hehl and Baker, Mol. Gen. Genet. 217:53-59 (1989), Hehl and Baker, The Plant Cell 2:709-721 (1990)). Jeden DNA fragment, označený jako Nt-1, detekoval RFLP mezi TMVS tabákem cv SRÍ a TMVR tabákovým kultivarem Samsun NN. Obr. 2A ukazuje výsledky hybridizace 1.2 kb BglII/HindlII Nt-1 fragmentu na EcoRI trávenou genomovou DNA ze tří diploidních druhů tabáku N.glutinosa (zdroj N genu), N.sylvestris, a N.tomentosiformis (Obr. 2A, linie 1, 4, a 5) a dvou N.tabacum kultivarů Samsun NN a SRÍ (0br.2A, linie 2 a 3). Nt-1 detekuje RFLP specifický pro každý diploidní druh tabáku. 13.1 kb fragment je přítomen v Samsun NN, SRÍ, a N.sylvestris, (Obr. 2A, linie 2, 3 a 4). 15.5 kb fragment je přítomen v N.tomentosiformis a SRÍ (Obr. 2A, linie 5 a 3) a 14.3 kb DNA fragment je přítomen v N.glutinosa a Samsun NN (Obr. 2A, linie 1 a 2). Samsun NN postrádá 15.5 kb N.tomentosiformis RFLP (Nt-IT) , ale nese RFLP identické velikosti jako 14.3 kb RFLP u N.glutinosa (Nt-IG).
Vazba mezi Nt-IG a N byla testována v 420 TMVS F2 potomstvu křížení mezi Samsun NN a SRÍ tabákem segregujícím 3:1 pro TMV resistenci a citlivost a 1:2:1 pro Nt-IG a Nt-IT RFLP. DNA z TMV citlivých F2 rostlin byla trávena EcoRI a hybridizována Nt-1. Jedna TMVS rostlina měla Nt-IG RFLP demonstrující, že Nt-IG je velmi těsně navázán na N<0.25 cM.
Dva Ac transposony kosegregovaly s N-vázaným RFLP Nt-IG. Jestliže byl TMVR/S fenotyp závislý na mutabilní alele N, byla očekávána kosegregace s molekulárním markérem navázaným na N lokus. Byla testována kosegregace TMVR/S fenotypu s N-vázaným Nt-IG markérem v testovacím křížení potomstva nestabilních HR- mutantů C2-2 a SRÍ tabáku. Potomstvo testovacího křížení (nazývané Dlll populace) bylo inokulováno TMV a vyšetřováno na svůj fenotyp. Z 264 vyšetřovaných Dlll rostlin bylo 164 TMV citlivých (TMVe), zatímco 80 vykazovalo sektory nekrosy na podkladě citlivosti na TMV. Divoký typ TMV resistentních rostlin nebyl pozorován. DNA 80 Dlll rostlin byla trávena EcoRI a hybridizována s Nt-1. Nt-1 genotyp rostlin byl určen a 39 individuí bylo Nt-lG/T, zatímco 41 bylo Nt-1T/T (Tabulka 3). 26 rostlin, které vykazovaly TMVR/S fenotyp mělo Nt-IG markér, zatímco Nt-1T/T rostliny byly TMVB (Tabulka 3) . Tyto výsledky indikují, že nestabilní HRmutace, definovaná schopností vytvářet sektory nekrosy, byla navázána na Nt-IG.
Protože byla nestabilní HR- mutace navázána na Nt-IG, bylo vyšetřováno, zda Ac transposon kosegreguje s Nt-IG RFLP markérem v Dlll populaci. Dlll DNA trávená EcoRI byla hybridizována probou od 5 konce Ac. Byly nalezeny dva Ac hybridizační proužky, označené Ac8 (8.0 kb EcoRI Ac proužek) a AclO (10.2 kb EcoRI Ac proužek), které kosegregovaly s Nt-IG. Třicet Nt-lG/T rostlin mělo jak Ac8, tak AclO, pět mělo Ac*, 3 měly AclO, a 1 rostlina neměla ani jeden element (Tabulka 4) . Ac8 ani AclO nebyly přítomny v 41 Nt-IT/T rostlinách stanovujíc tak, že dva Ac transposony byly navázány na Nt-IG.
Příklad dat Southern hybridizace sumarizovaných v Tabulkách 3 a 4 je ukázán na Obrázku 2B a 2C. Na Obr. 2B je zobrazena hybridizace Nt-1 na EcoRI trávenou DNA 14 Dlll rostlin. Zde ukázané rostliny mají heterozygotní , Nn, Nt-lG/T genotyp jak demonstruje přítomnost 14.3 kb Nt-IG RFLP a 15.5 kb Nt-IT RFLP (linie 2,4-11 a 14). Šest z těchto rostlin má TMVR/S fenotyp korespondující liniím 2, 4, 7, 9, 11, a 14. Čtyři rostliny^aj i homozygotní, nn, genotyp Nt-IT «Sis*..»— genotyp jak je demonstrováno přítomností 15.5 kb Nt-IT RFLP a absencí 14.3 kb Nt-IG RFLP (linie 1, 3, 12 a 13). Čtyři rostliny Nt-1T/T genotypu neměly TMVR/S fenotyp. Následně byly tyto DNA hybridizovány s 5' Ac probou jak je ukázáno na Obr. 2C. Všech 10 rostlin Nt-1G/T genotypu nesou 8.0 kb Ac prožek (nazývaný Ac8), zatímco 7 z těchto individuí (linie 2, 4, Ί, 8, 9, 11, a 14) nesou 10.2 kb Ac (nazývaný AclO). Rostliny Nt-1T/T genotypu neobsahují ani 8.0 kb, ani 10.2 kb Ac RFLP, ačkoliv nesou jiné Ac transposony.
Tabulka 3. Nestabilní HR- fenotyp kosegreguje s N-vázaným RFLP, Nt-IG
| Nt-1 genotyp13 | TMVR | TMV TMV1 | fenotyp s TMVS | Celkem |
| Nt-1G/T | 0 | 26 | 13 | 39 |
| Nt-1T/T | 0 | 0 | 41 | 41 |
a 80 rostlin z křížení nestabilního HR- mutantu, C2-2, a SRÍ tabáku (Dlll populace) bylo inokulováno TMV a skorováno na fenotyp jak je popsáno v Tabulce 2
DNA izolovaná z Dlll rostlin byla trávena EcoRI pro Southern analýzu s Nt-1.
Tabulka 4. Dva Ac transposony kosegregují s Nt-IG
| Nt-1 genotyp | AclO/8 | Kosegreguj ící | proužky C | a , t> )elkei | |
| AclO | Ac8 | ||||
| Nt-1G/T | 30 | 3 | 5 | 1 | 39 |
| Nt-1T/T | 0 | 0 | 0 | 41 | 41 |
a Po Nt-1 hybridizaci byly Southern bloty obsahující Dlll DNA trávené EcoRI vyjmuty a hybridizovány 5-Ac probou .
53 Dva Ac proužky byly identifikovány, že kosegregují s Nt-IG, nicméně většina rostlin měla 3 až 8 kopií Ac
PŘÍKLAD 3
Tento příklad popisuje test pro určení, jestli Ac8 nebo AclO je odpovědný za nestabilní HR- mutaci.
K určení, jestli Ac8 nebo AclO způsobuje nestabilní HRmutaci byly identifikovány germinální revertanty (Dlll-15) z vlastního potomstva HR- mutantů C2-2. D112-15 byl homozygotní pro Nt-IG a nesl jak Ac8, tak AclO. Protože jak Ac8, tak AclO byly přítomny, bylo předpokládáno, že jedna transposon tagged alela N germinálně revertovala na divoký typ, zatímco jiná stále obsahovala Ac a tak měla potenciál revertovat. D112-15 byl křížen s SRÍ kvůli testu, jestli excise Ac8 nebo AclO může být korelována s reversí k resistenci a instabilitě HR- mutace, 0 potomstvu tohoto křížení (E501 populaci) bylo předpokládáno, že segreguje ~1:1 pro TMVR ku TMVS + TMVR/S a má Nt-1G/T genotyp. 0 Ac odpovědném za nestabilní mutace N byla předpokládána absence u všech resistentních offspring tohoto křížení, Devadesát pět E501 rostlin bylo inokulováno TMV a vyšetřováno na svůj fenotyp. Padesát pět bylo TMVR, nekrotické sektory byly pozorovány na 21 rostlinách, a 20 bylo TMVS (Tabulka 5) . DNA z těchto rostlin byla trávena EcoRI a probována Nt-l následovanou 5' Ac probou, všech 95 rostlin bylo Nt-1G/T genotypu. Signifikantně, žádná z 54 TMV resistentních individuí neměla 10.2 kb EcoRI Ac proužek, zatímco 8 kb proužek byl přítomen u 52 rostlin (Tabulka 5) , Přítomnost Ac8 a absence AclO v TMV resistentním E5Q1 potomstvu implikovala AclO jako element, který způsobuje nestabilní HR- mutace a tak tagging N.
Tabulka 5 AclO je korelován s HR- mutací
| N-vázaný Ac | TMVR | TMV fenotyp e,to | |
| tmvr/s | TMVS | ||
| AclO | 0 | 1 | 1 |
| Acl0/Ac8 | 0 | 18 | 1 |
| Ac8 | 52 | 1 | 18 |
| - | 2 | 1 | 0 |
a 95 rostlin z křížení TMVR germinálního revertantu, D112-15, a SRÍ tabáku {E501 populace) bylo inokulováno TMV a skorováno na jejich fenotyp jak popisuje Tabulka 2.
10 DNA izolovaná z E501 rostlin byla trávena EcoRI pro Southern analýzu a hybridizována 5-Ac probou.
Množství Ac kopií je vysoké v Dlll a E501 populacích, a to může, snad, maskovat jiné Ac elementy kosegregující s Nt-lG,
U TMVS rostlin E501-70, bylo identifikováno, že mají pouze jeden AclO. K potvrzení, že AclO sám může způsobovat nestabilní HR- mutace bylo vlastní potomstvo těchto rostlin (F501 populace) zkoumáno na svůj fenotyp po infekci TMV a analyzováno na přítomnost AclO a jeho Nt-1 genotypu. Sedm TMVR rostlin bylo získáno z celkem 500 rostlin. Molekulární analýza ukázala, že tři TMVR rostliny byly heterozygoti pro Nt-IG a neměly AclO hybridizaci, zatímco čtyři TMVR rostliny byly Nt-IG/G a měly AclO proužek. Jako u D112-15 rostlin bylo předpokládáno, že Ac hybridizace v Nt-IG homozygotech byla. díky přítomnosti mutantní alely N v těchto rostlinách stejně jako u revertantů.
V E501 a F501 populacích je korelace mezi přítomností AclO a TMVR/S fenotypem. Devatenáct z 21 E501 rostlin TMVR/S fenotypu mělo Ac hybridizaci, 12 z 12 F501 TMVR/S rostlin analyzovaných molekulárně mělo 10.2 kb Ac proužek. Tyto výsledky indikují, že přítomnost AclO je pro rostliny nezbytná pro formování sektorů nekrosy a udržuje potenciál revertovat somaticky na resistenci. Tkáně ze sektorovaných rostlin bez Ac hybridizace pravděpodobně mají více excisí, takže 10.2 kb Ac proužek není dále detekovatelný Southern blot hybridizaci.
V Dlll a E501 se 2.3 kb proužek, který hybridizuje na 3Ac probu, chová identicky jako 10.2 kb 5Ac proužek. Je-li dáno, že Ac je 4.6 bp, je určen EcoRi divokého typu, nebo excisní fragment 7.9 kb. 0 tomto fragmentu se očekává, že bude obnoven v TMVR revertantech. k testování přítomnosti genomické inserce a excisních fragmentů byla izolována genomická sekvence doprovázející AclO pomocí IPCR z rostlin Dlll-95, které obsahují pouze AclO a Ac8 (Obr. 2C, linie 9). (viz. Příklad 4, níže).
Genomické sekvence doprovázející AclO byly izolovány inversní polymerasovou řetězovou reakcí (IPCR). Templátová DNA z rostlin Dlll-95, které nesou pouze Ac8 a AclO byla trávena Hpall, ligována a linearizována Clal. PCR reakce byly provedeny v 50 ul užitím Taq polymerasy (Promega, Madison,
WI) na Perkin-Elmer Thermocycle (Emeryville, CA). Parametry byly 94°C - 1 min., 55°C -1 min.,a 72°C - 2 min, pro 35 cyklů. 419 bp produkt (AclO-l) 5 k AclO byl amplifikován užitím Ac specifického primerů CC28 (5'CACGGATCCATACGATAACGGTCGGTACGGGA-3') a CC32 (5'CACGAATTCGGAAACGGAAACGGTAGAGC-3'). K získání AclO
3'doprovázející sekvence (AclO-2), Dlll-95 DNA byla trávena EcoRI, ligována a linearizována AccI. 122 bp produkt byl amplifikován užitím primerů CC21 (5'CACCTGCAGAGATCTTTACCGACCGTTACCGACCG) a CC30 {CACCTGCAGAGATCTGCAGGCTTATAATATAAGGC- 3 ') . IPCR produkty byly klonovány do TA klonujícího vektoru (Invitrogen, San Diego, CA) .
400 bp produkt IPCR z 5' konce Ac byl izolován (AclO-1). AclO-1 byl klonován do TA klonujícího vektoru a sekvenován. Byly syntetizovány PCR primery pro generování AclO-1 proby bez Ac sekvence k redukci možnosti spuriosní Ac hybridizace. Je-li užita jako proba na tabákovou genomovou DNA, detekuje AclO-1 repetitivní sekvence. Hybridizace na 10.2 kb Ac insertní proužky byla pozorována v DNA Dll-1, nicméně, předpokládaný 7.9 kb EcoRI excisní proužek nebyl rozpoznatelný vzhledem k repetitivní přirozenosti proby. IPCR klon získaný z 3'- konce AclO (AclO-2) byl 1118 bp dlouhý a jevil se nedůvěryhodný jako proba.
Důvěryhodná proba s malým množstvím kopií, N-5, byla získána z 3'konce (base 5020 až 5370) cDNA klonu C7. Toto koresponduje bažím 6587-6600, 6934-6948, a 6977-7270 SEQ ID NO:1. Molekulární analýza E501 a P501 populací pokračovala užitím restrikční endonukleasy EcoRI. DNA z E501 a F501 populací byly tráveny EcoRI a hybridizovány Ac a N-5 probami. Ac proba byla hybridizována na 10.2 kb EcoRI proužek korespondující AclO v E501 a F501 populacích. Ac hybridizace k selekci individuí z každé generace v nestabilní HRmutantní linii je ukázána na Obr.3C. Ac hybridizace nebyla pozorována v kontrolních DNA SRÍ, N.glutinosa, nebo Samsun NN. Originální HR- mutantn C2-2 měl 10.2 kb proužek navíc k alespoň dvěma jiným Ac transposonům. Germinální revertant, D112-15, měl 10.2 kb Ac proužek stejně jako alespoň 10 jiných Acs. E501-70, TMVS rostlinky D112-15, měly pouze 10.2 kb AclO proužek. Dva germinální revertanty TMVR rostlinek E501-70, F501-65, a F501-66 neměly 10.2 kb proužek. F501-65 měl novou Ac inserci, zatímco F501-66 neměl dále Ac hybridizací. Sektorované rostliny F501-2, 3, a 4 všechny stále mají AclO inserci. F501-48 a F501-64 jsou dvěma příklady TMVS rostlin, které také dále nemají AclO hybridizací. F501-48 dále nemá Ac hybridizací, zatímco F501-64 má novou inserci.
Je-li dáno, že Ac je 4.6 kb, pak je určen 7.9 kb EcoRI divokého typu nebo excisní fragment, když je N-5 užita jako proba (viz. Obr.3A) . Příklady proba N-5 hybridizace jsou ukázány na Obr.3B. N-5 hybridizuje k 7.9 kb proužku N.glutinosa a Samsun NN. HR- mutant, C2-2, měl hybridizací na 10.2 kb AclO inserční proužek a slabou hybridizací na 7.9 kb proužek. D112-15 měl jak 10.2 kb, tak 7.9 kb proužek. E501-70 měl 10.2 kb inserční proužek a nějakou hybridizací 7.9 kb proužek. Dva germinální revertanty, F501-65 a F501-66 mají pouze 7.9 kb proužek. Tyto rostliny byly Nt-1G/T, takže nesou pouze jednu alelu N, která je revertována. Jiné revertanty, jako je D112-15, které jsou Nt-IG/G mají jak inserční, tak excisní fragmenty. F501-2, 3, a 4 mají jak 10.2 kb a 7.9 kb RFLP. F501-48 a F501-64 mají pouze 7.9 kb excisní fragment.
Signifikantně, 54 TMVR E501 potomků D112-15 mělo 7.9 kb EcoRI excisní prožek jako měly 7 TMVR F501 rostliny. Tyto výsledky indikují, že restaurace genomové DNA sekvence na divoký typ je žádoucí pro reversi resistence. Tyto výsledky také demonstrují, že jedna mutantní alela N byla germinálně revertována v D112-15 a že excise AclO byla odpovědná za restauraci funkce N genu. Tyto výsledky byly potvrzeny v analýze potomstva E01-70, nesoucí pouze AclO, kde všech 7
TMVR rostlin mělo 7.9 kb excisní proužek. Nt-1G/T rostliny nevykazovaly žádnou AclO hybridizací, a měly 7.9 kb velký genomový fragment divokého typu.
TMVr/s rostliny, s výjimkou dvou z generace E501, měly jak 10.2 kb, tak 7.9 kb proužky. Společná přítomnost těchto proužků ve stejné tkáni indikuje, že jsou přítomny buňky s umístěním AclO,a AclO excise. Každý proužek indikuje, že některé tkáně budou buď TMSs nebo potenciálně revertantní. Toto by mělo vysvětlit TMVR/S fenotyp pozorovaný v těchto studiích.
PŘÍKLAD 4
Tento příklad popisuje analýzu sekvencí genomových insertních a excisních míst.
PCR produkty obsahující Ac excisní místa byly přímo sekvencovány. Použité rostliny jsou ukázány v Tabulce 6. Primery doprovázející excisní místo NG1-5 (base 4477 až 4496 5'- GCCCTCGAGAAATCAAGAAAACAGAGGTC-3) a N7-52 (base 4838 až 4856 5-GCACTCGAGCTTCAAGATTACTACATTG-3) bylu použity k amlifikaci -379 bp produktu. PCR reakce byly provedeny jako při IPCR s výjimkou následujících parametrů: 94°C - 1 min., 55°C - 2min, a 72°C-3 min. pro 25 cyklů. PCR produkty byly purifikovány elektroforesou v agarose s nízkým bodem tání (FMC) následované fenolovou extrakcí. Přibližně 500 fmol každého produktu bylo použito pro sekvencování s fmol DNA Sequencing System (Promega, Madison, WI) užitím primerů N7-52.
Devatenáct z 21 TMVS E501 rostlin stejně jako čtyři TMVS F501 rostliny Nt-1G/T genotypu měly excisní proužek a postrádaly AclO (Ac 10(-)). Ac vlastností, která byla konzervována v tabáku je ta nad insercí, je vytvořeno osm párů baží přímé duplikace doprovázející element. Toto bylo potvrzeno v sekvencích AclO-l a AclO-2. AclO je doprovázen 8 bp přímého repeatu 5'- ATTTGCCG-3'. Často je Ac excise nepřesná a footprint je vlevo předním. Footprinty mohou způsobit mutace posunu rámečku a/nebo aminokyselinové delece nebo inserce, které zabraňují produkci funkčního genového produktu.
Tabulka 6
Hilfl .fcypa
-CAT TTG CCG TCTphenotypfl
TMVR
Ac insertion
-CAT TTG CCG//AC//AT TTG CCG TCTTMV3
Ac excísion
N* footprints
| F501-48 | -CAT TTG |
| F501-S4 | -CAT TTG |
| E501-2 | -CAT TTG |
| E501-3 | -CAT TTG |
| E501-9 | -CAT TTG |
| E501-16 | -CAT TTG |
| E501-28 | -CAT TTG |
| CCC TTT GCC GTC | -9 | aa- * |
| CCT GCC GTC | -9 | aa- * |
| CTT TGC CGT | -4 | aa- * |
| CCA TTT TGC CGT | -4 | aa- * |
| CCC—CGT | -4 | aa- * |
| CCC TTT GCC GTC | -9 | aa- * |
| CCC TTT GCC GTC | -9 | aa- * |
TMV3 TMV3 TMV3 TMV3 TMV3 TMV 3 TMV3
N revertants D112-1Í5 F501-34 F501-45 F501-65 F501-66 F501-e7 F501-68 F501-69
-CAT TTG CCG TCT-CAT TTG CCG TCT-CAT TTG CCG TCT-CAT TTG CCG TCT-CAT TTG CCG TCT-CAT TTG CCG TCT-CAT TTG CCG TCT- CAT TTG CCG TCTtmvr tmvr tmvr tmvr tmvr tmvr tmvr tmvr
Tabulka 6 ukazuje sekvenční analýzu Ac cílového místa v N genu a resistentní nebo senzitivní (na TMV infekci) fenotyp asociovaný s jednotlivým genotypem. Při inserci AclO je duplikována 8 bp sekvence divokého typu N sekvence (od nukleotidu 5034 do 5041, ATTTGCCG). Triplety basí v Tabulce 6 indikují kodony bez cDNA sekvence. Další sekvence, které zůstávají v sensitivních rostlinách po excisi AclO jsou podtrženy. Hvězdičky indikují výskyt prematurovaných stop kodonů, které se nevyskytují v ani 9, ani 4 aminokyselinách downstream. E501 jsou potomci zpětného křížení rostlin germinálních revertantů D112-15, a F501 jsou vlastní potomstvo rostlin E501-70. TMV sensitivní a resistentní fenotypy jsou v Tabulce 6 indikovány TMVS a TMVR , v příslušném pořadí.
AclO se připojuje k N genu. Excisní místa sedmi AclO(-) TMVS rostlin byla sekvencována a u každého bylo zjištěno, že má nukleotidové změny ve srovnání s divokým typem excisního místa (Tabulka 6) . Tyto nukleotidové změny demonstrují, že nedokonalá excise AclO vede k footprints, které způsobují rámečkové mutace. Předpokládané polypeptidy jsou terminovány 9 aminokyselinami nebo 4 aminokyselinami downstream od footprints (Tabulka 6).
Kromě toho bylyu sekvencovány excisní místa D112-15 a šesti TMVS rostlin z F501 generace a bylo zjištěno, že mají divoký typ sekvence (Tabulka 6). Schopnost nalézt revertantní rostliny bez změn baží napovídá, že tento region je velmi důležitý pro funkci proteinů, a že aminokyselinové substituce, adice nebo delece nejsou tolerovány. Nicméně,
TMVS rostliny s footprint, který by měl dovolovat syntézu kompletního, ale nefunkčního proteinu, nebyly dosud identifikovány. Tyto výsledky zde popsané demonstrují, že AclO je připojen k N genu a napovídají, že přesná excise AclO z N genu je žádoucí pro nastolení HR+ fenotypu.
PŘÍKLAD 5
N cDNA byly izolovány z N.glutinosa cDNA knihovny následovně: Rostliny osm až dvanáct týdnů staré byly infikovány TMV při 32°C. Teplota byla snížena na 24°C 24 hodin po inokulaci. Listy byly sklízeny pro polyadenylovanou (Póly (A)+) RNA izolaci 48 hodin po inokulaci. cDNA byla připravena z 5 ug Póly (A)+RNA užitím lambda-Zap cDNA syntézního kitu (Stratagene, La Jolla, CA). cDNA byla zabalena s Gigapack II Gold balícími extrakty od Stratagene a umístěna v hostitelském kmeni Escherichia coli XL 1-Blue mrf.
AclO-l byl použit k vyšetření 1.0 x 106 klonů cDNA knihovny konstruovaných z RNA TMV infikovaných N.glutinosa.
U patnácti klonů bylo identifikováno, že mají homologii k AclO-l, nicméně , pouze jeden (C7) měl 100% identitu sekvence s AclO-1. Proba (N-5) byla odvozena z baží 5020 až 5370 v 3-konci C7, která byla jedinou kopií v tabáku a která hybridizovala na 7.9 kb EcoRI fragment. Následně bylo hybridizováno lxl0e plaků s N-5 probou. Tři klony (C16, C17, a C18) byly izolovány ve druhém vyšetření a všechny měly 100% identitu sekvence s Acl0-l. Bylu určeny kompletní sekvence cDNA C7, C16, a C18 insertů (viz níže).
Dvouřetězcová plasmidová DNA byla sekvenována dideoxy řetězcovou terminační metodou (Sanger et al., Proč. Nati.
Acad. Sci USA 74:5463-5467 (1977)) užitím Sequenase verse 2.0 systému ( United States Biochemical Corporation, Cleveland,
OH) a pro sekvenování C7 cDNA byly nested delece připraveny Exonucleasa III metodou (Henikoff, Methods in Enzymology 155: 156- 165 (1987)). cDNA C16 a C18 byla sekvenována za použití primerů odvozených d C7 sekvence.
Sekvenční analýza byla provedena užitím GCG sekvenčního programu analýzy (Madison, Wisconsin). Byly odvozeny mapy pro exony a introny kódované genomovým N genem (viz SEQ ID NO:1) ze sekvenční analýzy C7, C16 a C18 cDNA klonů a parciálního sekvencování C38 lambda klonu (0br.4B). Dohromady C7 a C18 určují, že pět exonů je vyříznuto pro vytvoření otevřeného čtecího rámečku 3432 párů basí, který kóduje polypeptid o 1144 aminokyselinách (N). C18 DNA sekvence je přítomna v SEQ ID NO:3. C16 kóduje polypeptid o 652 aminokyselinách (Ntr), protože exon o 70 párech baží je alternativně vyříznut pro vytvoření zkráceného otevřeného čtecího rámečku 1956 bp (Obr. 4A a SEQ ID NO:5). Tento extra exon (EE) může být vyříznut způsobem podobným jako u fibronektin EDA exonu (M.Caputi, Nucleic Acids Research 22:1018-1022 (1994)). Sekvenční motivy uvnitř 70 bp exonu jsou 95% podobné sekvencím EDA exonu, který definuje bipartitní enhancer, který moduluje vyříznutí tohoto 81 bp exonu.
3- konce cDNA se liší v délce, což indikuje, že jsou použity různé polyadenylační signály. Mnohotné potenciální polyadenylační signály jsou nacházeny v pozicích v 3netranslatovaném regionu těchto DNA klonů, což mohou vysvětlit různé události zpracování. C7 má delší 3- terminus a obsahuje sekvence pro zkrácené C16 a C18 3- konce. C7 a C16 jsou identické v 5-konci. C18 sekvence je nalezena celá uvnitř C16 a C7, takže není kompletní cDNA a má kratší 3-konec. C7 obsahuje intron 2 a může být z mRNA , která není plně vyříznuta.
C16 a C18 postrádají intron 2. Přidání 5- 750 bp sekvence C16 nebo C7 k C18 vytváří předpokládaný otevřený čtecí rámeček o 3432 bp kódující polypeptid o 1144 aminokyselinách (Tabulka 7A). Parciální sekvencování G38 lambda klonu ukazuje, že všechny izolované sekvence nezbytné pro nárůst tří typů cDNA jsou přítomné v genomové sekvenci. Tak jsou tyto cDNA kódovány jednotlivým genem.
Předpokládaná molekulární hmotnost předpokládaného N a Ntr proteinu je 131.4 kd a 75.3 kd, v příslušném pořadí. Tabulka 7A ukazuje dedukovanou aminokyselinovou sekvenci pro produkt N genu (viz také SEQ ID N0:4). Potenciální signální (cytoplasmatická) doména je podtržena. Aminokyseliny konzervované mezi ATP/GTP-vazebné místo motivem (P-smyčka) jsou dvojitě podtrženy. Na leucin bohaté opakující se úseky (LRR1 až LRR13) jsou kurzívou. Osm potenciálních N vázaných glykosylačních míst se vyskytuje v aminokyselinové sekvenci N. Tato místa jsou uvedena písmeny výrazného typu v Tabulce 7A a mají konsensuální aminokyselinovou sekvenci NX(S/T). Zkratky použité v Tabulkách 7A-C pro jednopísmený aminokyselinový kód jsou: A, Ala. C, Cys. D, Asp; E, Glu; F, Phe; G, Gly; H, His; I, Ile; K, Lys; L, Leu; M, Met; N, Asn; P, Pro; Q, Gin; R,
Arg; S, Ser; T, Thr; V, Val; W, Trp; a Y, Tyr.
Analýza N proteinové sekvence podle programu ualom ukazuje, že žádný transmembránový region není přítomen v N. Navíc, analýza sekvence N proteinu programem Signalase ukazuje, že žádná signální sekvence není přítomna. Tak, vzhledem k sekvenční analýze, se N jeví být lokalizovaný v cytoplasmě.
Odvozené aminokyselinové sekvence N polypeptidu byly srovnány s Genbank (uvolnění 82.0) užitím BLAST programu (Altschul et al., J.Mol. Biology 215:403-410 (1990)). Předpokládaná aminokyselinová sekvence vykazuje omezenou, ale signifikantní podobnost s proteiny, o kterých je známo, že jsou zahrnuty v signální transdukci.
Předpokládaná aminokyselinová sekvence N obsahuje motiv P-smyčky (Tabulka 7A). Sekvence GMGGVGKT (aa 216-223) odpovídají konsensuální sekvenci P-smyčky (A/G)XXXXGK(S/T) nalezené v různých ATP- nebo GTP- vazebných proteinech (Tabulka 7A). Rodina proteinů obsahujících P-smyčku zahrnuje adenylát kinasy, ras rodinu proteinů, elongační faktory, b-podjednotku ATP-syntetázy, thymidin kinásy a fosfoglycerát kinásy (M.Saraste et al., Trends in Biochemical Sciences
15:430-434 (1990)). Tato jednotlivá P-smyčka je nejpravděpodobněji zahrnuta ve vazbě ATP. Konsensuální sekvence, DXXG a NXKD, pro vazbu GTP navíc k P-smyčce, nejsou přítomny v aa sekvenci (Dever et al., Proceedings of National Academy of Sciences USA 84:1814-1818 (1987)
Kromě P-smyčky definoval Fry et al., (Proceedings of National Academy of Sciences USA 83:907-901(1986)) definoval dva jiné segmenty, které se zdají být zahrnuté v ATP vazbě v adenylát kinase a Fl-ATPase. Inspekce N sekvence napovídá, že tyto segmenty jsou přítomny a ve správném umístění. Segment 2 obsahuje dipeptid (I,A,L,V)(V,I) a N má sekvenci AI v pozicíh 228 a 229, podle příslušnosti (Tabulka 7A). V 80-100 aminokyselinách z P-smyčky byl segment 3 definován jako glucin následovaný úsekem 5 hydrofobních aminokyselin a kyselinou aspartátovou (Tabulka 7A). N má sekvenci VLIVLDD v aminokyselinách 296-302. Z aminokyselinové sekvence není možné předpovědět za jakých podmínek je ATP vázána nebo zda se při vazbě vyskytuje ATP hydrolýza spontálně nebo zda vyžaduje jiné faktory.
Tabulka 7B ukazuje připojení amino terminálních aminokyselin (potenciální signální doménu) (8 až 150 SEQ ID NO:4) s cytoplasmatickou (signální) doménou Drosophila Toll proteinu (aa 804-9996, Yamagata et al., Gene 139:223-228 (1994)) a lidského Interleukin 1 receptorového proteinu (H IL1-R, aa 317-524, Sims et al., Proceedings of the National Academy of Science 86:8946-8950 (1989)). Rámečky indikují, regiony similarity. Použité konzervativní substituce jsou: hydrofobní aminokyseliny = L/I/V/M/A/F, iontové aminokyseliny = K/R/D/E/Q/N/H, aromatické aminokyseliny = F/Y.
N sekvence obsahuje některé konservované aminokyseliny žádoucí pro transmisní signál z cytoplasmy do jádra v Toll a
IL1-R reguůlační dráze (Schneider et al., Genes and
Devolopment 5:797-807 (1991), Heguy et al., Journal of
Biological Chemistry, 267: 2605-2609 (1992)).
Určená aminokyselinová sekvence N od aminokyselin 590 do 928 SEQ ID NO:4 obsahuje na leucin bohatý region složený ze třinácti opakujících se úseků délky přibližně 25 aminokyselin. Tabulka 7C ukazuje primární strukturu na leucin bohatých opakujících se úseků N genu (LRR) (aa 590-928) a srovnání jejich konsensuální sekvence s LRR konsensem kvasinkové adenylát cyklásy (AdCy, Kataoka et al., Cell 43:493-505 (1985)), Drosophila Toll (Hashimoto et al., Cell 52:269-279 (1988)), Iba řetězce lidského destičkového membránového glykoproteinu (H Gplba, Titáni et al., Proceedings of the National Academy of Science 84:5610-5614 (1987)), Drosophila Chaoptinem (Reinke et al., Cell 52:291-301 (1988)) a Arabidopsis receptor- like transmembránovou kinasou (TMK1, Chang et al., Plant Cell 4:1263-1271 (1992)), TMKL1, Valon et al., (Plant Molecular Biology 23:415-421 (1993)), a RLK5, Walker, The Plant Journal 3:451-456 (1993)).
Na leucin bohaté opakující se úseky (LRR) jsou nacházeny ve velké šíři proteinů zahrnutých v signální transdukci, buněčné adhesy, a různých jiných funkcích, a soudí se, že zprostředkuj i protein-protein interakce. Konsensuální sekvence odvozená z připojených LRR je podobná konsensu nacházeném v kvasinkových adenylát cyklázách (Kataoka (1985) supra), Drosophila Toll (Hashimoto et al.,(Hashimoto et al., supra, (1988)), Iba řetězce lidského destičkového membránového glykoproteinu ( Titáni et al.,(1987)supra), Drosophila Chaoptinem (Reinke et al., (1988) supra) a Arabidopsis receptor- like transmembránovou kinasou (Chang et al., (1992) supra), Valon et al., (1993) supra), Walker, (1993) supra). S výjimkou adenylát cyklásy se soudí, že LRR doména je v extracelulární matrix těchto proteinů.
WO 95/35024
PCT/US95/07754
MASSSSSSRW SYDVFLSFRG EDTRKTFTSH LYEVLHDKGI KTFQDDKRLE YGATIPGELC 61 KAIEESQFAI WFSEHYATS RHCLHELVKI HECKTRFKQT VTPIFYDVPP SHVRHQKESF
| H | to >3» | W4 | K | to | to | t*» | 9 | H A | q | M | 0 | 0 | cu | ||||
| bS | to | >, | 5 | q | K | to | 5 | g | q | q | 0 | q | X | fe | |||
| u | 0 | qH | X | o | Cu | fe | g | •“n | q | q | q | Ck | V4 | ||||
| q | t4ij | tu | <0 | > | to | Cd | q | q | q | q | CS | to | q | co | |||
| bS | q | 5 | ►4 | fe | q | to | S | Cd | O | q | q | a | X | CS | E | B4 | |
| to | to | ζ* | O | m | to | > | >d | >d | H | to | q | H | co | ta | to | ||
| to | q | bs | q | X | *> | Cd | =5 | CJ | q | ta | q | to | 5 | ||||
| w | >4 | tn | to | s | 0 | q | q | Jn | q | q | es | w | u | 2 | G | ||
| o | q | q | tu | q | υ | iď | 2 | q | p | £· | > | bž | £ | ||||
| o | Q | q | 55 | X | q | tu | «0 | o | s | to | O | U | σ | to | σ | ||
| > | fu | q | O | ·— | H | X | q | q | υ | q | 0 | Cu | Cu | q | |||
| q | q | tO | řk | w | q | q | »d | P | *4 | Λ | 2 q | 'T | to | 0 | cí | ||
| σ | < | q | H | q | to | £5 | q | P | b> | P | q | X | CS | ||||
| cs | ž | ž | 2 | *4 | to | W | H | £> | q | Q | >1 | Cu | q | q | |||
| M | S | fe | tn | 10 | 3: | M | q | to | q | q | < | bí | to | to | |||
| u q | q | > | « | tu | Ε | q | q | q | q | ta | tu | 0 | < | q | |||
| £ | E | tu | » | éc | P- | q | H | P | q | O | q | 0 | tu | tn | |||
| 2 | to | fe | Ul | G | q | £ | iu | b* | tu | q | q | Cí | jT? | ||||
| o | Ej | o | H | q | tn | P | &4 | q | q | rs | c | >4 | > | tu | |||
| q | tO | tu | W | ►4 | q | X | u | X | q | to | S | d | X | X | fu | q | |
| bí | > | tu | 0 | d | a | > | > | P | to | 2 | O | q | v | — | Cu | q | |
| a | Ď! | T* | j4 | to | cd | q | ř-4 | Q | q | p | 0 | β | tu | tu | cu | ||
| cs | Uí | cs | 2 | cu | Cd | u | q | υ | q | 2 | 5 | cu | X | ** | |||
| XI | £ | tu | q | q | S | q | Q | 3 | υ | q | q | fc_» | q | q | 2 | ||
| 5 | G | M | q | Cd | q | q | cd | H | 13 | to | 2 | X | 0 | ||||
| <j | »2 | 2 | q | ►4 | σ | X | X | q | q | to | q | to | 0 | > | *> | éu | |
| ťO | q | M | q | ps | O | P | q | q | 0 | to | tu | X | |||||
| to | tO | tu | 2 | O | q | 3 | q | q | q | X | q | q | > | 61 | X | ||
| bs | V | q | a | s | fe | •5* | q | q | q | q | q | bs | to | fe | a | ||
| q | £ | >4 | q | > | a | q | >- | #ĎS | q | «; | q | q | > | ta | k« | q | |
| q | q | q | x | q | 0 | q | b> | q | tu | cí | 0 | to | |||||
| 2 | tu | q | tu | to | q | Jo | Jo | q | q | •X | X | X | ta | 2 | |||
| 2 | G | co | K | ? | cu | q | 3; | q | s | 2d | z: | U3 | to | cu | ah* | ||
| w | *~ | q | q | q | o | tu | > | q | g | Ss | to | tc | a | q | 5 | ||
| q | q | q | q | q | to | X | q | z | 3 | q | bd | 55 | 0 | Cd | |||
| >4 | (J | 2 | q | q | q | q | Q | υ | SX | q | q | q | 7-7 | u | CU | ||
| 2 | q | tr> | to | q | 0 | to | H | ς> | q | Q | *> | tu | tu | 0 | |||
| H4 | tu | δ | u | bs | u | q | to | s | q | q | q | q | q | to | Cd | ||
| es | >4 | ►4 | 2 | σ | q | es | U| | q | jo | 2 | ta | « | |||||
| ·> ·» | q | <0 | G | fe | q | q | u | q | es | q | to | 2 | q | Cu | 2 | X | |
| q | to | — | Cu | 0 | X | <0 | 2 | v. ·-» | q | q | q | q | q | ►d | |||
| o | tu | g | q | £ | c q | q | q | q | <a | •C | X | bS | •4 | ||||
| q | H | to | O | j> | q | q | c | q | Jo | > | e; | to | q | tu | σ | e: | |
| ϋ ω | bS | q | q | cu | X | >4 | > | H | q | q | >4 | ||||||
| tu | q | 0 | q | tu | 2 | q | £ | υ | fe | q | s* | >* | y | O | |||
| > | q | to | to | σ | o | q | řr | ’Q | q | P | q | Cí | 2 | ||||
| o | Q | q | σ | X | q | q | q | q | 5 | 0 | co | é | |||||
| o | H | s«s | q | bí | q | 0 | q | q | H | 0 | Q | q | g | ϋ | *r* | ||
| & | o | q | tu | q | σ | T | q | q | ta | q | h4 | 2 | tu | ||||
| M | O | tu | q | w | q | C | q | q | H | -O | q | G | tu | G | w | ||
| iU | O | •xí | •4 | q | q | £ | 5 | P | ta | p | q | p | > | Q | to | ||
| q | > | q | >4 | tu | to | 0 | > | H | P | q | P | q | O | P | |||
| W | H | Cu | 0 | q | q | fe | q | to | q | > | tu | ||||||
| y | Ξ | p. | > | g | s | Jo | q | es | P | q | to | eu | to | ||||
| W | δ | id | J> | to | a | P | q | q | q | q | q | H | q | ||||
| CU | q | δ | [4 | K | > | 2 | tu | q | SX | q | co | q | Ξ | ||||
| Cu | >4 | a | s | tu | bS | a | q | .u | H | Q | p | q | G | ·-» | q | 10 | |
| 10 | tu | qw | to | q | q | q | 0 | to | q | P | q | ®3 | H | X | |||
| O | »4 | o | ofl | tu | 2 | £ | q | a | q | P | p | q | q | 2 | P | q | |
| 2 | ¢0 | >< | < | 0 | Cd | E-· | q | to | Ό | to | to | q | eo | H | >< | q | |
| q | H | ^4 | τ—1 | rU | tH | q | r4 | q | q | q | ►i | q | q | q | q | ||
| CM | « | «»· | o | UJ | CM | 0 | O | to | S< | co | 0 | to | CM | <0 | X» | ||
| q | CJ | n | CO | •n· | tn | kj | to | h> | q | <0 | ©v | co | 0 | 0 | q | ||
| q | q | q |
SUBSTITUTE SHEET (RULF
WO 95/35024
PCT/US95/07754
TABLE 7C
Cu ca ta ta υ
o ►3
U
| Γ- Η r. | H > | (U | 31 ta 31 2« | |||||||||||||
| O· & | .2 | Cu | 31 | ca ta · | cu | |||||||||||
| Ol | « | O | cu cA | Ou | ||||||||||||
| ►3 | £ υ | 3t *4 | 31 | Cu | O | 31 | 31 iA | ►ú | 31 | 31 | n w | a | 31 | |||
| CA | u o « F „ W | W> CA | 01 U | Cu CA | > | a H | _ | O F F > | ►ú | 1 1 | F F | a 1 | 1 1 1 o | 1 o | 1 u | |
| ►3 | tu ÍJ 31 | w ť | >3 | 31 | O | 31 | u | 31 31 · | ►ú | 31 | 31 | 1 | 31 01 | 1 | 01 | |
| 01 | q2 oí | 2 | W | o | Cu | ca >· | ►3 | 1 | 1 | .1 31 | a | 31 | ||||
| 2 | cu Ξ o | O « | Ol | 31 | 2 | 2 | σ ~ | 2 | 2 | 1 | 2 1 | 1 | 1 | |||
| F > O | tn 2 | υ | F | Cu | υ | 2 | O M | 1 | 1 | = | 1 2 | 2 | 25 | |||
| j- | CA M « | O 2 | u | O | o | >· | ci | Q Cu | 1 | 01 | 1 | 01 1 | 1 | 1 | ||
| CA | F W P· 33 3 | oa | 01 | 01 | ci | 01 | 01 | ta ta | 31 | 31 | 1 | 31 1 | 1 | 1 | ||
| ►3 | 2 3t | > | •A | Cu | 31 | 31 | 31 31 | ►ú | »4 | 1 | 1 | a | a 31 | 34 | 31 | |
| O | 5 5 u | ·—· jJ | Ol | a | 2 | Q | Q < | 31 | 31 | 1 | 31 1 | 1 | 1 | |||
| >3 | 2 01 oí U <3 | 31 | Cu | ►3 | 31 | 31 | 31 2 | ►ú | ►4 | 1 | t | 31 | 1 31 | 34 | 31 | |
| 2 O > | O « t_i e_« | 01 | > | >-U | >< | 2 | Ol 2 | 1 | 01 | 1 | 1 I | 1 | Ol | |||
| > | οι >> ω | ta £ | > | ci | w | ω | σ o | 31 | 31 | 1 | 31 1 | 1 | I | |||
| 31 | >3 >3 >3 | CU 2 | 31 | 31 | 31 | 31 | 31 | 31 o | ►Ú | »3 | — | 1 | 31 | 1 31 | 31 | 31 |
| 2 | ta F | Ol | «*· | ta | Ol | Ol | < > | 1 | 1 | 1 | cu | I 1 | 1 | 1 | ||
| ta | O 2 | 2 * | X | a | 2 | Ol | O 2 | 1 | 1 | 1 | 31 | 31 1 | 1 | 1 | ||
| »3 | h > tn | ca f | ►3 31 (3 31 | 31 | 31 34 | »4 | >3 | 2 | 1 | 1 31 | 31 | 1 | ||||
| ca >· ω | o a ca | a | 0£ | O] | .či ta | I | 1 | 1 | 1.. 1 | 1 | 1 | |||||
| W | ci ω > >· tu | u | o | H | « | O | fč 2 | J | 1 | Cu | 31 | tu 1 | 1 | 1 | ||
| tu | 31 31 2 | H H | w | H | H | ω | H | H 31 | ti | ti | 31 | 31 | 1 34 | 31 | H | |
| F | > | oi | cn | ω | cn | ca | cn tú | 1 | I | 1 | O | 1 1 | 1 | |||
| gen | Ol 2 υ | M 01 | cn | w | on | > | ta | tn 04 | I | s | 1 | 1 | 1 1 | 1 | ||
| tnF | &t dt Cu | CU CU | 04 | CU | 04 | Cit | cu | fU fU | tu | 04 | CU | Cu | cu cu | |||
| X | tí •H | |||||||||||||||
| 0 | Λ | +1 | ||||||||||||||
| tí | rl | Λ | A | H |
>1H O H •ti o »4 F ta ta o tn X M Λ >4 O CA
H
K
F
WO 95/35024
TABLE 7B
| i 1-1 | υ < j | «4 *5 1 | |
| σ σ x | » g g[ | Itf trf | |
| Cm Cm > | ď ωΓ5Γ | < 1 1 |
| t- 1 1 ití 1 1 | A. | cn | z |
| k | tx | ω| | |
| d |to cn| | u | > | = |
E- O O
| OJ Μ H, Q QfZ | • f-M li C- |<r=i > |
| 1 (Z1 U | < fo, P« |
| q |w | ω | |Ξ ] č| x |
| 7Π > ►= | 1-qTZ |
| uť > ,4 | <1 d d |
| H W > | Γμ >4 > |
| > | |=c ϋ d |
| m a x | Z 1 1 |
PCT/XJS95/07754
U X I d σι cu
| Lu ΪΠ | >4 M | |
| M | H | |
| Cm | ÍM | >· |
| > | * | -i |
| Q | O | o |
| Cu | íh | |
| cn | X | H |
| 1 | 1« |
- «71 PŘÍKLAD 6
Tento příklad popisuje izolaci genomových N genových ekvencí.
K vytvoření genomové knihovny byly DNA připravené z í.glútinosa částečně tráveny Mbol a frakcionovány podle relíkosti na gelové elektroforese. DNA fragmenty >12 kb byly igovány do BamHI, tráveny, defosforylovány pomocí >akteriofágu lambda Gem-11 (Promega). Ligace byly packaged ligapack II Gold packaging extrakty (Stratagene, La Jolla, CA) a 1 x 106 plaky formujících jednotek bylo plátováno na SURE E.coli hostitelském kmenu koupeného od GIBCO, BRL., Gaithersburg, MD)
K izolování genomové sekvence N genu byla bakteriofág lambda knihovna Mbol rozrušené DNA N.glutinosa vyšetřována probami N-5 a N-9 (nukleotidy 695-1090 C7). Byly purifikovány tři klony, které hybridizovaly jak na N-5, tak na N-9. Tyto klony (G25, G34 a G38) byly restrikčně mapovány EcoRi, BamHI, a Xhol a charakterizovány Southern analýzou (Obr. 4B). Bylo určeno, že tři klony přesahují a obsahují celý genomový N gen. G34 má o 1.4 kb více DNA upstream od N genu než G38, zatímco G38 je o 5.4 kb delší na 3-konci N genu. Sekvence klonu G25 byla obsažena v G38 klonu.
PŘÍKLAD 7
Tento příklad popisuje citlivé nebo mutantní rostliny transformované genomovým N gen klonem, jehož rostliny byly resistentní na TMV.
SRÍ tabák a TMV sensitivní rostliny F501-48 a F501-64 nesoucí germinální Ac excise byly transformovány buď pTG34 nebo pTG38. pTG34 a pTG38 byly konstruovány subklonováním 12.0 kb nebo 10.6 kb Xhol fragmentu z přesahujících DNA klonů G34 nebo G38 do T-DNA vektoru, pOCA28 (Olscewski et al., Nucleic Acids Researh 16:10765-10781 (1988)), který byl linearizován
WO 95/35024
PCT/US95/07754
| ATG | CAT | TCT | TTG | CAA | AAT | GCC | CTT | CTC | TCT | GAA | cn | nA | AGG | GAA | AAA | 1345 |
| Met | His | Ser | Leu | Gin | Asn | Ala | Leu | Leu | Ser | Glu | Leu | Leu | Arg | Glu | Lys | |
| 260 | 265 | 270 | ||||||||||||||
| GCT | AAT | TAC | AAT | AAT | GAG | GAG | GAT | GGA | AAG | CAC | CAA | ATG | GCT | AGT | AGA | 1393 |
| Ala | Asn | Tyr | Asn | Asn | Glu | Glu | Asp | Gly | Lys | His | Gin | Met | Ala | Ser | Arg | |
| 275 | 280 | 285 | 290 | |||||||||||||
| CTT | CGT | TCG | AAG | AAG | GTC | CTA | ATT | GTG | cn | GAT | GAT | ATA | GAT | AAT | AAA | 1441 |
| Leu | Arg | Ser | Lys | Lys | Val | Leu | Ile | Val | Leu | Asp | Asp | Ile | Asp | Asn | Lys | |
| • | 295 | 300 | 305 | |||||||||||||
| GAT | CAT | TAT | TTG | GAG | TAT | TTA | GCA | GGT | GAT | cn | GAT | TGG | τη | GGT | AAT | 1489 |
| Asp | His | Tyr | Leu | Glu | Tyr | Leu | Ala | Gly | Asp | Leu | Asp | Trp | Phe | Gly | Asn | |
| 310 | 315 | 320 | ||||||||||||||
| GGT | AGT | AGA | ATT | ATT | ATA | ACA | ACT | AGA | GAC | AAG | CAT | nc | ATA | GAG | AAG | 1537 |
| Gly | Ser | Arg | Ile | Ile | Ile | Thr | Thr | Arg | Asp | Lys | His | Leu | Ile | Glu | Lys | |
| 325 | 330 | 335 | ||||||||||||||
| AAT | GAT | ATA | ATA | TAT | GAG | GTG | ACT | GCA | CTA | CCC | GAT | CAT | GAA | TCC | An | 1585 |
| Asn | Asp | Ile | Ile | Tyr | Glu | Val | Thr | Ala | Leu | Pro | Asp | His | Glu | Ser | Ile | |
| 340 | 345 | 350 | ||||||||||||||
| CAA | HG | nc | AAA | CAA | CAT | GCT | nc | GGA | AAA | GAA | Gn | CCA | AAT | GAG | AAT | .1633 |
| Gin | Leu | Phe | Lys | Gin | His | Ala | Phe | Gly | Lys | Glu | Val | Pro | Asn | Glu | Asn | |
| 355 | 360 | 365 | 370 | |||||||||||||
| TTT | GAG | AAG | CTT | TCA | TTA | GAG | GTA | GTA | AAT | TAT | GCT | AAA | GGC | cn | CCT | 1681 |
| Phe | Glu | Lys | Leu | Ser | Leu | Glu | Val | Val | Asn | Tyr | Ala | Lys | Gly | Leu | Pro | |
| 375 | 380 | 385 | ||||||||||||||
| TTA | GCC | CTC | AAA | GTG | TGG | GGT | TCT | nG | CTG | CAT | AAC | CTA | CGA | nA | ACT | 1729 |
| Leu | Ala | Leu | Lys | Val | Trp | Gly | Ser | Leu | Leu | His | Asn | Leu | Arg | Leu | Thr | |
| 390 | 395 | 400 | ||||||||||||||
| GAA | TGG | AAA | AGT | GCT | ATA | GAG | CAC | ATG | AAA | AAT | AAC | TCT | TAT | TCT | GGA | 1777 |
| Glu | Trp | Lys | Ser | Ala | Ile | Glu | His | Met | Lys | Asn | Asn | Ser | Tyr | Ser | Gly | |
| 405 | 410 | 415 | ||||||||||||||
| ATT | ATT | GAT | AAG | CTC | AAA | ATA | AGT | TAT | GAT | GGA | TO | GAG | CCC | AAA | CAA | 1825 |
| Ile | Ile | Asp | Lys | Leu | Lys | Ile | Ser | Tyr | Asp | Gly | Leu | Glu | Pro | Lys | Gin | |
| 42Q | 425 | 430 | ||||||||||||||
| CAA | GAG | ATG | TTT | HA | GAT | ATA | GCA' | TGC | nc | nG | CGA | GGG | GAA | GAA | AAA | 1873 |
| Gin | Glu | Met | Phe | Leu | Asp | Ile | Ala | Cys | Phe | Leu | Arg | Gly | Glu | Glu | Lys | |
| 435 | 440 | 445 | 450 | |||||||||||||
| GAT | TAC | ATC | CTA | CAA | ATC | CTT | GAG | AGT | TGT | CAT | An | GGA | GCT | GAA | TAC | 1921 |
| Asp | Tyr | Ile | Leu | Gin 455 | Ile | Leu | Glu | Ser | Cys 460 | His | Ile | Gly | Ala | Glu 465 | Tyr | |
| GGG | TTA | CGT | ATT | TTA | ATT | GAC | AAA | TCT | cn | GTG | nc | ATC | TCT | GAA | TAT | 1969 |
| Gly | Leu | Arg | Ile | Leu | Ile | Asp | Lys | Ser | Leu | Val | Phe | Ile | Ser | Glu | Tyr | |
| 470 | 475 | 480 |
WO 95/35024
PCT/US95/07754
| ATT TTA lle Leu | CGA Arg | CCT CCG TCT TCC ATC ATA CGC TTG AAC AAA CTT ATA ATC | 5616 | |||||||||||||
| Pro Pro Ser Ser lle lle Arg | Leu Asn | Lys | Leu | lle 810 | lle | |||||||||||
| 800 | . 805 | |||||||||||||||
| TTG | ATG | TTT | CGA | GGC | TTC | AAA | GAT | GGA | GTG | CAC | TH | GAG | HC | CCT | CCT | 5664 |
| Leu | Met | Phe | Arg | Gly | Phe | Lys Asp | Gly | Val | His | Phe | Glu | Phe | Pro | Pro | ||
| 815 | 820 | 825 | ||||||||||||||
| GTG | GCT | GAA | GGA' TTA | CAC | TCA TTG | GAA | TAT | CTG | AAT | CTC | AGT TAC | TGC | 5712 | |||
| Val | Ala | Glu | Gly Leu | His | Ser | Leu | Glu | Tyr | Leu | Asn | Leu | Ser | Tyr Cys | |||
| 830 | 835 | 840 | ||||||||||||||
| AAT | CTA ATA | GAT GGA | GGA | CTT | CCG | GAA | GAG | AH | GGA | TCC | HA | TCC TCT | 5760 | |||
| Asn | Leu | lle Asp Gly Gly | Leu | Pro | Glu | Glu | lle | Gly | Ser | Leu | Ser Ser | |||||
| - | 845 | 850 | 855 | |||||||||||||
| TTG | AAA | AAG | TTG | GAT | CTC | AGT AGA | AAT | AAT | TH | GAG | CAT | HG | CCT TCA | 5808 | ||
| Leu | Lys | Lys | Leu | Asp | Leu | Ser | Arg | Asn | Asn | Phe | Glu | His | Leu | Pro | Ser | |
| 860 | 865 | 870 | 875 | |||||||||||||
| AGT | ATA | GCC | CAA | CH | GGT | GCT | CH | CAA TCC | HA | GAC | HA | AAA | GAT TGC | 5856 | ||
| Ser | lle | Ala | Gin | Leu | Gly Ala | Leu | Gin | Ser | Leu | Asp | Leu | Lys Asp | Cys | |||
| 880 | 885 | 890 | ||||||||||||||
| CAG | AGG | CTT | ACA | CAG | CTA | CCA | GAA | CH | CCC | CCA | GAA | HA | AAT | GAA | HG | 59.04 |
| Gin | Arg | Leu | Thr | Gin | Leu | Pro | Glu | Leu | Pro | Pro | Glu | Leu | Asn | Glu | Leu | |
| 895 | 900 | 905 | ||||||||||||||
| CAT | GTA | GAT | TGT | CAT ATG | GCT | CTG | AAA | TTT | ATC | CAT TAT | HA | GTA | ACA | 5952 | ||
| His | Val | Asp | Cys | His | Met | Ala | Leu | Lys | Phe | lle | His | Tyr | Leu | Val | Thr | |
| 910 | 915 | 920 | ||||||||||||||
| AAG | AGA | AAG | AAA | CTA | CAT AGA | GTG | AAA | CH | GAT | GAT | GCA | CAC | AAT | GAT | 6000 | |
| Lys Arg | Lys | Lys | Leu | His | Arg | Val | Lys | Leu | Asp Asp | Ala | His | Asn | Asp | |||
| 925 | 930 | 935 | ||||||||||||||
| ACT ATG | TAC | AAT | HG | TTT | GCA | TAT | ACC | ATG | HT | CAG | AAT | ATC TCT | TCC | 6048 | ||
| Thr | Met | Tyr | Asn | Leu | Phe | Ala | Tyr | Thr | Met | Phe | Gin | Asn | lle | Ser | Ser | |
| 940 | 945 | 950 | 955 | |||||||||||||
| - ATG | AGG | CAT | GAC | ATC | TCT | GCT | TCA | GAT | TCC | HG | TCA | CTA | ACA | GTA TH | 6096 | |
| Met | Arg | His | Asp | lle | Ser | Ala | Ser Asp | Ser | Leu | Ser | Leu | Thr | Val | Phe | ||
| - | 960 | 965 | 970 | — | ||||||||||||
| ACC | GGT | CAA | CCG | TAT | CCT | GAA AAG, ATC | CCG | AGT | TGG | HC | CAC | CAT | CAG | 6144 | ||
| Thr | Gly | Gin | Pro | Tyr. | Pro | Glu | Lys lle | Pro | Ser | Trp | Phe | His | His | Gin | ||
| 975 | 980 | 985 | ||||||||||||||
| GGT | TGG | GAT AGT AGT | GTA TCA | GTC AAT TTG | CCT | GAA AAT TGG TAT ATA | 6192 | |||||||||
| Gly | Trp Asp | Ser | Ser | Val | Ser | Val | Asn | Leu | Pro | Glu Asn Trp Tyr lle | ||||||
| 990 | 995 | 1000 | ||||||||||||||
| CCT | GAT AAA | TTC | TTG | GGA | TTT | GCT | GTA | TGT TAC TCT CGT AGC HA AH | 6240 | |||||||
| Pro | Asp Lys | Phe | Leu | Gly | Phe Ala | Val | Cys Tyr Ser Arg Ser Leu | lle | ||||||||
| 1005 | 1010 | 1015 |
r*i incriTi nrr pi ir
WO 95/35024
PCT/US95/07754
| GAC ACA Asp Thr 1020 | ACA GCT CAC TTG ATT CCC GTA TGT GAT GAC AAG ATG TCG CGC | ||||
| Thr Ala | His | Leu Ile Pro Val Cys Asp Asp Lys Met Ser Aro | |||
| 1025 | 1030 | 1035 | |||
| ATG ACC | CAG AAA | cn | GCC TTA TCA | GAA TGT GAT ACA | GAA TCA TCC AAC |
| Met Thr | Gin Lys | Leu | Ala Leu Ser | Glu Cys Asp Thr | Glu Ser Ser Asn |
| 1040 | 1045 | 1050 | |||
| TAT TCA | GAA TGG GAT | ATA CAT TTT TTC TTT GTA CCT | TTT GCT GGC TTA | ||
| Tyr Ser | Glu Trp Asp | Ile His Phe | Phe Phe Val Pro | Phe Ala Gly Leu | |
| 1055 | 1060 | 1065 | |||
| . TGG GAT | ACA TCT AAG | GCA AAT GGA AAA ACA CCA AAT | GAT TAT GGG ATT | ||
| Trp Asp | Thr Ser | Lys | Ala Asn Gly Lys Thr Pro Asn | Asp Tyr Gly Ile | |
| 1070 | 1075 | 1080 | |||
| ATT AGG | CTA TCT | TTT TCT GGA GAA GAG AAG ATG TAT | GGA CH CGT nG | ||
| Ile Arg | Leu Ser | Phe | Ser Gly Glu | Glu Lys Met Tyr | Gly Leu Arg Leu |
| 1085 | 1090 | 1095 | |||
| TTG TAT | AAA GAA | GGA | CCA GAG GTT AAT GCC TTG TTA | CAA ATG AGG GAA | |
| Leu Tyr | Lys Glu | Gly | Pro Glu Val | Asn Ala Leu Leu | Gin Met Arg Glu |
| 1100 | 1105 | 1110 | 1115 | ||
| AAT AGC | AAT GAA | CCA ACA GAA CAT | TCC ACT GGG ATA | AGG AGG ACT CAA | |
| Asn Ser | Asn Glu | Pro Thr Glu His | Ser Thr Gly Ile Arg Arg Thr Gin | ||
| 1120 | 1125 | 1130 | |||
| TAT AAC | AAC AGA | ACT TCC TTT TAT | GTAAGTCTCT ACTTCTATTA GCTACAAAGT | ||
| Tyr Asn | Asn Arg | Thr Ser Phe Tyr | |||
| 1135 |
CTTCTTCCAA AATCAATACT CCATCCGTTC CAGTTTATGT GAACCTATTT TTTGTTCGTC CATTCTAAAA AGAATGACCC CTTTCTAAAT HGGAAATAA TTTTGGnAA AOTATAAn
CTACCATTAA CGAGAAGCH KATAACCAC ACAAATATTC TGGGGCCCK TTTGAATTGT . TTAGGACCAT AAATTCCAAA AGTCCTCAK TTTTCnAAA CTCCGTGCCC AATCAAACAA
GTTCACGTAA AKGGAACGG AGGGAATATA ITTTTTCTTC TCAKCTÍTT CCCCTATTTA
CAG GAG CTC ATC AAT GGG TGATGTACAT ATCAACAACG AGTTTTAAAG Glu Leu Ile Asn Gly 1140 114
GATTCCAACA AGTATAACTT TTTATGCTCA AATCAGCTCC TTGTATTGTG GAGAAAGCTG AGTACGAGAT GAAGTTGACG TCCGTTATCC TTTATGATCT CTCTGTTCTT TGTGTTAACT TGCCTACTTC ATCAGATGAA TAACAGAAGC CCGTTCCTCT CATTCTCAAC ACTGTTTGCA CGTCTGTTGT TACTTGTTAA AATGGATCTT GATAAAGTAA TAACATCTCT ATATTACTTA TAAGTGGTTT TAACAAGTTC ACTCTTTTGC TTTTGCAGTT CAAATGGGAA CACAATGTAT AHGAGAACT AGAACAATGA CACTGCATAT ATATATATAT ATGTATGTAT GTAAHCTCG
6288
6336
6384
6432
6480
6528
6576
6630
6690
6750
6810
6870
6930
6978
7038
7098
7158
7218
7278
7338
WO 95/35024 PCI7US95/07754
TCTTTTGGAC TAGAATACCT TGTTTCATTA T6AAATGAAT TAACATCTTC GCCTTTGCTG 7398
AC
7400
WO 95/35024
PCT/US95/07754
| Gly Arg Ser Ser | Thr His 565 | Tyr Ala Ile Asp 570 | Tyr Leu Pro Asn | Asn Leu 575 | |||||||||||
| Arg | Cys | Phe | Val | Cys | Thr | Asn | Tyr | Pro | Trp | Glu | Ser | ' Phe | : Pro | Ser | Thr |
| 580 | 585 | 590 | |||||||||||||
| Phe | Glu | Leu | Lys | Het | Leu | Val | His | Leu | Gin | Leu | Arg | His | Asn | Ser | Leu |
| 595 | • | 600 | 605 | ||||||||||||
| Ai*g | His | Leu | Trp | Thr | Glu | Thr | Lys | His | Leu | Pro | Ser | Leu | Arg Arg | Ile | |
| 610 | 615 | 620 | |||||||||||||
| Asp | Leu | Ser | Trp | Ser | Lys Arg | Leu | Thr | Arg | Thr | Pro | Asp | Phe | Thr | Gly | |
| 625 | 630 | 635 | 640 | ||||||||||||
| Het | Pro | Asn | Leu | Glu | Tyr | Val | Asn | Leu | Tyr | Gin | Cys | Ser | Asn | Leu | Glu |
| 645 | 650 | 655 | |||||||||||||
| Glu | Val | His | His | Ser | Leu | Gly Cys Cys | Ser | Lys | Val | Ile | Gly | Leu | Tyr | ||
| 660 | 665 | 670 | |||||||||||||
| Leu | Asn | Asp Cys | Lys | Ser | Leu | Lys Arg | Phe | Pro | Cys | Val | Asn | Val | Glu | ||
| 675 | 680 | 685 | |||||||||||||
| Ser | Leu | Glu | Tyr | Leu | Gly | Leu | Arg | Ser | Cys | Asp | Ser | Leu | Glu | Lys | Leu |
| 690 | 695 | 700 | |||||||||||||
| Pro | Glu | Ile | Tyr Gly Arg | Het | Lys | Pro | Glu | Ile | Gin | Ile | His | Het | Gin | ||
| 705 | 710 | 715 | 720 | ||||||||||||
| Gly | Ser | Gly | Ile | Arg | Glu | Leu | Pro | Ser | Ser | Ile | Phe | Gin | Tyr Lys | Thr | |
| 725 | 730 | 735 | |||||||||||||
| His | Val | Thr | Lys | Leu | Leu | Leu | Trp | Asn | Het | Lys | Asn | Leu | Val | Ala | Leu |
| 740 | 745 | 750 | |||||||||||||
| Pro | Ser | Ser | Ile | Cys Arg | Leu | Lys | Ser | Leu | Val | Ser | Leu | Ser | Val | Ser | |
| 755 | 760 | 765 | |||||||||||||
| Gly Cys | Ser | Lys | Leu Glu | Ser | Leu | Pro | Glu | Glu | Ile | Gly Asp | Leu | Asp | |||
| 770 | 775 | 780 | |||||||||||||
| Asn | Leu | Arg | Val | Phe Asp Ala | Ser Asp | Thr | Leu | Ile | Leu | Arg | Pro | Pro | |||
| 785 | 790 | • | « | 795 | 800 | ||||||||||
| Ser | Ser | Ile | Ile | Arg | Leu | Asn | Lys | Leu | Ile | Ile | Leu | Het | Phe Arg Gly | ||
| 805 | 810 | 815 | |||||||||||||
| Phe | Lys Asp Gly | Val | His | Phe | Glu | Phe | Pro | Pro | Val | Ala | Glu Gly Leu | ||||
| 820 | 825 | 830 | |||||||||||||
| His | Ser | Leu | Glu | Tyr | Leu | Asn | Leu | Ser | Tyr Cys | Asn | Leu | Ile Asp Gly | |||
| 835 | 840 | 845 | |||||||||||||
| Gly | Leu | Pro | Glu | Glu | Ile | Gly | Ser | Leu | Ser Ser | Leu | Lys | Lys Leu Asp | |||
| 850 | 855 | 860 |
WO 95/35024
PCT/US95/07754
| Leu Ser Arg Asn 865 | Asn | Phe 870 | Glu | His | Leu Pro Ser Ser Ile Ala Gin Leu | |
| 875 | 880 | |||||
| Gly Ala Leu Gin | Ser | Leu | Asp | Leu | Lys Asp Cys | Gin Arg Leu Thr Gin |
| 885 | 890 | . 895 | ||||
| Leu Pro Glu Leu | Pro | Pro | Glu | Leu | Asn Glu Leu | His Val Asp Cys His |
| 900 | 905 | 910 | ||||
| Het Ala Leu Lys | Phe | Ile | His | Tyr | Leu Val Thr | Lys Arg Lys Lys Leu |
| 915 | 920 | 925 | ||||
| His Arg Val Lys | Leu. | Asp Asp | Ala | His Asn Asp | Thr Het Tyr Asn Leu | |
| 930 | 935 | 940 | ||||
| Phe Ala Tyr Thr | Het | Phe | Gin | Asn | Ile Ser Ser | Het Arg His Asp Ile |
| 945 | 950 | 955 | 960 | |||
| Ser Ala Ser Asp | Ser | Leu | Ser | Leu | Thr Val Phe | Thr Gly Gin Pro Tyr |
| 965 | 970 | 975 | ||||
| Pro Glu Lys Ile | Pro | Ser | Trp | Phe | His His Gin | Gly Trp Asp Ser Ser |
| 980 | 985 | 990 | ||||
| Val Ser Val Asn | Leu | Pro | Glu | Asn | Trp Tyr Ile | Pro Asp Lys Phe Leu |
| 995 | 1000 | 1005 | ||||
| Gly Phe Ala Val | Cys Tyr | Ser | Arg | Ser Leu Ile | Asp Thr Thr Ala His | |
| 1010 | 1015 | 1020 | ||||
| Leu Ile Pro Val | Cys Asp Asp | Lys | Het Ser Arg | Het Thr Gin Lys Leu | ||
| 1025 | 1030 | 1035 1040 | ||||
| Ala Leu Ser Glu | Cys Asp | Thr | Glu | Ser Ser Asn | Tyr Ser Glu Trp Asp | |
| 1045 . | 1050 | 1055 | ||||
| Ile His Phe Phe | Phe | Val | Pro | Phe Ala Gly Leu | Trp Asp Thr Ser Lys | |
| 1060 | 1065 | 1070 | ||||
| Ala Asn Gly Lys | Thr | Pro | Asn | Asp Tyr Gly Ile | Ile Arg Leu Ser Phe | |
| 1075 | 1080 | : 1085 | ||||
| Ser Gly. Glu Glu | Lys | Het | Tyr | Gly Leu Arg Leu | Leu Tyr Lys Glu Gly | |
| • 1090 | 1095 | 1100 | ||||
| Pro Glu Val Asn | Ala | Leu | Leu | Gin Het Arg Glu | Asn Ser Asn Glu Pro | |
| 1105 | 1110 | 1115 1120 | ||||
| Thr Glu HisSer | Thr Gly Ile Arg Arg Thr Gin Tyr Asn Asn Arg Thr | |||||
| 1125 | 1130 | 1135 |
Ser Phe Tyr Glu Leu Ile Asn Gly 1140
WO 95/35024
PCT/TJS95/07754
| ha | AAT | GAA | GCG | GCC | AAT | CTC | AAA | GGC | TCC | TGT | GAI | ' AAT | CGT GAC | : AAG | 539 |
| Leu | Asn | Glu | Ala | Ala | Asn | Leu | Lys | Gly | Ser | Cys | Asp | i Asn | Arg Asp | i Lys | |
| 145 | 150 | 155 | 160 | ||||||||||||
| ACT | GAT | GCA | GAC | TGT | ATT | CGA | CAG | AH | GH | GAC | CAA | , ATC | TCA TCC | AAA | 587 |
| Thr | Asp | Ala | Asp | Cys | lle | Arg | Gin | lle | Val | Asp | Gin | lle | Ser Ser | Lys | |
| 165 | 170 | 175 | |||||||||||||
| TTA | TGC | AAG | ATT | TCT | HA | TCT | TAT | HG | CAA | AAC | AH | GH | GGA ATA | GAT | 635 |
| Leu | Cys | Lys | lle | Ser | Leu | Ser | Tyr | Leu | Gin | Asn | lle | Val | Gly lle | Asp | |
| 180 | 185 | 190 | |||||||||||||
| ACT | CAT | TTA | GAG | AAA | ATA | GAA | TCC | HA | CTA | GAG | ATA | GGA | ATC AAT | GGT | 683 |
| Thr | His | Leu | Glu | Lys | lle | Glu | Ser | Leu | Leu | Glu | lle | Gly | lle Asn | Gly | |
| 195 | 200 | 205 | |||||||||||||
| GTT | CGG | ATT | ATG | GGG | ATC | TGG | GGA | ATG | GGG | GGA | GTC | GGT | AAA ACA | ACA | 731 |
| Val | Arg | lle | Met | Gly | lle | Trp | Gly | Met | Gly | Gly | Val | Gly | Lys Thr | Thr | |
| 210 | 215 | 220 | |||||||||||||
| ATA | GCA | AGA | GCT | ATA | ITT | GAT | ACT | CH | HA | GGA | AGA | ATG | GAT AGT | TCC | 779 |
| lle | Ala | Arg | Ala | lle | Phe | Asp | Thr | Leu | Leu | Gly | Arg | Met | Asp Ser | Ser | |
| 225 | 230 | 235 | 240 | ||||||||||||
| TAT | CAA | TTT | GAT | GGT | GCT | TGT | HC | CH | AAG | GAT | AH | AAA | GAA AAC | AAA | 827 |
| Tyr | Gin | Phe | Asp | Gly | Ala | Cys | Phe | Leu | Lys | Asp | lle | Lys | Glu Asn | Lys | |
| 245 | 250 | 255 | |||||||||||||
| CGT | GGA | ATG | CAT | TCT | HG | CAA | AAT | GCC | CH | CTC | TCT | GAA | CH HA | AGG | 875 |
| Arg | Gly | Met | His | Ser | Leu | Gin | Asn | Ala | Leu | Leu | Ser | Glu | Leu Leu | Arg | |
| 260 | 265 | 270 | |||||||||||||
| GAA | AAA | GCT | AAT | TAC | AAT | AAT | GAG | GAG | GAT | GGA | AAG | CAC | CAA ATG | GCT | 923 |
| Glu | Lys | Ala | Asn | Tyr | Asn | Asn | Glu | Glu | Asp | Gly | Lys | His | Gin Met | Ala | |
| 275 | 280 | 285 | |||||||||||||
| AGT | AGA | CTT | CGT | TCG | AAG | AAG | GTC | CTA | AH | GTG | CH | GAT | GAT ATA | GAT | 971 |
| Ser | Arg | Leu | Arg | Ser | Lys | Lys | Val | Leu | lle | Val | Leu | Asp | Asp lle | Asp | |
| 290 | 295 | 300 | |||||||||||||
| AAT | AAA | GAT | CAT | TAT | HG | GAG | TAT | HA | GCA | GGT | GAT | CH | GAT TGG | TH | 1019 |
| Asn | Lys | Asp | His | Tyr | Leu | Glu | Tyr | Leu | Ala | Gly | Asp | Leu | Asp Trp | Phe | |
| 305 | 310 | - | 315 | 320 | |||||||||||
| GGT | AAT | GGT | AGT | AGA | AH | AH | ATA' | ACA | ACT | AGA | GAC | AAG | CAT HG | ATA | 1067 |
| Gly | Asn | Gly | Ser | Arg | lle | lle | lle | Thr | Thr | Arg | Asp | Lys | His Leu | lle | |
| 325 | 330 | 335 | |||||||||||||
| GAG | AAG | AAT | GAT | ATA | ATA | TAT | GAG | GTG | ACT | GCA | CTA | CCC | GAT CAT | GAA | 1115 |
| Glu | Lys | Asn | Asp | lle | lle | Tyr | Glu | Val | Thr | Ala | Leu | Pro | Asp His | Glu | |
| 340 | 345 | 350 | |||||||||||||
| TCC | ATT | CAA | TTG | TTC | AAA | CAA | CAT | GCT | HC | GGA | AAA | GAA | GH CCA | AAT | 1163 |
| Ser | lle | Gin | Leu | Phe | Lys | Gin | His | Ala | Phe | Gly | Lys | Glu | Val Pro . | Asn | |
| 355 | 360 | 365 |
ITE SHEET (RULL2
WO 95/35024
PCIYUS95/07754
| GAG | AAT | T77 | GAG | AAG | cn | TCA | nA | , GAG | GTA | GTA | . AAI | ' TAI | ' GCT | AAA | . GGC | 1211 |
| Glu | Asn | Phe | Glu | Lys | Leu | Ser | Leu | Glu | Val | Val | Asn | Tyr | Ala | Lys | Gly | |
| 370 | 375 | 380 | ||||||||||||||
| cn | CCT | TTA | GCC | CTC | AAA | GTG | TGG | GGT | TCT | nG | CTG | CAT | AAC | CTA | CGA | ' 1259 |
| Leu | Pro | Leu | Ala | Leu | Lys | Val | Trp | Gly | Ser | Leu | Leu | His | Asn | Leu | Arg | |
| 385 | 390 | 395 | 400 | |||||||||||||
| ΠΑ | ACT | GAA | TGG | 'AAA | AGT | GCT | ATA | GAG | CAC | ATG | AAA | AAT | AAC | TCT | TAT | 1307 |
| Leu | Thr | Glu | Trp | Lys | Ser | Ala | Ile | Glu | His | Met | Lys | Asn | Asn | Ser | Tyr | |
| 405 | 410 | 415 | ||||||||||||||
| TCT | GGA | ATT | ATT | GAT | AAG | CTC | AAA | ATA | AGT | TAT | GAT | GGA | nA | GAG | CCC | 1355 |
| Ser | Gly | Ile | Ile | Asp | Lys | Leu | Lys | Ile | Ser | Tyr | Asp | Gly | Leu | Glu | Pro | |
| 420 | 425 | 430 | ||||||||||||||
| AAA | CAA | CAA | GAG | ATG | ITT | nA | GAT | ATA | GCA | TGC | nc | ne | CGA | GGG | GAA | 1403 |
| Lys | Gin | Gin | Glu | Met | Phe | Leu | Asp | Ile | Ala | Cys | Phe | Leu | Arg | Gly | Glu | |
| 435 | 440 | 445 | ||||||||||||||
| GAA | AAA | GAT | TAC | ATC | CTA | CAA | ATC | cn | GAG | AGT | TGT | CAT | An | GGA | GCT | 1451 |
| Glu | Lys | Asp | Tyr | Ile | Leu | Gin | Ile | Leu | Glu | Ser | Cys | His | Ile | Gly | Ala | |
| 450 | 455 | 460 | ||||||||||||||
| GAA | TAC | GGG | TTA | CGT | An- | nA | An | GAC | AAA | TCT | cn | GTG | nc | ATC | TCT | 1499 |
| Glu | Tyr | Gly | Leu | Arg | He | Leu | Ile | Asp | Lys | Ser | Leu | Val | Phe | Ile | Ser | |
| 465 | 470 | 475 | 480 | |||||||||||||
| GAA | TAT | AAT | CAG | GTT | CAA | ATG | CAT | GAC | nA | ATA | CAG | GAT | ATG | GGT | AAA | 1547 |
| Glu | Tyr | Asn | Gin | Val | Gin | Met | His | Asp | Leu | Ile | Gin | Asp | Met | Gly | Lys | |
| 485 | 490 | 495 | ||||||||||||||
| TAT | ATA | GTG | AAT | TTT | CAA | AAA | GAT | CCC | GGA | GAA | CGT | AGC | AGA | nA | TGG | 1595 |
| Tyr | Ile | Val | Asn | Phe | Gin | Lys | Asp | Pro | Gly | Glu | Arg | Ser | Arg | Leu | Trp | |
| 500 | 505 | 510 | ||||||||||||||
| CTC | GCC | AAG | GAA | GTC | GAA | GAA | GTG | ATG | AGC | AAC | AAC | ACA | GGG | ACC | ATG | 1643 |
| Leu | Ala | Lys | Glu | Val | Glu | Glu | Val | Met | Ser | Asn | Asn | Thr | Gly | Thr | Met | |
| - | 515 | 520 | 525 | |||||||||||||
| GCA | ATG | GAA | GCA | ATT | TGG | cn | TCT | TCT | TAT | TCT | AGT | ACT | CTA | CGC | τη | 1691 |
| Ala. | Met | Glu | Ala | Ile | Trp | Val | Ser | Ser | Tyr | Ser | Ser | Thr | Leu | Arg | Phe | |
| - | 530 | 535 | • | 540 | ||||||||||||
| AGC | AAT | CAG | GCC | GTG | AAA | AAT | ATG | AAA | AGG | cn | AGG | GTA | ητ | AAC | ATG | 1739 |
| Ser | Asn | Gin | Ala | Val | Lys | Asn | Met | Lys | Arg | Leu | Arg | Val | Phe | Asn | Met | |
| 545 | 550 | 555 | 560 | |||||||||||||
| GGG | AGG | TCG | TCG | ACA | CAT | TAT | GCC | ATC | GAT | TAT | CTG | CCC | AAC | AAC | nc | 1787 |
| Gly | Arg | Ser | Ser | Thr | His | Tyr | Ala | Ile | Asp | Tyr | Leu | Pro | Asn | Asn | Leu | |
| 565 | 570 | 575 | ||||||||||||||
| CGT | TGT | ΊΓΓΤ | GTT | TGC | ACT | AAC | TAT | CCT | TGG | GAG | TCA | ητ | CCA | TCT | ACA | 1835 |
| Arg | Cys | Phe | Val | Cys | Thr | Asn | Tyr | Pro | Trp | Glu | Ser | Phe | Pro | Ser | Thr | |
| 580 | 585 | 590 |
WO 95/35024
PCT/US95/07754
| τη | GAA | CTC | AAA | ATG | cn | cn | CAC | CTC CAA | CTC | CGA | CAC | AAT TC1 | ' CTG | |
| Phe | Glu | Leu | Lys | Met | Leu | Val | His | Leu Gin | Leu | Arg | His | Asr | i Ser | • Leu |
| 595 | 600 | 605 | ||||||||||||
| CGT | CAT | .TTA | TGG | ACA | GAA | ACA | AAG | CAT nG | CCG | TCT | CTA | CGG | í AGG | , ATA |
| Arg | His | Leu | Trp | Thr | Glu | Thr | Lys | His Leu | Pro | Ser | Leu | Arg | 1 Arg | Ile |
| 610 | 615 | 620 | ||||||||||||
| GAT | CTC | AGC | TGG | TCT | AAA | AGA | nG | ACG CGA | ACA | CCA | GAT | nc | ACG | GGG |
| Asp | Leu | Ser | Trp | Ser | Lys | Arg | Leu | Thr Arg | Thr | Pro | Asp | Phe | Thr | Gly |
| 625 | 630 | 635 | 640 | |||||||||||
| ATG | CCA | AAT | TTG | GAG | TAT | GTG | AAT | nG TAT | CAA | TGT | AGT | AAT | cn | GAA |
| Met | Pro | Asn | Leu | Glu | Tyr | Val | Asn | Leu Tyr | Gin | Cys | Ser | Asn | Leu | Glu |
| 645 | 650 | 655 | ||||||||||||
| GAA | GTT | CAC | CAT | TCC | CTG | GGA | TGT | TGC AGC | AAA | GTC | An | GGT | nA | TAT |
| Glu | Val | His | His | Ser | Leu | Gly | Cys | Cys Ser | Lys | Val | Ile | Gly | Leu | Tyr |
| 660 | 665 | 670 | ||||||||||||
| TTG | AAT | GAT | TGT | AAA | AGC | cn | AAG | agg τη | CCA | TGT | Gn | AAC | GTG | GAA |
| Leu | Asn | Asp | Cys | Lys | Ser | Leu | Lys | Arg Phe | Pro | Cys | Val | Asn | Val | Glu |
| 675 | 680 | 685 | ||||||||||||
| TCT | cn | GAA | TAT | CTG | GGT | CTA | AGA | AGT TGC | GAT | AGT | nA | GAG | AAA | nG |
| Ser | Leu | Glu | Tyr | Leu | Gly | Leu | Arg | Ser Cys | Asp | Ser | Leu | Glu | Lys | Leu |
| 690 | 695 | 700 | ||||||||||||
| CCA | GAA | ATC | TAC | GGG | AGA | ATG | AAG | CCG GAG | ATA | CAG | An | CAC | ATG | CAA |
| Pro | Glu | Ile | Tyr | Gly | Arg | Met | Lys | Pro Glu | Ile | Gin | Ile | His | Met | Gin |
| 705 | 710 | 715 | 720 | |||||||||||
| GGC | TCT | GGG | ATA | AGG | GAA | CTA | CCA | TCA TCT | An | τη | CAG | TAC | AAA | ACT |
| Gly | Ser | Gly | Ile | Arg | Glu | Leu | Pro | Ser Ser | Ile | Phe | Gin | Tyr | Lys | Thr |
| 725 | 730 | 735 | ||||||||||||
| CAT | GTT | ACC | AAG | CTA | nc | nG | TGG | AAT ATG | AAA | AAC | cn | GTA | GCT | cn |
| His | Val | Thr | Lys | Leu | Leu | Leu | Trp | Asn Met | Lys | Asn | Leu | Val | Ala | Leu |
| 740 | 745 | 750 | ||||||||||||
| CCA | AGC | AGC | ATA | TGT | AGG | nG | AAA | AGT nG | Gn | AGT | CTG | AGT | GTG | TCG |
| Pro | Ser | Ser | Ile | Cys | Arg | Leu | Lys | Ser Leu | Val | Ser | Leu | Ser | Val | Ser |
| 755 | - | 760 | 765 | |||||||||||
| GGT | TGC | TCA | AAA | cn | GAA | AGC | ns' | CCA GAA | GAG | ATA | GGG | GAT | nA | GAC |
| Gly | Cys | Ser | Lys | Leu | Glu | Ser | Leu | Pro Glu | Glu | Ile | Gly | Asp | Leu | Asp |
| 770 | 775 | 780 | ||||||||||||
| AAC | TTA | CGG | GTG | τη | GAT | GCC | AGT | GAT ACT | CTA | An | nA | CGA | CCT | CCG |
| Asn | Leu | Arg | Val | Phe | Asp | Ala | Ser | Asp Thr | Leu | Ile | Leu | Arg | Pro | Pro |
| 785 | 790 | 795 | 800 | |||||||||||
| TCT | TCC | ATC | ATA | CGC | nG | AAC | AAA | cn ATA | ATC | nG, | ATG | m | CGA | GGC |
| Ser | Ser | He | Ile | Arg | Leu | Asn | Lys | Leu Ile | Ile | Leu i | Het | Phe | Arg | Gly |
| 805 | 810 | 815 |
1883
1931
1979
2027
2075
2123
2171
2219
2267
2315
2363
2411
2459
2507
• WO 95/35024
PCT/US95/07754
| TTC AAA GAT GGA GTG CAC TTT GAG ne CCT CCT GTG GCT GAA GGA TTA | 2555 | |||||
| Phe | Lys | Asp Gly Val 820 | His | Phe Glu Phe Pro Pro Val Ala Glu Gly Leu | ||
| 825 | 830 | |||||
| CAC | TCA | TTG GAA TAT | CTG | AAT CTC AGT TAC TGC AAT CTA ATA GAT GGA | 2603 | |
| His | Ser | Leu Glu Tyr | Leu | Asn Leu Ser Tyr Cys Asn Leu | Ile Asp Gly | Cw v W>J |
| 835 | 840 845 | |||||
| GGA | cn | CCG GAA GAG | An | GGA TCC nA TCC TCT nG AAA | AAG nG GAT | 2651 |
| Gly | Leu | Pro Glu Glu | Ile | Gly Ser Leu Ser Ser Leu Lys | Lys Leu Asp | |
| 850 | 855 860 | |||||
| CTC | AGT | AGA AAT AAT TTT | GAG CAT nG CCT TCA AGT ATA | GCC CAA cn | 2699 | |
| Leu | Ser | Arg Asn Asn | Phe | Glu His Leu Pro Ser Ser Ile | Ala Gin Leu | |
| 865 | 870 | 875 | 880 | |||
| GGT | GCT | CTT CAA TCC | nA | GAC nA AAA GAT TGC CAG AGG | cn ACA CAG | 2747 |
| Gly Ala | Leu Gin Ser | Leu | Asp Leu Lys Asp Cys Gin Arg | Leu Thr Gin | ||
| 885 | ’ 890 | 895 | ||||
| CTA | CCA | GAA CH CCC | CCA | GAA nA AAT GAA nG CAT GTA | GAT TGT.CAT | 2795 |
| Leu | Pro | Glu Leu Pro | Pro | Glu Leu Asn Glu Leu His Val | Asp Cys His | |
| 900 | 905 | 910 | ||||
| ATG | GCT | CTG AAA Tn | ATC | CAT TAT nA GTA ACA AAG AGA | AAG AAA CTA | 2843 |
| Met | Ala | Leu Lys Phe | Ile | His Tyr Leu Val Thr Lys Arg Lys Lys Leu | ||
| 915 | 920 925 | |||||
| CAT | AGA | GTG AAA Cn | GAT | GAT GCA CAC AAT GAT ACT ATG | TAC AAT nG | 2891 |
| His | Arg | Val Lys Leu | Asp Asp Ala His Asn Asp Thr Met | Tyr Asn Leu | ||
| 930 | 935 940 | |||||
| TTT | GCA | TAT ACC ATG ITT | CAG AAT ATC TCT TCC ATG AGG | CAT GAC ATC | 2939 | |
| Phe | Ala | Tyr Thr Met | Phe | Gin Asn Ile Ser Ser Met Arg | His Asp Ile | |
| 945 | 950 | 955 | 960 | |||
| TCT | GCT TCA GAT TCC | nG | TCA CTA ACA GTA Tn ACC GGT | CAA CCG TAT | 2987 | |
| Ser | Ala | Ser Asp Ser | Leu | Ser Leu Thr Val Phe Thr Gly Gin Pro Tyr | ||
| 965 | 970 | 975 | ||||
| CCT | GAA AAG ATC CCG | AGT | TGG nC CAC CAT CAG GGT TGG GAT AGT AGT | 3035 | ||
| Pro | Glu Lys Ile Pro | Ser | Trp Phe His His Gin Gly Trp Asp Ser Ser | |||
| 980 | .985 | 990 | ||||
| GTA TCA GTC AAT TTG CCT | GAA AAT TGG TAT ATA CCT GAT AAA nC nG | 3083 | ||||
| Val | Ser Val Asii Leu | Pro | Glu Asn Trp Tyr Ile Pro Asp Lys Phe Leu | |||
| 995 • | 1000 1005 | |||||
| GGA TTT GCT GTA TGT TAC | TCT CGT AGC nA An GAC ACA ACA GCT CAC | 3131 | ||||
| Gly Phe Ala Val Cys Tyr | Ser Arg Ser Leu Ile Asp Thr Thr Ala His | |||||
| 1010 | 1015 1020 | |||||
| TTG ATT CCC GTA TGT GAT | GAC AAG ATG TCG CGC ATG ACC CAG AAA Cn | 3179 | ||||
| Leu | Ile Pro Val Cys Asp Asp Lys Met Ser Arg Met Thr Gin Lys Leu | |||||
| 1025 | 1030 | 1035 | 1040 |
WO 95/35024
PCT/US95/07754
| GCC KA | TCA Ser | GAA TGT GAT ACA GAA TCA TCC AAC TAT TCA GAA TGG GAT | |||||
| Ala | Leu | Glu Cys Asp 1045 | Thr | Glu Ser | Ser Asn Tyr Ser Glu Trp Asp | ||
| 1050 | 1055 | ||||||
| ATA | CAT | TTT | TTC TTT GTA | CCT | TTT GCT | GGC KA TGG | GAT ACA TCT AAG |
| Ile | His | Phe | Phe Phe Val | Pro | Phe Ala | Gly Leu Trp Asp Thr Ser Lys | |
| 1060 | 1065 | 1070 | |||||
| GCA AAT | GGA | AAA ACA CCA | AAT | GAT TAT | GGG ATC AK | AGG CTA TCT KT | |
| Ala | Asn | Gly Lys Thr Pro | Asn | Asp Tyr Gly Ile Ile | Arg Leu Ser Phe | ||
| 1075 | 1080 | 1085 | |||||
| .TCT | GGA | GAA GAG AAG ATG | TAT | GGA CTT | CGT KG KG | TAT AAA GAA GGA | |
| Ser | Gly | Glu | Glu Lys Met | Tyr Gly Leu | Arg Leu Leu | Tyr Lys Glu Gly | |
| 1090 | 1095 ' | 1100 | |||||
| CCA | GAG | GTT AAT GCC KG | KA | CAA ATG | AGG GAA AAT | AGC AAT GAA CCA | |
| Pro | Glu | Val | Asn Ala Leu | Leu | Gin Met | Arg Glu Asn | Ser Asn Glu Pro |
| 1105 | 1110 | 1115 | . 1120 | ||||
| ACA | GAA | CAT | TCC ACT GGG | ATA | AGG AGG | ACT CAA TAT | AAC AAC AGA ACT |
| Thr | Glu | His | Ser Thr Gly | Ile | Arg Arg Thr Gin Tyr | Asn Asn Arg Thr | |
| 1125 | 1130 | 1135. | |||||
| TCC | TTT | TAT | GAG CTC ATC | AAT | GGG TGATGTACAT ATCAACAACG AGTTTTAAAG | ||
| Ser | Phe | Tyr | Glu Leu Ile | Asn | Gly |
1140
3227
3275
3323
3371
3419
3467
3521
GAKCCAACA AGTATAACK TKATGCTCA AATCAGCTCC KGTAKGTG GAGAAAGCTG 3581
AGTACGAGAT GAAGKGACG TCCGTTATCC TTTATGATCT CTCTGKCK TGTGKAACT 3641
TGCCTACTTC ATCAGATGAA TAACAGAAGC CCGTTCCTCT CATTCTCAAC ACTGTKGCA 3701
CGTCTGKGT TACKGKAA AATGGATCK GATAAAGTAA TAACATCTCT ATAKACK 3760 ' WO 95/35024
PCT/US95/07754 (2) INFORMATION FOR SEQ ID N0:4:
(i) SEQUENCE CHARACTERISTICS:
(A) LEHGTH: 1144 amino acids (B) TYPE: amino acid (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (xi) SEQUENCE DESCRIPTION: SEQ ID N0:4:
'Met Ala Ser Ser Ser Ser Ser Ser Arg Trp Ser Tyr Asp Val Phe Leu 15 10 15
| ‘Ser Phe Arg Gly | Glu Asp Thr Arg Lys Thr Phe Thr Ser His | Leu | Tyr | ||||||||||||
| 20 | 25 | 30 | |||||||||||||
| Glu | Val | Leu | Asn | Asp Lys Gly | Ile | Lys | Thr | Phe | Gin | Asp Asp Lys Arg | |||||
| 35 | 40 | 45 | |||||||||||||
| Leu | Glu | Tyr Gly Ala | Thr | Ile | Pro | Gly | Glu | Leu | Cys | Lys | Ala | Ile | Glu | ||
| 50 | 55 | 60 | |||||||||||||
| Glu | Ser | Gin | Phe | Ala | Ile | Val | Val | Phe | Ser | Glu | Asn | Tyr | Ala | Thr | Ser |
| 65 | 70 | 75 | 80 | ||||||||||||
| Arg Trp | Cys | Leu | Asn | Glu | Leu | Val | Lys Ile Met | Glu | Cys | Lys | Thr | Arg | |||
| 85 | •90 | 95 | |||||||||||||
| Phe | Lys | Gin | Thr | Val | Ile | Pro | Ile | Phe | Tyr Asp | Val | Asp | Pro | Ser | His | |
| 100 | 105 | 110 | |||||||||||||
| Val | Arg | Asn | Gin | Lys | Glu | Ser | Phe | Ala | Lys | Ala | Phe | Glu | Glu | His | Glu |
| 115 | 120 | 125 | |||||||||||||
| Thr | Lys Tyr Lys Asp Asp | Val | Glu | Gly | Ile | Gin Arg Trp Arg | Ile | Ala | |||||||
| 130 | 135 | 140 | |||||||||||||
| Leu | Asn | Glu | Ala Ala Asn | Leu | Lys | Gly | Ser | Cys Asp | Asn | Arg Asp | Lys | ||||
| 145 | 150 | 155 | 160 | ||||||||||||
| Thr Asp | Ala | Asp Cys | Ile | Arg | Gin | Ile | Val | Asp | Gin | Ile | Ser | Ser | Lys | ||
| 165 | • | 170 | 175 | ||||||||||||
| Leu | Cys | Lys | Ile | Ser | Leu | Ser | Tyr | Leu | Gin | Asn | Ile | Val | Gly | Ile | Asp |
| 180 | 185 | 190 | |||||||||||||
| Thr | His | Leu | Glu | Lys | Ile | Glu | Ser | Leu | Leu | Glu | Ile | Gly | Ile Asn | Gly | |
| 195 | 200 | 205 |
Val Arg Ile Met Gly Ile Trp Gly Met Gly Gly Val Gly Lys Thr Thr 210 215 220
Ile Ala Arg Ala Ile Phe Asp Thr Leu Leu Gly Arg Met Asp Ser Ser
| 225 | 230 | 235 | 240 | |
| Tyr Gin | Phe Asp Gly Ala Cys | Phe Leu Lys Asp Ile Lys Glu | Asn | Lys |
| 245 | 250 | 255 |
WO 95/35024
PCT/US95/07754
| Arg | Gly | Met | His | Ser | Leu | Gin | Asn | Ala | Leu | Leu | : Ser | Glu | Leu | Leu | Arg |
| 260 | 265 | 270 | |||||||||||||
| Glu | Lys | Ala | Asn | Tyr | Asn | Asn | Glu | Glu | Asp | Gly | Lys | His | Gin | Het | Ala |
| 275 | 280 | 285 | |||||||||||||
| Ser | Arg | Leu | Arg | Ser | Lys | Lys | Val | Leu | Ile | Val | Leu | Asp | Asp | Ile | Asp |
| 290 | 295 | 300 | |||||||||||||
| Asn | Lys | Asp | His | Tyr | Leu | Glu | Tyr | Leu | Ala | Gly | Asp | Leu | Asp | Trp | Phe |
| 305 | 310 | 315 | 320 | ||||||||||||
| Gly | Asn | Gly | Ser | Arg | Ile | Ile | Ile | Thr | Thr | Arg | Asp | Lys | His | Leu | Ile |
| 325 | 330 | 335 | |||||||||||||
| Glu | Lys | Asn | Asp | Ile | Ile | Tyr | Glu | Val | Thr | Ala | Leu | Pro | Asp | His | Glu |
| 340 | 345 | 350 | |||||||||||||
| Ser | Ile | Gin | Leu | Phe | Lys | Gin | His | Ala | Phe | Gly | Lys | Glu | Val | Pro | Asn |
| 355 | 360 | 365 | |||||||||||||
| Glu | Asn | Phe | Glu | Lys | Leu | Ser | Leu | Glu | Val | Val | Asn | Tyr | Ala | Lys | Gly |
| 370 | 375 | 380 | |||||||||||||
| Leu | Pro | Leu | Ala | Leu | Lys | Val | Trp | Gly | Ser | Leu | Leu | His | Asn | Leu | Arg |
| 385 | 390 | 395 | 400 | ||||||||||||
| Leu | Thr | Glu | Trp | Lys | Ser | Ala | Ile | Glu | His | Met | Lys | Asn | Asn | Ser | Tyr |
| 405 | 410 | 415 | |||||||||||||
| Ser | Gly | Ile | Ile | Asp | Lys | Leu | Lys | Ile | Ser | Tyr | Asp | Gly | Leu | Glu | Pro |
| 420 | 425 | 430 | |||||||||||||
| Lys | Gin | Gin | Glu | Het | Phe | Leu | Asp | Ile | Ala | Cys | Phe | Leu | Arg | Gly | Glu |
| 435 | 440 | 445 | |||||||||||||
| Glu | Lys | Asp | Tyr | Ile | Leu | Gin | Ile | Leu | Glu | Ser | Cys | His | Ile | Gly | Ala |
| 450 | 455 | 460 | |||||||||||||
| Glu | Tyr | Gly | Leu | Arg | Ile | Leu | Ile | Asp | Lys | Ser | Leu | Val | Phe | Ile | Ser |
| 465 | 470 | 475 | 480 | ||||||||||||
| Glu | Tyr | Asn | Gin | Val | Gin | Het | His | Asp t | Leu | Ile | Gin | Asp | Met | Gly | Lys |
| 485 | 490 | 495 | |||||||||||||
| Tyr- | Ile | Val | Asn | Phe | Gin | Lys | Asp | Pro | Gly | Glu | Arg | Ser | Arg | Leu | Trp |
| 500 | 505 | 510 | |||||||||||||
| Leu | Ala | Lys | Glu | Val | Glu | Glu | Val | Het | Ser | Asn | Asn | Thr | Gly | Thr | Het |
| 515 | 520 | 525 | |||||||||||||
| Ala | Het | Glu | Ala | Ile | Trp | Val | Ser | Ser | Tyr | Ser | Ser | Thr | Leu | Arg | Phe |
| 530 | 535 | 540 | |||||||||||||
| Jer | Asn | Gin | Ala | Val | Lys | Asn | Het | Lys | Arg | Leu | Arg | Val | Phe | Asn | Het |
| ,45 | 550 | 555 | 560 |
SUBSTITUTE SHEET (RULE 2>
WO 95/35024
PCT/US95/07754
| Gly | Arg | Ser | Ser | Thr | His | Tyr | Ala | Ile | Asp | Tyr | Leu | Pro | Asn | Asn | Leu |
| 565 | 570 | 575 | |||||||||||||
| Arg | Cys | Phe | Val | Cys | Thr | Asn | Tyr | Pro | Trp | Glu | Ser | Phe | Pro | Ser | Thr |
| 580 | 585 | 590 | |||||||||||||
| Phe | Glu | Leu | Lys | Het | Leu | Val | His | Leu | Gin | Leu | Arg | His | Asn | Ser | Leu |
| 595 | 600 | 605 | |||||||||||||
| Arg | His | Leu | Trp | Thr | Glu | Thr | Lys | His | Leu | Pro | Ser | Leu | Arg | Arg | Ile |
| 610 | 615 | 620 |
| Asp Leu Ser Trp Ser Lys | Arg | Leu Thr | Arg Thr Pro Asp 635 | Phe | Thr | Gly 640 | |||||||||
| 6Z5 | 630 | ||||||||||||||
| Het | Pro | Asn | Leu | Glu | Tyr | Val | Asn | Leu | Tyr | Gin | Cys | Ser | Asn | Leu | Glu |
| 645 | 650 | 655 | |||||||||||||
| Glu | Val | His | His | Ser | Leu | Gly Cys Cys Ser | Lys | Val | Ile | Gly | Leu | Tyr | |||
| 660 | 665 | 670 | |||||||||||||
| Leu | Asn | Asp | Cys | Lys | Ser | Leu | Lys Arg | Phe | Pro | Cys | Val | Asn | Val | Glu | |
| 675 | 680 | 685 | |||||||||||||
| Ser | Leu | Glu | Tyr | Leu | Gly | Leu | Arg | Ser | Cys | Asp | Ser | Leu | Glu | Lys | Leu |
| 690 | 695 | 700 | |||||||||||||
| Pro | Glu | Ile | Tyr Gly Arg | Het | Lys | Pro | Glu | Ile | Gin | Ile | His | Het | Gin | ||
| 705 | 710 | 715 | 720 | ||||||||||||
| Gly | Ser Gly | Ile | Arg | Glu | Leu | Pro | Ser | Ser | Ile | Phe | Gin | Tyr Lys | Thr | ||
| 725 | 730 | 735 | |||||||||||||
| His | Val | Thr | Lys | Leu | Leu | Leu | Trp Asn | Het | Lys | Asn | Leu | Val | Ala | Leu | |
| 740 | 745 | 750 | |||||||||||||
| Pro | Ser | Ser | Ile | Cys Arg | Leu | Lys | Ser | Leu | Val | Ser | Leu | Ser | Val | Ser |
755 760 765
| Gly | Cys | Ser | Lys | Leu | Glu | Ser | Leu | Pro | Glu | Glu | Ile | Gly | Asp | Leu | Asp |
| 770 | 775 | 780 | |||||||||||||
| Asn | Leu | Arg | Val | Phe | Asp | Ala | Ser | •Asp « | Thr | Leu | Ile | Leu | Arg | Pro | Pro |
| 785 | 790 | • | 795 | 800 | |||||||||||
| Ser | Ser | Ile | Ile | Arg | Leu | Asn | Lys | Leu | Ile | Ile | Leu | Het | Phe | Arg | Gly |
| 805 | 810 | 815 | |||||||||||||
| Phe | Lys | Asp | Gly | Val | His | Phe | Glu | Phe | Pro | Pro | Val | Ala | Glu | Gly | Leu |
| 820 | 825 | 830 | |||||||||||||
| His | Ser | Leu | Glu | Tyr | Leu | Asn | Leu | Ser | Tyr | Cys | Asn | Leu | Ile | Asp | Gly |
| 835 | 840 | 845 | |||||||||||||
| Gly | Leu | Pro | Glu | Glu | Ile | Gly | Ser | Leu | Ser | Ser | Leu | Lys | Lys | Leu | Asp |
| 850 | 855 | 860 |
WO 95/35024
PCT/US95/07754
| Leu Ser Arg Asn Asn 865 | Phe 870 | Glu His | Leu Pro Ser Ser Ile Ala Gin Leu | |
| 875 | 880 | |||
| Gly Ala Leu Gin Ser | Leu | Asp Leu | Lys Asp Cys Gin Arg | Leu Thr Gin |
| 885 | 890 | 895 | ||
| Leu Pro Glu Leu Pro | Pro | Glu Leu | Asn Glu Leu His Val | Asp Cys His |
| 900 | 905 | 910 | ||
| Met Ala Leu Lys Phe | Ile | His Tyr | Leu Val Thr Lys Arg Lys Lys Leu | |
| 915 | 920 | 925 | ||
| His Arg Val Lys Leu | Asp Asp Ala | His Asn Asp Thr Met | Tyr Asn Leu | |
| 930 | 935 | 940 | ||
| Phe Ala Tyr Thr Met | Phe | Gin Asn | Ile Ser Ser Met Arg | His Asp Ile |
| 945 | 950 | 955 | 960 | |
| Ser Ala Ser. Asp Ser | Leu | Ser Leu | Thr Val Phe Thr Gly | Gin Pro Tyr |
| 965 | 970 | 975 | ||
| Pro Glu Lys Ile Pro | Ser | Trp Phe | His His Gin Gly Trp Asp Ser Ser | |
| 980 | 985 | 990 | ||
| Val Ser Val Asn Leu | Pro | Glu Asn | Trp Tyr Ile Pro Asp Lys Phe Leu | |
| 995 | 100C | 1 1005 | ||
| Gly Phe Ala Val Cys Tyr | Ser Arg | Ser Leu Ile Asp Thr Thr Ala His | ||
| 1010 | 1015 | 1020 | ||
| Leu Ile Pro Val Cys Asp Asp Lys | Met Ser Arg Met Thr | Gin Lys Leu | ||
| 1025 | 1030 | ' 1035 | 1040 | |
| Ala Leu Ser Glu Cys Asp | Thr Glu | Ser Ser Asn Tyr Ser | Glu Trp Asp | |
| 1045 | 1050 | 1055 | ||
| Ile His Phe Phe Phe | Val | Pro Phe Ala Gly Leu Trp Asp | Thr Ser Lys | |
| 1060 | 1065 | 1070 | ||
| Ala Asn Gly Lys Thr | Pro | Asn Asp Tyr Gly Ile Ile Arg | Leu Ser Phe | |
| 1075 | 1080 | 1085 | ||
| Ser Gly Glu Glu Lys | Met | Tyr Gly Leu Arg Leu Leu Tyr.Lys Glu Gly | ||
| 1090 | 1095 | 1100 | ||
| Pro Glu Val Asn Ala | Leu | Leu Gin Met Arg Glu Asn Ser Asn Glu Pro |
1105 1110 1115 1120
Thr Glu His Ser Thr Gly Ile Arg Arg Thr Gin Tyr Asn Asn Arg Thr 1125 1130 1135
Ser Phe Tyr Glu Leu Ile Asn Gly 1140 ~ WO 95/35024
PCT/US95/07754 (2) INFORMATION FOR SEQ ID N0:5:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 3830 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULĚ TYPE: cDNA to mRNA (vi) ORIGINÁL SOURCE:
(A) ORGANISM: Nicotiana glutinosa (F) TISSUE TYPE: leaf (ix) FEATURE:
(A) NAME/KEY: COS (B) LOCATION: 60..2018 (xi) SEQUENCE DESCRIPTION: SEQ ID NO:5:
GGCACGAGAT THHCACAT ACAGTHCH ACTCTTTTCA GAGAATTAAC GTTGAGTCC 59
ATG GCA TCT TCT TCT TCT TCT TCT AGA TGG AGC TAT GAT GIT TTC HA 107
Met Ala Ser Ser Ser Ser Ser Ser Arg Trp Ser Tyr Asp Val Phe Leu
5 10, 15
| AGT | TH | AGA | GGC | GAA | GAT | ACT | CGA | AAA | ACG | TH | ACA | AGT | CAC | HA | TAC | 155 |
| Ser | Phe | Arg | Gly | Glu | Asp | Thr | Arg | Lys | Thr | Phe | Thr | Ser | His | Leu | Tyr | |
| 20 | 25 | 30 | ||||||||||||||
| GAA | GTC | HG | AAT | GAT | AAG | GGA | ATA | AAA | ACC | TH | CAA | GAT | GAT | AAA | AGG | 203 |
| Glu | Val | Leu | Asn | Asp | Lys | Gly | lle | Lys | Thr | Phe | Gin | Asp | Asp | Lys | Árg | |
| 35 | 40 | 45 | - | |||||||||||||
| CTA | GAG | TAC | GGC | GCA | ACC | ATC | CCA | GGT | GAA | CTC | TGT | AAA | GCT | ATA | GAA . | 251 |
| Leu | Glu | Tyr | Gly | Ala | Thr | lle | Pro | Gly | Glu | Leu | Cys | Lys | Ala | lle | Glu | |
| 50 | 55 | 60 | ||||||||||||||
| GAG | TCT | CAA | TH | GCC | AH | GH | GH | HC | TCA | GAG | AAT | TAT | GCA | ACA | TCA | 299 |
| Glu | Ser | Gin | Phe | Ala | lle | Val | Val | Phe | Ser | Glu | Asn | Tyr | Ala | Thr | Ser | |
| 65 | 70 | 75 | 80 | |||||||||||||
| AGG | TGG | TGT | HG | AAT | GAA | CTA | GTG | •AAG | ATC | ATG | GAA | TGC | AAA | ACT | CGA | 347 |
| Arg | Trp | Cys | Leu | Asn | Glu | Leu | Val | Lys | lle | Met | Glu | Cys | Lys | Thr | Arg | |
| 85 | 90 | 95 | ||||||||||||||
| TH | AAG | CAA | ACT | GH | ATA | CCG | ATA | HC | TAT | GAT | GTG | GAT | CCA | TCA | CAT | 395 |
| Phe | Lys | Gin | Thr | Val | lle | Pro | lle | Phe | Tyr | Asp | Val | Asp | Pro | Ser | His | |
| 100 | 105 | 110 | ||||||||||||||
| GH | CGG | AAC | CAA | AAG | GAG | AGC | TH | GCA | AAA | GCC | HT | GAA | GAA. | CAT | GAA | 443 |
| Val | Arg | Asn | Gin | Lys | Glu | Ser | Phe | Ala | Lys | Ala | Phe | Glu | Glu | His | Glu | |
| 115 | 120 | 125 | ||||||||||||||
| ACA | AAG | TAT | AAG | GAT | GAT | GH | GAG | GGA | ATA | CAA | AGA | TGG | AGG | AH | GCT | 491 |
| Thr | Lys | Tyr | Lys | Asp | Asp | Val | Glu | Gly | lle | Gin | Arg | Trp | Arg | lle | Ala | |
| 130 | 135 | 140 |
WO 95/35024 PCT/US95/07754
| ΠΑ Leu 145 | AAT GAA | GCG Ala | GCC AAT CTC AAA GGC TCA TGT GAT AAT CGT GAC AAG | 539 | ||||||||||||
| Asn | Glu | Ala | Asn 150 | Leu | Lys Gly Ser Cys 155 | Asp | Asn Arg Asp Lys 160 | |||||||||
| ACT | GAT | GCA | GAC | TGT | An | CGA | CAG | An | Gn | GAC | CAA ATC | TCA | TCC | AAA | 587 | |
| Thr | Asp | Ala | Asp | Cys | Ile | Arg | Gin | Ile | Val | Asp | Gin | Ile | Ser | Ser | Lys | |
| 165 | 170 | 175 | ||||||||||||||
| TTA TGC | AAG | ATT | TCT | nA | TCT | TAT | nc | CAA | AAC | An | Gn | GGA | ATA | GAT | 635 | |
| Leu | Cys | Lys | Ile | Ser | Leu | Ser | Tyr | Leu | Gin | Asn | Ile | Val | Gly | Ile | Asp | |
| 180 | 185 | 190 | ||||||||||||||
| ACT | CAT | TTA | GAG | AAA ATA | GAA | TCC | nA | CTA | GAG | ATA | GGA | ATC | AAT | GGT | 683 | |
| Thr | His | Leu | Glu | Lys | Ile | Glu | Ser | Leu | Leu | Glu | Ile | Gly | Ile | Asn | Gly | |
| 195 | 200 | 205 | ||||||||||||||
| GTT | CGG | ATT | ATG | GGG | ATC | TGG | GGA | ATG | GGG | GGA | GTC | GGT | AAA | ACA | ACA | 731 |
| Val | Arg | Ile | Met | Gly | Ile | Trp | Gly | Met | Gly Gly | Val | Gly | Lys | Thr | Thr | ||
| 210 | 215 | 220 | ||||||||||||||
| ATA | GCA | AGA | GCT ATA | τη | GAT ACT | cn | nA | GGA | AGA | ATG | GAT AGT TCC | 779 | ||||
| Ile | Ala | Arg Ala Ile | Phe | Asp | Thr | Leu | Leu | Gly Arg | Met | Asp Ser | Ser | |||||
| 225 | 230 | 235 | 240 | |||||||||||||
| TAT | CAA | TTT | GAT GGT | GCT | TGT | nc | cn | AAG | GAT | An AAA | GAA AAC | AAA | 827 | |||
| Tyr | Gin | Phe | Asp Gly Ala | Cys | Phe | Leu | Lys Asp | Ile | Lys | Glu | Asn | Lys | ||||
| 245 | 250 | 255 | ||||||||||||||
| CGT | GGA ATG | CAT TCT nc | CAA AAT | GCC | cn | CTC | TCT | GAA | cn | nA | AGG | 875 | ||||
| Arg Gly Met | His | Ser | Leu | Gin | Asn | Ala | Leu | Leu | Ser | Glu | Leu | Leu | Arg | |||
| 260 | 265 | 270 |
| GAA | AAA | GCT | AAT | TAC | AAT | AAT | GAG | GAG | GAT | GGA | AAG | CAC | CAA | ATG | GCT | 923 |
| Glu | Lys | Ala | Asn | Tyr | Asn | Asn | Glu | Glu | Asp | Gly | Lys | His | Gin | Met | Ala | |
| 275 | 280 | 285 | ||||||||||||||
| AGT | AGA | cn | CGT | TCG | AAG | AAG | GTC | CTA | An | GTG | cn | GAT | GAT | ATA | GAT | 971 |
| Ser | Arg | Leu | Arg | Ser | Lys | Lys | Val | Leu | Ile | Val | Leu | Asp | Asp | Ile | Asp | |
| 290 | 295 | 300 | ||||||||||||||
| AAT | AAA | GAT | CAT | TAT | nG | GAG | TAT | nA | GCA | GGT | GAT | cn | GAT | TGG | τη | 1019 |
| Asn | Lys | Asp | His | Tyr | Leu | Glu | Tyr | Leu | Ala | Gly | Asp | Leu | Asp | Trp | Phe | |
| 305 | 310 | • | 315 | 320 | ||||||||||||
| GGT | AAT | GGT | AGT | AGA | An | An | ATA | ACA | ACT | AGA | GAC | AAG | CAT | nc | ATA | 1067 |
| Gly | Asn | Gly | Ser | Arg | Ile | Ile | Ile | Thr | Thr | Arg | Asp | Lys | His | Leu | Ile | |
| 325 | 330 | 335 | ||||||||||||||
| GAG | AAG | AAT | GAT | ATA | ATA | TAT | GAG | GTG | ACT | GCA | CTA | CCC | GAT | CAT | GAA | 1115 |
| Glu | Lys | Asn | Asp | Ile | Ile | Tyr | Glu | Val | Thr | Ala | Leu | Pro | Asp | His | Glu | |
| 340 | 345 | 350 | ||||||||||||||
| TCC | An | CAA | nG | nc | AAA | CAA | CAT | GCT | nc | GGA | AAA | GAA | cn | CCA | AAT | 1163 |
| Ser | Ile | Gin | Leu | Phe | Lys | Gin | His | Ala | Phe | Gly | Lys | Glu | Val | Pro | Asn | |
| 355 | 360 | 365 |
WO 95/35024
PCT/US95/07754
GAG AAT TTT GAG AAG CTT TCA TTA GAG GTA GTA AAT TAT GCT AAA GGC Glu Asn Phe Glu Lys Leu Ser Leu Glu Val Val Asn Tyr Ala Lys Gly
370 375 380
| cn CCT nA GCC CTC AAA GTG TGG GGT | ||||||||
| Leu 385 | Pro Leu | Ala | Leu Lys 390 | Val Trp Gly | ||||
| nA ACT | GAA | TGG | AAA | AGT | GCT ATA GAG | |||
| Leu | Thr | Glu | Trp Lys | Ser Ala | Ile Glu | |||
| 405 | ||||||||
| TCT | GGA An | An | GAT AAG | CTC | AAA ATA | |||
| Ser | Gly | Ile | Ile | Asp | Lys | Leu | Lys | Ile |
| 420 | 425 | |||||||
| AÁA | CAA | CAA | GAG | ATG | τη | nA | GAT ATA | |
| Lys | Gin | Gin | Glu | Met | Phe | Leu | Asp | Ile |
| 435 | 440 | |||||||
| GAA | AAA | GAT | TAC | ATC | CTA | CAA | ATC | cn |
| Glu | Lys Asp Tyr | Ile | Leu | Gin | Ile | Leu | ||
| 450 | 455 | |||||||
| GAA TAC | GGG | nA | cgt An nA | An | GAC | |||
| Glu | Tyr Gly | Leu | Arg | Ile Leu | Ile | Asp | ||
| 465 | 470 | |||||||
| GAA | TAT AAT | CAG | cn | CAA ATG | CAT | GAC | ||
| Glu | Tyr | Asn | Gin | Val | Gin | Met | His | Asp |
| 485 | ||||||||
| TAT | ATA | GTG | AAT τη | CAA AAA | GAT | CCC | ||
| Tyr | Ile | Val | Asn | Phe | Gin | Lys Asp | Pro | |
| 500 | 505 | |||||||
| :tc | GCC | AAG | GAA | GTC | GAA | GAA | GTG | ATG |
| eu | Ala | Lys | Glu | Val | Glu | Glu | Val | Met |
| 515 | 520 | |||||||
| l CA ATG | GAA | GCA An TGG | Gn | TCT | TCT | |||
| la | Met | Glu | Ala | Ile | Trp | Val | Seř | Ser |
| 530 | 535 | |||||||
| 1 C | AAT | CAG | GCC | GTG | AAA AAT ATG | AAA | ||
| lr | Asn | Gin | Ala | Val | Lys Asn | Met | Lys | |
| 15 | 550 | |||||||
| 1 1 | AGG | TCG | TCG | ACA | CAT TAT | GCC ATC | ||
| 1 / | Arg | Ser | Ser | Thr | His Tyr | Ala | Ile | |
| 565 | ||||||||
| TGT | τη | cn TGC | ACT AAC | TAT | CCT | |||
| Cys | Phe | Val Cys | Thr Asn | Tyr Pro | ||||
| 580 | 585 |
| TCT | nG | CTG | CAT | AAC | CTA | CGA | 1259 |
| Ser | Leu | Leu | His | Asn | Leu | Arg | |
| 395 | 400 | ||||||
| CAC | ATG | AAA | AAT | AAC | TCT | TAT | 1307 |
| His | Met | Lys | Asn | Asn | Ser | Tyr | |
| 410 | 415 | ||||||
| AGT | TAT | GAT | GGA | nA | GAG | CCC | 1355 |
| Ser | Tyr | Asp | Gly | Leu | Glu | Pro | |
| 430 | |||||||
| GCA | TGC | nc | ne | CGA | GGG | GAA | 1403 |
| Ala | Cys | Phe | Leu | Arg | Gly | Glu |
445
| GAG AGT TGT CAT An GGA GCT | 1451 | ||||||
| Glu | Ser | Cys 460 | His | Ile Gly.Ala | |||
| AAA | TCT | cn | GTG | nc | ATC TCT | 1499 | |
| Lys | Ser | Leu | Val | Phe | Ile Ser | ||
| 475 | 480 | ||||||
| nA | ATA | CAG | GAT | ATG | GGT AAA | 1547 | |
| Leu | Ile | Gin | Asp | Met | Gly Lys | ||
| 490 | 495 | ||||||
| GGA | GAA | CGT | AGC | AGA nA TGG | 1595 | ||
| Gly | Glu | Arg | Ser | Arg Leu Trp | |||
| 510 | |||||||
| AGC | AAC | AAC ACA | GGG ACC | ATG | 1643 | ||
| Ser | Asn | Asn Thr | Gly Thr | Met | |||
| 525 | |||||||
| TAT TCT AGT ACT | CTA CGC | m | 1691 | ||||
| Tyr | Ser | Ser | Thr | Leu Arg | Phe | ||
| 540 | |||||||
| AGG | cn | AGG | GTA Tn AAC | ATG | 1739 | ||
| Arg | Leu | Arg | Val | Phe | Asn | Met | |
| 555 | 560. | ·,· | |||||
| GAT TAT | CTG | CCC | AAC | AAC | nG | 1787 | |
| Asp Tyr | Leu | Pro | Asn | Asn | Leu | ||
| 570 | 575 | ||||||
| TGG | GAG | tca ητ | CCA TCT ACA | 1835 | |||
| Trp | Glu | Ser Phe | Pro Ser Thr | ||||
| 590 |
WO 95/35024
PCT/US95/07754
| TH GAA CTC AAA | ATG CTT GTT CAC CTC CAA CTC CGA CAC AAT TCT CTG | ||||||||||||||
| Phe Glu Leu | Lys | Met | Leu | Val His 600 | Leu Gin | Leu Arg His 605 | Asn Ser | Leu | |||||||
| 595 | |||||||||||||||
| CGT | CAT | TTA | TGG | ACA | GAA | ACA | AAG | AAG | AAG | AAC | AAT | AH | GCA | GAG | AAA |
| Arg | His | Leu | Trp | Thr | Glu | Thr | Lys | Lys | Lys | Asn | Asn | lle | Ala | Glu | Lys |
| 610 | 615 | 620 | |||||||||||||
| GAG | GGA | GAT | GGA' | AH | CH AH | GAA TH | TGG | GGC | GAT | HA | CAA | TGG | GCA | ||
| Glu | Gly | Asp Gly | lle | Leu | lle | Glu | Phe | Trp | Gly Asp | Leu | Gin | TrD Ala | |||
| 625 | 630 | 635 | 640 | ||||||||||||
| TH | GCC | GTC TCT | ACG | GAG | GAT | AGA | TCT | CAG | CTG GTC | TAAAAGAHG | |||||
| Phe | Ala | Val | Ser | Thr | Glu | Asp Arg | Ser | Gin | Leu | Val | |||||
| 645 | 650 |
ACGCGAACAC
AGTAATCHG
HGAATGAH
CTGGGTCTAA
CCGGAGATAC
CAGTACAAAA
CCAAGCAGCA
CHGAAAGCT
GATACTCTAA
ATGTTTCGAG
CACTCATTGG
GAGAHGGAT
HGCCHCAA
AGGCHACAC
ATGGCTCTGA
CHGATGATG
ATCTCTTCCA
GGTCAACCGT
GTATCAGTCA
TGHACTCTC
VTGTCGCGCA
CAGATTTCAC
AAGAAGHCA
GTAAAAGCCT
GAAGHGCGA
AGATTCACAT
CTCATGHAC
TATGTAGGH
TGCCAGAAGA
TTTTACGACC
GCTTCAAA6A
AATATCTGAA
CCHATCCTC
GTATAGCCCA
AGCTACCAGA
AATHATCCA
CACACAATGA
TGAGGCATGA
ATCCTGAAAA
ATTTGCCTGA
GTAGCTTAAT
TGACCCAGAA
GGGGATGCCA
CCATTCCCTG
TAAGAGGHT
TAGTTTAGAG
GCAAGGCTCT
CAAGCTATTG
GAAAAGHTG
GATAGGGGAT
TCCGTCTTCC
TGGAGTGCAC
TCTCAGTTAC
HTGAAAAAG
ACHGGTGCT
ACHCCCCCA
TTATTTAGŤA
TACTATGTAC
CATCTCTGCT
GATCCCGAGT
AAAHGGTAT
TGACACAACA
ACHGCCHA
AATTTGGAST
GGATGHGCA
CCATGTGHA
AAATTGCCAG
GGGATAAGGG
HGTGGAATA
GTTAGTCTGA
HAGACAACT
ATCATACGCT
THGAGTTCC
TGCAATCTAA
HGGATCTCA
CTTCAATCCT
GAAHAAATG
ACAAAGAGAA
AATHGHTG
TCAGATTCCT
TGGTTCCACC
ATACCTGATA
GCTCACHGA
TCAGAATGTG
ATGTGAATTT
GCAAAGTCAT
ACGTGGAATC
AAATCTACGG
AACTACCATC
TGAAAAACCT
GTGTGTCGGG
TACGGGT6TT
TGAACAAACT
CTCCTGTGGC
TAGATGGAGG
GTA6AAATAA
TAGACHAAA
AAHGCATGT
AGAAACTACA
CATATACCAT
TGTCACTAAC
ATCAGGGTTG
AATTCTTGGG
HCCCGTATG
ATACAGAATC
GTATCAATGT
TGGTTTATAT
TCHGAATAT
GAGAATGAAG
ATCTATTTTT
TGTAGCTCn
HGCTCAAAA
TGATGCCAGT
TATAATCTTG
TGAAGGAHA
ACTTCCG6AA
TTHGAGCAT
AGAHGCCAG •AGAHGTCAT
TAGAGTGAAA
GTTTCAGAAT
AGTATHACC
GGATAGTAGT
ATTTGCTGTA
TGATGACAAG
ATCCAACTAT
1883
1931
1979
2025
2085
2145 .2205
2265
2325
2385
2445
2505
2565
2625
2685
2745
2805
2865
2925
2985
3045
3105
3165
3225
3285
WO 95/35024
PCT/US95/07754
TCAGAATGGG ATATACATTT TTT C TTT GTA CCTTTTGCTG GCTTATGGGA TACATCTAAG GCAAATGGAA AAACACCAAA TGATTATGGG ATTATTAGGC TATCTTTTTC TGGAGAAGAG AAGATGTATG GACTTCGTTT GTTGTATAAA GAAGGACCAG AGGTTAAT6C CTTGTTACAA ATGAGGGAAA ATAGCAATGA ACCAACAGAA CATTCCACTG GGATAAGGAG GACTCAATAT AACAACAGAA CTTCCTTTTA TGAGCTCATC AATGGGTGAT GTACATATCA ACAAC6AGTT TTAAAG6ATT CCAACAAGTA TAACTTTTTA TGCTCAAATC AGCTCCTTGT ATTGTGGAGA ÁAGCTGAGTA CGAGATGAAG TTGACGTCCG TTATCCTTTA TGATCTCTCT GTTCTTTGTG TTAACTTGCC TACTTCATCA GATGAATAAC AGAAGCCCGT TCCTCTCATT CTCAACACTG
TTTGCACGTC TGTTGTTACT TGnAAAATG GATCTTGATA AAGTAATAAC ATCTCTATAT
3345
3405
3465
3525
3585
3645
3705
3765
3825
TÁCU
3830
WO 95/35024
PCT/US95/07754 (2) INFORMATION FOR SEQ ID NO:6:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 652 amino acids (B) TYPE: amino acid (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (xi) SEQUENCE DESCRIPTION: SEQ ID N0:6:
| Met Ala Ser Ser Ser Ser Ser | Ser Arg Trp 10 | Ser Tyr Asp Val | Phe 15 | Leu | ||||||||||
| 1 | 5 | |||||||||||||
| Ser | Phe | Arg Gly | Glu | Asp | Thr | Arg Lys | Thr | Phe | Thr | Ser His | Leu | Tyr | ||
| 20 | 25 | 30 | ||||||||||||
| Glu | Val | Leu | Asn | Asp | Lys | Gly | Ile | Lys | Thr | Phe | Gin | Asp Asp | Lys | Arg |
| 35 | 40 | 45 | ||||||||||||
| Leu | Glu | Tyr Gly Ala | Thr | Ile | Pro | Gly | Glu | Leu | Cys | Lys Ala | Ile | Glu | ||
| 50 | 55 | 60 | ||||||||||||
| Glu | Ser | Gin | Phe | Ala | Ile | Val | Val | Phe | Ser | Glu | Asn | Tyr Ala | Thr | Ser |
| . 65 | 70 | 75 | 80 | |||||||||||
| Arg Trp | Cys | Leu | Asn | Glu | Leu | Val | Lys | Ile | Met | Glu | Cys Lys | Thr | Arg | |
| 85 | 90 | 95 | ||||||||||||
| Phe | Lys | Gin | Thr | Val | Ile | Pro | Ile | Phe | Tyr Asp | Val | Asp Pro | Ser | His | |
| 100 | 105 | 110 | ||||||||||||
| Val | Arg | Asn | Gin | Lys | Glu | Ser | Phe | Ala | Lys | Ala | Phe | Glu Glu | His | Glu |
| 115 | 120 | 125 | ||||||||||||
| Thr | Lys Tyr Lys Asp Asp | Val | Glu | Gly | Ile | Gin | Arg Trp Arg | Ile | Ala | |||||
| 130 | 135 | 140 | ||||||||||||
| Leu | Asn | Glu | Ala Ala | Asn | Leu | Lys Gly | Ser | Cys Asp | Asn Arg Asp Lys | |||||
| 145 | 150 | 155 | - | 160 | ||||||||||
| Thr | Asp | Ala | Asp Cys | Ile | Arg | Gin | Ile | Val | Asp | Gin | Ile Ser Ser Lys | |||
| 165 | 170 | 175 | ||||||||||||
| Leu | Cys | Lys | Ile | Ser | Leu | Ser | Tyr- Leu | Gin | Asn | Ile | Val Gly Ile Asp | |||
| 180 | 185 | 190 | ||||||||||||
| Thr | His | Leu | Glu | Lys | Ile | Glu | Ser Leu | Leu | Glu | Ile | Gly Ile Asn Gly | |||
| 195 | 200 | 205 | ||||||||||||
| Val | Arg | Ile | Met | Gly | Ile | Trp | Gly Met Gly Gly | Val | Gly Lys | Thr Thr | ||||
| 210 | 215 | 220 | ||||||||||||
| Ile | Ala | Arg | Ala | Ile | Phe Asp | Thr | Leu Leu Gly Arg Met Asp | Ser | Ser | |||||
| 225 | 230 | 235 | 240 |
Tyr Gin Phe Asp Gly Ala Cys Phe Leu Lys Asp Ile Lys Glu Asn Lys 245 250 255
WO 95/35024
PCT/US95/07754
| Gly | Arg Ser Ser Thr 565 | His | Tyr | Ala Ile Asp Tyr Leu Pro Asn Asn Leu | |||||||||||
| 570 | 575 | ||||||||||||||
| Arg Cys | Phe | Val | Cys | Thr | Asn | Tyr | Pro | Trp | Glu | Ser | Phe | Pro | Ser | Thr | |
| 580 | 585 | 590 | |||||||||||||
| Phe | Glu | Leu | Lys | Het | Leu | Val | His | Leu | Gin | Leu | Arg | His | Asn | Ser | Leu |
| 595 | 600 | 605 | |||||||||||||
| Arg | His | Leu | Trp | Thr | Glu | Thr | Lys Lys Lys | Asn | Asn | Ile Ala | Glu | Lys | |||
| 610 | 615 | 620 | |||||||||||||
| Glu | Gly Asp Gly | Ile | Leu | Ile | Glu | Phe Trp Gly Asp | Leu Gin | Trp Ala | |||||||
| 625 | 630 | 635 | 640 | ||||||||||||
| Phe | Ala | Val | Ser | Thr | Glu | Asp Arg | Ser Gin | Leu | Val | ||||||
| 645 | 650 |
PI .rrr ,n, „ r
Claims (31)
1. Izolovaná a purifikovaná molekula nukleové kyseliny obsahující nukleotidovou sekvenci kódující protein N genu vybraná ze skupiny sestávající z:
(a) nukleotidové sekvence kódující protein N genu jak je daná SEQ ID NO:3 od nukleotidu 60 do nuklotidu 3494, (b) nukleotidové sekvence kódující protein N genu s aminokyselinovou sekvencí jak je daná SEQ ID N0:4.
(c) DNA sekvence se 70% homologií nuklotidové sekvence se SEQ ID NO:3 od asi nukleotidu 60 až do nuklotidu 3494, a kde zmíněný kódovaný protein N genu má za funkci zprostředkování resistence na virus tabákové mozaiky v rostlinách syntetizujících zmíněný protein N genu.
(d) nukleotidové sekvence kódující protein N genu jak je daná SEQ ID N0:l od nukleotidu 1 do nuklotidu 7400, a (e) DNA sekvence se 70% homologií nuklotidové sekvence se SEQ ID NO:1 od asi nukleotidu 1 až do nuklotidu 7400, a kde zmíněný kódovaný protein N genu má za funkci zprostředkování resistence na virus tabákové mozaiky v rostlinách syntetizujících zmíněný protein N genu.
2. Molekulu nukleové kyseliny nároku 1, kde zmíněná nukleotidové sekvence kóduje protein N genu s aminokyselinovou sekvencí jak je dána SEQ ID N0:4.
3. Molekulu nukleové kyseliny nároku 2, kde zmíněná nukleotidové sekvence kóduje protein N genu je dána SEQ ID NO:4 od nukleotidu 60 do nukleotidu 3494.
4. Přirozeně se nevyskytující molekulu nukleové kyseliny obsahující část nukleové kyseliny, která kóduje protein N genu , kde zmíněný N gen je odvozen od rostlin rodiny Solanaceae a zmíněná část kódující protein N genu a zmíněná část má alespoň 70% homologií nuklotidové sekvence se SEQ ID NO:3 od asi nuklotidu 60 do nuklotidu 3494 a kde zmíněný protein N genu má za funkci zprostředkování resistence na virus tabákové mozaiky v rostlinách syntetizujících zmíněný protein N genu.
5. Přirozeně se nevyskytující molekulu nukleové kyseliny nároku 4, kde je zmíněná část kódující N gen odvozena od rostlin rodu Nicotiana.
6. Přirozeně se nevyskytující molekulu nukleové kyseliny nároku 5, kde je zmíněná část kódující N gen odvozena od rostlin druhu Nicotiana glutinosa.
7. Přirozeně se nevyskytující molekulu nukleové kyseliny nároku 6, kde zmíněná část kódující protein N genu má aminokyselinovou sekvenci jak je dána SEQ ID N0:4.
8. Přirozeně se nevyskytující molekulu nukleové kyseliny nároku 4, kde zmíněná část kódující protein N genu má nukleotidovou sekvenci jak je dána SEQ ID NO:3 od nukleotidu 60 do nukleotidu 3494 a kde zmíněný protein N genu má za funkci zprostředkování resistence na virus tabákové mozaiky v rostlinách syntetizujících zmíněný protein N genu.
9. Přirozeně se nevyskytující molekulu nukleové kyseliny zahrnující část nukleové kyseliny, která kóduje protein N genu, kde zmíněný N gen je odvozen od rostlin rodiny Solanaceae a zmíněná část kóduje protein N genu a zmíněná část má alespoň 70% homologii nukleotidové sekvence se SEQ ID N0:l od asi nukleotidu 1 do nukleotidu 7400 a kde zmíněný protein
N genu má za funkci zprostředkování resistence na virus tabákové mozaiky v rostlinách syntetizujících zmíněný protein N genu.
10. Transgení rostlina rodiny Solanaceae, která byla zpracována genetickým inženýrstvým tak, aby obsahovala a exprivovala nukleokyselinový konstrukt obsahující nukleotidovou sekvenci kódující protein N genu, kde zmíněná nukleotidová sekvence kódující protein N genu je odvozena od rostlin rodiny Solanaceae, a zmíněná N gen kódující sekvence má alespoň 70% homologii nukleotidové sekvence se SEQ ID NO:3 od asi nukleotidu 60 do nukleotidu 3494 a kde je zmíněná rostlina učiněna resistentní na vius tabákové mozaiky cestou exprese zmíněné nukleotidové sekvence kódující zmíněný protein N genu.
11. Transgení rostlina nároku 10, kde je zmíněná N gen kódující část odvozena od rostlin rodu Nicotiana.
12. Transgení rostlina nároku 11, kde je zmíněná N gen kódující část odvozena od rostliny druhu Nicotiana glutinosa.
13. Transgení rostlina nároku 10, kde je zmíněná část kódující protein N genu má aminokyselinovou sekvenci jak je dána SEQ ID N0:4.
14. Transgení rostlina nároku 10, kde je zmíněná část kódující protein N genu má nukleotidovou sekvenci jak je dána SEQ ID NO:3 od nukleotidu 60 do nukleotidu 3494.
15. Transgení rostlina nároku 10, kde je zmíněná rostlina členem rodu Capsicum.
16. Transgení rostlina nároku 10, kde je zmíněná rostlina rodu Lysopersicon.
17. Transgení rostlina nároku 16, kde je zmíněná rostlina druhu Lysopersicon esculentum.
18. Transgení rostlina nároku 10, kde je zmíněná rostlina rodu Nicotiana.
19. Transgení rostlina nároku 10, kde je zmíněná rostlina druhu Nicotiana tabacum.
20. Transgení rostlina nároku 10, kde je zmíněná rostlina druhu Nicotiana glutinosa.
21. Transgení rostlina rodiny Solanaceae, která byla zpracována genetickým inženýrstvým tak, aby obsahovala a exprivovala N gen, kde zmíněný N gen má nukleotidovou sekvenci jak je dána SEQ ID NO:1.
22. Transgení rostlina rodiny Solanaceae, která byla zpracována genetickým inženýrstvým tak, aby obsahovala a exprivovala N protein kódující sekvenci jak je dána SEQ ID NO:3, kde zmíněná transgení rostlina byla dále zpracována genetickým inženýrstvím tak, aby obsahovala a exprivovala N odvozenou sekvenci jak je dána SEQ ID NO:5.
23. Metoda užití nukleové molekuly obsahující část nukleové kyseliny , která kóduje protein N genu , kde je zmíněná protein N genu kódující část odvozena od rostliny rodiny Solanaceae a zmíněná protein N genu kódující část má alespoň 70% homologii nukleotidové sekvence se SEQ ID NO:3 od asi nukleotidu 60 do nukleotidu 3494 a kde zmíněný protein
N genu má za funkci zprostředkování resistence na virus tabákové mozaiky v rostlinách syntetizujících zmíněný protein N genu a učinit tak transgení rostliny obsahující a exprivující zmíněný protein N genu resistentní na virus tabákové mozaiky , kde zmíněná metoda obsahuje kroky:
(a) zpracování rostlině tkáně genetickým inženýrstvím tak, aby obsahovala a exprivovala protein N genu kódující sekvenci, a (b) regeneraci rostlině tkáně zpracované genetickým inženýrstvím kroku (a) tak, aby vytvořila rostlinu, která obsahuje a exprivuje zmíněnou sekvenci a je tak učiněna resistentní na virus tabákové mozaiky.
24. Metodu nároku 23, kde zmíněná část kódující N gen je odvozena od rostlin rodu Nicotiana.
25. Metodu nároku 24, kde zmíněná část kódující N gen je odvozena od rostlin druhu Nicotiana glutinosa.
26. Metodu nároku 25, kde zmíněná část kódující protein N genu má aminokyselinovou sekvenci jak je dána SEQ ID NO:4.
27. Metodu nároku 26, kde zmíněná část kódující protein N genu má nukleotidovou sekvenci jak je dána SEQ ID NO:3 od nukleotidu 60 do nukleotidu 3494.
28. Metodu nároku 25, kde zmíněná část kódující protein N genu má aminokyselinovou sekvenci jak je dána SEQ ID NO:6.
29.Metodu nároku 28, kde zmíněná část kódující protein N genu má nukleotidovou sekvenci jak je dána SEQ ID NO:5 od nukleotidu 60 do nukleotidu 2018.
30..Metoda užití nukleové molekuly obsahující část nukleové kyseliny , která kóduje protein N genu , kde zmíněná část je dána SEQ ID NO:1 má za funkci zprostředkování resistence na virus tabákové mozaiky v rostlinách syntetizujících zmíněný protein N genu a učinit tak transgení rostliny obsahující a exprivující zmíněný protein N genu resistentní na virus tabákové mozaiky , kde zmíněná metoda obsahuje kroky:
(a) zpracování rostlině tkáně genetickým inženýrstvím tak, aby obsahovala a exprivovala protein N genu kódující sekvenci, a (b) regeneraci rostlině tkáně zpracované genetickým inženýrstvím kroku (a) tak, aby vytvořila rostlinu, která obsahuje a exprivuje zmíněnou sekvenci a je tak učiněna resistentní na virus tabákové mozaiky.
31.Metodu užití nukleové molekuly obsahující první část nukleové kyseliny, která kóduje protein N genu, kde zmíněná protein N genu kódující část má nukleotidovou sekvenci danou SEQ ID NO:3 od nukleotidu 60 do nukleotidu 3494 a druhá část nukleové kyseliny má nukleotidovou sekvenci danou SEQ ID NO:5, kde jsou zmíněné první a druhé části nukleové kyseliny exprivovány v rostlině tkáni , kde zmíněná metoda obsahuje kroky:
(a) zpracování rostlině tkáně genetickým inženýrstvím tak, aby obsahovala a exprivovala zmíněnou první a druhou část nukleové kyseliny a (b) regeneraci zmíněné rostlině tkáně tak, aby vytvořila rostlinu, která obsahuje a exprivuje zmíněnou první a druhou část nukleové kyseliny a je tak učiněna resistentní na virus tabákové mozaiky.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US08/261,663 US5571706A (en) | 1994-06-17 | 1994-06-17 | Plant virus resistance gene and methods |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CZ369296A3 true CZ369296A3 (cs) | 1998-06-17 |
Family
ID=22994295
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CZ963692A CZ369296A3 (cs) | 1994-06-17 | 1995-06-16 | Metody a geny virové resistence u rostlin |
Country Status (16)
| Country | Link |
|---|---|
| US (1) | US5571706A (cs) |
| EP (1) | EP0767605A4 (cs) |
| JP (1) | JPH10501972A (cs) |
| KR (1) | KR970703695A (cs) |
| CN (1) | CN1157549A (cs) |
| AU (1) | AU688924B2 (cs) |
| BR (1) | BR9508047A (cs) |
| CA (1) | CA2193123A1 (cs) |
| CZ (1) | CZ369296A3 (cs) |
| HU (1) | HUT76529A (cs) |
| MX (1) | MX9606535A (cs) |
| NZ (1) | NZ289259A (cs) |
| PL (1) | PL317898A1 (cs) |
| RU (1) | RU2140985C1 (cs) |
| SK (1) | SK161796A3 (cs) |
| WO (1) | WO1995035024A1 (cs) |
Families Citing this family (56)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5981730A (en) | 1994-04-13 | 1999-11-09 | The General Hospital Corporation | RPS gene family, primers, probes, and detection methods |
| CA2188418A1 (en) * | 1994-04-21 | 1995-11-02 | Gregory James Lawrence | Genetic sequences conferring disease resistance in plants and uses therefor |
| US6903248B2 (en) | 1997-02-19 | 2005-06-07 | Cornell Research Foundation, Inc. | DNA constructs and methods to impart resistance to at least one virus on plants |
| CA2243985C (en) * | 1997-09-11 | 2004-08-10 | F. Hoffmann-La Roche Ag | Thermostable dna polymerases incorporating nucleoside triphosphates labeled with fluorescein family dyes |
| US20020108140A1 (en) * | 1998-07-17 | 2002-08-08 | Jeffrey L. Bennetzen | Compositions and methods for enhancing disease resistance in plants |
| US6372962B1 (en) | 1998-07-20 | 2002-04-16 | The Regents Of The University Of California | Pathogen resistance in plants using CDNA-N/intron constructs |
| US6479731B1 (en) | 1998-08-04 | 2002-11-12 | E. I. Du Pont De Nemours And Company | Pi-ta gene conferring fungal disease resistance to plants |
| US20050086718A1 (en) | 1999-03-23 | 2005-04-21 | Mendel Biotechnology, Inc. | Plant transcriptional regulators of abiotic stress |
| US7897843B2 (en) | 1999-03-23 | 2011-03-01 | Mendel Biotechnology, Inc. | Transcriptional regulation of plant biomass and abiotic stress tolerance |
| FR2799204B1 (fr) * | 1999-10-01 | 2003-12-12 | Agronomique Inst Nat Rech | Nouvelle classe de proteines et leurs applications a la resistance de plantes a divers agents pathogenes |
| EP1950306A1 (en) | 1999-11-17 | 2008-07-30 | Mendel Biotechnology, Inc. | Environmental stress tolerance genes |
| AU1610101A (en) | 1999-11-17 | 2001-05-30 | Jacqueline Heard | Plant developmental genes |
| US6630618B2 (en) * | 2000-03-21 | 2003-10-07 | The United States Of America As Represented By The Secretary Of Agriculture | Transgenic plants having non-pathogen induced systemic acquired resistance (SAR) |
| EP1406483A4 (en) | 2000-08-22 | 2005-05-25 | Mendel Biotechnology Inc | GENE FOR CHANGING THE PROPERTIES OF PLANTS |
| US6743969B2 (en) | 2000-11-14 | 2004-06-01 | E. I. Du Pont De Nemours And Company | Modification of PI-TA gene conferring fungal disease resistance to plants |
| KR100447813B1 (ko) * | 2000-12-18 | 2004-09-08 | 세미니스코리아주식회사 | 담배 유래의 Tsip1 유전자 도입 재조합 벡터 및 그 형질전환균주 |
| KR100423262B1 (ko) * | 2000-12-18 | 2004-03-19 | 세미니스코리아주식회사 | 담배 유래의 Tsi1 유전자를 도입하여 제조된 형질전환균주 |
| WO2002074926A2 (en) | 2001-03-19 | 2002-09-26 | Cargill Incorporated | Myo-inositol oxygenases |
| BR0209181A (pt) | 2001-04-24 | 2004-08-24 | Cornell Res Foundation Inc | Molécula sintética de ácido nucléico para conferir traços múltiplos |
| CA2436341A1 (en) * | 2001-09-10 | 2003-03-20 | National Institute Of Agrobiological Sciences | Impartment of virus-resistance with the use of plant protein binding to plant virus transport protein |
| US7220445B2 (en) * | 2001-10-26 | 2007-05-22 | Genecor International, Inc. | Phytase enzymes, nucleic acid sequences encoding phytase enzymes and vectors and host cells incorporating same |
| US7510831B2 (en) * | 2001-10-26 | 2009-03-31 | Genencor International, Inc. | Trichoderma reesei phytase enzymes, nucleic acids encoding such phytase enzymes, vectors and host cells incorporating same and methods of making and using same |
| AU2003258157A1 (en) * | 2002-08-12 | 2004-02-25 | Genencor International, Inc. | Mutant e. coli appa phytase enzymes |
| EP2272962B1 (en) | 2002-09-18 | 2017-01-18 | Mendel Biotechnology, Inc. | Polynucleotides and polypeptides in plants |
| CN101153318B (zh) * | 2006-09-29 | 2010-11-17 | 中国农业科学院蔬菜花卉研究所 | 用于辅助抗根结线虫n基因选择的分子标记 |
| AU2008245611B2 (en) | 2007-04-27 | 2014-09-18 | University Of California | Plant CO2 sensors, nucleic acids encoding them, and methods for making and using them |
| WO2010046423A2 (en) | 2008-10-22 | 2010-04-29 | Basf Se | Use of sulfonylurea herbicides on cultivated plants |
| AR075466A1 (es) | 2008-10-22 | 2011-04-06 | Basf Se | Uso de herbicidas tipo auxina en plantas cultivadas |
| US9074005B2 (en) * | 2009-01-02 | 2015-07-07 | Washington State University | Compositions and methods for modulating plant disease resistance and immunity |
| CN101805398B (zh) * | 2010-03-02 | 2012-07-04 | 中国农业大学 | 与植物耐寒性及抗病性相关的基因及其编码蛋白与应用 |
| CN101892304B (zh) * | 2010-04-07 | 2012-04-04 | 云南省烟草农业科学研究院 | 分子标记检测n基因控制的烟草tmv抗性的方法 |
| US8816156B2 (en) * | 2010-06-04 | 2014-08-26 | Monsanto Technology Llc | Transgenic Brassica event MON 88302 and methods of use thereof |
| US9920327B2 (en) | 2011-06-02 | 2018-03-20 | The Regents Of The University Of California | Plants with elevated levels of glucan |
| WO2013009935A2 (en) | 2011-07-12 | 2013-01-17 | Two Blades Foundation | Late blight resistance genes |
| CN102690839B (zh) * | 2011-10-24 | 2014-04-02 | 贵州省烟草科学研究所 | 烟草普通花叶病毒抗性的种内基因改良方法 |
| UA119636C2 (uk) | 2012-06-22 | 2019-07-25 | Дзе Ріджентс Оф Дзе Юніверсіті Оф Каліфорнія | Спосіб, що спричиняє розвиток продихів у відповідь на діоксид вуглецю для розвитку посухостійкості у рослин |
| BR112015004074A2 (pt) | 2012-10-01 | 2017-07-04 | Basf Se | método para controlar pragas, uso e semente de uma planta cultivada. |
| WO2014079820A1 (en) | 2012-11-22 | 2014-05-30 | Basf Se | Use of anthranilamide compounds for reducing insect-vectored viral infections |
| WO2014118123A1 (en) | 2013-01-29 | 2014-08-07 | The University Court Of The University Of Glasgow | Methods and means for increasing stress tolerance and biomass in plants |
| CN103290543A (zh) * | 2013-05-13 | 2013-09-11 | 天宇羊毛工业(张家港保税区)有限公司 | 针梳机平台输送机构 |
| EP3017049B1 (en) | 2013-07-01 | 2018-08-22 | Bayer CropScience NV | Methods and means for modulating flowering time in monocot plants |
| WO2015193653A1 (en) | 2014-06-16 | 2015-12-23 | Consejo Nacional De Investigaciones Cientificas Y Tecnicas | Oxidative resistance chimeric genes and proteins, and transgenic plants including the same |
| WO2016050512A1 (en) | 2014-10-03 | 2016-04-07 | Bayer Cropscience Nv | Methods and means for increasing stress tolerance and biomass in plants |
| EP3028573A1 (en) | 2014-12-05 | 2016-06-08 | Basf Se | Use of a triazole fungicide on transgenic plants |
| WO2016091674A1 (en) | 2014-12-12 | 2016-06-16 | Basf Se | Use of cyclaniliprole on cultivated plants |
| WO2016162371A1 (en) | 2015-04-07 | 2016-10-13 | Basf Agrochemical Products B.V. | Use of an insecticidal carboxamide compound against pests on cultivated plants |
| BR112017011621B1 (pt) * | 2015-10-09 | 2023-10-17 | Yunnan Academy Of Tobacco Agricultural Sciences | Uso de um gene nau resistente ao vírus do mosaico do tabaco, cassete de expressão recombinante, método para produzir uma planta de tabaco transgênica e método de identificação de uma planta de tabaco tendo um gene nau resistente ao vírus do mosaico do tabaco |
| CN105274120B (zh) * | 2015-10-09 | 2018-07-03 | 云南省烟草农业科学研究院 | 一种抗烟草花叶病毒的N′au基因及其克隆方法和应用 |
| CN105200052B (zh) * | 2015-10-30 | 2018-05-15 | 云南省烟草农业科学研究院 | 估算烟草n导入片段左端长度的分子标记、引物及方法 |
| WO2018037281A1 (en) | 2016-08-22 | 2018-03-01 | Biolumic Limited | System, device and methods of seed treatment |
| EP3338552A1 (en) | 2016-12-21 | 2018-06-27 | Basf Se | Use of a tetrazolinone fungicide on transgenic plants |
| WO2019002946A1 (en) | 2017-06-29 | 2019-01-03 | Biolumic Limited | METHOD OF ENHANCING YIELD AND / OR CULTURE QUALITY |
| WO2019038594A2 (en) | 2017-08-21 | 2019-02-28 | Biolumic Limited | TRANSGENIC PLANTS WITH HIGH GROWTH AND HIGH RUSTICITY |
| US11259473B2 (en) | 2017-09-20 | 2022-03-01 | Yunnan Academy Of Tobacco Agricultural Sciences | TMV resistant tobacco plant containing short N introduced fragment and method for breeding same |
| BR112022007209A2 (pt) * | 2019-10-17 | 2022-08-16 | BASF Agricultural Solutions Seed US LLC | Métodos para aumentar os níveis de expressão ou reduzir o impacto negativo de um n-transgene em uma planta e prever se um transgene será fitotóxico, vetores de expressão vegetal, célula e plantas |
| CN111996204B (zh) * | 2020-08-24 | 2023-04-18 | 浙江师范大学 | 烟草GSNOR1a/1b在植物抗逆中的应用 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| IL74298A (en) * | 1982-05-13 | 1985-09-29 | Israel State | Material obtainable from"green islands"for the prevention of virus replication in plants,its isolation and its use for plant immunization |
| US4732856A (en) * | 1984-04-03 | 1988-03-22 | Carnegie Institution Of Washington | Transposable elements and process for using same |
| SU1572466A1 (ru) * | 1985-11-28 | 1990-06-23 | Kazak Nii Kartofelnogo Ovoshch | Cпocoб oцehkи пotehциaльhoй уctoйчиboctи pactehий kaptoфeля k фиtoпatoгehhыm пopaжehияm |
| US5013658A (en) * | 1988-05-13 | 1991-05-07 | Dna Plant Technology Corporation | Transposon tagging of genes in transformed plants |
-
1994
- 1994-06-17 US US08/261,663 patent/US5571706A/en not_active Expired - Fee Related
-
1995
- 1995-06-16 MX MX9606535A patent/MX9606535A/es unknown
- 1995-06-16 NZ NZ289259A patent/NZ289259A/en unknown
- 1995-06-16 SK SK1617-96A patent/SK161796A3/sk unknown
- 1995-06-16 CN CN95194556A patent/CN1157549A/zh active Pending
- 1995-06-16 AU AU29045/95A patent/AU688924B2/en not_active Ceased
- 1995-06-16 HU HU9603482A patent/HUT76529A/hu unknown
- 1995-06-16 RU RU97100896A patent/RU2140985C1/ru active
- 1995-06-16 EP EP95924613A patent/EP0767605A4/en not_active Withdrawn
- 1995-06-16 BR BR9508047A patent/BR9508047A/pt unknown
- 1995-06-16 PL PL95317898A patent/PL317898A1/xx unknown
- 1995-06-16 KR KR1019960707279A patent/KR970703695A/ko not_active Withdrawn
- 1995-06-16 JP JP8502537A patent/JPH10501972A/ja active Pending
- 1995-06-16 CZ CZ963692A patent/CZ369296A3/cs unknown
- 1995-06-16 WO PCT/US1995/007754 patent/WO1995035024A1/en not_active Ceased
- 1995-06-16 CA CA002193123A patent/CA2193123A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| AU688924B2 (en) | 1998-03-19 |
| AU2904595A (en) | 1996-01-15 |
| US5571706A (en) | 1996-11-05 |
| SK161796A3 (en) | 2000-02-14 |
| EP0767605A1 (en) | 1997-04-16 |
| KR970703695A (ko) | 1997-08-09 |
| HUT76529A (en) | 1997-09-29 |
| RU2140985C1 (ru) | 1999-11-10 |
| HU9603482D0 (en) | 1997-02-28 |
| MX9606535A (es) | 1997-12-31 |
| EP0767605A4 (en) | 1998-02-04 |
| PL317898A1 (en) | 1997-04-28 |
| WO1995035024A1 (en) | 1995-12-28 |
| CN1157549A (zh) | 1997-08-20 |
| NZ289259A (en) | 1998-05-27 |
| BR9508047A (pt) | 1997-09-09 |
| JPH10501972A (ja) | 1998-02-24 |
| CA2193123A1 (en) | 1995-12-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CZ369296A3 (cs) | Metody a geny virové resistence u rostlin | |
| US8334427B2 (en) | Induction of Xa27 by the avrXa27 gene in rice confers broad-spectrum resistance to Xanthomonas oryzae pv. oryzae and enhanced resistance to Xanthomonas oryzae pv. oryzicola | |
| CA2459079C (en) | Plant-derived resistance gene | |
| AU655186B2 (en) | New antifungal preparations, process for making such preparations, process for obtaining plants with decreased susceptibility to fungi | |
| CA2249990A1 (en) | Antifungal polypeptide and methods for controlling plant pathogenic fungi | |
| WO1996037615A1 (en) | Maize gene and protein for insect control | |
| JPH0851986A (ja) | ウイルス耐性の植物の生産方法 | |
| WO1996036697A1 (en) | Transcriptional control sequences and methods | |
| KR20010005581A (ko) | 성장 변형 식물 | |
| US5932784A (en) | Method for obtaining male-sterile plants | |
| US6284952B1 (en) | Transgenic plants with divergent [ScaM4 or] SCaM5 gene to achieve multiple disease resistance | |
| AU3412599A (en) | Method for the induction of pathogen resistance in plants | |
| JP2001500390A (ja) | プロテインキナーゼおよびその使用 | |
| WO1999054490A2 (en) | Plant-derived resistance gene | |
| US6653463B1 (en) | Biocidal protein | |
| WO2002020791A1 (en) | Plant resistance gene | |
| US6448471B1 (en) | Nematode-feeding structure specific gene and its application to produce nematode resistant plants | |
| Padmanabhan | Isolation and expression analysis of genes induced by water-deficit stress in loblolly pine (Pinus taeda L.) | |
| Pelletier | Attempts toward the expression in transgenic Arabidopsis thalha of Esi4 7, salt stress-induced gene encoding a protein b e fiom Lophopyrtcm elongatum | |
| Chisholm | Cloning and functional characterization of RTM1, a gene required for restriction of tobacco etch virus long-distance movement in Arabidopsis thaliana | |
| WO2003091441A1 (en) | Sfr2 protein encoding gene |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PD00 | Pending as of 2000-06-30 in czech republic |