MXPA00000336A - Metodos y composiciones para producir plantas y microorganismos que expresan la treonina deshidratasa/desaminasa insensible a la retroalimentacion - Google Patents
Metodos y composiciones para producir plantas y microorganismos que expresan la treonina deshidratasa/desaminasa insensible a la retroalimentacionInfo
- Publication number
- MXPA00000336A MXPA00000336A MXPA/A/2000/000336A MXPA00000336A MXPA00000336A MX PA00000336 A MXPA00000336 A MX PA00000336A MX PA00000336 A MXPA00000336 A MX PA00000336A MX PA00000336 A MXPA00000336 A MX PA00000336A
- Authority
- MX
- Mexico
- Prior art keywords
- seq
- sequence described
- sequence
- leu
- cell
- Prior art date
Links
- 244000005700 microbiome Species 0.000 title claims abstract description 58
- 108010006873 Threonine Dehydratase Proteins 0.000 title claims description 47
- 239000000203 mixture Substances 0.000 title description 5
- 229920001850 Nucleic acid sequence Polymers 0.000 claims abstract description 168
- 229920001184 polypeptide Polymers 0.000 claims abstract description 46
- 230000002588 toxic Effects 0.000 claims abstract description 25
- 231100000331 toxic Toxicity 0.000 claims abstract description 25
- 229960000310 ISOLEUCINE Drugs 0.000 claims abstract description 22
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims abstract description 22
- 230000003115 biocidal Effects 0.000 claims abstract description 19
- 238000004519 manufacturing process Methods 0.000 claims abstract description 18
- 230000000694 effects Effects 0.000 claims abstract description 12
- 230000001965 increased Effects 0.000 claims abstract description 12
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 10
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 6
- 230000033228 biological regulation Effects 0.000 claims abstract description 5
- 230000002194 synthesizing Effects 0.000 claims abstract description 5
- 238000010353 genetic engineering Methods 0.000 claims abstract description 4
- 230000001976 improved Effects 0.000 claims abstract description 4
- 239000000463 material Substances 0.000 claims abstract description 4
- 235000015097 nutrients Nutrition 0.000 claims abstract 2
- 241000196324 Embryophyta Species 0.000 claims description 185
- 150000001413 amino acids Chemical group 0.000 claims description 79
- 229920003013 deoxyribonucleic acid Polymers 0.000 claims description 53
- 230000001131 transforming Effects 0.000 claims description 47
- 125000003729 nucleotide group Chemical group 0.000 claims description 46
- 239000002773 nucleotide Substances 0.000 claims description 42
- 239000000758 substrate Substances 0.000 claims description 29
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 27
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 27
- OZAIFHULBGXAKX-UHFFFAOYSA-N precursor Substances N#CC(C)(C)N=NC(C)(C)C#N OZAIFHULBGXAKX-UHFFFAOYSA-N 0.000 claims description 26
- 229920000023 polynucleotide Polymers 0.000 claims description 24
- 239000002157 polynucleotide Substances 0.000 claims description 24
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 23
- 230000002401 inhibitory effect Effects 0.000 claims description 23
- 230000035772 mutation Effects 0.000 claims description 19
- 150000007523 nucleic acids Chemical group 0.000 claims description 19
- 239000003242 anti bacterial agent Substances 0.000 claims description 15
- 230000035897 transcription Effects 0.000 claims description 15
- 229940064005 Antibiotic throat preparations Drugs 0.000 claims description 13
- 229940083879 Antibiotics FOR TREATMENT OF HEMORRHOIDS AND ANAL FISSURES FOR TOPICAL USE Drugs 0.000 claims description 13
- 229940042052 Antibiotics for systemic use Drugs 0.000 claims description 13
- 229940042786 Antitubercular Antibiotics Drugs 0.000 claims description 13
- 229940093922 Gynecological Antibiotics Drugs 0.000 claims description 13
- 229940024982 Topical Antifungal Antibiotics Drugs 0.000 claims description 13
- 229940079866 intestinal antibiotics Drugs 0.000 claims description 13
- 229940005935 ophthalmologic Antibiotics Drugs 0.000 claims description 13
- 230000001580 bacterial Effects 0.000 claims description 12
- 240000001016 Solanum tuberosum Species 0.000 claims description 8
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 8
- 230000000875 corresponding Effects 0.000 claims description 7
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 claims description 5
- 240000003259 Brassica oleracea var. botrytis Species 0.000 claims description 5
- 240000008042 Zea mays Species 0.000 claims description 5
- 150000002520 isoleucines Chemical class 0.000 claims description 5
- FYCWLJLGIAUCCL-DMTCNVIQSA-N (2S,3R)-2-azaniumyl-3-methoxybutanoate Chemical compound CO[C@H](C)[C@H](N)C(O)=O FYCWLJLGIAUCCL-DMTCNVIQSA-N 0.000 claims description 4
- 244000144730 Amygdalus persica Species 0.000 claims description 4
- 235000006040 Prunus persica var persica Nutrition 0.000 claims description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 4
- 235000005822 corn Nutrition 0.000 claims description 4
- 235000005824 corn Nutrition 0.000 claims description 4
- 235000007119 Ananas comosus Nutrition 0.000 claims description 3
- 240000002254 Ananas comosus Species 0.000 claims description 3
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 3
- 240000002840 Allium cepa Species 0.000 claims description 2
- 240000002234 Allium sativum Species 0.000 claims description 2
- 240000007087 Apium graveolens Species 0.000 claims description 2
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 claims description 2
- 235000010591 Appio Nutrition 0.000 claims description 2
- 235000005340 Asparagus officinalis Nutrition 0.000 claims description 2
- 240000001498 Asparagus officinalis Species 0.000 claims description 2
- 235000000832 Ayote Nutrition 0.000 claims description 2
- 240000002791 Brassica napus Species 0.000 claims description 2
- 235000011293 Brassica napus Nutrition 0.000 claims description 2
- 240000007124 Brassica oleracea Species 0.000 claims description 2
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 claims description 2
- 235000017647 Brassica oleracea var italica Nutrition 0.000 claims description 2
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 claims description 2
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 claims description 2
- 235000004936 Bromus mango Nutrition 0.000 claims description 2
- 240000001358 Bromus mango Species 0.000 claims description 2
- 235000002566 Capsicum Nutrition 0.000 claims description 2
- 235000009467 Carica papaya Nutrition 0.000 claims description 2
- 240000006432 Carica papaya Species 0.000 claims description 2
- 235000007542 Cichorium intybus Nutrition 0.000 claims description 2
- 240000008051 Cichorium intybus Species 0.000 claims description 2
- 241000219112 Cucumis Species 0.000 claims description 2
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 claims description 2
- 240000008067 Cucumis sativus Species 0.000 claims description 2
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 2
- 235000009854 Cucurbita moschata Nutrition 0.000 claims description 2
- 240000001980 Cucurbita pepo Species 0.000 claims description 2
- 244000302526 Cucurbita pepo subsp pepo Species 0.000 claims description 2
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 claims description 2
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 claims description 2
- 240000000590 Cydonia oblonga Species 0.000 claims description 2
- 235000017788 Cydonia oblonga Nutrition 0.000 claims description 2
- 240000002860 Daucus carota Species 0.000 claims description 2
- 235000002243 Daucus carota subsp sativus Nutrition 0.000 claims description 2
- 235000016623 Fragaria vesca Nutrition 0.000 claims description 2
- 240000009088 Fragaria x ananassa Species 0.000 claims description 2
- 235000011363 Fragaria x ananassa Nutrition 0.000 claims description 2
- 235000010469 Glycine max Nutrition 0.000 claims description 2
- 240000005979 Hordeum vulgare Species 0.000 claims description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 2
- 235000002678 Ipomoea batatas Nutrition 0.000 claims description 2
- 240000003613 Ipomoea batatas Species 0.000 claims description 2
- 235000003228 Lactuca sativa Nutrition 0.000 claims description 2
- 240000008415 Lactuca sativa Species 0.000 claims description 2
- 240000007119 Malus pumila Species 0.000 claims description 2
- 235000011430 Malus pumila Nutrition 0.000 claims description 2
- 235000015103 Malus silvestris Nutrition 0.000 claims description 2
- 235000014826 Mangifera indica Nutrition 0.000 claims description 2
- 240000005561 Musa balbisiana Species 0.000 claims description 2
- 235000018290 Musa x paradisiaca Nutrition 0.000 claims description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 2
- 240000008962 Nicotiana tabacum Species 0.000 claims description 2
- 240000007594 Oryza sativa Species 0.000 claims description 2
- 235000007164 Oryza sativa Nutrition 0.000 claims description 2
- 239000006002 Pepper Substances 0.000 claims description 2
- 240000008426 Persea americana Species 0.000 claims description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 2
- 240000005158 Phaseolus vulgaris Species 0.000 claims description 2
- 235000016761 Piper aduncum Nutrition 0.000 claims description 2
- 235000017804 Piper guineense Nutrition 0.000 claims description 2
- 240000000129 Piper nigrum Species 0.000 claims description 2
- 235000008184 Piper nigrum Nutrition 0.000 claims description 2
- 235000010582 Pisum sativum Nutrition 0.000 claims description 2
- 240000004713 Pisum sativum Species 0.000 claims description 2
- 235000009827 Prunus armeniaca Nutrition 0.000 claims description 2
- 240000005204 Prunus armeniaca Species 0.000 claims description 2
- 240000002799 Prunus avium Species 0.000 claims description 2
- 235000014443 Pyrus communis Nutrition 0.000 claims description 2
- 240000001987 Pyrus communis Species 0.000 claims description 2
- 240000007742 Raphanus sativus Species 0.000 claims description 2
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 claims description 2
- 235000017848 Rubus fruticosus Nutrition 0.000 claims description 2
- 240000007651 Rubus glaucus Species 0.000 claims description 2
- 235000011034 Rubus glaucus Nutrition 0.000 claims description 2
- 235000009122 Rubus idaeus Nutrition 0.000 claims description 2
- 240000000111 Saccharum officinarum Species 0.000 claims description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 2
- 235000007238 Secale cereale Nutrition 0.000 claims description 2
- 240000002057 Secale cereale Species 0.000 claims description 2
- 235000019095 Sechium edule Nutrition 0.000 claims description 2
- 240000007660 Sechium edule Species 0.000 claims description 2
- 240000002686 Solanum melongena Species 0.000 claims description 2
- 240000003829 Sorghum propinquum Species 0.000 claims description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 2
- 235000009337 Spinacia oleracea Nutrition 0.000 claims description 2
- 240000003453 Spinacia oleracea Species 0.000 claims description 2
- 235000009184 Spondias indica Nutrition 0.000 claims description 2
- 240000008529 Triticum aestivum Species 0.000 claims description 2
- 240000008536 Vaccinium myrtillus Species 0.000 claims description 2
- 240000006365 Vitis vinifera Species 0.000 claims description 2
- 235000014787 Vitis vinifera Nutrition 0.000 claims description 2
- 235000005042 Zier Kohl Nutrition 0.000 claims description 2
- 235000021029 blackberry Nutrition 0.000 claims description 2
- 235000002354 carica papaya Nutrition 0.000 claims description 2
- 235000019693 cherries Nutrition 0.000 claims description 2
- 235000004611 garlic Nutrition 0.000 claims description 2
- 235000009754 grape Nutrition 0.000 claims description 2
- 235000012333 grape Nutrition 0.000 claims description 2
- 235000002732 oignon Nutrition 0.000 claims description 2
- 235000005426 persea americana Nutrition 0.000 claims description 2
- 235000015136 pumpkin Nutrition 0.000 claims description 2
- 235000009566 rice Nutrition 0.000 claims description 2
- 235000021307 wheat Nutrition 0.000 claims description 2
- 235000005765 wild carrot Nutrition 0.000 claims description 2
- 230000002538 fungal Effects 0.000 claims 4
- 241000218631 Coniferophyta Species 0.000 claims 1
- 240000003768 Solanum lycopersicum Species 0.000 claims 1
- 210000004027 cells Anatomy 0.000 description 90
- 235000001014 amino acid Nutrition 0.000 description 77
- 229940014598 TAC Drugs 0.000 description 69
- 125000003275 alpha amino acid group Chemical group 0.000 description 57
- 235000018102 proteins Nutrition 0.000 description 55
- 102000004169 proteins and genes Human genes 0.000 description 55
- 108090000623 proteins and genes Proteins 0.000 description 55
- 229920002676 Complementary DNA Polymers 0.000 description 51
- 238000010804 cDNA synthesis Methods 0.000 description 50
- 108020004635 Complementary DNA Proteins 0.000 description 49
- 239000002299 complementary DNA Substances 0.000 description 49
- 230000001105 regulatory Effects 0.000 description 44
- 102000004190 Enzymes Human genes 0.000 description 40
- 108090000790 Enzymes Proteins 0.000 description 40
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 32
- 238000006467 substitution reaction Methods 0.000 description 32
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 32
- 108010073969 valyllysine Proteins 0.000 description 32
- 241000219194 Arabidopsis Species 0.000 description 29
- 238000000034 method Methods 0.000 description 29
- 229940088598 Enzyme Drugs 0.000 description 27
- 108010070643 prolylglutamic acid Proteins 0.000 description 27
- 210000003763 Chloroplasts Anatomy 0.000 description 26
- 108010034529 leucyl-lysine Proteins 0.000 description 26
- 210000001519 tissues Anatomy 0.000 description 24
- 241000227653 Lycopersicon Species 0.000 description 22
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 21
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 21
- 241000219195 Arabidopsis thaliana Species 0.000 description 20
- 241000588724 Escherichia coli Species 0.000 description 20
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 20
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 20
- 230000001851 biosynthetic Effects 0.000 description 20
- QXRNAOYBCYVZCD-BQBZGAKWSA-N (2S)-6-amino-2-[[(2S)-2-aminopropanoyl]amino]hexanoic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 19
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 19
- 108010037850 glycylvaline Proteins 0.000 description 19
- 238000003752 polymerase chain reaction Methods 0.000 description 19
- 241000894007 species Species 0.000 description 19
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 18
- MTCFGRXMJLQNBG-REOHCLBHSA-N L-serine Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 18
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 18
- 108010053725 prolylvaline Proteins 0.000 description 18
- 241000894006 Bacteria Species 0.000 description 17
- 235000010523 Cicer arietinum Nutrition 0.000 description 17
- 240000000464 Cicer arietinum Species 0.000 description 17
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 17
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 17
- 101710037964 OMR1 Proteins 0.000 description 16
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 15
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 15
- 239000004473 Threonine Substances 0.000 description 15
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 15
- 108010056582 methionylglutamic acid Proteins 0.000 description 15
- MPZWMIIOPAPAKE-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-4-(diaminomethylideneamino)butyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CCCN=C(N)N MPZWMIIOPAPAKE-UHFFFAOYSA-N 0.000 description 14
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 14
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 14
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 14
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 14
- XUJNEKJLAYXESH-REOHCLBHSA-N L-cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 14
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 14
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 14
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 14
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 14
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 14
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 14
- 108091006028 chimera Proteins 0.000 description 14
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 14
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 13
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 13
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 13
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 13
- FADYJNXDPBKVCA-UHFFFAOYSA-N Phenylalanyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 13
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 13
- 125000000539 amino acid group Chemical group 0.000 description 13
- 238000010367 cloning Methods 0.000 description 13
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 13
- 108010051242 phenylalanylserine Proteins 0.000 description 13
- QLROSWPKSBORFJ-BQBZGAKWSA-N pro glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 13
- 108010026333 seryl-proline Proteins 0.000 description 13
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 12
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 12
- 108020004999 Messenger RNA Proteins 0.000 description 12
- 108010008355 arginyl-glutamine Proteins 0.000 description 12
- 230000003197 catalytic Effects 0.000 description 12
- 108010057821 leucylproline Proteins 0.000 description 12
- 229920002106 messenger RNA Polymers 0.000 description 12
- AAKRWBIIGKPOKQ-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 11
- 229920001405 Coding region Polymers 0.000 description 11
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 11
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 11
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 11
- 108010060035 arginylproline Proteins 0.000 description 11
- 108010068265 aspartyltyrosine Proteins 0.000 description 11
- 108010025306 histidylleucine Proteins 0.000 description 11
- 108010092114 histidylphenylalanine Proteins 0.000 description 11
- 239000002609 media Substances 0.000 description 11
- 108020004707 nucleic acids Proteins 0.000 description 11
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 102000004196 processed proteins & peptides Human genes 0.000 description 11
- 108010077112 prolyl-proline Proteins 0.000 description 11
- ZVDPYSVOZFINEE-UHFFFAOYSA-N Aspartyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(O)=O ZVDPYSVOZFINEE-UHFFFAOYSA-N 0.000 description 10
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 10
- ARPVSMCNIDAQBO-UHFFFAOYSA-N Glutaminyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CCC(N)=O ARPVSMCNIDAQBO-UHFFFAOYSA-N 0.000 description 10
- MRVYVEQPNDSWLH-UHFFFAOYSA-N Glutaminyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O MRVYVEQPNDSWLH-UHFFFAOYSA-N 0.000 description 10
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 10
- 241000880493 Leptailurus serval Species 0.000 description 10
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 10
- JMEWFDUAFKVAAT-UHFFFAOYSA-N Methionyl-Asparagine Chemical compound CSCCC(N)C(=O)NC(C(O)=O)CC(N)=O JMEWFDUAFKVAAT-UHFFFAOYSA-N 0.000 description 10
- 241000237955 Nassarius Species 0.000 description 10
- 108010078144 glutaminyl-glycine Proteins 0.000 description 10
- 108010049041 glutamylalanine Proteins 0.000 description 10
- 108010050848 glycylleucine Proteins 0.000 description 10
- 108010064235 lysylglycine Proteins 0.000 description 10
- 108010090894 prolylleucine Proteins 0.000 description 10
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 9
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 9
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 9
- OHUXOEXBXPZKPT-STQMWFEESA-N Phe-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 OHUXOEXBXPZKPT-STQMWFEESA-N 0.000 description 9
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 9
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 9
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 9
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 9
- 230000002068 genetic Effects 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 230000037361 pathway Effects 0.000 description 9
- 241000589158 Agrobacterium Species 0.000 description 8
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 8
- 239000003155 DNA primer Substances 0.000 description 8
- 241001200922 Gagata Species 0.000 description 8
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 8
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 8
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 8
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 8
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 8
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 8
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 8
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 8
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 8
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 8
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 8
- ZSXJENBJGRHKIG-UHFFFAOYSA-N Tyrosyl-Serine Chemical compound OCC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UHFFFAOYSA-N 0.000 description 8
- 108010047495 alanylglycine Proteins 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 238000010276 construction Methods 0.000 description 8
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 8
- 108010085203 methionylmethionine Proteins 0.000 description 8
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 8
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 8
- 230000001052 transient Effects 0.000 description 8
- OSASDIVHOSJVII-UHFFFAOYSA-N Arginyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CCCNC(N)=N OSASDIVHOSJVII-UHFFFAOYSA-N 0.000 description 7
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 7
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 7
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 7
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 7
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 7
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 7
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 7
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 7
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 7
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 7
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 7
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 7
- YKRQRPFODDJQTC-UHFFFAOYSA-N Threoninyl-Lysine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CCCCN YKRQRPFODDJQTC-UHFFFAOYSA-N 0.000 description 7
- 108010013835 arginine glutamate Proteins 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 108010069495 cysteinyltyrosine Proteins 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 239000000543 intermediate Substances 0.000 description 7
- 108010044655 lysylproline Proteins 0.000 description 7
- 108010017391 lysylvaline Proteins 0.000 description 7
- 108010005942 methionylglycine Proteins 0.000 description 7
- 108010004914 prolylarginine Proteins 0.000 description 7
- FAQVCWVVIYYWRR-WHFBIAKZSA-N (2S)-2-[[(2S)-2,5-diamino-5-oxopentanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 6
- TYEYBOSBBBHJIV-UHFFFAOYSA-M 2-oxobutanoate Chemical compound CCC(=O)C([O-])=O TYEYBOSBBBHJIV-UHFFFAOYSA-M 0.000 description 6
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 6
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 6
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 6
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 6
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 6
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 6
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 6
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 6
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 6
- 229920002459 Intron Polymers 0.000 description 6
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 6
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 6
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 6
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 6
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 6
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 6
- 230000000295 complement Effects 0.000 description 6
- 108010079547 glutamylmethionine Proteins 0.000 description 6
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 6
- 108010087823 glycyltyrosine Proteins 0.000 description 6
- 108010036413 histidylglycine Proteins 0.000 description 6
- 125000001165 hydrophobic group Chemical group 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 6
- 230000002103 transcriptional Effects 0.000 description 6
- 108010003137 tyrosyltyrosine Proteins 0.000 description 6
- SITLTJHOQZFJGG-XPUUQOCRSA-N α-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 6
- WNGVUZWBXZKQES-YUMQZZPRSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 5
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 5
- ROWCTNFEMKOIFQ-YUMQZZPRSA-N Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N ROWCTNFEMKOIFQ-YUMQZZPRSA-N 0.000 description 5
- WXOFKRKAHJQKLT-UHFFFAOYSA-N Cysteinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CS WXOFKRKAHJQKLT-UHFFFAOYSA-N 0.000 description 5
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 5
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 5
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 5
- JAQGKXUEKGKTKX-HOTGVXAUSA-N L-tyrosyl-L-tyrosine Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 5
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 5
- RVKIPWVMZANZLI-ZFWWWQNUSA-N Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-ZFWWWQNUSA-N 0.000 description 5
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- JPNRPAJITHRXRH-UHFFFAOYSA-N Lysyl-Asparagine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC(N)=O JPNRPAJITHRXRH-UHFFFAOYSA-N 0.000 description 5
- HGCNKOLVKRAVHD-RYUDHWBXSA-N Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-RYUDHWBXSA-N 0.000 description 5
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 5
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 5
- 229920000272 Oligonucleotide Polymers 0.000 description 5
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 5
- KNPVDQMEHSCAGX-UHFFFAOYSA-N Phenylalanyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KNPVDQMEHSCAGX-UHFFFAOYSA-N 0.000 description 5
- 229920000331 Polyhydroxybutyrate Polymers 0.000 description 5
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 5
- 108020004511 Recombinant DNA Proteins 0.000 description 5
- 241000607142 Salmonella Species 0.000 description 5
- 206010039447 Salmonellosis Diseases 0.000 description 5
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 5
- RZEQTVHJZCIUBT-UHFFFAOYSA-N Serinyl-Arginine Chemical compound OCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-UHFFFAOYSA-N 0.000 description 5
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 5
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 5
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 5
- ONWMQORSVZYVNH-UHFFFAOYSA-N Tyrosyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UHFFFAOYSA-N 0.000 description 5
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 5
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 230000004075 alteration Effects 0.000 description 5
- 125000000511 arginine group Chemical class N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 238000004166 bioassay Methods 0.000 description 5
- 238000005755 formation reaction Methods 0.000 description 5
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 108010081551 glycylphenylalanine Proteins 0.000 description 5
- 108010077515 glycylproline Proteins 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 108010085325 histidylproline Proteins 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 108010091871 leucylmethionine Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 108010068488 methionylphenylalanine Proteins 0.000 description 5
- 108010073101 phenylalanylleucine Proteins 0.000 description 5
- 239000005015 poly(hydroxybutyrate) Substances 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- BUZMZDDKFCSKOT-CIUDSAMLSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-carboxybutanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 4
- VKVDRTGWLVZJOM-DCAQKATOSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 4
- RFCVXVPWSPOMFJ-UHFFFAOYSA-N 2-[(2-azaniumyl-3-phenylpropanoyl)amino]-4-methylpentanoate Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-UHFFFAOYSA-N 0.000 description 4
- XUUXCWCKKCZEAW-YFKPBYRVSA-N 2-[[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 4
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N Ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 4
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 4
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 4
- IQTUDDBANZYMAR-UHFFFAOYSA-N Asparaginyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(N)=O IQTUDDBANZYMAR-UHFFFAOYSA-N 0.000 description 4
- OMSMPWHEGLNQOD-UHFFFAOYSA-N Asparaginyl-Phenylalanine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UHFFFAOYSA-N 0.000 description 4
- 206010003664 Atrial septal defect Diseases 0.000 description 4
- WYVKPHCYMTWUCW-UHFFFAOYSA-N Cysteinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CS WYVKPHCYMTWUCW-UHFFFAOYSA-N 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 4
- 101710023886 GUSB Proteins 0.000 description 4
- 229960002989 Glutamic Acid Drugs 0.000 description 4
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 4
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 4
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N Kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- 125000002435 L-phenylalanyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 4
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 4
- 210000003463 Organelles Anatomy 0.000 description 4
- 102100017875 S100A8 Human genes 0.000 description 4
- 101710023380 S100A8 Proteins 0.000 description 4
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 4
- 229940081969 Saccharomyces cerevisiae Drugs 0.000 description 4
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 4
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 4
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 4
- GRQCSEWEPIHLBI-UHFFFAOYSA-N Tryptophyl-Asparagine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-UHFFFAOYSA-N 0.000 description 4
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 230000001413 cellular Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000010192 crystallographic characterization Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 230000002708 enhancing Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 235000013922 glutamic acid Nutrition 0.000 description 4
- 239000004220 glutamic acid Substances 0.000 description 4
- VPZXBVLAVMBEQI-VKHMYHEASA-N gly ala Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000006011 modification reaction Methods 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 239000004474 valine Substances 0.000 description 4
- 230000003612 virological Effects 0.000 description 4
- SBVPYBFMIGDIDX-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-pyrrolidin-1-ium-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylate Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 3
- CQGSYZCULZMEDE-SRVKXCTJSA-N (2S)-1-[(2S)-5-amino-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-5-oxopentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 3
- PJYSOYLLTJKZHC-GUBZILKMSA-N (2S)-5-amino-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-carboxypropanoyl]amino]-5-oxopentanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 3
- PVMPDMIKUVNOBD-CIUDSAMLSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-[[(1S)-1-carboxy-2-hydroxyethyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 3
- 229920000160 (ribonucleotides)n+m Polymers 0.000 description 3
- BUXAPSQPMALTOY-UHFFFAOYSA-N 2-[(2-amino-3-sulfanylpropanoyl)amino]pentanedioic acid Chemical compound SCC(N)C(=O)NC(C(O)=O)CCC(O)=O BUXAPSQPMALTOY-UHFFFAOYSA-N 0.000 description 3
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 3
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 3
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 3
- 102000033147 ERVK-25 Human genes 0.000 description 3
- VHLZDSUANXBJHW-UHFFFAOYSA-N Glutaminyl-Phenylalanine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-UHFFFAOYSA-N 0.000 description 3
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 3
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 3
- NIKBMHGRNAPJFW-UHFFFAOYSA-N Histidinyl-Arginine Chemical compound NC(=N)NCCCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 NIKBMHGRNAPJFW-UHFFFAOYSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 125000003338 L-glutaminyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 3
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 3
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 3
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 3
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 3
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 3
- SBMNPABNWKXNBJ-UHFFFAOYSA-N Serinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CO SBMNPABNWKXNBJ-UHFFFAOYSA-N 0.000 description 3
- 101700067391 TACC1 Proteins 0.000 description 3
- XCTHZFGSVQBHBW-IUCAKERBSA-N Val-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C XCTHZFGSVQBHBW-IUCAKERBSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 239000003150 biochemical marker Substances 0.000 description 3
- 230000001925 catabolic Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 3
- 101700015997 grg-1 Proteins 0.000 description 3
- 230000002363 herbicidal Effects 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 230000002209 hydrophobic Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000036961 partial Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 108010036320 valylleucine Proteins 0.000 description 3
- ZNJFBWYDHIGLCU-HWKXXFMVSA-N (-)-Jasmonic acid Natural products CC\C=C/C[C@@H]1[C@@H](CC(O)=O)CCC1=O ZNJFBWYDHIGLCU-HWKXXFMVSA-N 0.000 description 2
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 2
- DSTWKJOBKSMVCV-UWVGGRQHSA-N (2S)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DSTWKJOBKSMVCV-UWVGGRQHSA-N 0.000 description 2
- XMAUFHMAAVTODF-STQMWFEESA-N (2S)-2-[[(2S)-2-amino-3-(1H-imidazol-5-yl)propanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N (2S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]-3-phenylpropanoate Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- OCUSNPIJIZCRSZ-ZTZWCFDHSA-N (2S)-2-amino-3-methylbutanoic acid;(2S)-2-amino-4-methylpentanoic acid;(2S,3S)-2-amino-3-methylpentanoic acid Chemical class CC(C)[C@H](N)C(O)=O.CC[C@H](C)[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O OCUSNPIJIZCRSZ-ZTZWCFDHSA-N 0.000 description 2
- MWMOPIVLTLEUJO-UHFFFAOYSA-N 2-oxopropanoic acid;phosphoric acid Chemical compound OP(O)(O)=O.CC(=O)C(O)=O MWMOPIVLTLEUJO-UHFFFAOYSA-N 0.000 description 2
- MGHKSHCBDXNTHX-UHFFFAOYSA-N 4-amino-5-[(4-amino-1-carboxy-4-oxobutyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-UHFFFAOYSA-N 0.000 description 2
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- FSHURBQASBLAPO-WDSKDSINSA-N Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)N FSHURBQASBLAPO-WDSKDSINSA-N 0.000 description 2
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 2
- ALZVPLKYDKJKQU-XVKPBYJWSA-N Ala-Tyr Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ALZVPLKYDKJKQU-XVKPBYJWSA-N 0.000 description 2
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 2
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 2
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 2
- 101710010587 CASP13 Proteins 0.000 description 2
- 210000000805 Cytoplasm Anatomy 0.000 description 2
- 108010058076 D-Xylulose Reductase Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 101700014779 GLB1 Proteins 0.000 description 2
- 102100014497 GOLPH3 Human genes 0.000 description 2
- 101710008339 GOLPH3 Proteins 0.000 description 2
- 102100004985 GUSB Human genes 0.000 description 2
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 2
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- WRPDZHJNLYNFFT-UHFFFAOYSA-N Histidinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WRPDZHJNLYNFFT-UHFFFAOYSA-N 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 229940088597 Hormone Drugs 0.000 description 2
- 108090001042 Hydro-Lyases Proteins 0.000 description 2
- 102000004867 Hydro-Lyases Human genes 0.000 description 2
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 2
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 2
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 2
- 108010060534 MSH (11-13) Proteins 0.000 description 2
- 101700062818 NP Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 101710043203 P23p89 Proteins 0.000 description 2
- 101710026311 PF14_0127 Proteins 0.000 description 2
- 108091005771 Peptidases Proteins 0.000 description 2
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 2
- 108020005089 Plant RNA Proteins 0.000 description 2
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 2
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- YAHZABJORDUQGO-NQXXGFSBSA-N Ribulose-1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 2
- 235000011449 Rosa Nutrition 0.000 description 2
- 108060007759 SLC6A1 Proteins 0.000 description 2
- 102100013658 SORD Human genes 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 2
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 2
- 229920000978 Start codon Polymers 0.000 description 2
- 101700073473 TPT1 Proteins 0.000 description 2
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N Thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229920001949 Transfer RNA Polymers 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- KRNYOVHEKOBTEF-YUMQZZPRSA-N Val-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O KRNYOVHEKOBTEF-YUMQZZPRSA-N 0.000 description 2
- 101700057036 accC1 Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 101710025952 adhT Proteins 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 244000052616 bacterial pathogens Species 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 101700068391 cgt-2 Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 230000003247 decreasing Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drugs Drugs 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000002255 enzymatic Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 101710034616 gVIII-1 Proteins 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 230000002452 interceptive Effects 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 101700045377 mvp1 Proteins 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 125000001235 proline group Chemical group [H]N1[C@@](C(=O)[*])([H])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 108091007521 restriction endonucleases Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 230000002269 spontaneous Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 108010021889 valylvaline Proteins 0.000 description 2
- FVIYEKRCCSJZFZ-UHFFFAOYSA-M (1-$l^{1}-oxidanyl-2,2,6,6-tetramethylpiperidin-4-yl)-trimethylazanium;iodide Chemical compound [I-].CC1(C)CC([N+](C)(C)C)CC(C)(C)N1[O] FVIYEKRCCSJZFZ-UHFFFAOYSA-M 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-2-amino-3-methylbutanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N (2S)-1-[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-3-phenylpropanoyl]amino]propanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N (2S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]-4-methylpentanoate Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N (4S)-4-amino-5-[[(2S)-4-carboxy-1-(carboxymethylamino)-1-oxobutan-2-yl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- GJSURZIOUXUGAL-UHFFFAOYSA-N 2-((2,6-Dichlorophenyl)imino)imidazolidine Chemical compound ClC1=CC=CC(Cl)=C1NC1=NCCN1 GJSURZIOUXUGAL-UHFFFAOYSA-N 0.000 description 1
- KPGXRSRHYNQIFN-UHFFFAOYSA-L 2-oxoglutarate(2-) Chemical compound [O-]C(=O)CCC(=O)C([O-])=O KPGXRSRHYNQIFN-UHFFFAOYSA-L 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 108010080376 3-Deoxy-7-Phosphoheptulonate Synthase Proteins 0.000 description 1
- 108010019608 3-Oxoacyl-(Acyl-Carrier-Protein) Synthase Proteins 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-Phosphoglyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- 101710041057 AT2S4 Proteins 0.000 description 1
- 102000000452 Acetyl-CoA Carboxylase Human genes 0.000 description 1
- 108010016219 Acetyl-CoA Carboxylase Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 108010049418 Acyl Carrier Protein Proteins 0.000 description 1
- 229960000643 Adenine Drugs 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Natural products NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000242764 Aequorea victoria Species 0.000 description 1
- 241000589159 Agrobacterium sp. Species 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- 241000724328 Alfalfa mosaic virus Species 0.000 description 1
- WVRUNFYJIHNFKD-WDSKDSINSA-N Arg-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N WVRUNFYJIHNFKD-WDSKDSINSA-N 0.000 description 1
- PMGDADKJMCOXHX-BQBZGAKWSA-N Arg-Gln Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PMGDADKJMCOXHX-BQBZGAKWSA-N 0.000 description 1
- XTWSWDJMIKUJDQ-RYUDHWBXSA-N Arg-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XTWSWDJMIKUJDQ-RYUDHWBXSA-N 0.000 description 1
- XNSKSTRGQIPTSE-UHFFFAOYSA-N Arginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCCNC(N)=N XNSKSTRGQIPTSE-UHFFFAOYSA-N 0.000 description 1
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- 229960001230 Asparagine Drugs 0.000 description 1
- 229960005261 Aspartic Acid Drugs 0.000 description 1
- 102100015648 BACE2 Human genes 0.000 description 1
- 101700051947 BACE2 Proteins 0.000 description 1
- 206010060945 Bacterial infection Diseases 0.000 description 1
- 101710028544 CG3967 Proteins 0.000 description 1
- 101700015466 Cat-1 Proteins 0.000 description 1
- NSMUHPMZFPKNMZ-VBYMZDBQSA-M Chlorophyll b Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C=O)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 NSMUHPMZFPKNMZ-VBYMZDBQSA-M 0.000 description 1
- 108010049994 Chloroplast Proteins Proteins 0.000 description 1
- 229940089639 Cornsilk Drugs 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108091022177 Cysteine synthases Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 229940104302 Cytosine Drugs 0.000 description 1
- OPTASPLRGRRNAP-UHFFFAOYSA-N Cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L D-glyceraldehyde 3-phosphate(2-) Chemical compound O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- QIVBCDIJIAJPQS-SECBINFHSA-N D-tryptophane Chemical compound C1=CC=C2C(C[C@@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-SECBINFHSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-N Deoxycytidine triphosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 1
- 108010021809 EC 1.1.1.1 Proteins 0.000 description 1
- 102000007698 EC 1.1.1.1 Human genes 0.000 description 1
- 108010031396 EC 1.10.3.1 Proteins 0.000 description 1
- 102000031088 EC 1.10.3.1 Human genes 0.000 description 1
- 108010039811 EC 2.4.1.21 Proteins 0.000 description 1
- 108010092799 EC 2.7.7.49 Proteins 0.000 description 1
- 108010068561 EC 4.1.2.13 Proteins 0.000 description 1
- 102000001390 EC 4.1.2.13 Human genes 0.000 description 1
- 210000001161 Embryo, Mammalian Anatomy 0.000 description 1
- 210000003935 Endoplasmic Reticulum, Rough Anatomy 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 210000003414 Extremities Anatomy 0.000 description 1
- 108050000784 Ferritin Proteins 0.000 description 1
- 102000008857 Ferritin Human genes 0.000 description 1
- 238000008416 Ferritin Methods 0.000 description 1
- 101710008404 GAPDH Proteins 0.000 description 1
- 102100006425 GAPDH Human genes 0.000 description 1
- 102100010500 GGT1 Human genes 0.000 description 1
- 101700082072 GGT1 Proteins 0.000 description 1
- 101700012085 GRE3 Proteins 0.000 description 1
- 102100013241 GSR Human genes 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- 108091000031 Glucose-1-phosphate adenylyltransferases Proteins 0.000 description 1
- CLSDNFWKGFJIBZ-UHFFFAOYSA-N Glutaminyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CCC(N)=O CLSDNFWKGFJIBZ-UHFFFAOYSA-N 0.000 description 1
- 108010063907 Glutathione Reductase Proteins 0.000 description 1
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 1
- 108010041921 Glycerolphosphate Dehydrogenase Proteins 0.000 description 1
- 102000000587 Glycerolphosphate Dehydrogenase Human genes 0.000 description 1
- 108010088778 Glycine max beta-conglycinin protein Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 108020004391 Introns Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- 125000002059 L-arginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C([H])([H])N([H])C(=N[H])N([H])[H] 0.000 description 1
- 125000000415 L-cysteinyl group Chemical group O=C([*])[C@@](N([H])[H])([H])C([H])([H])S[H] 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 125000002061 L-isoleucyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](C([H])([H])[H])([H])C(C([H])([H])[H])([H])[H] 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- JXNRXNCCROJZFB-RYUDHWBXSA-N L-tyrosyl-L-arginine Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JXNRXNCCROJZFB-RYUDHWBXSA-N 0.000 description 1
- 101700021119 LEUC Proteins 0.000 description 1
- 241000254158 Lampyridae Species 0.000 description 1
- LCPYQJIKPJDLLB-UWVGGRQHSA-N Leu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C LCPYQJIKPJDLLB-UWVGGRQHSA-N 0.000 description 1
- NTISAKGPIGTIJJ-IUCAKERBSA-N Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C NTISAKGPIGTIJJ-IUCAKERBSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N Leu-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- MDSUKZSLOATHMH-IUCAKERBSA-N Leu-Val Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C([O-])=O MDSUKZSLOATHMH-IUCAKERBSA-N 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 108090000128 Lipoxygenases Proteins 0.000 description 1
- 102000003820 Lipoxygenases Human genes 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 108060001084 Luciferase family Proteins 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- 101710013896 MIMI_R730 Proteins 0.000 description 1
- 101710008147 MRPS2 Proteins 0.000 description 1
- 241000702489 Maize streak virus Species 0.000 description 1
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 1
- PESQCPHRXOFIPX-RYUDHWBXSA-N Met-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-RYUDHWBXSA-N 0.000 description 1
- 210000004897 N-terminal region Anatomy 0.000 description 1
- XJLXINKUBYWONI-NNYOXOHSSA-N Nicotinamide adenine dinucleotide phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-NNYOXOHSSA-N 0.000 description 1
- 108010025915 Nitrite Reductases Proteins 0.000 description 1
- VZXPDPZARILFQX-BYPYZUCNSA-N O-acetyl-L-serine zwitterion Chemical compound CC(=O)OC[C@H]([NH3+])C([O-])=O VZXPDPZARILFQX-BYPYZUCNSA-N 0.000 description 1
- 101710026527 OLE Proteins 0.000 description 1
- 101700074785 OLEO Proteins 0.000 description 1
- 102100019712 OXSM Human genes 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 101700008436 PCSK1 Proteins 0.000 description 1
- 101700032936 PRK2 Proteins 0.000 description 1
- 229960005190 Phenylalanine Drugs 0.000 description 1
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 1
- GVUVRRPYYDHHGK-UHFFFAOYSA-N Prolyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C1CCCN1 GVUVRRPYYDHHGK-UHFFFAOYSA-N 0.000 description 1
- 108010078762 Protein Precursors Proteins 0.000 description 1
- 102000014961 Protein Precursors Human genes 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 241001340896 Pyralis Species 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J Pyrophosphate Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 229940076788 Pyruvate Drugs 0.000 description 1
- 101710028069 QTRT1 Proteins 0.000 description 1
- 229920000320 RNA (poly(A)) Polymers 0.000 description 1
- 108020004412 RNA 3' Polyadenylation Signals Proteins 0.000 description 1
- 101700016451 RPS2 Proteins 0.000 description 1
- 102100014339 RPS2 Human genes 0.000 description 1
- 101700011085 RPS5 Proteins 0.000 description 1
- 210000003705 Ribosomes Anatomy 0.000 description 1
- 101700027726 SPE1 Proteins 0.000 description 1
- 241000235060 Scheffersomyces stipitis Species 0.000 description 1
- 241000242583 Scyphozoa Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108010043943 Starch Phosphorylase Proteins 0.000 description 1
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 1
- 108010012715 Superoxide Dismutase Proteins 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- NBFQPSCRGQGZEP-YBKRDZSWSA-N TAT 14 Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(N)=N)NC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)[C@@H](C)O)CC1=CC=CC=C1 NBFQPSCRGQGZEP-YBKRDZSWSA-N 0.000 description 1
- 102000005497 Thymidylate Synthase Human genes 0.000 description 1
- 108010067449 Thymidylate Synthase Proteins 0.000 description 1
- 229940113082 Thymine Drugs 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- 101710009617 USP14 Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102400000757 Ubiquitin Human genes 0.000 description 1
- HSRXSKHRSXRCFC-WDSKDSINSA-N Val-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(O)=O HSRXSKHRSXRCFC-WDSKDSINSA-N 0.000 description 1
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 1
- YSGSDAIMSCVPHG-YUMQZZPRSA-N Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C YSGSDAIMSCVPHG-YUMQZZPRSA-N 0.000 description 1
- HEBKCHPVOIAQTA-SCDXWVJYSA-N Xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 1
- 229960002675 Xylitol Drugs 0.000 description 1
- 108020000244 Xylose isomerases Proteins 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 229940093612 Zein Drugs 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- 108010055615 Zein Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K [O-]P([O-])([O-])=O Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- ZKJOXOJMGXFSPF-QYZPTAICSA-N [[(2R,3R,4R,5R)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2R,3S,4R,5R)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate;hydrate Chemical compound O.NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 ZKJOXOJMGXFSPF-QYZPTAICSA-N 0.000 description 1
- JLIDBLDQVAYHNE-FEGZXCSJSA-N abscisic acids Chemical compound OC(=O)C=C(C)\C=C\C1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-FEGZXCSJSA-N 0.000 description 1
- 229930000028 abscisic acids Natural products 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 238000009632 agar plate Methods 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 1
- 230000000340 anti-metabolite Effects 0.000 description 1
- 239000002256 antimetabolite Substances 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 101700065210 asp1 Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 102000024070 binding proteins Human genes 0.000 description 1
- 108091007650 binding proteins Proteins 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 101700021616 catA1 Proteins 0.000 description 1
- 230000035569 catabolism Effects 0.000 description 1
- 230000024881 catalytic activity Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 101700041353 cbbX Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 101700063833 cgt-1 Proteins 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 229930002868 chlorophyll a Natural products 0.000 description 1
- 229930002869 chlorophyll b Natural products 0.000 description 1
- 108091000086 chlorophyll binding proteins Proteins 0.000 description 1
- 108010031100 chloroplast transit peptides Proteins 0.000 description 1
- 230000001010 compromised Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 101710036879 ctg-1 Proteins 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000004059 degradation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 230000001419 dependent Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 102000004419 dihydrofolate reductase family Human genes 0.000 description 1
- 108020001096 dihydrofolate reductase family Proteins 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- -1 diplocyanine Proteins 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 201000009910 diseases by infectious agent Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N edta Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 230000000408 embryogenic Effects 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 230000002349 favourable Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 239000001963 growth media Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000102 heterotrophic Effects 0.000 description 1
- 125000003372 histidine group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 101710004442 ilv1 Proteins 0.000 description 1
- 101700083182 ilvA Proteins 0.000 description 1
- 101700039365 ilvC Proteins 0.000 description 1
- 101700046987 ilvY Proteins 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 230000010189 intracellular transport Effects 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl β-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 230000001665 lethal Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 210000004901 leucine-rich repeat Anatomy 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010091798 leucylleucine Proteins 0.000 description 1
- 101710030587 ligN Proteins 0.000 description 1
- 101700077585 ligd Proteins 0.000 description 1
- 230000000670 limiting Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229940049920 malate Drugs 0.000 description 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-L malate(2-) Chemical compound [O-]C(=O)C(O)CC([O-])=O BJEPYKJPYRNKOW-UHFFFAOYSA-L 0.000 description 1
- 210000004962 mammalian cells Anatomy 0.000 description 1
- 108010083942 mannopine synthase Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000001404 mediated Effects 0.000 description 1
- 201000009906 meningitis Diseases 0.000 description 1
- 230000002503 metabolic Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000017066 negative regulation of growth Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 108010086644 oleoyl-(acyl-carrier-protein) hydrolase Proteins 0.000 description 1
- 210000000056 organs Anatomy 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000865 phosphorylative Effects 0.000 description 1
- 238000004161 plant tissue culture Methods 0.000 description 1
- 230000001402 polyadenylating Effects 0.000 description 1
- 101700015794 pro Proteins 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000002035 prolonged Effects 0.000 description 1
- 230000001737 promoting Effects 0.000 description 1
- 230000000644 propagated Effects 0.000 description 1
- 210000001938 protoplasts Anatomy 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 101700017580 rca Proteins 0.000 description 1
- 230000002829 reduced Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical compound OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 230000001502 supplementation Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 108020002982 thioesterase family Proteins 0.000 description 1
- 102000005488 thioesterase family Human genes 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000007039 two-step reaction Methods 0.000 description 1
- 101700075735 tyr-1 Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 101700006979 xyl2 Proteins 0.000 description 1
- 239000000811 xylitol Substances 0.000 description 1
- 235000010447 xylitol Nutrition 0.000 description 1
- 101710038554 xynBS9 Proteins 0.000 description 1
- 239000001231 zea mays silk Substances 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- UKKNTTCNGZLJEX-UHFFFAOYSA-N γ-glutamyl-Serine Chemical compound NC(=O)CCC(N)C(=O)NC(CO)C(O)=O UKKNTTCNGZLJEX-UHFFFAOYSA-N 0.000 description 1
Abstract
La presente invención se refiere a métodos y materiales en el campo de al biología molecular y a la regulación de la síntesis de polipéptidos a través de la ingeniería genética de las plantas y/o los microorganismos. Más particularmente, la invención se refiere a secuencias de nucleótidos aislados recientemente, a secuencias de nucleótidos que tienen una identidad substancial con la misma y a los equivalentes de la misma, asícomo a los polipéptidos codificados por la misma. La invención también involucra la introducción de secuencias de nucleótidos extrañas en el genoma de una planta y/o microorganismo, en donde la introducción de la secuencia de nucleótidos efectúa un incremento en la resistencia del transformante a los análogos estructurales de la isoleucina tóxicos. Las secuencias inventivas por lo tanto pueden ser utilizadas como marcadores moleculares excelentes para seleccionar los transformantes exitosos, por lo cual se reemplazan los genes resistentes a los antibióticos utilizados en la técnica previa. Los transformantes hospedan una secuencia de nucleótidos que comprende un promotor enlazado operativamente a una secuencia de nucleótidos de la invención, demostraron niveles incrementados de producción de isoleucina, por lo cual se proporciona una fuente de nutrientes mejorada.
Description
MÉTODOS Y COMPOSICIONES PARA PRODUCIR PLANTAS Y MICROORGANISMOS QUE EXPRESAN LA TREONINA
DESHIDRATASA/DESAMINASA INSENSIBLE A IA RETROALIMENTACIÓN
ANTECEDENTES DE LA INVENCIÓN
Campo de la Invención
La presente invención se refiere a métodos y materiales en el campo de la biología molecular y a la utilización de secuencias de nucleótidos aisladas para diseñar genéticamente plantas, y/o microorganismos. Más particularmente, la invención se refiere en ciertos aspectos preferidos a nuevas secuencias de nucleótidos y a los usos de la misma, incluyendo su uso en las construcciones de ADN para transformar plantas, hongos, levaduras y bacterias. Las secuencias de nucleótidos son particularmente útiles como marcadores seleccionables para seleccionar plantas y/o microorganismos para transformantes exitosos y también para mejorar el valor nutricional de las plantas.
Rßf .032459 Introducción y Descripción de la Técnica Relacionada
La treonina deshidratasa/desaminasa ("TD") es la primera enzima en la ruta biosintética de la isoleucina, y cataliza la formación del 2-oxobutirato a partir de la treonina ("Thr") en una reacción de dos pasos. El primer paso es una deshidratación de la Thr, seguido por la rehidratación y liberación de amoníaco. Todas las reacciones corriente abajo del TD son catalizadas por enzimas que son compartidas por dos ramificaciones principales de la ruta biosintética que conduce a la producción de los aminoácidos de cadena ramificada, isoleucina ("lie"), leucina ("Leu"), y valina ("Val") . Una ilustración de la ruta biosintética se describe en la Figura 1. Los niveles celulares de la lie son controlados por la inhibición de la retroalimentación negativa. Cuando los niveles celulares de la lie son elevados, la lie se une a la TD en un sitio regulatorio (sitio aloestérico) que es diferente del sitio de unión del substrato (sitio catalítico) de la enzima. La formación de este complejo de Ile-TD provoca cambios conformacionales a la TD, los cuales previenen la unión del substrato, inhibiendo así la ruta biosintética de la He.
Ya se sabe que existen ciertos análogos estructurales de la He los cuales son tóxicos para una amplia variedad de plantas y microorganismos. Se cree que estos análogos de He son tóxicos a causa de que las células incorporan los análogos en los polipéptidos en lugar de la He, por lo cual se sintetizan polipéptidos defectuosos. A este respecto, la L-O-metiltreonina ("OMT") se reportó en 1955 que es un análogo estructural de la He que inhibe el crecimiento de los cultivos de las células de los mamíferos, inhibiendo la incorporación de la He en las proteínas. (Rabinovitz M. et al., Steric relationship between threonine and isoleucine as indicated by an antimetabolite study. J Am Chem Soc 77:3109-3111 (1955)). Se cree que el mismo fenómeno explica la inhibición del crecimiento, el cual es provocado por otros análogos estructurales de la He tales como, por ejemplo, thialle. Ciertas cepas de las bacterias y levaduras y ciertas líneas vegetales han sido identificadas, las cuales son resistentes a la toxicidad de los análogos estructurales de He señalados anteriormente, y esta resistencia ha sido atribuida a una mutación en la enzima de TD. La TD mutada aparentemente caracteriza una pérdida o reducción de la sensibilidad de retroalimentación de la He (referida aquí como "insensibilidad") . Como resultado de esta insensibilidad, las células que hospedan la TD insensible producen cantidades incrementadas de He, por lo cual compiten con el análogo de He tóxico durante la incorporación en las proteínas celulares. Por ejemplo, la resistencia a thialle ha sido asociada en ciertas cepas de bacterias y levadura con una pérdida de la sensibilidad en la retroalimentación de TD a He. En las células de Rosa, la resistencia a OMT también fue asociada con una TD que tiene sensibilidad reducida a la inhibición en la retroalimentación por He. Existiendo en el cultivo del tejido y teniendo un nivel de ploidía elevado, sin embargo, no fue posible determinar las bases genéticas de la insensibilidad en la retroalimentación a la He en la variante Rosa, la única planta conocida mutada con una TD insensible a la He. Pasando a un campo de investigación en donde la presente invención encuentra aplicación ventajosa, los marcadores seleccionables son utilizados ampliamente en métodos para transformar genéticamente células, tejidos y organismos. Tales marcadores son utilizados para seleccionar células, más comúnmente bacterias, para determinar si un procedimiento de transformación ha sido exitoso. Como un ejemplo específico, se conoce ampliamente que las construcciones para transformar una célula pueden incluir como un marcador seleccionable una secuencia de nucleótidos que confiere resistencia a los antibióticos a la célula transformada. Cuando se utilice aquí con relación a las células y las plantas, los términos "transformada" y "transgénica" son utilizados intercambiablemente para referirse a una célula o planta que expresa una secuencia de nucleótidos extraña introducida por medio de esfuerzos de transformación. El término "secuencia de nucleótidos extraña" está propuesto para indicar una secuencia que codifica un polipéptido cuya secuencia de aminoácidos exacta no es encontrada normalmente en la célula huésped, pero es introducida en la misma a través de técnicas de transformación. Después de la transformación, las células se pueden poner en contacto con un antibiótico en un procedimiento de selección. Solamente los transformantes exitosos, es decir, aquellos que poseen el gen de resistencia a los antibióticos, sobreviven y continúan creciendo y proliferando en la presencia del antibiótico. Estas técnicas proporcionan una manera por la cual los transformantes exitosos pueden ser identificados y propagados, por lo cual se elimina el consumo de tiempo y las alternativas costosas de crecimiento y trabajo con las células las cuales no fueron transformadas exitosamente.
La técnica de selección descrita anteriormente está llegando a ser menos ventajosa, sin embargo, a causa de que, debido a la exposición prolongada a los antibióticos, un número siempre creciente de microorganismos que están presentes naturalmente están desarrollando resistencia a los antibióticos por la mutación espontánea. La confiabilidad de esta técnica de selección está comprometida por lo tanto a causa de que la exposición continua a los antibióticos provoca que los microorganismos que no son transformados desarrollen una mutación espontánea que les confiere resistencia a los antibióticos. Además, de la viabilidad decreciente de esta técnica de selección, el sobreuso de antibióticos, y la resistencia resultante desarrollada espontáneamente por los microorganismos, es de un interés médico creciente porque la eficacia de los antibióticos en la batalla contra las infecciones bacterianas está disminuyendo. Muchas infecciones -incluyendo la meningitis- ya no responden bien a los fármacos que una vez trabajaron bien contra ellos. Este fenómeno es atribuido ampliamente al sobreuso de los antibióticos, tanto a los fármacos y como una herramienta de selección de laboratorio, como a la resistencia a los antibióticos resultantes de un número creciente de microorganismos. Como un ejemplo, la bacteria que provoca la meningitis una vez fue controlada rutinariamente con ampicilina, un antibiótico prescrito comúnmente y un antibiótico utilizado muy pesadamente en la selección de las células bacterianas transformadas para la resistencia como un marcador seleccionable. Ahora, sin embargo, aproximadamente 20 por ciento de tales infecciones son resistentes a la ampicilina. La presente invención se dirige a los problemas mencionados anteriormente en la selección de transformantes genéticos y proporciona secuencias de nucleótidos las cuales pueden ser utilizadas ventajosamente como marcadores seleccionables, y las cuales pueden ser insertadas en el genoma de una planta o microorganismo para proporcionar una planta o microorganismo transformado. Tal planta o microorganismo transformado exhibe venta osamente niveles incrementados significativamente de la síntesis de He y la síntesis de los compuestos intermedios de la ruta biosintética de He y por lo tanto también son capaces de sobrevivir en la presencia de un análogo de He tóxico.
Breve Descripción de la Invención
La presente invención proporciona secuencias de nucleótidos, aisladas y clonadas originalmente a partir de Arabidopsis thaliana, las cuales codifican la TD insensible a la retroalimentación que pueden ser utilizadas ventajosamente para transformar una amplia variedad de plantas, hongos, bacterias y levaduras. Las formas inventivas de TD no solamente son insensibles a la inhibición de la retroalimentación por la isoleucina, sino también insensibles a los análogos estructurales de la isoleucina que son tóxicos para las plantas y los microorganismos que sintetizan solamente la TD del tipo silvestre. Por lo tanto, las secuencias de nucleótidos inventivas que codifican las formas mutadas de la TD pueden ser utilizadas para crear las células que son insensibles a los compuestos normalmente tóxicos a las células que expresan solamente las enzimas de TD del tipo silvestre. A este respecto, una secuencia de nucleótidos de la invención puede ser utilizada en una construcción de ADN para proporcionar un marcador seleccionable bioquímico. Un aspecto de la presente invención es la identificación, aislamiento y purificación de un gen que codifica una forma del tipo silvestre de la TD. La secuencia de ADN de la misma puede ser utilizada como se describe aquí para determinar la secuencia de aminoácidos completa para la proteína codificada por la misma y por consiguiente permite la identificación de los dominios encontrados allí que pueden ser mutados para producir las proteínas de TD adicionales que tienen características enzimáticas alteradas. En otro aspecto de la invención, se proporcionan polinucleótidos aislados y purificados, los polinucleótidos codifican una forma mutada de la TD, o una porción de la misma, como se describe aquí. Por ejemplo, la invención proporciona polinucleótidos aislados que comprenden las secuencias descritas en las SEC ID N0:2, SEC ID NO: 3 y la SEC ID NO: 4, las secuencias de nucleótidos que tienen la identidad substancial para la misma, y las secuencias de nucleótidos que codifican las variantes de TD de la invención. También son provistos los polipéptidos aislados que comprenden las secuencias de aminoácidos descritas en las SEC ID NO: 2, SEC ID NO: 3 y la SEC ID NO: 4 y las variantes de las mismas seleccionadas de acuerdo con la invención. En un aspecto alternativo de la invención, se proporciona una construcción de ADN quimérica que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es substancialmente resistente a la inhibición de la retroalimentación. En una célula que hospeda la construcción, la secuencia de nucleótidos puede ser transcrita para producir el ARNm y dicho ARNm puede ser transladado o traducido para producir ya sea la TD mutada, madura o una proteína de TD mutada del precursor, la proteína es funcional en la célula. También se provee, por lo tanto, un vector útil para transformar una células, y las plantas y microorganismos transformados .con el mismo, el vector comprende una construcción de ADN seleccionada de acuerdo con la invención. En los aspectos alternativos de la invención, se proporcionan células y plantas que tienen incorporado en su genoma una secuencia de nucleótidos extraña enlazada operativamente a un promotor, la secuencia extraña comprende una secuencia de nucleótidos que tiene una identidad substancial con respecto a una secuencia descrita aquí o una secuencia de nucleótidos extraña que codifica un polipéptido de la invención. En otro aspecto de la invención, se proporciona un método que comprende incorporar en un genoma de la planta una construcción de ADN de la invención para proporcionar una planta transformada; en donde la planta transformada es capaz de expresar las secuencias de nucleótidos. Todavía otro aspecto de la invención es la producción y propagación de las células transformadas de acuerdo con la invención, en donde las células expresan una enzima de TD mutada, haciendo por consiguiente resistentes a las células para la inhibición de la retroalimentación por la leucina, y resistentes a las moléculas que son tóxicas para una célula que produce solamente la enzima de TD del tipo silvestre. A este respecto, se proporciona un método que comprende proveer un vector que caracteriza un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es resistente a la inhibición de la retroalimentación, en donde el promotor regula la expresión de la secuencia de nucleótidos en una célula de la planta huésped; y transformar una planta de blanco u objetivo con el vector para proporcionar una planta transformada, la planta transformada es capaz de expresar la secuencia de nucleótidos. Las plantas transformadas de acuerdo con la invención tienen dentro de sus cloroplastos una forma mutado de la TD, madura, la cual hace a las células resistentes a los análogos de He tóxicos. También se proporcionan plantas transformadas obtenidas de acuerdo con los métodos de la invención y la progenie de los mismos. También se proporciona un método para seleccionar los transformantes potenciales, que comprende (1) proveer una pluralidad de células, en donde al menos una de las células tiene en su genoma una secuencia de nucleótidos extraña, expresable, seleccionada de acuerdo con la invención; y (2) poner en contacto la pluralidad de las células con un substrato que comprende un análogo estructural de isoleucina tóxica; en donde las células que comprenden la secuencia de nucleótidos extraña, expresable, son capaces de crecimiento en el substrato, y en donde las células que no comprenden la secuencia de nucleótidos extraña, expresable, son incapaces de crecer en el substrato. En otro aspecto de la invención, se proporciona una construcción que comprende una secuencia de nucleótidos primaria que va a ser introducida en el genoma de una célula, tejido y/u organismo de blanco u objetivo, y que comprende además un marcador seleccionable bioquímico, seleccionado de acuerdo con la invención. Este aspecto de la invención puede ser utilizado ventajosamente para transformar una amplia variedad de células, que incluyen los microorganismos y las células vegetales. Después de introducir la construcción de ADN, la cual también incluye un promotor apropiado y tales otras secuencias regulatorias como pueden ser seleccionadas por un artesano experto, en un microorganismo o planta de blanco u objetivo, la planta o microorganismo, se puede hacer crecer en un substrato que comprende un análogo de isoleucina tóxica (un "substrato tóxico"), por lo cual se proporciona un mecanismo para la determinación inicial si la transformación fue exitosa. En donde una pluralidad de plantas o microorganismos son transformadas, colocando los transformantes potenciales en un substrato tóxico proporciona un paso de selección inicial por el cual los transformantes exitosos pueden ser ientificados. Se entiende fácilmente por una persona experta en el campo relevante, en vista de la presente especificación, que los transformantes exitosos crecerán normalmente en el substrato tóxico en virtud de la expresión de la TD insensible; sin embargo, las plantas y/o los microorganismos transformados no exitosamente morirán debido al efecto tóxico del substrato. Las plantas transformadas pueden ser identificadas por lo tanto rápidamente de acuerdo con la invención, y los microorganismos transformados pueden ser identificados de acuerdo con la invención sin utilizar genes resistentes a los antibióticos. En otro aspecto de la invención, se proporciona un método para incorporar confiablemente una primera secuencia de nucleótidos extraña, expresable, en una célula de blanco u objetivo, que comprende proporcionar un vector que comprende un promotor enlazado operativamente a una primera secuencia de nucleótidos primaria y una segunda secuencia de nucleótidos seleccionada de acuerdo con la invención, la segunda secuencia que codifica una enzima de TD insensible; transformar la célula de blanco u objetivo con el vector para proporcionar una célula transformada; y poner en contacto la célula con un substrato que comprende la L-0-metiltreonina; en donde las células transformadas exitosamente son capaces de crecer en el substrato, y en donde las células transformadas exitosamente son incapaces de crecer en el substrato. En un aspecto alternativo de la invención, se proporciona un método para hacer crecer una pluralidad de plantas en la ausencia de las plantas indeseables, tales como, malas hierbas, el método comprende proporcionar una pluralidad de plantas, cada una teniendo en su genoma una secuencia de nucleótidos extraña que comprende un promotor enlazado operativamente a una secuencia de nucleótidos seleccionada de acuerdo con la invención; hacer crecer la pluralidad de las plantas en un substrato; e introducir una cantidad preseleccionada de un análogo estructural de isoleucina en el substrato. Las enzimas de TD descritas aquí funcionan en los cloroplastos de una célula vegetal. Por lo tanto, es apreciado fácilmente por un artesano experto que una secuencia de nucleótidos insertada en una célula vegetal codificará necesariamente un péptido de TD del precursor. Por consiguiente, las construcciones del ADN quimérico son descritas aquí, las cuales comprenden una primera secuencia de nucleótidos que codifica una forma mutada madura de la TD y una segunda secuencia de nucleótidos que codifica un péptido de tránsito de cloroplastos de elección, la segunda secuencia está unida funcionalmente al extremo 5' de la primera secuencia. La expresión de la construcción del ADN quimérico conduce a la producción de una enzima de TD precursora mutada que puede ser translocada o translocalizada en un cloroplasto. La presencia de una TD mutada madura en el cloroplasto conduce a una célula vegetal que tiene las características descritas aquí. Es un objeto de la presente invención proporcionar secuencias de nucleótidos aisladas las cuales pueden ser introducidas en el genoma de una planta o microorganismo para incrementar la capacidad de la planta o microorganismo para sintetizar la He y los compuestos intermedios de la ruta biosintética de la He. Adicionalmente, es un objeto de la invención proporcionar secuencias de nucleótidos, las cuales puedan ser utilizadas como excelentes marcadores seleccionables bioquímicos para identificar transformantes exitosos en los protocolos de la ingeniería cinética.
También es un objeto de la invención proporcionar un sistema herbicida, que no es nocivo para el medio ambiente, selectivo, eficiente, novedoso. Los objetos, ventajas y características adicionales de la presente invención serán evidentes a partir de la descripción detallada de aquí.
Breve Descripción de las Figuras
Aunque las características distintivas de esta invención serán puntualizadas particularmente en las reivindicaciones, la invención por sí misma, y la manera en la cual la misma se puede hacer y utilizar, puede ser mejor entendida por la referencia a la siguiente descripción tomada con relación a las Figuras que se acompañan que forman una parte de la misma. La Figura 1 ilustra la ruta biosintética de los aminoácidos de cadena ramificada de valina, leucina e isoleucina. La Figura 2 describe el alineamiento de la secuencia de aminoácidos de TD del tomate y el garbanzo. Las regiones C son regiones altamente conservadas del sitio catalítico de TD mientras que las regiones R son regiones altamente conservadas del sitio regulatorio de TD. También se muestran las localizaciones de los cebadores de oligonucleótidos degeneradas TD205 y TD206 utilizadas para amplificar por PCR un fragmento de ADN genómico de TD de Arabidopsis. La Figura 3 muestra la estructura y el grado de degeneración de los dos cebadores de oligonucleótidos TD205 y TD206 utilizados en la amplificación de un fragmento de ADN genómico de Arabidopsis del gen de TD omr 1. El TD205 es anclado con un sitio Eco IR (subrayado) en su extremo 5' y el TD206 es anclado con un sitio Hind III (subrayado) en su extremo 5' . La Figura 4 describe la secuencia de ADN del clon 23 (pGM-td23) aislada de una biblioteca de ADNc de la línea mutada GMHb (omr 1/omr 1) de Arabidopsis thaliana. La Figura 5 describe la secuencia de nucleótidos y la secuencia de aminoácidos predicha del clon 23 como se aislan de la biblioteca de ADNc construida a partir de la línea GMllb de Arabidopsis (omr 1/omr 1) . El inserto de TD en el clon 23 está en el vector pBluescript entre los sitios Eco IR y Xho. Un marco de lectura abierta (marco de lectura superior) se observó que muestra un codón ATG en el nucleótido 166 y un codón de terminación en el nucleótido 1801. La Figura 6a muestra la estructura del vector de expresión pCM35S-omr 1 utilizado en la transformación de la Arabidopsis thaliana del tipo silvestre y la cual expresó una forma mutada de TD capaz de conferir resistencia a la L-O-metiltreonina del análogo tóxico sobre los transformantes. La Figura 6b describe la secuencia de nucleótidos y la secuencia de aminoácidos predicha del mutante quimérico omr 1 que expresa resistencia a la L-O-metiltreonina en las plantas de Arabidopsis transgénicas que han sido transformadas con el vector de expresión pCM35s-ornr 1 (mostrado en la Figura 6a) . La longitud total del TD mutante de la fusión (quimérico) expresado en las plantas transgénicas fue de 609 residuos de aminoácidos. Los primeros 9 residuos amino-terminales empiezan por la metionina codificada por un codón de inicio (ATG) provisto por el extremo 3' de la secuencia de nucleótidos del promotor de CaMV 35s enlazado al inserto de omr 1 del clon 23. Los siguientes 15 residuos de aminoácidos son generados por la secuencia de nucleótidos de la región polienlazadora desde el sitio de clonación múltiple del vector y finalmente los 585 residuos de aminoácidos restantes son codificados por el alelo mutante omr 1 de Arabidopsis como está presente en el clon 23. El primer residuo de la porción larga de 585 aminoácidos codificada por omr 1 en pCM35s-omr 1 corresponde a la treonina (Thr) la cual es el residuo amino-terminal numero 8 del ADNc de omr 1 de longitud total mostrado en las Figuras 8 y 9 y la SEC ID NO: 2. La Figura 7 es la secuencia de nucleótidos del ADNc de longitud total del alelo de omr 1 que codifica el TD mutado. La longitud total del ADNc del omr 1 es de 1779 nucleótidos incluyendo el codón de parada. La Figura 8 es la secuencia de aminoácidos predicha de la TD mutada codificada por el omr 1. La longitud total de la proteína de TD codificada por omr 1 es de 592 aminoácidos. La Figura 9 es la secuencia de nucleótidos y la secuencia de aminoácidos predicha codificada por el omr 1 del alilo mutado de la línea GMllb de la Arabidopsis thaliana. La Figura 10 es la secuencia de nucleótidos del
ADNc de longitud total del OMRl del alelo del tipo silvestre que codifica la TD del tipo silvestre. La Figura 11 es la secuencia de aminoácidos predicha del TD del tipo silvestre codificada por OMRl. La Figura 12 es la secuencia de nucleótidos y la secuencia de aminoácidos predicha codificada por el OMRl del alelo del tipo silvestre Columbia de la Arabidopsis thaliana. La Figura 13 describe el alineamiento múltiple de la secuencia de aminoácidos deducida de la TD del tipo silvestre de la Arabidopsis thaliana reportada en esta descripción con aquella de otros organismos obtenida de GenBank con los siguientes números de acceso: 940472 para el garbanzo; 10257 para el tomate; 401179 para la papa; 730904 para la levadura 1; 134962 para la levadura 2, 68318 para E. coli Biosintético; 135723 para E. coli catabólico; 1174668 para Salmonella typhimurium. El programa megalign de la Lasergene software, DNASTAR Inc., Madison, Wisconsin fue utilizado. La Figura 14 es una porción del gel de secuenciamiento del ADN comparando la secuencia de nucleótidos del alelo de omr 1 mutado y su OMR 1 del alelo del tipo silvestre y que muestra la substitución básica C (en OMRl) a T (en omr 1) en el residuo 1495 del nucleótido partiendo del inicio de la secuencia de codificación. La flecha está apuntando a la substitución básica. La Figura 15 muestra la mutación puntual en omr 1 en el residuo de nucleótidos 1495, que predice una substitución de aminoácidos, desde la arginina (R) hasta la cisteína (C) en el residuo de aminoácidos 499 al nivel de la TD. La Figura 16 describe la secuencia de aminoácidos en la región regulatoria R4 de la TD codificada por los alelos de omr 1 mutada y OMRl del tipo silvestre de la Arabidopsis thaliana comparada por aquella de varios organismos. La flecha apunta al residuo de aminoácidos mutado en omr 1. La Figura 17 es una porción del gel de secuenciamiento del ADN que compara la secuencia de nucleótidos del alelo de omr 1 mutado y su OMRl del alelo del tipo silvestre y que muestra la substitución básica G (en OMRl) a A (en omr 1) en el residuo de nucleótidos 1631. La flecha está apuntando a la substitución básica. La Figura 18 muestra la mutación puntual en omr 1 en el residuo de nucleótido 1631, que predice una substitución de aminoácido, arginina (R) a histidina (H) en el residuo de aminoácidos 544 al nivel de la TD. La Figura 19 describe la secuencia de aminoácidos en la región regulatoria R6 de la TD codificada por los alelos de la omr 1 mutada y el OMRl del tipo silvestre de la Arabidopsis thaliana comparado con aquella de varios organismos. La flecha apunta al residuo de aminoácidos mutado en omr 1.
Descripción Detallada de la Invención __
Para propósitos de promover un entendimiento de los principios de la invención, se hará referencia ahora a las modalidades particulares de la invención y el lenguaje específico será utilizado para describir el mismo. Sin embargo se entenderá que ninguna limitación del alcance de la invención es propuesta por medio de esto, y las alteraciones y las modificaciones adicionales en la invención, y para tales aplicaciones adicionales de los principios de la invención como se describió aquí, están contempladas como se le podrían ocurrir normalmente a una persona experta en la técnica a la cual pertenece la invención. Como se describió anteriormente, la presente invención se refiere a métodos y composiciones para obtener células transformadas, las células que expresan en las mismas una forma mutada de treonina deshidratasa/desaminasa ("TD") . Más particularmente, la invención proporciona secuencias de nucleótidos aisladas que codifican los polipéptidos funcionales de TD mutados ("TD mutada") los cuales son resistentes a la inhibición de la retroalimentación de la He y son resistentes a los efectos tóxicos de los análogos de la He. Estas secuencias de nucleótidos inventivas pueden ser incorporadas en vectores, los cuales a su vez pueden ser utilizados para transformar células. Tal transformación puede ser utilizada, por ejemplo, para los propósitos de proporcionar un marcador seleccionable, para incrementar el valor nutricional de la planta o para incrementar la producción de los compuestos intermedios importantes comercialmente de la ruta biosintética de la isoleucina. La expresión de la TD mut.ada conduce a una célula que tiene una susceptibilidad alterada con respecto a ciertos inhibidores de enzima con relación a las células que tienen solo la TD del tipo silvestre. Estas y otras características de la invención son descritas con detalle adicional posteriormente. Una característica de la presente invención involucra el descubrimiento, el aislamiento y la caracterización de una secuencia de genes a partir de la Arabidopsis thaliana, designada omr 1, la cual codifica una forma mutada sorprendentemente ventajosa de la TD de la enzima. Los aspectos de la presente invención se refieren así a las secuencias de nucleótidos que codifican las formas mutadas de la TD, tales secuencias pueden ser introducidas en células vegetales o microorganismos de objetivo para proporcionar una planta o microorganismo transformado que tiene un número de características deseables. Las formas mutadas de la TD, a diferencia de la TD del tipo silvestre, son resistentes a la inhibición de la retroalimentación negativa por la isoleucina ("He") y las células transformadas son resistentes a las moléculas las cuales son tóxicas para las células que no expresan la TD insensible a la retroalimentación. Por lo tanto, los transformantes que hospedan una secuencia de nucleótidos de la invención, expresable, demuestran niveles incrementados de producción de isoleuceno y niveles incrementados de la producción de los compuestos intermediarios en la ruta biosintética de He, y los agentes transformantes son resistentes a los análogos estructurales de He los cuales son letales para los no transformantes, los cuales expresan solamente la TD del tipo silvestre. La presente invención se refiere a otro aspecto de las secuencias de aminoácidos que comprenden enzimas de TD sensibles a la retroalimentación, funcionales. El término "secuencia de aminoácidos" es utilizada aquí para designar una pluralidad de aminoácidos enlazados en una red o arreglo en serie. Los artesanos expertos reconocerán que por medio del proceso de mutación y/o evolución, pueden surgir polipéptidos de diferentes longitudes y que tienen diferentes constituyentes, por ejemplo, con las inserciones, substituciones, deleciones de los aminoácidos, y semejantes, que están relacionados con una secuencia descrita aquí en virtud de la homología de la secuencia de aminoácidos y una funcionalidad ventajosa como se describió con detalle aquí. El término "enzima de TD" es utilizado para referirse en general a una secuencia de aminoácidos de TD del tipo silvestre, a una TD mutada seleccionada de acuerdo con la invención, y a variantes de cada una las cuales catalizan la reacción de la treonina al 2-oxobutirato en las rutas biosintéticas de la He, como se describió aquí. Para propósitos de claridad, la forma del tipo silvestre es distinguida de una forma mutada, en donde sea necesario, por el uso de los términos "TD del tipo silvestre" y "TD mutada". No está propuesto que la presente invención esté limitada a las secuencias específicas descritas aquí. Se sabe bien que las plantas y microorganismos de una amplia variedad de especies expresan y utilizan comúnmente enzimas y/o polipéptidos análogos los cuales tienen grados variables de degeneración, y todavía que proporcionan efectivamente la misma función o una similar. Por ejemplo, una secuencia de aminoácidos aislada de una especie puede diferir a un cierto grado de la secuencia del tipo silvestre descrita en la SEC ID N0:1, y todavía tiene una funcionalidad similar con respecto a la función catalítica y reguladora. Las secuencias de aminoácidos que comprenden tales variaciones están incluidas dentro del alcance de la presente invención y están consideradas substancialmente similares a una secuencia de aminoácidos de referencia. Se cree que la identidad entre las secuencias de aminoácidos que es necesaria para mantener una funcionalidad apropiada está relacionada con el mantenimiento de la estructura terciaria del polipéptido de tal modo que las secuencias interactivas específicas serán localizadas apropiadamente y tendrán la actividad deseada. Aunque no está propuesto que la presente invención esté limitada por cualquier teoría por la cual la misma logre su resultado ventajoso, está contemplado que un polipéptido que incluye estas secuencias interactivas en el contexto espacial apropiado tendrán buena actividad, aún en donde existan alteraciones en otras porciones de las mismas . A este respecto, una variante de TD se espera que sea funcionalmente similar a la TD del tipo silvestre descrita en la SEC ID N0:1, por ejemplo, si la misma incluye aminoácidos los cuales son conservados entre una variedad de especies o si la misma incluye aminoácidos no conservados los cuales existen en una localización dada en otras especies que expresan la TD funcional. La Figura 13 describe un alineamiento de aminoácidos de los polipéptidos de TD de un número de especies. Dos observaciones significativas las cuales se pueden hacer con base en la Figura 13 son (1) que existe un alto grado de conservación de los aminoácidos en muchos lugares entre las especies mostradas, y (2) un número de inserciones, substituciones y/o deleciones están representadas en la TD de ciertas especies y/o cepas, las cuales no eliminan la funcionalidad doble de las enzimas de TD respectivas. Por ejemplo, en la Página 4 de la Figura 13, la Región Reguladora 4 ("R4") de la Arabidopsis del tipo silvestre es mostrada, la cual comprende la siguiente secuencia (que corresponde a los códigos de tres letras numerados como se describe en la SEC ID N0:1) :
V N L T T D L V D K L R ? M G G Val Asn Leu Thr Th. Se: Aso Leu Val Lys Asp His- Leu Arg Tyr Leu Met Gly Gl
486 490 495 500
La degeneración mostrada en la Figura 13 en esta porción de la secuencia, proporciona ejemplos de substituciones las cuales se pueden hacer sin alterar substancialmente la funcionalidad de la secuencia del tipo silvestre descrita en la SEC ID NO:l. Por ejemplo, se espera que el Asp ("D") en la posición 492 podría ser substituido con una Glu ("E") y que la Leu ("L") en la posición 493 podría ser substituida con una Met ("M") sin alterar substancialmente la funcionalidad de la secuencia de aminoácidos. Lo siguiente describe una pluralidad de secuencias de R4, mostrada de tal modo que las substituciones aceptables sean descritas en varias localizaciones de los aminoácidos. Las secuencias abarcadas por medio de esto se espera que exhiban una funcionalidad similar a la porción correspondiente de la SEC ID N0:1. Una barra diagonal ("/") entre dos o en una serie de aminoácidos indica que cualquiera de los aminoácidos indicados puede estar presente en este lugar.
Val /Leu/ Phe/Ile Asn/Asp/Glu/Ser -eu/Iie/Phe/Vai/Gly Thr/Ser/Ala/Glv 486
Thr/HiS/Asp/Asn Ser/Asn/Asp/Iie Asp/Glu Leu/Met Val/Ala ys/Val/Ala 495 Asp/ Ile/Glu/Ser His Leu/Gly/Ile /Val Arg/Lvs Tyr/His Leu/Met Met /Va 500 Gl y Gl v 504
Se sobreentiende que las substituciones análogas en toda la secuencia están abarcadas dentro del alcance de la invención, y que la Región R4 simplemente es utilizada anteriormente para propósitos de ilustración. Otra manera en la cual puede existir una similaridad entre dos secuencias de aminoácidos es en donde un aminoácido dado está substituido con otro aminoácido a partir del mismo grupo de aminoácidos. De esta manera, se sabe que la serina puede ser substituida comúnmente con la treonina en un polipéptido sin alterar substancialmente la funcionalidad del polipéptido. Lo siguiente describe los grupos de los aminoácidos que se cree que van a ser intercambiables en las secuencias de aminoácidos de la invención en una amplia variedad de lugares sin alterar substancialmente la funcionalidad del mismo : Grupo I: Aminoácidos no polares: Alanina, valina, prolina, leucina, fenilalanina, triptófano, metionina, isoleucina, cisteína, glicina; Grupo II: Aminoácidos polares no cargados: Serina, treonina, asparagina, glutamina, tirosina; Grupo III: Aminoácidos ácidos polares cargados: Aspártico, glutámico; y Grupo IV: Aminoácidos básicos polares cargados: Lisina, arginina, histidina. En donde se esté inseguro de si una substitución dada afectará la funcionalidad de la enzima, esta puede ser determinada sin experimentación indebida utilizando técnicas de síntesis y ensayos de selección conocidos en la técnica. Habiéndose establecido el significado de la similaridad con respecto a una secuencia de aminoácidos, es importante señalar que la invención caracteriza secuencias de aminoácidos mutadas que comprenden una o más substituciones de aminoácidos que no alteran la funcionalidad de la enzima de TD del tipo silvestre. Las enzimas de TD insensibles de la invención no son similares a la TD del tipo silvestre, como este término es definido y utilizado aquí, a causa de que la funcionalidad de la inhibición es alterada. Las enzimas de TD insensibles caracterizan una o más mutaciones en el sitio regulatorio, tales mutaciones alteran la funcionalidad del sitio regulatorio sin alterar substancialmente la funcionalidad del sitio catalítico. En un aspecto específico de la invención, se proporciona una secuencia de aminoácidos (SEC ID NO: 2) que tiene dos substituciones, esta secuencia comprende una TD mutada la cual tiene buena funcionalidad catalítica pero la cual no exhibe funcionalidad regulatoria. En otras palabras, la enzima descrita en la SEC ID NO: 2 comprende una TD de Arabidopsis thaliana insensible a la retroalimentación. Se observa comparando la TD del tipo silvestre descrita en la SEC ID NO:l y la secuencia mutada de la SEC ID NO: 2, la cual comprende una modalidad específica de la invención, que las secuencias difieren solamente en dos mutaciones puntuales en las secuencias de nucleótidos respectivas (C a T en el nucleótido 1495; y G a A en el nucleótido 1631) , lo cual conduce a dos substituciones de aminoácidos en el polipéptido de TD (Arg a Cys en el lugar 499 del aminoácido; y Arg a His en el lugar 544 del aminoácido) . La primera mutación está en la región regulatoria R4 de TD, y la segunda está en la región regulatoria R6 de TD. La substitución de Arg a Cys en el residuo 499 de aminoácidos cambió a un aminoácido básico, polar (Arg) a un aminoácido no polar (Cys), los cuales alteraron el sitio de retroalimentación en TD. Por otra parte, el cambio de Arg a His en el residuo 544 fue un cambio desde un aminoácido básico, polar, cargado (Arg) hasta otro aminoácido básico, polar, cargado (His) . Aunque no está propuesto que la presente invención esté limitada por cualquier teoría por la cual la misma logre su resultado ventajoso, se cree que la substitución en el residuo 544 sola no puede tener substancialmente alterado el sitio de retroalimentación de TD, y, en contraste, que la substitución en el residuo 499 solo puede tener una TD desensibilizada codificada por medio de esto a una regulación de la retroalimentación. Ciertamente, cuando se combinan, las substituciones fueron muy efectivas para desensibilizar la TD codificada por omr 1 a la regulación de la retroalimentación. Se reconoce que la secuencia de aminoácidos descrita en la SEC ID NO: 3 (585 residuos codificados por omrl) es una versión truncada, omitiendo 7 residuos a ino-terminales, de aquella descrita en la SEC ID NO: 2. Se observa de la siguiente descripción, incluyendo los Ejemplos descritos aquí, que una cantidad significativa de búsqueda fue efectuada con base en esta versión ligeramente acortada, y que la versión acortada ligeramente puede ser utilizada ventajosamente para transformar una amplia variedad de plantas y microorganismos. Se cree que la porción de la secuencia de aminoácidos que está presente en la SEC ID NO: 2 y ausente en la SEC ID NO: 3 es una porción de la secuencia directora del cloroplasto, y no está presente en la enzima de TD madura. Como se mencionó anteriormente, para ayudar en la descripción de la presente invención, la SEC ID N0:1 es provista, la cual describe una secuencia de nucleótidos, y la secuencia de aminoácidos codificada por la misma, que comprende una TD del tipo silvestre de la Arabidopsis thaliana. Las SEC ID NOS : 2 y 3 describen secuencias de nucleótidos, y las secuencias de aminoácidos codificadas por la misma, que comprende las proteínas precursoras de diferentes longitudes. La SEC ID NO: 3 (véase también la Figura 6b) codifica un polipéptido quimérico o de fusión de 609 aminoácidos de los cuales 585 residuos de aminoácidos son codificados por la omr 1 mutante de la Arabidopsis. Es decir, la SEC ID NO: 3 codifica una TD mutante que es más corta que la TD mutante de longitud completa mostrada en la SEC ID NO: 2 por 7 residuos amino terminales. Puesto que las plantas transgénicas transformadas con pCM35s-omrl fueron capaces de expresar resistencia a la OMT, entonces el precursor truncado largo de 585 aminoácidos fue totalmente capaz de translocación desde el citoplasma hasta el cloroplasto. Las SEC ID NOS: 4, 5 y 6 describen las secuencias que comprenden tres proteínas maduras predichas. La SEC ID NO: 7 describe el sitio regulatorio putativo o supuesto de una enzima de TD mutada de la invención, y las SEC ID NOS: 8 y 9 describen regiones regulatorias que hospedan mutaciones de acuerdo con un aspecto de la invención. Se sobreentiende que la enzima de TD del tipo silvestre caracteriza la doble funcionalidad. Específicamente, la enzima de TD tiene un sitio catalítico el cual es dividido en regiones catalíticas de C1-C5, como se muestra con respecto a la enzima de TD del tomate análoga, y la enzima de TD del garbanzo en la Figura 2. El sitio catalítico cataliza la reacción de la treonina al 2-oxobutirato. La TD también tiene un sitio regulatorio el cual es dividido en regiones regulatorias R1-R7, como se muestra en la Figura 2. El sitio regulatorio es responsable de la inhibición de la retroalimentación la cual ocurre cuando el sitio regulatorio se une a un inhibidor, en este caso la isoleucina. La presente solicitud encuentra un uso ventajoso en una amplia variedad de plantas, así como en una amplia variedad de microorganismos. Con respecto a las plantas, es importante reconocer que la enzima de TD funciona en los cloroplastos, y, por lo tanto, que el polipéptido transcrito por lo tanto, es una proteína precursora la cual incluye una porción identificada aquí como una "secuencia directora de cloroplasto". Para los propósitos de la presente invención, el término "secuencia directora de cloroplastos" es utilizado intercambiablemente con el término "péptido de tránsito". La secuencia directora de cloroplasto está unida covalentamente a la "enzima madura" o "enzima pasajera". El término "proteína precursora" se entiende como un polipéptido que tiene un péptido de tránsito, unidos o fijados covalentemente entre sí. Típicamente, el extremo carboxi del péptido de tránsito está unido covalentamente al extremo amino del péptido pasajero. El péptido pasajero y el péptido de tránsito pueden ser codificados por el mismo sitio del gen, es decir, homólogos entre sí, de modo que los mismos sean codificados de una manera aislada desde una sola fuente. Alternativamente, el péptido de tránsito y el péptido pasajero pueden ser heterólogos entre sí, es decir, el péptido de tránsito y el péptido pasajero pueden ser de diferentes genes y/o diferentes organismos. Los términos "péptido de tránsito", "secuencia directora del cloroplasto", y "péptido de la señal" son utilizados intercambiablemente para designar aquellos aminoácidos que dirigen un péptido pasajero a un cloroplasto. Por "péptido maduro" o "péptido pasajero" se entiende un polipéptido el cual es encontrado después del procesamiento y en el paso hacia un organelo y el cual es funcional en el organelo para su propósito propuesto. Los péptidos pasajeros se hacen originalmente en una forma del precursor que incluye un péptido de tránsito y el péptido del pasajero. Durante la entrada en un organelo, la porción del péptido de tránsito es escindida, dejando por consiguiente el péptido "pasajero" o "maduro". Los péptidos pasajeros son los polipéptidos obtenidos típicamente durante la purificación desde un homogenato, la secuencia del cual puede ser determinada como se describió aquí. El péptido de tránsito puede ser derivado de las plantas monocotiledóneas o dicotiledóneas a elección del artesano. Las secuencias de ADN que codifican los péptidos de tránsito pueden ser obtenidos de las proteínas de cloroplastos tales como la ?-9 desaturasa, palmitoil-ACP tioesterasa, ß-KETOACYL-ACP sintasa, oleil-ACP tioesterasa, proteína de unión de la clorofila a/b, la gliceraldehido-3-fosfato deshidrogenasa dependiente de NADPH+, la proteína inducible con luz más inicial, la proteasa regulatoria de la proteasa de unión, la piruvato ortofosfato dicinasa, la proteína de unión de la clorofila a/b, el translocalizador de la triosa fosfato3-fosfoglicerato fosfato, 5-enol piruval shikimato-e-fosfato sintasa, dihidrofolato reductasa, timidilato sintasa, acetil-coenzima A carboxilasa, Cu/Zn superóxido dismutasa, cisteína sintasa, rubisco activasa, ferritina, sintasa de la fécula de unión de los granulos, pirofosfato, glutamina sintasa, aldolasa, glutation reductasa, nitrito reductasa, translocalizador de la 2-oxoglutarato/malato, ADP-glucosa pirofosforilasa, ferrodoxina, anhidrasa carbónica, polifenol oxidasa, ferrodoxin NADP= oxidoreductasa, platocianina, glicerol-3-fosfato deshidrogenasa, lipoxigenasa, o-acetilserina (tiol) -lisasa, proteína portadora de acilo, 3-desoxi-D-arabino-heptulosonato 7-fosfato sintasa, proteína de choque térmico localizada en el cloroplasto, fosforilasa de almidón, piruvato ortofosfato dicinasa, glicosiltransferasa de almidón, y semejantes, de los cuales la porción del péptido de tránsito ha sido definida en GenBank.
En las plantas, la secuencia directora del cloroplasto es utilizada para dirigir la proteína pasajera a los cloroplastos; sin embargo, los mismos son típicamente escindidos y degradados durante la entrada de la proteína pasajera en el organelo de interés. Por lo tanto, la purificación de un péptido de tránsito escindido desde los tejidos de las plantas típicamente no es posible. En algunos casos, sin embargo, las secuencias del péptido de transito pueden ser determinadas por la comparación de la secuencia de aminoácidos de la proteína precursora obtenida desde el gen que codifica el mismo hasta la secuencia de aminoácidos de la proteína pasajera aislada (proteína madura) . Además, las secuencias de la proteína pasajera también pueden ser determinadas de las proteínas del péptido de tránsito asociadas con la misma por la comparación de las secuencias con otras proteínas similares aisladas de las diferentes especies. Como se ejemplificó aquí, los genes que codifican las formas precursoras de la proteína de TD mutada, descrita como la SEC ID NO: 2 y la SEC ID NO: 3, cuando se comparan con el precursor del tipo silvestre y la proteína de TD madura de otras especies, puede establecer la secuencia esperada de la proteína madura. Como se describió previamente, la secuencia de aminoácidos y por consiguiente la secuencia de ácidos nucleicos de un péptido de tránsito pueden ser determinadas en una variedad de formas disponibles para el artesano experto. Por ejemplo, las proteína pasajeras de interés pueden ser purificadas utilizando una variedad de técnicas disponibles para la persona experta en la técnica de' la bioquímica de las proteínas. Una vez purificada, la secuencia amino terminal de la proteína puede ser determinada utilizando métodos tales como la degradación de Edman, la espectroscopia de masa, la espectroscopia magnética nuclear y semejantes. Utilizando esta información y el código genético, las técnicas de biología molecular estándares pueden ser empleadas para clonar el gen que codifica la proteína como se ejemplificó aquí. La comparación de la secuencia de aminoácidos determinada del ADNc con aquella obtenida de la secuencia amino terminal de la proteína pasajera puede permitir la determinación de la secuencia del péptido de tránsito. Además, muchas secuencias del péptido de tránsito están disponibles en la técnica y pueden ser obtenidas fácilmente de GenBank localizado en la Base de Datos Entrez en el sitio de la red del National Center for Biotechnology Information. El objetivo de las péptidos de tránsito en las plantas ha sido revisado extensamente por Keegstra et al., (1989) (Cell, 56:247-253), el cual es incorporado aquí para referencia. Típicamente, existe una homología de la secuencia de aminoácidos primaria muy pequeña entre los diferentes péptidos de tránsito de la planta. Aún cuando las proteínas pasajeras pueden tener similaridades de las secuencias de aminoácidos y ácidos nucleicos entre los cultivares, las líneas, y las especies, el péptido de tránsito puede mostrar una homología de la secuencia muy pequeña a cualquier nivel. Además, la longitud de los péptidos de tránsito puede variar, con algunas proteínas precursoras que comprenden las proteínas del péptido de tránsito con tan poco como aproximadamente 10 aminoácidos mientras que otras pueden ser de aproximadamente 150 aminoácidos o más largos. Las descripciones adicionales de las características del péptido de tránsito en las plantas y los mecanismos asociados con las mismas se pueden encontrar en Ko y Ko, (1992) J. Biol. Chem. 267, 13910-13916; Bascomb et al. (1992) Plant Microb. Biotechnol. Res. Ser. 1:142-163; y Bakau et al., (1996) Trends en Cell Biol. 6:480-486; las cuales son incorporadas aquí para referencia. A este respecto, los primeros 90 residuos de aminoácidos en la región N-terminal de la proteína de TD de Arabidopsis codificada por omr 1 (en la SEC ID NO: 2) representa una región esperada que comprende el péptido de tránsito, como está indicado por: (i) la disimilaridad con las proteínas de TD de la levadura, Salmonella y E. coli, (ii) la comparación de los tamaños de TD de Arabidopsis, tomate, garbanzo, levadura, Salmonella y E. coli, y (iii) la composición de aminoácidos la cual contiene 12 residuos de prolina y 33 de otros residuos hidrofóbicos que constituyen un total de 50% de los residuos hidrofóbicos. Por lo tanto, se espera que la TD pasajera/madura de la Arabidopsis sea codificada por el sitio omr 1, la escisión del péptido de tránsito puede ocurrir en el enlace del péptido entre la alanina en el residuo 90 y al ácido glutámico en el residuo 91, dejando debajo una TD pasajera/madura que empieza en el ácido glutámico en el residuo 91. Como tal, la SEC ID NO: 4 identifica una TD madura esperada para la Arabidopsis que empieza en el ácido glutámico en al residuo 91 de la SEC
ID NO: 2 (clon 592) . Este polipéptido de TD maduro esperado comprende 502 residuos de aminoácidos secuenciales. Los dos únicos diferentes de los genes de TD de la planta más elevados que han sido clonados hasta la fecha, son aquellos del tomate (Samach A., Harven D., Gutfinger T., Ken-Dror S., Lifschitz E., 1991, Proc Nati Acad Sci EUA 88:2678-2682) y el garbanzo (Jacob John S., Srivastava V., Guha-Mukherjee S., 1995, Plant Physiol 107:1023-1024). Las longitudes de los péptidos de tránsito de la TD del tomate y la TD del garbanzo se predijo que van a ser los primeros 80 y 91 residuos amino terminales, respectivamente, y las proteínas precursoras de la longitud completa se reportaron que van a ser de 595 residuos y de 590 residuos, respectivamente (Samach et al., 1991; Jacob John et al., 1995). Tanto en el tomate como el garbanzo, la extremidad amino de la proteína de TD contuvo un péptido de tránsito de dos dominios típico, consistente con las secuencias de ubicación del blanco del lumen del cloroplasto (Keegstra K., Olsen L. J. , Theg S.M., 1989, Chloroplast precursors and their transport across the membrane. Annu Rev Plant Physiol Plant Mol Biol 40:471-501). En el tomate, el primer dominio en el amino-terminal (45 residuos) del péptido de tránsito fue rico en serina y treonina (33 %) mientras que la siguiente secuencia de 35 residuos contuvo 8 prolíneas espaciadas regularmente y otros residuos hidrofóbicos (Samach et al., 1991). Secuenciando los primeros diez residuos amino-terminales de una TD de tomate purificado a partir de las flores, Samach et al., (1991) encontraron que la lisina en el residuo 52 es el primer aminoácido en el extremo amino-terminal de la proteína pasajera/madura. De acuerdo con Samach et al., (1991), el dominio hidrofóbico del péptido de tránsito de la TD del tomate no es escindido y permanece como parte de la TD madura en los cloroplastos. Samach et al., (1991) también explicó que "es posible que solamente una fracción de la proteína de TD del tomate sea escindida en la posición 52, mientras que el resto del péptido de tránsito es escindido en cualquier parte y permanece refractario con respecto al secuenciamiento amino-terminal". En el garbanzo, el primer dominio en el extremo amino-terminal del péptido de tránsito se dedujo que va a ser de 45 residuos y rico en treonina y serina (37%) mientras que los 46 residuos restantes contuvieron 8 residuos de prolína espaciados regularmente y 19 de otros residuos hidrofóbicos (Jacob John et al., 1995). El sitio de escisión del péptido de tránsito de la TD del garbanzo no fue determinado. Por analogía con el tomate y el garbanzo, la TD de Arabidopsis también mostró un péptido de tránsito de dos dominios, típico, consistente con las secuencias de ubicación de blanco del lumen del cloroplasto (como se revisó por Keegstra et al., 1989). Los primeros 49 residuos del extremo amino terminal representaron un dominio que fue rico en serina y treonina (31%) y otros residuos hidrofílicos mientras que los 41 residuos restantes representaron un segundo dominio que contuvo 59% de los residuos hidrofóbicos. El sitio de escisión del péptido de tránsito de la TD de Arabidopsis no fue determinado. Por lo tanto, por analogía con el tomate, se espera que el sitio de escisión del péptido de tránsito de la TD de Arabidopsis puede iniciar alternativamente en la lisina en el residuo 54 o en la lisina en el residuo 61. Este es un sitio de escisión presumible y un experto en la técnica puede determinar fácilmente el sitio de escisión de un modo similar como en el caso del tomate (Samach et al., 1991) purificando la TD de Arabidopsis luego secuenciandp los primeros diez aminoácidos en el extremo amino-terminal. Por lo tanto, dos secuencias adicionales son provistas como las SEC ID NOS: 5 y 6 que identifican alternativamente dos TD maduras esperadas en la Arabidopsis. Está dentro del alcance de la presente invención crear polinucleótidos quiméricos que codifican las proteínas precursoras en donde un péptido de tránsito de elección está en el marco de lectura apropiado con la secuencia de codificación madura de la TD mutada. Cuando se utilicen aquí, los términos "polinucleótido quimérico", "construcción de ADN quimérico" y "ADN quimérico" son utilizadas para referirse al ADN recombinante.
En la creación de una construcción de ADN quimérico que codifica un péptido de tránsito como se describe aquí, el péptido de tránsito es heterólogo con respecto a la TD mutada, madura, el ADN que codifica el péptido de tránsito está en el lugar 5' y el marco de lectura apropiado con el ADN que codifica la proteína de TD mutada, madura. La colocación del ADN quimérico en la relación correcta con los elementos regulatorios promotores y otras secuencias como se describe aquí, pueden permitir la producción de las moléculas de ARNm que codifican las proteínas precursoras heterólogas. Por "elemento regulatorio del promotor" se entiende los elementos de la secuencia de nucleótidos dentro de una secuencia de nucleótidos la cual controla la expresión de esta secuencia de nucleótidos. Los elementos regulatorios promotores proporcionan la secuencia de ácido nucleico necesaria para el reconocimiento de la ARN polimerasa y otros factores transcripcionales requeridos para una transcripción eficiente. Los elementos regulatorios promotores se entiende que incluyen los promotores inducibles, específicos para el desarrollo, específicos para el tejido, constitutivos, y semejantes. Los elementos regulatorios del promotor también pueden incluir ciertos elementos de la secuencia mejoradora que mejoran la eficiencia transcripcional . El ARNm puede ser transladado entonces produciendo así una proteína precursora heteróloga funcional la cual puede ser suministrada al cloroplasto. Por supuesto, se sobreentiende que una construcción de ADN puede estar de acuerdo con la invención para incluir un promotor que es natural con respecto al gen de una especie seleccionada que codifica este polipéptido del precursor de TD de las especies'. La recepción de la proteína por el cloroplasto y la escisión del péptido de tránsito asociado puede conducir a un cloroplasto que contiene una forma mutada, madura, de la TD, haciendo así a la célula resistente a la inhibición de la retroalimentación lo cual podría inhibir normalmente las células que contienen solamente la proteína de TD del tipo silvestre. La presente invención, por lo tanto, proporciona, en los aspectos alternativos, una TD insensible a la retroalimentación que comprende la secuencia de aminoácidos descrita en la SEC ID NO: 2 o la SEC ID NO: 3 (polipéptidos precursores); descritos en la SEC ID NO: 4, la SEC ID NO: 5 o la SEC ID NO: 6 (excepto las enzimas de TD maduras esperadas); la SEC ID NO:7 (un sitio regulatorio de TD insensible) ; y descritos en la SEC ID NO: 8 (región regulatoria R4 ) o la SEC ID NO: 9 (región regulatoria R6) . La SEC ID NO: 7 o las variantes de la misma como se describieron anteriormente, pueden ser acopladas operativamente a una secuencia que codifica un sitio catalítico de TD desde una amplia variedad de especies, que incluyen una funcionalidad similar a las variantes de la misma, para proporcionar el resultado ventajoso de la invención. Se entiende fácilmente que, en el caso de la transformación de los procariotas, no es necesario incluir un péptido de tránsito en la región de codificación del vector. En lugar de esto, puesto que tales células no poseen cloroplastos, una construcción de ADN inventivo para transformar, por ejemplo, las bacterias, se puede hacer simplemente fijando un codón de partida directamente a, y en el marco de lectura apropiado con, un péptido maduro. Por supuesto, otros elementos están presentes preferentemente como se describió aquí, tales como un promotor corriente arriba del codón de parada y una secuencia de terminación corriente abajo de la región de codificación. Las SEC ID NOS : 8 y 9 también pueden ser acopladas operativamente a una amplia variedad de secuencias para proporcionar enzimas de TD insensibles, y por lo tanto comprenden ciertos aspectos preferidos de la invención. Las substituciones que ocasionan secuencias de aminoácidos similares, como se describe aquí, son particularmente aplicables a la SEC ID NO: 8, y lo siguiente describe una pluralidad de secuencias alternativas preferidas particularmente para la SEC ID NO: 8 de acuerdo con la invención:
Vai/Leu/Phe/Ile Asn/Asp/Glu/Ser Leu/Ile/Phe/Val/Gly Thr/Ser/Ala/Gly
Thr/His/Asp/Asn Ser/Asn/Asp/Ile Aso/Glu Leu/Met Val/Ala Lys/Val/Ala
Asp/Ile/Glu/Ser His Leu/Gly/Ile/Vai Cys Tvr/His Leu/Met Met/Val Gly Gly
La invención también abarca por lo tanto las secuencias de aminoácidos similares a las secuencias de aminoácidos descritas aquí que tienen al menos aproximadamente 50% de identidad con la misma y que son insensibles a la inhibición de la retroalimentación por la He. Preferentemente, las secuencias de aminoácidos de la invención tienen al menos aproximadamente 75% de identidad con estas secuencias, más preferentemente al menos aproximadamente 85% de identidad y aún más preferentemente al menos aproximadamente 95% de identidad. La identidad porcentual puede ser determinada, por ejemplo, comparando la información de • la secuencia utilizando el programa de computadora GAP, versión 6.0, disponible de la University of Wisconsin Genetics Computer Group (UWGCG) . El programa GAP utiliza el método de alineamiento de Needleman y Wunsch (J. Mol. Biol. 48:443, 1970), como se revisó por Smith y Waterman (Adv.
Appl. Math. 2:482,1981). Brevemente, el programa GAP define la identidad como el número de símbolos alineados (es decir, los nucleótidos o aminoácidos) los cuales son los mismos, divididos entre el número total de símbolos en la más corta de las dos secuencias. Los parámetros de falla preferidos para el programa de GAP incluyen: (1) una matriz de comparación unitaria (que contiene un valor de 1 para las identidades y de 0 para las no identidades), y la matriz de comparación ponderada de Gribskov y Burgess, Nucí. Acids Res. 14:6745, 1986, como se describe por Schwartz y Dayhoff, eds . , Atlas of Protein Sequence and Structure, National Biomedical Research Foundation, pp. 353-358, 1979; (2) una penalidad de 3.0 para cada vacío y una penalidad de 0.10 adicional para cada símbolo en cada hueco; y (3) ninguna penalidad para los huecos finales. La invención también contempla las secuencias de aminoácidos que tienen mutaciones alternativas a aquellas identificadas aquí las cuales podrían conducir a una TD insensible a la retroalimentación. Por ejemplo, se espera que la cys en la posición 499 y la his en la posición 544 en la SEC ID NO: 2 podrían ser substituidas con aminoácidos alternativos desde el mismo grupo de aminoácidos que cys y his, respectivamente (como se describió anteriormente) para proporcionar una enzima inventiva alternativa. Además, están bien adentro del punto de vista de una persona experta en la técnica diseñar una TD insensible a la retroalimentación proporcionando una TD del tipo silvestre y substituir un aminoácido altamente conservado en una localización dada en el sitio regulatorio con un aminoácido diverso (es decir, uno de un grupo de aminoácido diferente) , y ensayar la enzima resultante para verificar la actividad catalítica y la sensibilidad de la retroalimentación. Por ejemplo, un artesano experto puede alterar la secuencia de nucleótidos descrita en la SEC ID NO:l por la mutagénesis dirigida al sitio para proporcionar una secuencia mutada la cual codifica una enzima que tiene un aminoácido alternativo en una localización dada de la enzima. Alternativamente, un artesano experto puede sintetizar una secuencia de aminoácidos que tiene una o más adiciones, substituciones y/o deleciones en un sitio altamente conservado de la enzima de TD del tipo silvestre utilizando técnicas bien conocidas en el arte. Tales variantes, las cuales exhiben una funcionalidad substancialmente similar a un polipéptido que comprende las secuencias descritas en la SEC ID NO: 2, están incluidas dentro del alcance de la presente invención. Pasando ahora a las secuencias de nucleótidos que codifican las enzimas de TD insensibles de la invención, las secuencias de nucleótidos que codifican la TD precursora insensible a la retroalimentación, preferida, de las especies de Arabidopsis thaliana se describen en las SEC ID NOS : 2 y 3 de aquí. Los polinucleótidos mutados descritos allí son referidos como omrl . El omrl se encontró que va a ser un alelo dominante, impartiendo esto un valor significativo a la invención. Por supuesto que no está propuesto que la presente invención sea limitada a esta secuencia de nucleótidos ejemplar, sino que incluya secuencias que tienen una identidad substancial con la misma y las secuencias que codifican las formas variantes de la TD insensible como se describieron anteriormente. El término "secuencias de nucleótidos", como se utiliza aquí, está propuesto para referirse a una arreglo secuencial y lineal natural o sintético de nucleótidos y/o nucleósidos, y derivados de los mismos. Los términos "que codifica" y "codifica" se refieren al proceso por el cual una secuencia de nucleótidos, por medio de los mecanismos de transcripción y translación, proporciona la información a una célula a partir de la cual una serie de aminoácidos puede ser ensamblada en una secuencia de aminoácidos específica para producir un polipéptido funcional, tal como, por ejemplo, una enzima activa. El proceso de codificación de una secuencia de aminoácidos específica puede involucrar las secuencias de ADN que tienen uno o más cambios básicos (es decir, inserciones, deleciones, substituciones) que no provocan un cambio en el aminoácido codificado, o los cuales involucran cambios básicos los cuales pueden alterar uno o más aminoácidos, pero no eliminan las propiedades funcionales del polipéptido codificado por la secuencia de ADN. Por lo tanto se entiende que la invención abarca más de la secuencia de nucleótidos ejemplar específica de omr 1. Por ejemplo, una secuencia de ácido nucleico que codifica una secuencia de aminoácidos variable, como se describió anteriormente, está dentro del alcance de la invención. Las modificaciones a una secuencia, tales como deleciones, inserciones, o substituciones en la secuencia que producen cambios "silenciosos" que no afectan substancialmente las propiedades funcionales de la molécula del polipéptido resultante, son contempladas expresamente por la presente invención. Por ejemplo, se sobreentiende que las alteraciones en una secuencia de nucleótidos la cual refleja la degeneración del código genético, o la cual conduce a la producción de un aminoácido equivalente químicamente en un sitio dado, están contemplados. Por consiguiente, un codón para la alanina del aminoácido, un aminoácido hidrofóbico, puede ser substituido por un codón que codifica otro residuo menos hidrofóbico, tal como la glicina, o un residuo más hidrofóbico, tal como la valina, leucina, o isoleucina. De manera similar, los cambios que conducen a la substitución de un residuo cargado negativamente por otro, tal como el ácido aspártico por el ácido glutámico, o un residuo cargado positivamente por otro, tal como la lisina por la arginina, también se puede esperar que produzca un producto equivalente biológicamente. Los cambios de nucleótidos que conducen a una alteración de las porciones N-terminal y C-terminal de la molécula del polipéptido tampoco se podría esperar que alteren la actividad del polipéptido. En algunos casos, puede ser deseable en efecto hacer mutaciones en la secuencia para estudiar el efecto de la alteración sobre la actividad biológica del polipéptido. Cada una de las modificaciones propuestas está bien adentro de la experiencia rutinaria en la técnica. En un aspecto preferido, por lo tanto, la presente invención contempla secuencias de nucleótidos que tienen una identidad substancial con respecto a las secuencias descritas aquí y las variantes de las mismas que se describieron aquí. El término "identidad substancial" es utilizado aquí con respecto a una secuencia de nucleótidos para designar que la secuencia de nucleótidos tenga una secuencia suficientemente similar a una secuencia de nucleótidos de referencia que se hibridizará con la misma bajo condiciones moderadamente estrictas, este método de determinación de la identidad es bien conocido en la técnica a la cual pertenece la invención. Brevemente, las condiciones moderadamente estrictas son definidas en Sambrook et al., Molecular Cloning: a Laboratory Manual, 2/a. ed., Vol. 1, pp. 101-104, Cold Spring Harbor Laboratory Press (1989) como incluyendo el uso de una solución de prelavado de 5 x SSC, 0.5% SDS, 1.0 mM EDTA (pH 8.0) y las condiciones de hibridación y lavado de aproximadamente 55 °C, 5 x SSC. Un requerimiento adicional de una variante de polinucleótido de la invención es que la misma debe codificar un polipéptido que tiene una funcionalidad similar a las enzimas de TD mutadas específicas recitadas aquí, es decir, una buena funcionalidad catalítica e insensibilidad a la inhibición de la retroalimentación. Una secuencia de ADN adecuada, seleccionada para su uso de acuerdo con la invención puede ser obtenida, por ejemplo, por técnicas de clonación que utilizan las bibliotecas de ADNc que corresponden a una amplia variedad de especies, estas técnicas son bien conocidas en la técnica relevante. Las secuencias de nucleótidas adecuadas pueden ser aisladas de las bibliotecas de ADN obtenidas de una amplia variedad de especies por medio de la hibridación del ácido nucleico o PCR, utilizando como sondas de hibridación o las secuencias de nucleótidos de los cebadores seleccionadas de acuerdo con la invención, tales como aquellas descritas en las SEC ID NOS: 1-10; las secuencias de nucleótidos que tienen una identidad substancial con la misma; o porciones de la misma. Las secuencias del tipo silvestre aisladas que codifican la TD pueden ser alteradas entonces como se provea por la presente invención, por la mutagénesis dirigida al sitio. Alternativamente, una secuencia adecuada se puede hacer por técnicas las cuales son bien conocidas en la técnica. Por ejemplo, las secuencias de ácido nucleico que codifican las enzimas de la invención pueden ser construidas utilizando la tecnología del ADN recombinante estándar, por ejemplo, cortando o dividiendo los ácidos nucleicos los cuales codifican las citocinas y/u otros péptidos utilizando las enzimas de restricción y la ligasa del ADN. Alternativamente, las secuencias del ácido nucleico pueden ser construidas utilizando la síntesis química, tal como la tecnología de fosforamidato de fase sólida. En las modalidades preferidas de la invención, la reacción en cadena de la polimerasa (PCR) es utilizada para efectuar la separación o división de las secuencias del ácido nucleico por la extensión de superposición como se conoce en la técnica. Las secuencias de ADN de la invención pueden ser incorporadas en el genoma de una planta o microorganismo utilizando la tecnología de ADN recombinante convencional, haciendo por lo tanto una planta o microorganismo transformado que tiene las excelentes características descritas aquí. A este respecto, el término "genoma" como es utilizado aquí, está propuesto para referirse al ADN el cual está presente en una planta o microorganismo y el cual es heredable por la progenie durante la propagación de la misma. Como tal, una planta o microorganismo transformado de la invención puede ser producido alternativamente produciendo Fl o una progenie de una generación más elevada de una planta o microorganismo transformado directamente, en donde la progenie comprende la secuencia de nucleótidos extraña. Las plantas o microorganismos transformados y la progenie de los mismos son todos contemplados por la invención y todos están propuestos para caer directamente dentro del significado de los término "planta transformada" y "microorganismo transformado" . De esta manera, la presente invención contempla el uso de las plantas transformadas las cuales son purificadas para producir una planta endogámica. La planta endogámica produce semillas que contienen el gen de interés. Estas semillas se pueden hacer crecer para producir plantas que expresan la proteína de interés. Las líneas endogámicas también pueden ser cruzadas con otras líneas endogámicas para producir híbridos. Las partes obtenidas de la planta regenerada, tales como las flores, semillas, hojas, ramas, fruta, y semejantes, sean recuperadas por la invención siempre que las partes contengan genes que codifican yo expresan la proteína de interés. La progenie y las variantes, y los mutantes de las plantas regeneradas también son incluidas dentro del alcance de la invención. En plantas diploides, típicamente un padre puede ser transformado y el otro padre es del tipo silvestre. Después de cruzar a los padres, los híbridos de la primera generación (Fl) son purificados para producir los híbridos de la segunda generación (F2) . Aquellas plantas que exhiben los niveles más elevados de la expresión pueden ser elegidas entonces para multiplicación adicional. Los genes que codifican los polipéptidos de TD mutados del precursor, como se describieron aquí como la SEC ID NO:2 y la SEC ID NO:3, pueden ser utilizados en conjunción con otros elementos regulatorios de las plantas para crear células vegetales que expresan los polipéptidos. Por "expresión" como se utiliza aquí, se entiende la transcripción y la acumulación estable del ARNm dentro de una célula, la célula es de un origen procariótico o eucariótico. Además, está dentro del alcance de la invención colocar la TD madura mutada de Arabidopsis en otras especies que incluyen plantas monocotiledóneas y dicotiledóneas. Haciéndolo así, las construcciones del gen quimérico que codifican las proteínas de TD mutadas, maduras, que tienen péptidos de tránsito heterólogos para la misma (péptidos de tránsito de una proteína o especie diferente) pueden ser utilizados. Los péptidos de tránsito de la presente invención, cuando se fijan covalentamente a la proteína mutada, madura, pueden proporcionar un transporte intracelular al cloroplasto. En las plantas, una forma madura mutada de la TD encontrada en un cloroplasto de una célula hace a la célula resistente a la inhibición de la retroalimentación y con resistencia a los análogos estructurales de He. En general, la transformación de una planta o microorganismo involucra la inserción de la secuencia de ADN en un vector de expresión en la orientación apropiada y el marco de lectura correcto. El vector puede contener deseablemente los elementos necesarios para la transcripción de la secuencia de codificación del polipéptido insertada. Una amplia variedad de sistemas del vector conocidos en la técnica pueden ser utilizados ventajosamente de acuerdo con la invención, tales como los plásmidos, los virus bacteriófagos u otros virus modificados. Los vectores adecuados incluyen, pero no están limitados a los siguientes vectores virales: sistemas gtll, gtlO, Charon 4 del vector lambda y los vectores del plásmido tales como pBH21, pBR322, pACYC177, pACYC184, series PAR, pKK223-3, pUC8, pUC9, pUC18, pUC19, pLG339, pRK290, pKC37, pKClOl, pCDNAII, y otros sistemas similares. Las secuencias de ADN pueden ser clonadas en el vector utilizando los procedimientos de clonación estándares en la técnica, por ejemplo, como se describe por Maniatis et al., Molecular Cloning: a Laboratory Manual, Cold Springs Laboratory, Cold Springs Harbor, New York (1982), el cual es incorporado aquí para referencia en su totalidad. El plásmido pBI121 está disponible de Clontech Laboratories, Palo Alto, California. Se sobreentiende que las técnicas conocidas pueden ser utilizadas ventajosamente de acuerdo con la invención para transformar los microorganismos tales como, por ejemplo, Agrobacterium sp., levadura, E. coli y Pseudomonas sp.
Para obtener la expresión satisfactoria de una secuencia de nucleótidos que codifica una TD insensible a la retroalimentación de la invención en una planta o microorganismo, se prefiere que un promotor esté presente en el vector de expresión. El promotor es preferentemente un promotor constitutivo, pero puede ser alternativamente un promotor específico para el tejido o un promotor inducible. Preferentemente, el promotor es uno aislado de un gen natural que codifica una TD. Aunque los promotores para ciertas clases de genes difieren comúnmente entre las especies, se sobreentiende que la presente invención incluye los promotores que regulan la expresión de una amplia variedad de genes en una amplia variedad de especies de plantas o microorganismos. Un vector de expresión de acuerdo con la invención puede ser producido ya sea natural o artificialmente a partir de las partes derivadas de las fuentes heterólogas, tales partes pueden estar presentes en forma natural o sintetizadas químicamente, y en donde las partes han sido unidas por ligamiento u otros medios conocidos en la técnica. La secuencia de codificación introducida está preferentemente bajo el control del promotor y por consiguiente generalmente estará corriente abajo desde el promotor. Establecido alternativamente, la secuencia promotora generalmente estará corriente arriba (es decir, en el extremo 5' ) de la secuencia de codificación. La frase "bajo el control de" contempla la presencia de tales otros elementos que pueda ser necesario para lograr la transcripción de la secuencia introducida. Como tal, en un ejemplo representativo, la producción mejorada de una TD insensible a la retroalimentación puede ser lograda insertando una secuencia de nucleótidos de la invención en un vector corriente abajo desde y enlazado operativamente a una secuencia promotora capaz de impulsar la expresión en una célula huésped. Dos secuencias de ADN (tales como una secuencia de una región promotora y una secuencia de nucleótidos que codifica la TD, insensible a la retroalimentación) se dice que van a estar enlazadas operativamente si la naturaleza del enlace entre las dos secuencias de ADN no (1) conduce a la introducción de una mutación de desplazamiento del marco, (2) interfiere con la capacidad de la secuencia de la región promotora para dirigir la transcripción de la secuencia de nucleótidos deseada, o (3) interfiere con la capacidad de la secuencia de nucleótidos deseada que va a ser transcrita por la secuencia de la región promotora. La polimerasa de ARN normalmente se une al promotor e inicia la transcripción de una secuencia de ADN o un grupo de secuencias de ADN enlazadas y elementos regulatorios (operon) . Un transgen, tal como una secuencia de nucleótidos seleccionada de acuerdo con la presente invención, es expresada en una célula transformada para producir en la célula un polipéptido codificado por el mismo. Brevemente, la transcripción de la secuencia de ADN es iniciada por la unión de la ARN polimerasa a la región promotora de la secuencia del ADN. Durante la transcripción, el movimiento de la ARN polimerasa a lo largo de la secuencia del ADN forma el ARN mensajero ("ARNm") y, como resultado, la secuencia del ADN es transcrita en un ARNm correspondiente. Este ARNm se mueve entonces a los ribosomas del citoplasma o el retículo endoplásmico áspero el cual, con el ARN de transferencia ("ARNt") , translada el ARNm hacia el polipéptido codificado por el mismo. Se sabe bien que pueden existir o no existir otros elementos regulatorios (por ejemplo, secuencias mej oradoras) las cuales cooperan con el promotor y un sitio de inicio transcripcional para lograr la transcripción de la secuencia de codificación introducida (es decir, extraña) . Por "mejorador" se entiende elementos de la secuencia de nucleótidos la cual puede estimular la actividad del promotor en una célula tal como aquellas encontradas en las plantas como se ejemplificó por la secuencia directora del virus de la línea del maíz (MSV) , el intrón 1 de la alcohol deshidrogenasa, y semejantes. También, el ADN recombinante incluirá preferentemente una secuencia de terminación transcripcional corriente abajo de la secuencia introducida. Puede ser deseable utilizar un gen reportero. En algunos casos, un gen reportero puede ser utilizado con o sin un marcador seleccionable. Los genes reporteros son los genes los cuales típicamente no están presentes en el organismo o tejido del receptor y típicamente codifican las proteínas que conducen a un cambio fenotípico o a una propiedad enzimática. Los ejemplos de tales genes se proporcionan en K. Wising et al. (1988) Ann. Rev. Genetics, 22:421, la cual es incorporada aquí para referencia. Los genes reporteros preferidos incluyen la beta-glucuronidasa (GUS) del sitio uidA del E. coli, la proteína fluorescente verde de la Aequorea victoria de la medusa bioluminiscente, y los genes de luciferasa de la P otinus pyralis de la luciérnaga. Un ensayo para detectar la expresión del gen reportero puede ser efectuado entonces en un tiempo adecuado después que el gen ha sido introducido en las células receptoras. Un ensayo preferido de tales ensayos abarca el uso del gen que codifica la beta-glucuronidasa (GUS) del sitio uidA del E. coli, como se describe por Jefferson et al., (1987 Biochem. Soc. Trans. 15, 17-19) para identificar las células transformadas. Los elementos reguladores del promotor de la planta desde una amplia variedad de fuentes pueden ser utilizados eficientemente en las células vegetales para expresar genes extraños. Por ejemplo, los elementos regulatorios del promotor de origen bacteriano, tales como el promotor de la octipina sintasa, el promotor de la nopalina sintasa, el promotor de la manopina sintasa, y los promotores de origen viral, tales como el virus de mosaico de la coliflor (35S y 19S), 35T (el cual es un promotor de 35S rediseñado, WO 97/13402 publicada el 17 de abril de 1997) y semejantes, pueden ser utilizados. Los elementos regulatorios del promotor de la planta incluyen, pero no están limitados a, la subunidad pequeña (ssu) de la tibulosa-1, 5-bisfosfato (RUBP) carboxilasa, el promotor de beta-conglicinina, el promotor de beta-faseolin, el promotor de ADH, los promotores del choque térmico, y los promotores específicos para el tejido. Otros elementos tales como las regiones de fijación de la matriz, las regiones de fijación en forma de andamio, los intrones, los mejoradores, las secuencias de poliadenilación, y semejantes, pueden estar presentes y por consiguiente pueden mejorar la eficiencia de la transcripción o la integración del ADN. Tales elementos pueden o no pueden ser necesarios para la función del ADN, aunque los mismos pueden proporcionar una mejor expresión o funcionamiento del ADN afectando la transcripción, la estabilidad de ARNm, y semejantes. Tales elementos pueden ser incluidos en el ADN cuando se desee para obtener un funcionamiento óptimo del ADN transformado en la planta. Los elementos típicos incluyen, pero no están limitados a, Adh-intrón 1, Adh-intrón 6, la secuencia directora de la proteína de recubrimiento del virus de mosaico de la alfalfa, la secuencia directora de la proteína de recubrimiento del virus de la línea del maíz, así como otros valiosos para el experto en la técnica. Los elementos regulatorios del promotor, constitutivos, pueden ser utilizados, por lo cual se dirige la expresión del gen continua en todos los tipos de células en cualquier instante (por ejemplo, la actina, ubiquitina, CaMV 35S, y semejantes) . Los elementos regulatorios del promotor específico del tejido son responsables de la expresión del gen en los tipos de célula o tejido específicos, tales como las hojas o las semillas (por ejemplo, la zeína, oleosina, napina, ACP, globulina, y semejantes) y estos pueden ser utilizados alternativamente .
Los elementos regulatorios del promotor también pueden ser activos durante una cierta etapa del desarrollo de la pianta así como activos en los tejidos y órganos de la planta. Los ejemplos de tales elementos incluyen, pero no están limitados a, elementos regulatorios del promotor específico para el polen, específico para el embrión, específico para la seda maíz, específicos para la fibra del algodón, específicos para la raíz, específicos para el endosperma de la semilla, y semejantes. Bajo ciertas circunstancias, puede ser deseable utilizar un elemento regulatorio del promotor inducible, el cual es responsable de la expresión de los genes en respuesta a una señal específica, tal como, por ejemplo, un estímulo físico (genes del choque térmico) , la luz (RUBP carboxilasa), las hormonas (Em), los metabolitos, las substancias químicas y la tensión. Otros elementos de transcripción y translación deseables que funcionan en las plantas también pueden ser utilizados*. Numerosos vectores de transferencia del gen, específicos para la planta son conocidos en la técnica. Una vez que la construcción de ADN de la presente invención ha sido clonada en un vector de expresión, la misma puede ser transformada entonces en una célula huésped. Además de numerosas tecnologías para transformar las plantas, el tipo de tejido el cual se pone en contacto con los polinucleótidos extraños puede variar también. El tejido de las plantas adecuado para la transformación de una planta de acuerdo con ciertos aspectos preferidos de la invención incluye, por ejemplo, las plantas completas, los tejidos de las hojas, los botones de las flores, los tejidos de las raíces, los tipos I, II y III del tejido calloso, el tejido embriogénico, los meristemas, los protoplastos, los hipocotilos y los cotiledones. Se sobreentiende, sin embargo, que esta lista no está propuesta para ser limitativa, sino solamente proporcionar ejemplos de los tejidos de las plantas los cuales pueden ser transformados ventajosamente de acuerdo con la presente invención. Una amplia variedad de tejidos de las plantas pueden ser transformados durante la diferenciación utilizando las técnicas apropiadas descritas aquí. La transformación de una planta o microorganismo puede ser lograda utilizando una de una amplia variedad de las técnicas conocidas en el arte. La manera en la cual la unidad transcripcional es introducida en el huésped de la planta no es crítica para la invención. Cualquier método que proporciona una transformación eficiente puede ser empleada. Una técnica de transformación de las plantas con una construcción de ADN de acuerdo con la presente invención es poniendo en contacto el tejido de tales plantas con un inoculo de las bacterias transformado con un vector que comprende la construcción de ADN. En general, este procedimiento involucra la inoculación del tejido de la planta con una suspensión de bacterias e incubar el tejido durante aproximadamente 48 hasta aproximadamente 72 horas sobre el medio de regeneración sin antibióticos a aproximadamente 25-28 °C. Las bacterias del género Agrobacterium pueden ser utilizadas ventajosamente para transformar las células vegetales. Las especies adecuadas de tales bacterias incluyen Agrobacterium tumefaciens y
Agrobacterium rhizogenes. El Agrobacterium tumafaciens
(por ejemplo, las cepas LBAA4404 o EHA105) es particularmente útil debido a su capacidad bien conocida para transformar las plantas. Otra técnica la cual puede ser utilizada ventajosamente es la infiltración al vacío de los botones de las flores utilizando los vectores a base de Agrobacterium. Varios métodos para la transformación de la planta incluyen el uso de los plásmidos Ti o Ir y semejantes para efectuar la transformación mediada por Agrobacterium. En muchos casos, es deseable tener la construcción utilizada para la transformación limitada sobre uno o ambos lados por las fronteras o límites de T-ADN, más específicamente la frontera o límite derecho.
Esto es particularmente útil cuando la construcción utiliza el Agrobacterium tumefaciens o el Agrobacterium rhizogenes como un modo para la transformación, aunque los límites o fronteras de T-ADN pueden encontrar uso con otros modos de transformación. En donde el Agrobacterium es utilizado para la transformación de la planta, un vector puede ser utilizado, el cual puede ser introducido en el huésped para la recombinación homologa con el T-ADN o el plásmido de Ti o Ri presente en el huésped. La introducción del vector puede ser efectuada por medio de electroporación, correspondencia o igualación tri-parental u otras técnicas para transformar las bacterias gram-negativas las cuales son conocidas por aquellos expertos en la técnica. La manera de la transformación del vector en el huésped de Agrobacterium no es crítica para la invención. En algunos casos en donde el Agrobacterium es utilizado para la transformación, la construcción de la expresión que es dentro de los límites o fronteras de T-ADN será insertada en un vector de espectro amplio tal como pRK2 o derivados de los mismos como se describe en Ditta et al. (PNAS USA (1980) 77:7347-7351 y EPO 0 120 515), los cuales son incorporados aquí para referencia. Las explantas pueden ser combinadas e incubadas con el Agrobacterium transformado durante un período de tiempo suficiente para permitir la transformación de las mismas. Después de la transformación, las Agrobacterias y las células vegetales son cultivadas con el medio selectivo apropiado. Una vez que se forman ramificaciones, la formación de brotes puede ser estimulada empleando las hormonas de las plantas apropiadas de acuerdo con los métodos bien conocidos en la técnica del cultivo de tejidos de las plantas y la regeneración de las plantas. Sin embargo, una etapa intermedia de renuevos no es siempre necesaria. Después de la formación de los brotes, las células de la planta pueden ser transferidas a un medio el cual estimula la formación de las raíces por lo cual se completa la regeneración de la planta. Las plantas se pueden hacer crecer entonces hasta obtener semillas y las semillas pueden ser utilizadas para establecer generaciones futuras. Sin importar la técnica de la transformación, el polinucleótido de interés es incorporado preferentemente en un vector de transferencia adaptado para expresar el polinucleótido en una célula vegetal incluyendo en el vector un elemento regulatorio del promotor de la planta, así como las regiones de terminación transcripcional no transladadas en 3' tales como Nos y semejantes. Los sistemas de base viral de ARN de la planta también pueden ser utilizados para expresar los genes para los propósitos descritos aquí. Haciéndolo así, los genes quiméricos de interés pueden ser insertados en las regiones del promotor de recubrimiento de un virus de la planta adecuado bajo el control de un promotor subgenómico el cual infectará la planta huésped de interés. Los sistemas de base viral del ARN de la planta se describen, por ejemplo, en las Patentes U.S. Nos. 5,550,360; 5,316,931 y 5,589,367, cada una de las cuales es incorporada aquí por el presente para referencia en su totalidad. Otro enfoque para transformar las células vegetales con una secuencia de ADN seleccionada de acuerdo con la presente invención, involucra la propulsión de partículas activas biológicamente o inertes en las células o tejidos de la planta. Esta técnica se describe en las patentes U.S. Nos. 4,945,050, 5,036,006 y 5,100,792, todas de Sanford et al., las cuales son incorporadas aquí para referencia. En general, este procedimiento involucra la propulsión de partículas activas biológicamente o inertes en las células bajo condiciones efectivas para penetrar la superficie externa de la célula y para ser incorporados dentro del interior de la misma. Cuando las partículas inertes son utilizadas, el vector puede ser introducido en la célula recubriendo las partículas con el vector.
Alternativamente, la célula de blanco u objetivo puede estar rodeada por el vector de modo que el vector sea llevado en la célula por la estela de la partícula. Las partículas activas biológicamente (por ejemplo, las células de levadura secas, las bacterias secas o un bacteriófago, cada uno conteniendo el material de ADN que se desea que sea introducido) también pueden ser propulsadas hacia las células vegetales. No está propuesto, sin embargo, que la presente invención esté limitada por la selección del vector o la célula huésped. Se debe entender por supuesto que no todos los vectores y las secuencias de control de la invención funcionarán igualmente bien para expresar las secuencias de ADN de esta invención. Ni todos los huéspedes funcionarán igualmente bien con el mismo sistema de expresión del vector. Sin embargo, una persona con experiencia en la técnica puede hacer una selección entre los vectores, las secuencias de control de la expresión, y los huéspedes sin la experimentación indebida y sin apartarse del alcance de esta invención. Una construcción del ADN aislada seleccionada de acuerdo con la presente invención puede ser utilizada en un vector de expresión para transformar una amplia variedad de plantas, incluyendo monocotiledóneas y dicotiledóneas. La invención encuentra un uso ventajoso, por ejemplo, en la transformación de las siguientes plantas; arroz, trigo, cebada, centeno, maíz, papa, zanahoria, camote, frijol, arveja, achicoria, lechuga, col, coliflor, brócoli, nabo, rábano, espinaca, espárrago, cebolla, ajo, berenjena, pimienta, apio, chayóte, calabaza, calabacín, pepino, manzana, pera, membrillo, melón, ciruela, cereza, durazno, melocotón, albaricoque, fresa, uva, frambuesa, zarzamora, pina, aguacate, papaya, mango, banana, soya, tabaco, tomate, sorgo y caña de azúcar. La literatura adicional que describe la transformación de las plantas y/o los microorganismos incluye las siguientes, cada una de las cuales es incorporada aquí en su totalidad: Zhijian Li et al. "A Sulfonylurea Herbicide Resistance Gene from Arabidopsis thaliana as a New Selectable Marker for Production of Fertile Transgenic Rice Plants" Plant Physiol. 100, 662-668 (1992); Parsons et al. (1997) Proc. Nati. Acad. Sci. EUA 84:4161-4165; Daboussi et al. (1989) Curr. Genet. 15:453-456; Leung et al. (1990) Curr. Genet. 17:409-411; Kóetter et al., "Isolation and characterization of the Pichia stipitis xylitol dehydrogenase gene, XYL2, and construction of a xylose-utilizing Saccharomices cerevisiae transformant", Curr. Genet., 18:493-500 (1990); Strasser et al., "Cloning of yeast xylose reductase and xylitol dehydrogenase genes and their use", solicitud de patente alemana (1990); Hallborn et al., "Xylitol production by recombinant Saccharomyces cerevisiae", Bio. /Technol. , 9:1090 (1991); Becker and Guarente, "High efficiency transformation of yeast by electroporation", Methods in Enzymol. 194:182-186 (1991); Ammerer, "Expression of genes in yeast using the ADC1 promoter", Methods in Enzymol. 101:192-201 (1983); Sarthy et al., "Expression of the E. coli xylose isomerase gene in S. cerevisiae", Appl. Environ.Microb. , 53:1996-2000 (1987); Patentes U.S. Nos. 4,945,050, 5,141,131, 5,177,010, 5,104,310, 5,149,645, 5,469,976, 5,464,763, 4,940,838, 4,693,976, 5,591,616, 5,231,019, 5,463,174, 4,762,785, 5,004,863, 5,159,135, 5,302,523, 5,464,765, 5,472,869, 5,384,253; Solicitudes de Patente Europea Nos. 0131624B1, 120516, 159418B1, 176112, 116718, 290799, 320500, 604662, 627752, 0267159, 0292435; WO 87/06614; WO 92/09696; y WO 93/21335. Aquellos expertos en la técnica reconocerán las ventajas comerciales y agrícolas inherentes en las plantas transformadas para expresar la TD insensible a la retroalimentación. Tales plantas tienen la capacidad mejorada de sintetizar la He y, por lo tanto, se espera que sean más valiosas nutricionalmente, comparado con una planta no transformada correspondiente. Además, ciertos compuestos intermedios de la ruta biosintética de la He tienen un valor comercial significativo, y la producción de estos compuestos intermedios es incrementada ventajosamente en un transformante de acuerdo con la invención. Por ejemplo, el 2-oxobutirato, el producto de la reacción de la reacción catalizada por TD, se sabe que va a ser un precursor para la producción del polihidroxibutirato en las plantas que han sido diseñadas genéticamente utilizando las técnicas conocidas en el arte para incluir los genes bacterianos necesarios para producir el polihidroxibutirato. El polihidroxibutirato es un biopolímero deseado en la industria del plástico a causa de que el mismo puede ser degradado biológicamente. A causa de que las plantas y los . microorganismos transformados de acuerdo con la invención caracterizan la producción incrementada del 2-oxobutirato, tales plantas y/o microorganismos pueden ser utilizados ventajosamente por los fabricantes del plástico de esta manera. Por ejemplo, las plantas que sobreproducen el 2-oxobutirato podrían ser ideales para el diseño metabólico por los genes bacterianos para la producción del polihidroxibutirato a causa de que la sobreproducción del 2-oxobutirato podría proporcionar una abundancia del substrato por la ruta tanto biosintética de la He natural como la ruta del polihidroxibutirato diseñado.
Quizás la ventaja más significativa de la presente invención es que una secuencia de nucleótidos de la invención puede ser utilizada en un vector de expresión como un marcador seleccionable. En este aspecto de la invención, una secuencia de nucleótidos de la invención es incorporada en un vector tal como el mismo es expresado en una célula transformado por el mismo, en compañía de una segunda secuencia de nucleótidos preseleccionada (es decir, la secuencia primaria) la cual se desea que sea incorporada en el genoma de la célula de blanco u objetivo. En esta protocolo de selección de la invención, los transformantes exitosos no solamente expresarán la secuencia primaria, sino también expresarán una TD insensible a la retroalimentación. Por consiguiente, una vez que el ADN recombinante es introducido en el tejido de la planta o el microorganismo, los transformantes exitosos pueden ser seleccionados de acuerdo con la invención haciendo crecer la planta o microorganismo en un substrato que comprende un análogo de He tóxico, tal como, por ejemplo, OMT (llamado el "substrato tóxico" aquí) . El análogo estructural de la He es tóxico para la TD del tipo silvestre, y solamente los transformantes exitosos, es decir, aquellos que expresan la TD insensible a la retroalimentación, estarán vivos, crecerán y/o proliferarán en el substrato tóxico. De esta manera, omr 1 también es un excelente marcador bioquímico que va a ser utilizado en los experimentos de ingeniería genética de las bacterias reemplazando a los genes resistentes a los antibióticos, peligrosos ambientalmente y utilizados tradicionalmente (tales como los genes marcadores resistentes a la ampicilina y a la kanamicina) . El omr 1 es muy favorable para el medio ambiente y no posee ningún riesgo para la salud humana cuando se incluye en un transformante, a causa de que el mismo no tiene un ortólogo en los seres humanos. Los seres humanos no sintetizan la isoleucina y solamente pueden obtenerla por la digestión de los alimentos. Con base en las características ventajosas de la invención, también se proporciona un sistema de herbicida novedoso. De acuerdo con este sistema, las líneas de las plantas valiosas agrícolamente que comprenden una secuencia de nucleótidos expresable que codifica una td insensible ("línea de la planta transformada") se hacen crecer en un substrato y un análogo estructural de la He seleccionado de acuerdo con la invención se pone en contacto con el substrato o con las propias plantas. Como resultado, solamente las plantas transformadas continuarán creciendo y otras plantas puestas en contacto con el análogo morirán. La invención será descrita adicionalmente con referencia a los siguientes ejemplos específicos. Se sobreentenderá que estos Ejemplos son ilustrativos y no de naturaleza restrictiva. Las digestiones, las fosforilaciones, los ligamientos y las transformaciones con bacterias de la enzima de restricción, se hicieron como se describió en Sambrook et al, Molecular Cloning: A Laboratory Manual, Segunda Edición (1989) Cold Spring Harbor Laboratory Press. Las transformaciones de las plantas se hicieron de acuerdo con Bent et al. "RPS2 de Arabidopsis' thaliana: A leucine-rich repeat class of plant disease resistence genes". Science 265:1856-1860 (1994). Cada cita bibliográfica es incorporada aquí para referencia en su totalidad.
EJEMPLO UNO
Como se reporta en Mourad G, King J (1995) el mutante resistente a la L-O-metiltreonina de la Arabidopsis defectuosa en la regulación de la retroalimentación de la isoleucina, Plant Physiol 107:43-52, el GMllb de la línea mutada de Arabidopsis thaliana fue obtenido, utilizando la mutagénesis de EMS, por la selección en la presencia del análogo estructural de He tóxico, L-O-metiltreonina (OMT) . La base de la selección del mutante fue que el OMT se incorporó en las proteínas celulares en lugar de la He, provocando la pérdida de la función de la proteína y, por consiguiente, la muerte de la célula. La GMllb fue rescatada a causa de una mutación dominante en el omr 1 del gen único el cual codifica la TD. La mutación en el gen de omr 1 provoca que la TD desde GMllb sea insensible al control de la alimentación por la lie. La actividad de la TD en los extractos de las plantas de GMllb fue de aproximadamente 50 veces más resistente a la inhibición de la retroalimentación por la He que el TD en los extractos de las plantas del tipo silvestre. La pérdida de la sensibilidad a la retroalimentación de la He en GMllb conduce a una sobreproducción de 20 veces de la He libre cuando se compara con el tipo silvestre. Esta sobreproducción de la He en GMllb no tuvo efecto sobre el crecimiento o reproducción de las plantas.
EJEMPLO DOS
Clonación, Secuenciamiento y Prueba del omr 1 como un Marcador Seleccionable en Experimentos de Ingeniería Genética 1. La construcción de una biblioteca de ADNc a partir de GMllb (omrl/omrl) :
El ARN total se extrajo de las plantas de GMllb (omrl/omrl) de 16 días de edad en un medio de agar mínimo suplementado con 0.2 mM MTR. El Poli (A) ARN (ARNm) se extrajo desde el ARN total y el ADN complementario (ADNc) se sintetizó utilizando la transcriptasa inversa. La biblioteca de ADNc se sintetizó utilizando el juego o conjunto de síntesis de ZAP-ADNc de Stratagene. Para cebar la síntesis de ADNc, un cebador del enlazador de oligonucleótidos de base 50 que contiene un sitio X o I y un poli(dT) de base 18 fueron utilizados. Un adaptador de oligonucleótidos 13-mer que contiene un extremo cohesivo de Eco IR se ligó a las moléculas de ADNc de doble hebra en el extremo 5' . Esto permitió la clonación unidireccional de las moléculas de ADNc, en el sentido de la orientación, en los sitios Eco IR y Xho I del vector Uni-ZAP XR de Stratagene. La biblioteca del fago ? recombinante se amplificó utilizando las células huésped de E. coli XLl-Blue MRF* que dan una concentración de 6.8 x 109 pfu/ml. El inserto de tamaño promedio fue aproximadamente de 1.4 kb. Este se calculó a partir de un análisis de PCR de 20 placas claras, al azar, aisladas desde la biblioteca amplificada. El vector Uni-ZAP XR contiene el plásmido pBluescript SK(-) que contiene el extremo N del gen de lacZ. Para escindir el faguemido de pBluescript que contiene el' inserto de ADNc clonado, el sistema ExAssist/SOLR provisto por Stratagene fue utilizado. Esto permitió el rescate de los insertos de
ADNc desde los clones de ? positivos en los plásmidos de pBluescript SK en un solo paso.
2. El aislamiento de un fragmento de TD-ADN pequeño para su uso co o una sonda homologa:
Para aislar el gen omr 1 que codifica la TD de la biblioteca de ADNc de la línea GMllb, un oligonucleótido homólogo, aislado del ADN del Arabidopsis, se utilizó como una sonda contra la biblioteca de ADNc. Tomando en consideración que el TD es conservado en una variedad de organismos, los cebadores degenerados fueron diseñados a partir de las regiones de aminoácidos conservados de la TD. Tales regiones conservadas fueron identificadas alineando la secuencias de aminoácidos de la TD desde el garbanzo y el tomate. La Figura 2 muestra la localización de las secuencias de amino conservadas en el tomate y el garbanzo y también la localización de los cebadores de oligonucleótidos degenerados TD205 y TD206 que fueron diseñados para aislar un fragmento de TD-ADN de Arabidopsis. La Figura 4 muestra la estructura y el grado de degeneración de los cebadores de oligonucleótidos de PCR, TD205 (el cebador del extremo 5' ) y TD206 (el cebador del extremo 3' ) . Ambos cebadores TD 205 y TD 206 fueron diseñados para acomodar la desviación o desplazamiento del codón de Arabidopsis. El cebador TD 205 tuvo una degeneración de 384 veces y fue un 28-mer anclado con un sitio Eco IR partiendo de 2 bases corriente abajo del primer nucleótido en el extremo 5' del cebador. La TD 206 tuvo una degeneración de 324 veces y fue un 28-mer anclado con un sitio Hind III partiendo de 2 bases corriente abajo del primer nucleótido en el extremo 5' del cebador. El ADN genómico se aisló de GMllb y se utilizó como un modelo o plantilla en una amplificación de PCR con los cebadores TD205 y TD206. Un fragmento de 438 pb fue amplificado. El fragmento se clonó en los sitios Eco IR-Hind III del plásmido pGEM3Zf(+). El fragmento se secuenció hasta que se completó utilizando el método de terminación de la cadena de didesoxi y el juego o conjunto de secuenasa de USB. El fragmento mostró un intrón de 280 pb putativo o supuesto. Los restantes 158 pb del fragmento de PCR tuvieron 60.1 % de identidad de la secuencia de nucleótidos con el gen de TD del garbanzo. Para eliminar las secuencias del intrón putativas o supuestas, un segundo par de cebadores TD 211 y TD212 fue diseñado y utilizado en una reacción de PCR con el fragmento de 438 pb como un modelo o plantilla. Un fragmento de ADN de aproximadamente 100 pb de longitud, que contiene las secuencias del exon, fue amplificado y purificado. Esta fue la sonda homologa utilizada para la selección de la biblioteca de ADNc construida desde GMllb.
3. Selección de la biblioteca de ADNc de GMllb:
El fragmento de PCR de 100 pb fue etiquetado con [a-32P]dCTP (3000 Ci/mmoles) utilizando la cebadura al azar (juego o conjunto de etiquetación de un gen con el cebador a de Promega) y se utilizó como una sonda para seleccionar levantamientos de la placa (dos réplicas por placa) de la biblioteca de ADNc del GMllb colocado en placas. La hibridación se hizo a 42 °C en formamida durante 2 días. Las membranas de nilón que contienen los levantamientos de la placa se lavaron 3X a temperatura ambiente (25 °C) en 7XSSPE y 0.5% de SDS durante 5 minutos. Las membranas de nilón se colocaron entonces sobre una película de rayos X y se expusieron durante 1 día. Dos placas se hibridizaron y mostraron la señal sobre las películas de rayos X de las dos réplicas tomadas desde la misma placa. En el sitio de la hibridación positiva, se cortaron tapones de la placa de agar y se colocaron en 1 ml de la solución amortiguadora de SM con 20 µl de cloroformo. Una selección secundaria, terciaria y cuaternaria se efectuó hasta que aproximadamente 90% de las placas sobre la caja mostraron una señal fuerte sobre la película de rayos X de ambas réplicas de la misma caja. Una placa aislada de la cavidad que representa cada clon se cortó de la caja y se colocó en la solución amortiguadora de SM. El fago eluído se infectó con el fago del ayudante ExAssist para escindir el plásmido SK de pBluescript que contiene el inserto del ADNc y las bacterias recombinantes resultantes se colocaron en placas sobre un medio con ampicilina (60 µg/ml). Pocas colonias bacterianas fueron seleccionadas, el ADN del plásmido se preparó luego se digirió con Eco IR y Xho I para liberar los insertos. Una mancha de Southern se preparó a partir de las digestiones del plásmido y se sondearon con el fragmento de TD de 100 pb etiquetado con 32P. Todos los clones, descendientes de los dos clones del fago, mostraron una señal muy fuerte. Esta fue una indicación fuerte de que los clones aislados contuvieron la TD desde la línea GMllb. Un clon fue llamado TD23 y se- seleccionó para el secuenciamiento del ADN. El tamaño del inserto del ADNc en el clon TD23 fue de 2229 nucleótidos.
4. Secuenciamiento del fragmento de 2229 pb del clon TD23:
El secuenciamiento del inserto del ADNc del clon TD23 se efectuó por el método de terminación de la cadena de didesoxi utilizando el juego o conjunto de secuenasa de USB. Al inicio del proyecto _ de secuenciamiento, un cebador del oligonucleótido complementario para el promotor T3 de pBluescript T3 se sintetizó y se utilizó para obtener la secuencia de pocos de los primeros nucleótidos del inserto. Esta secuencia, de 30 nucleótidos, incluyó el sitio de clonación múltiple corriente abajo del promotor de T3. El inicio de la secuencia de ADNc fue inmediatamente a continuación del sitio de Eco IR el cual inicia en la posición 31. El secuenciamiento del ADN también fue efectuado sobre la hebra opuesta partiendo del extremo 3' y utilizando el promotor de T7 del pBluescript SK. Ambas hebras del inserto TD 23 se secuenciaron hasta que se completaron utilizando un conjunto de cebadores de oligonucleótidos diseñados a partir del ADN revelado después de cada reacción de secuenciamiento. Un total de 19 cebadores de oligonucleótidos se sintetizaron y se utilizaron en el secuenciamiento del inserto del ADNc. La longitud del fragmento secuenciado fue de 2277 nucleótidos de los cuales 229 fueron del "inserto de ADNc. De los restantes 48 nucleótidos, 2277-2229, 31 nucleótidos fueron el sitio de clonación múltiple entre el promotor T3 y el sitio de Eco IR en el extremo 5' del inserto y 17 nucleótidos fueron el sitio de clonación múltiple entre el promotor T7 y el sitio Xho I en el extremo 3' del inserto (Figura 4). La Figura 5 muestra la secuencia de nucleótidos y la secuencia de aminoácidos predicha del clon 23 como se aisló de la biblioteca de
ADNc construida de la línea GMllb de Arabidopsis
(omrl/omrl) . El inserto de TD en el clon 23 está en el vector pBluescript entre los sitios Eco IR y Xho I. Un marco de lectura abierta (marco de lectura superior) se observó el cual mostró un codón de ATG en el nucleótido 166 y un codón de terminación en el nucleótido 1801. El inserto de ADNc total en el clon 23 es de 1758 nucleótidos (incluyendo el codón de parada) que codifica un polipéptido de 585 aminoácidos. La Figura 4 muestra la secuencia de ADN del clon 23 y la Figura 5 muestra la secuencia de ADN y el marco de lectura abierta con la secuencia de aminoácidos predicha codificada por el inserto de ADNc. La secuencia se aminoácidos predicha codificada por el gen de ADNc de TD 23 compartió una identidad mayor que el 50% con la secuencia de aminoácidos de TD de la papa y el tomate respectivamente. Esto fue una evidencia fuerte de que el inserto de ADNc del clon TD23 es realmente el gen que codifica la treonina deshidratasa/desaminasa, omr 1, de la GMllb de la línea resistente a la L-O-metiltreonina de la Arabidopsis thaliana.
. Prueba de funcionalidad del inserto de ADNc (omr 1) ue codifica la TD de Arabidopsis:
Para probar que el inserto de .ADNc clonado del clon Td 23 está codificando realmente una treonina deshidratasa/desaminasa funcional, se efectuó una prueba complementaria. La TGXA de la cepa de E. coli es un auxótrofo con una deleción en el gen ilvA que codifica la treonina deshidratasa/desaminasa. Fisher KE, Eisenstein e (1993), An efficient approach to identify ilva mutations reveáis an amino-terminal catalytic domain in biosynthetic threonine deaminase from Escherichia coli, J Bacteriol 175:6605-6613. Esta cepa no puede crecer sobre un medio mínimo sin suplemento con la He. Esta cepa fue un regalo generoso de los Drs. Kathryn E. Fisher y Edward Eisenstein, University of Maryland Baltimore County, Maryland. Los primeros experimentos complementarios se hicieron para probar la capacidad del omr 1 para invertir la TGXA del auxótrofo de He bacteriano a prototrofia. Esto se hizo transformando la TGXA con pGM-td23, que contiene el omr 1 de inserto del ADNc en pBluescript SK bajo el control del promotor T3. Además, el inserto de ADNc que contiene el omr 1 se subclonó en dos diferentes vectores de expresión procarióticos . Un fragmento de Xba I-Xho I, que contiene la secuencia de ADNc de omr 1, se escindió de pGM-td23 y se clonó en Xba I-Sal I de los vectores de expresión procarióticos linearizados pTrc99A y pUCK2. En pTrc99A, el omr 1 se clonó en el frente del promotor inducible de IPTG lacZ mientras que en pUCK2, el omr 1 se clonó en el frente de un promotor constitutivo. Las terminales o extremos cohesivos Xho I y Sal I son compatibles y por lo tanto se permite el ligamiento de los insertos en los vectores de expresión. Los vectores recombinantes pTrc-td23, pUCK-td23 o pBluescript-td23 todos conteniendo el omr 1 de longitud completa fueron transformados en la cepa TGXA y colocados en placas sobre un medio mínimo sin suplementación. La totalidad de las tres construcciones fueron capaces de invertir la auxotrofía de He de la TGXA huésped a prototrofía. Estos experimentos confirmaron que el omr 1 que codifica la Arabidopsis thaliana (línea GMllb) es funcional y capaz de desbloquear la ruta biosintética del He de la cepa TGXA de E. coli. En el segundo experimento de complemento, el huésped DH5a del prototrofo de E. coli se transformó con pTrc-td23 o pUCK-td23 y se colocó en placas sobre un medio mínimo suplementado con concentraciones variables de la L-O-metiltreonina del análogo tóxico. Ambas de las construcciones fueron capaces de conferir la resistencia del DH5a a 30 µM de la L-O-metiltreonina. Ninguna colonia bacteriana creció sobre las placas que contienen la DH5a no transformada. Este resultado proporcionó una evidencia fuerte de que el gen de omr 1 mutado de la línea GMllb de la Arabidopsis es capaz de conferir resistencia a la L-O-metiltreonina presente en el medio de crecimiento. Por lo tanto el omr 1 proporciona un nuevo marcador seleccionable favorable para el medio ambiente para la transformación genética de las bacterias.
6. Construcción del vector de expresión de pCM35S-omr 1 para la transformación de la planta:
La estrategia para clonar el alelo de omr 1 en un vector de expresión de la planta fue como sigue:
A. La región de codificación del alelo omr 1 se escindió de pGM-td23 como un fragmento de Xba I - Kpn I. B. El promotor de CaMV 35S de 500 pb se desdobló del vector pBI121.1 (Jefferson et al., 1987) con Hind III y Ba Hl. El vector pBINl9 se linearizó con Hind III y Bam Hl luego se ligó al promotor de CaMV 35S para colocar el promotor en el sitio de clonación múltiple en la orientación correcta. Este vector fue llamado pCM35S. C. El plásmido pCM35S se digirió con Xba I - Kpn I y el fragmento de omr 1 aislado en el paso A se clonó en los sitios Xba I - Kpn I colocando la secuencia de codificación de omr 1 en el frente del promotor de CaMV 35S y creando un plásmido con el gen resistente a la kanamicina (NOS:NPTII:NOS) cercano al borde o límite derecho RB de la región del T-ADN del plásmido Ti y 35S:omr 1 corriente abajo y cercano al borde izquierdo LB de la región de T-ADN del plásmido de Ti. Este plásmido se llamó pCM35S-omr 1-nos (ca. 13 kb) . D. El terminador NOS de pBIN19 fue amplificado por PCR utilizando un par de cebadores de oliglonucleótidos, el cebador 5' se ancló con un sitio Xha I y el cebador 3' se ancló con un sitio Sal I. La amplificación por PCR produjo un fragmento del terminador NOS de 300 pb.
E. Para clonar un terminador de NOS al extremo 3' del gen omr 1, el plásmido recombinante pCM35S-omr 1-nos se digirió con el Nhe I y Xho I. Esto produjo tres fragmentos : (i) un fragmento de Nhe I - Nhe I de 5 kb que contiene una parte del promotor NOS del gen NPTII, el promotor 35S y el ADNc del omr 1 de longitud completa excepto 200 pb de las secuencias no transladadas en el extremo 3' el cual incluye la cola o extremidad de poly A. (ii) un fragmento de Nhe I - Xho I de 200 pb que contiene el fragmento de 200 pb mencionado en (i) y que contuvo la cola o extremidad poly A y las secuencias no transladadas en el extremo 3' de omr 1. (iii) un fragmento Nhe I - Xho I de 8 kb que contiene el promotor NOS del extremo 5' del gen
NPTII y las secuencias restantes fuera de LB y RB del pCM35S-omr 1-nos. F. Para clonar el terminador NOS inmediatamente corriente abajo del gen omr 1 en pCM35S-omr 1-nos, se efectuó una triple ligadura incluyendo el fragmento Nhe I - Nhe I de 5 kb que contiene parte del promotor NOS del gen
NPTII mencionado anteriormente en E(i), el fragmento del terminador NOS de Sba I - Sal I de 300 pb mencionado en C, y el fragmento de Nhe I - Xho I de 8 kb que contiene el promotor NOS del extremo 5' del gen NPTH y las secuencias restantes fuera de LB y RB del pCM35S-omr 1-nos. El resultado de esta triple clonación fue el ligamiento del fragmento de 5 kb en un extremo Nhe I (el extremo del promotor NOS) al sitio Nhe I del fragmento de 8 kb (Nhe I/Nhe I) y el otro extremo Nhe I (en el extremo 3' de la secuencia de codificación de omr 1) del fragmento de 5 kb se ligó el Xba I (isosquizómero) del fragmento del terminador NOS de 300 pb. El extremo de Sal I del terminador NOS de 300 pb se ligó al extremo Xho I (isosquizómero) del fragmento de 8 kb. Esto generó el plásmido recombinante pCCM35S-omr 1 que contiene el gen omr 1 impulsado o activado por el promotor CaMV 35S y terminado por el terminador NOS y el gen resistencia a la kanamicina (Promotor NOS :NPTII: OS: terminador) entre el LB y el RB (Figura 16) . Para confirmar la clonación de los tres fragmentos en la orientación apropiada, una digestión de diagnóstico con Xba I y Kpn I produjo un fragmento de 2.3-2.4 kb. El plásmido pCM35S-omr 1 por lo tanto contuvo dos construcciones que podrían ser expresadas en las plantas, el CaMV35S:omr 1: terminador NOS que expresa la resistencia a la L-O-metiltreonina y el promotor NOS :NPTII : terminador NOS que expresa la resistencia a la kanamicina.
7. Transformación de la planta utilizando pCM35S-omr 1 :
Utilizando el método de infiltración al vacío de Bent et al. (1994), el tipo silvestre Columbia de la Arabidopsis thaliana sensible a la L-O-metiltreonina se transformó con pCM35S-omr 1. Diez macetas, cada una con 3-4 plantas, fueron transformadas y las semillas de TI fueron colectadas desde las plantas transformadas T0 de cada maceta separadamente. Las semillas TI de cada maceta fueron seleccionadas para la expresión de la resistencia a la L-O-metiltreonina por la germinación en un medio de agar suplementado con 0.2 mM de la L-O-metiltreonina, una concentración previamente determinada y conocida para inhibir completamente el crecimiento de los plantas que han crecido de las semillas más allá de la etapa cotiledónea (Mourad y King, 1995) . La mitad de las semillas TI de cada una de las diez macetas fueron seleccionadas para verificar la resistencia de la L-O-metiltreonina y 5 transformantes independientes fueron capaces de germinar y continuar haciendo crecer las raíces sanas y los renuevos entre miles de plantas crecidas de las semillas que fueron blanqueadas completamente después de la salida de los cotiledones. En una placa llena, es posible identificar los transformantes mirando en la parte inferior de la placa, los transformantes muestran el crecimiento de la raíz mientras que los no transformantes no tendrán ninguno. Después de tres semanas de crecimiento en el medio de agar de la L-O-metiltreonina 0.2 mM, cada uno de los 5 transformantes positivos se transfirió al suelo, se mantuvo separadamente y se le permitió autofertilizarse para producir la semilla T2.
8. Caracterización genética de los transformantes de omr 1:
La semilla T2 fue colectada de cada uno de los
transformantes de TI positivos y 50 semillas T2/transforinantes fueron plantados en una caja de petri separada que contiene 0.2 mM de medio de agar de la L-O-metiltreonina. En cada una de las 5 cajas de petri, la mayoría (75% o más) de las plantas que han crecido de las semillas T2 fueron resistentes a la L-O-metiltreonina indicando que una copia única del omr 1 del transgen ha sido insertado en el planta transgénica de TI original. La Figura 6b muestra que los residuos de 585 residuos de aminoácidos de los 592 residuos totales que representan la TD mutante de longitud total se expresaron en las plantas transgénicas. Esta TD mutante precursora ligeramente truncada fue capaz de translocalizarse hasta el cloroplasto y conferir a las plantas transgénicas resistencia a la OMT.
. Caracterización molecular de los transformantes de omr 1:
Dos a tres hojas de cada uno de los cinco transformantes de TI fueron escindidas de las plantas en la etapa de rosetón y el ADN total fue extraído de acuerdo con una modificación del procedimiento de Konieczny y Ausubel (1993). Un enfoque de PCR fue utilizado para confirmar la presencia del omr 1 del transgen introducido. Para esto, un par de cebadores de oligonucleótidos fueron sintetizados de tal modo que un cebador es complementario con el inicio de la omr 1 y el otro cebador fue complementario con el extremo del terminador de NOS. La reacción de PCR utilizando el ADN extraído de cada uno de los cinco transformantes de TI fue amplificado por PCR y cada uno produjo un fragmento de 2.5 kb que confirma la presencia del omr 1 del transgen seguido por el terminador de NOS en cada uno de los transformantes. El OMRl del alelo del tipo silvestre natural no se amplificó por PCR a causa de que el mismo no está seguido por el terminador de NOS y por lo tanto ninguna reacción por PCR podría llevarse a cabo. El ADN extraído de las plantas de Arabidopsis no transformadas fallaron en la amplificación utilizando tales cebadores.
EJEMPLO TRES
La Base Molecular de la Resistencia a la L-O- Metiltreonina Codificada por el Alelo omr 1 de la Linea GMllb de la Arabidopsis thaliana
1. Aislamiento del alelo de OMRl del tipo silvestre :
Una biblioteca de ADNc del tipo silvestre
Columbia de Arabidopsis thaliana construida a partir de plantas que crecieron de semillas, de 3 días de edad, eir el vector ? ZAP II de Stratagene se seleccionaron con un fragmento de ADN de 1080 pares base etiquetado con 32P amplificado por PCR a partir de la secuencia de ADNc del omr 1 (descrito anteriormente) como una sonda. La selección produjo un clon positivo TD54 el cual se purificó y se probó que va a ser el OMRl del alelo del tipo silvestre por- PCR y análisis de Southern.
2. Secuenciamiento del alelo del tipo silvestre de OMRl :
El plásmido recombinante que contiene el OMRl del alelo del tipo silvestre fue nombrado pGM-td54 y el alelo de OMRl fue secuenciado manualmente utilizando el juego o conjunto de secuenasa de USB y el mismo conjunto de cebadores de los oligonucleótidos que fue utilizado previamente en el secuenciamiento del alelo de omr 1. La secuencia de ADN del OMRl del tipo silvestre fue similar a aquel del omr 1 excepto para dos substituciones básicas diferentes que predicen dos substituciones de aminoácidos en la TD mutada codificada por omr 1. En un intento por clonar las secuencias corriente arriba de 5' desde el codón de partida del ATG del clon 23 (Figura 5) y utilizando un enfoque de PCR, un nuevo codón de ATG fue detectado en los 141 nucleótidos corriente arriba del codón de ATG reportado en el clon 23. Esto se confirmó tanto en el OMRl del alelo del tipo silvestre como en el omr 1 del alelo mutado. Por lo tanto el ADNc de longitud completa del sitio omr 1 se encontró que va a ser de 1779 nucleótidos (Figura 7) que codifican una proteína de TD de 592 aminoácidos (Figuras 8 y 9) . El inserto de omr 1 como se muestra en la Figura 6b (SEC ID NO: 3) fue no solamente expresado fuertemente en las primeras plantas transgénicas (TI) sino también fue heredado y expresado fuertemente en su progenie (plantas de T2) . Como se esperaba, el ADNc de longitud completa del alelo de OMRl del sitio de omrl fue de 1779 nucleótidos (Figura 10) que codifica una TD del tipo silvestre de 592 aminoácidos (Figuras 11 y 12) . El alineamiento de los aminoácidos de la treonina deshidratasa/desaminasa del tipo silvestre de la Arabidopsis thaliana con aquella del garbanzo (John et al., 1995), el tomate (Samach et al., 1991), la papa (Hildmann T, Ebneth M, Pena-Cortes H, Sánchez-Serrano JJ, Willmitzer L, Prat S (1992) General roles of abscisic and jasmonic acids in gene activation as a result of mechanical wounding. Plant Cell 4:1157-1170), la levadura 1 (Kielland-Brandt MC, Holmberg S, Petersen JGL, Nilsson-Tillgren T (1984) Nucleotide sequence of the gene for threonine deaminase (ilvl) of Saccharomyces cerevisiae. Carlsberg Res Commun 49:567-575), la levadura 2 (Bornaes C, Petersen JG. Holmberg S (1992) Serine and threonine catabolism in Saccharomyces cerevisiae: el polipéptido CHAI es homólogo con otras serina y treonina « deshidratasas . Genetics 131:531-539), E. coli biosynthetic (Wek RC, Hatfield GC (1986) Nucleotide sequence and in vivo expression of ilvY and illvC genes in Escherichia coli K12. La transcripción de los promotores de superposición divergentes, J Biol Chem 261:2441-2450), E. coli catabolic (Datta P, Goss TJ, Omnaas JR, Patil RV (1987) Covalent structure of biodegradative threonine dehydratase of Escherichia coli:homology with other dehydratases . Proc Nati Acad Sci USA 84:393-397), y Salmonella typhimurium (Taillon BE, Little R, Lawther RP (1988) . El análisis de los dominios funcionales de la treonina desaminasa biosintética por comparación de las secuencias de aminoácidos de los tres alelos del tipo silvestre con respecto al aminoácido de la treonina desaminasa biodegradante, Gene 62:245-252) se describe en la Figura 13. Se utilizó el programa Megalign del programa Lasergene, DNASTAR Inc., Madison, Wisconsin. El grado de similaridad entre los residuos de aminoácidos de la treonina deshidratasa/desaminasa de Arabidopsis y aquellos de los otros organismos se calcula por el método de alineamiento de la proteína de Lipman-Pearson utilizando el programa Lasergene y se encontró que va a ser del 46.2% con el garbanzo, 52.7% con el tomate, 55-0% con la papa (parcial), 45.0% con la levadura 1, 24.7% de la levadura 2, 43.4% con el E.coli (biosintético) , 39.3% con el E. coli (catabólico) y 43.3% con Salmonella.
3. Comparando las secuencias de ADN del omrl y el OMRl se revelaron las mutaciones puntuales involucradas :
Con referencia a la numeración de los residuos de nucleótidos en la SEC ID N0:1 y la SEC ID NO: 2, la primera substitución básica ocurrió en el nucleótido 1519 en donde C (citosina) en el OMRl del alelo del tipo silvestre fue substituido por T (timina) en el omr 1 del alelo mutado (Figuras 14 y 15) . Esta substitución básica predijo una substitución de aminoácidos en el residuo 452 de los aminoácidos al nivel del polipéptido en donde el residuo de arginina en la TD del tipo silvestre codificada por el OMRl se substituyó por un residuo de cisteína en la TD insensible a la isoleucina mutada, codificada por omr 1 (Figura 15) . Esta mutación puntual radica en una región regulatoria conservada de los aminoácidos designados como R4 (regulatorios) por Taillon et al. (1988) en donde el aminoácido mutado es normalmente un residuo de arginina en la TD de Arabidopsis, la levadura 1, el E. coli (biosintético) y Salmonella y un residuo de lisina en la TD del garbanzo, el tomate, y la papa (parcial) (Figura 16) . La segunda substitución básica ocurrió en el nucleótido 1655 en donde G (guanina) en el OMRl del alelo del tipo silvestre fue substituido por A (adenina) en el omr 1 del alelo mutado (Figuras 17 y 18) . Esta substitución básica predijo una substitución de aminoácidos en el residuo 597 al nivel del polipéptido en donde el residuo de arginina en la TD del tipo silvestre codificada por OMRl fue substituida por un residuo de histidina en la TD insensible a la isoleucina mutada, codificada por omr 1
(Figura 18) . Esta mutuación puntual radica en una región regulatoria conservada de los aminoácidos designados R6
(regulatorios) por Taillon et al. (1988) en donde el aminoácido mutado es normalmente un residuo de arginina en TD de la Arabidopsis, el garbanzo, el tomate, la papa
(parcial), la levadura 1, el E. coli (biosintético) y Salmonella (Figura 19) .
LISTADO DE SECUENCIAS
(1) INFORMACIÓN GENERAL
(i) SOLICITANTE: Mourad, George S.
(ii) TITULO DE LA INVENCIÓN: MÉTODOS Y COMPOSICIONES PARA PRODUCIR PLANTAS Y MICROORGANISMOS QUE EXPRESAN LA TREONINA DESHIDRATASA/DESAMINASA INSENSIBLE A LA RETROALIMENTACIÓN
(iii) NUMERO DE SECUENCIAS: 9
(iv) DIRECCIÓN PARA LA CORRESPONDENCIA
(A) DESTINATARIO: Thomas Q. Henry Woodard, Emhardt, Naughton, Moriarty & McNett (B) CALLE: 111 Monument Circle, Suite 3700 (C) CIUDAD: Indianapolis (D) ESTADO: Indiana (E) PAÍS: E.U.A. (F) CÓDIGO POSTAL (ZIP) : 46204-5237
(v) FORMA LEÍBLE PARA LA COMPUTADORA: (A) TIPO DE MEDIO: Disquete, 3.5:, 1.44 Mb
(B) COMPUTADORA: Hewlett Packard (C) SISTEMA OPERATIVO: MSDOS (D) PROGRAMA: ASCII
(vi) DATOS COMUNES DE LA SOLICITUD: (A) NUMERO DE SOLICITUD: Desconocido (B) FECHA DE PRESENTACIÓN: 10-JUL-1998 (C) CLASIFICACIÓN: desconocida
(vii) DATOS DE LA SOLICITUD PREVIA: (A) NUMERO DE SOLICITUD: 60/052,096 (B) FECHA DE PRESENTACIÓN: 10-JUL-1997
(vii) DATOS DE LA SOLICITUD PREVIA: (A) NUMERO DE SOLICITUD: 60/074,875 (B) FECHA DE PRESENTACIÓN: 17-FEB-1998
(viii) INFORMACIÓN DEL APODERADO/MANDATARIO: (A) NOMBRE: Henry, Thomas Q. (B) REGISTRO NO.: 28,309 (C) NUMERO DE REGISTRO/REFERENCIA: 7024-284
(ix) INFORMACIÓN DE TELECOMUNICACIÓN (A) TELEFONO: (317) 634-3456 (B) TELEFAX: (317) 637-7561
(2) INFORMACIÓN PARA LA SEC ID NO:l:
(i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1779 nucleótidos (592 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO:l:
ATG AAT TCC GTT CAG CTT CCG ACG GCG C?A TCC TCT CTC CGT AGC CAC Met Asn Ser Val Gln Leu Pro Thr Ala Gln Ser Ser Leu Arg Ser His
1 5 10 15 ATT CAC CGT CCA TCA AAA CCA GTG GTC GGA TTC ACT CAC TTC TCC TCC lie His Arg Pro Ser Lvs Pro Val Val Gly Phe Thr His Phe Ser Ser 20 25 30 CGT TCT CGG ATC GCA GTG GCG GTT CTG TCC CGA GAT GAA ACÁ TCT ATG 1
Arg Ser Arg lie Ala Val Ala Val Leu Ser Arg Asp Glu Thr Ser Met 35 40 45 ACT CCA CCG CCT CCA AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT CCG 1
Thr Pro Pro Pro Pro Lvs Leu Pro Leu Pro Arg Leu Lys Val Ser Pro
.50 ' 55 60 AAT TCG TTG CAÁ TAC CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA CGT 2
Asn Ser Leu Gln Tyr Pro Ala Gly Tyr Leu Gly Ala Val Pro Glu Arg
65 70 75 80
ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GAA GCT ATG GAG TAT TTG 2 Thr Asn Glu Ala Glu Asn Glv Ser líe Ala Glu Ala Met Glu Tvr Leu 85 " 90 95 ACG AA.T ATA CTG TCC ACT AAG GTT TAC GAC ATC GCC ATT GAG TCA CCA 3 Thr Asn He Leu Ser Thr Lys Val Tyr ASD He Ala He Glu Ser Pro 100 105 110 CTC CAÁ TTG GCT AAG AAG CTA TCT AAG AGA TTA GGT GTT CGT ATG TAT 3 Leu Gln Leu Ala Lys Lys Leu Ser Lys Arg Leu Gly Val Arg Met Tyr 115 120 125
CTT AAA AGA GAA GAC TTG CAÁ CCT GTA TTC TCG TTT AAG CTT CGT GGA Leu Lys Arg Glu Asp Leu Gln Pro Val Phe Ser Phe Lys Leu Arg Gly 130 135 140 GCT TAC AAT ATG A.TG GTG AAA CTT CCA GCA GAT CAÁ TTG GCA AAA GGA
Ala Tyr Asn Met Met Val Lys Leu Pro Ala Aso Gln Leu Ala Lys Gly
145 150 155 160
GTT ATC TGC TCT TCA GCT GGA AAC CAT GCT CAÁ GGA GTT GCT TTA TCT Val He Cys Ser Ser Ala Gly Asp His Ala Gln Gly Val Ala Leu Ser 165 170 175 GCT AGT AAA CTC GGC TGC ACT oCT GTG ZXTT- GTT ATG CCT GTT ACG ACT
Ala Ser Lys Leu Gly Cys Thr Ala Val He Val Met Pro Val Thr Thr 180 185 190 CCT GAG ATA AAG TGG CA GCT GTA GAG AAT TTG GGT GCA ACG GTT GTT Pro Glu He Lys i rp Gln Ala Val Glu Asn Leu Gly Ala Thr Val Val 195 200 205 CTT TTC GGA GAT TCG TAT GAT CAÁ GCA CAÁ GCA CAT GCT AAG ATA CGA Leu Phe Gly Asp Ser Tvr Aso Gln Ala Gln Ala His Ala Lys lie Arg 210 215 220 GCT GAA GAA G.AG GGT CTG ACG TTT ATA CCT CCT TTT GAT CAC CCT GAT 7
Ala Glu Glu Glu Gl Leu Thr Phe He Pro Pro Phe Asp His Pro Asp
225 230 235 240
GTT ATT GCT GGA CAÁ GGG ACT GTT GGG ATG GAG ATC ACT CGT CAG GCT 7
Val He Ala Gly Gin Gly Thr Val Giy Met Giu He Thr Arg Gln Ala 245 250 255 AAG GGT CCA TTG CAT GCT ATA GTG CCA GTT GGT GGT GGT GGT TTA Lys Gly Pro Leu His Ala He Phe Val Pro Val Gly Gly Gly Gly Leu 260 265 270 ATA GCT GGT ATT GCT GCT TAT GTG AAG AGG GTT TCT CCC GAG GTG AAG 1
He Ala Gly He Ala Ala Tyr Val Lys Arg Val Ser Pro Glu Val Lys 275 280 285 ATC ATT GGT GTA GAA CCA GCT GAC GCA AAT GCA ATG GCT TTG TCG CTG 9
He He Gly Val Glu Pro Ala Asp Ala Asn Ala Met Ala Leu Ser Leu 290 295 300 CAT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGG GGA TTT GCA GAT His His Gly Glu Arg Val He Leu Aso Gln Val Gly Gly Phe Ala Asp 305 310 315 320
GGT GTA GCA GTT AAA GAA GTT GGT GAA GAG ACT TTT CGT ATA AGC AGA l Gly Val Ala Val Lys Glu Val Gly Glu Glu Thr Phe Arg He Ser Arg 325 330 335
AAT CTA Al vj GAT GGT GTT GTT CTT ACT CGT GA.T GCT ATT TGT G'x.r-. 1
Asn JLIS — Met Asp Giy Val Val Leu Val Thr Arg Asp Ala He Cys Ala 340 345 350 TCA ATA AAG GAT ATG TTT GAG GAG AAA V_ J AAC ATA GAA CCA GCA .
Ser He Lys Asp Me Phe Glu Glu Lys .-. e Asn He Leu Glu Pro Ala 355 360 365 GGG GCT CTT GCA CTC GCT GGA O — * GAG TAC AAA x -. - TAT UJI-G1y Ala Leu Ala Leu .".— Cl Giy Ala Glu Ala Tyr Cvs Lys Tvr Tvr Gly 370 375 380 CTA AAG GAC GTG AAT G C GTA GCC ATA ACC AGT G *^ GCT AAC ATG AAC 1
Leu Lys Asp Val Asn Val Val Ala He Thr Ser Giy Ala A.sn Met As
385 390 395 400
TTT GAC AAG CTA AGG ATT v;r-_n >— C GCC AAT T*« GGT AGG CA 1
Phe .Ase Lys Leu Arg S I. s Val Thr Glu Leu nl? Asn al Gly Arg Gln 405 410 415 CAG GAA GGT GTT CTT GCT ACT CTC .".* CCG GGA AGC TTT 1
Glr. Glu Ala Val Leu Ala Thr Leu Me Pro Glu Lys Pro Glv Ser Fhe 420 425 430 AAG CAÁ -L i - iv ? GAG CTG u. CCA AAC ATA ? V. GAG i J. \_ AAA 1
Lys Gln Phe Cys Giu Leu Val Gly Pro Met Asn He Ser Glu Phe Lys 435 440 445 TAT AGA i J i AGC TCG GAA. AAG p.z.p. GCT GTT GTA CTA TAC GTC GGA .
Tyr Arg Cys Ser Ser Giu Lys Glu Ala ei Val Leu Tyr Ser Val Gly 450 455 460 GTT CAC ACÁ GCT G?n GAG ? "* — v-.-i CTA CAG AAG AGA. ATG GAA -.. Val His Thr Ala Giy Giu Leu Lys Ala Leu Gln Lys Arg Met Giu Ser
465 470 475 480 CT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT .— TTA GTG AAA GAT 1
Ser Gln Leu Lys Val Asn Leu Thr Thr Ser Asp Leu Val Lys Asp 465 490 495 CAC CGT TAC ATG GGA GGA AC-A ?-^rn ACT GTT GGA vr-.v_ GAG GTT I
M -i ß Leu Met Giy Gly Arg Ser Thr Val Gly ASD Glu Val —s Leu Axg Tyr 500 505 510 CTA TGC CGA TTC ACC TTT GAG AGA CCT GGT GCT CTA ATG AAC TTC 15
Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala Leu Met Asn Phe 515 520 525 TTG GAC TCT TTC AGT CCA ACC CTT TTC CAT TAC CGT 1
Leu Asp Ser Phe Ser Pro Aro Tro Asn II ?hr Leu Phe His Tyr Arg 530 535 540
GGA CAG GGT GAG ACG GGC GCG AAT GTG CTG GTC GGG ATC CAÁ GTC CCC 16
Giy Gln Gly Glu Thr Gly Ala Asn Val Leu Val Gly He Gln Val Pro
545 550 555 560
GAG CAÁ GAA ATG GAG GAA TTT AAA AAC CGA GCT AAA GCT CTT GGA TAC 17
Glu Gln Glu Met Glu Glu ?he Lys Asn Arg Ala Lys Ala Leu Gly Tyr 565 570 575 GAC TAC TTC TTA GTA AGT GAT GAC GAC TAT TTT AAG CTT CTG ATG CAC 17
Asp Tyr Phe Leu Val Ser Aso Asp Asp Tyr Phe Lys Leu Leu Met His 580 585 590 TGA .7
(2) INFORMACIÓN PARA LA SEC ID NO: 2:
(i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 2277 nucleótidos 592 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 2 AAT TCC GTT CAG CTT CCG ACG GCG CAÁ TCC TCT CTC CGT AGC CAC
Met Asn Ser Val Gln Leu P o Thr Ala Gl.-i Ser Ser Leu Arg Ser His 5 10 15 ATT CAC CGT CCA TCA AAA CCA GTG GTC GGA ?'?r* ACT CAC TTC TCC TCC
He His Arg Pro Ser Lys Pro Val Val Gly ?he Thr H i- S ^'ns 3 = *~ 3 s3c 20 25 30 CGT TCT CGG ATC GCA GTG GCG GTT CTG TCC CGA GAT GAA ACÁ TCT ATG 1
Arg Ser Arg He Ala Val Ala Val Leu Ser Arg Asp Glu Thr Ser Met 35 40 45 ACT CCA CCG CCT CCA AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT CCG 1
Thr Pro Pro Pro Pro Lys Leu Pro Leu Pro Arg Leu Lys Val Ser Pro 50 55 60 AAT TCG TTG CAÁ TAC CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA CGT 2
Asn Ser Leu Gln Tyr Pro Ala Gly Tyr Leu Gly Ala Val Pro Glu Arg
65 70 75 80
ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GAA GCT ATG GAG TAT TTG Thr Asn Glu Ala Glu Asn Gly Ser He Ala Glu Ala Met Glu Tyr Leu 85 90 95
AAT ATA CTG TCC ACT GTT TAC GAC ATC GCC ATT GAG TCA CCA 3
Thr A.sn He Leu Ser Thr Lys Val Tvr Asp lie Ala lie Glu Ser Pro 100 105 110 CTC CA TTG GCT AAG CTA TCT AAG AGA TTA GGT GTT CGT ATG TAT 3
Leu Gln Leu Ala Lys Lys Leu Ser Lys Arg Leu Gly Val Arg Met Tyr 115 120 125 CTT AAA AGA G.AA GAC TTG CAÁ CCT GTA TTC TCG AAG CTT CGT GGA 4
Leu Lvs Arg Glu Asp Leu Gin Pro Val Phe Ser Phe Lys Leu Arg Gly 130 135 140 GCT TAC AAT ATG ATG AAA CTT CCA GCA GAT CAÁ TTG GCA AAA GGA 4
Ala Tyr Asn Met Met Val Lys Leu Pro Ala Aso Gln Leu Ala Lys Gly
145 150 155 160
GTT ATC TGC TCT TCA GCT GGA AAC CAT GCT CA GGA GTT GCT TTA TCT 5
Val He Cys Ser Ser Ala Gly Asn His Ala Gln Gl'y Val Ala Leu Ser 165 170 175 GT AGT .AAA GGC TGC ACT GCT ATT GTT ATG CCT GTT ACG ACT 5
Ala Ser Lys Leu Gi Cys Thr Ala Va i He Val Met Pro Val Thr Thr 180 185 190 CCT GAG ATA AAG CA GCT GTA GAG .AAT TTG GGT GCA ACG GTT GTT 5
Pro Glu He Lys Trp Gl Ala Val Giu Asn Leu Gly Ala Thr Val Val 195 200 205 CTT GAT TCG T-T CAÁ GCA CAÁ GCA CAT GCT AAG ATA CGA 6
Leu Phe Gly Asp Ser T *" Aso GIn Ala Gln Ala His Ala Lys He Arg 210 215 220 GCT GAA GAA GAG GGT CTG ATA CCT CCT TTT GAT CAC CCT GAT 7
Ala Glu Glu Giu Gly Leu Thr Phe He Pro Pro Phe Asp His Pro Asp
225 230 235 240
GTT ATT GCT GGA C.AA GC ACT GTT GGG ATG GAG ATC ACT CGT CAG GCT 7
Val He Ala Gly Gln Giy Thr Val Gly Met Giu He Thr Arg Gln Ala 245 250 255 AAG GGT CCA TTG CAT GCT ATA TTT GTG CCA GTT GGT GGT GGT GGT TTA 8
Lys Gly Pro Leu HlS Ala He Phe Val Pro Val Gly Gly Gly Gly Leu 260 265 270 ATA GCT GGT ATT GCT GCT TAT GTG AAG AGG GTT TCT CCC GAG GTG AAG 8
He Ala Gly He Ala Ala Tyr Val Lys Arg Val Ser Pro Glu Val Lys 275 280 285 ATC ATT GGT GTA GAA CCA GCT GAC GCA AAT GCA ATG GCT TTG TCG CTG 9
He He Gly Val Glu Pro Ala Asp Ala Asn Ala Met Ala Leu Ser Leu 290 295 300
CAT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGA ~"T"J» GCA GAT 9
HlS His Gly Giu Arg Val He Leu Asp Gln Val Gly Giy Phe Ala Asp
3C5 310 315 320
GGT GTA GCA GTT AAA GAA GTT GGT GAA GAG ACT TTT CGT ATA AGC AGA 10
Gly Val Ala Val Lys Glu Val Gly Glu Gíu Thr Phe Arg He Ser Arg 325 330 335 AAT CTA ATG GAT GGT GTT GTT CTT GTC ACT CGT GAT GCT ATT TGT GCA 10
Asn Leu Met Asp Gly Val Val Leu Val Thr Arg Asp Ala He Cys Ala 340 345 350 TCA ATA AAG GAT ATG TTT G J GAG AAA CGG ATA TTG GAA CCA GCA 11
Ser He' Lvs A.sp Met Phe Giu Glu Lys Arg Asn He Leu Glu Pro Ala 355 360 365 GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA TAC TGT AAA TAT TAT GGC 11
Gly Ala Leu Ala Leu Ala Gly Ala Glu Ala Tyr Cys Lys Tyr Tyr Gly 370 375 380 CTA AAG GAC GTG AAT GTC GTA GCC ATA ACC AGT \JO* GCT AAC ATG AA.C 12
Leu Lys Asp Val Asn Val Val Ala He Tr". v- Ser Gly Ala Asn Met Asn
335 390 395 400
TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC GCC AAT GTC GGT AGG CAÁ 12
Phe Asp Lys Leu Arg He Val Thr Glu LJTU Ala Asn Val Gly Arg Gln 405 410 415 CAG GAA GCT GTT CTT GCT ACT CTC ATG CCG GAA AAA CCT GGA AGC TTT 12
GIn Glu Ala Val Leu Ala T r Leu Me Pro Glu Lys Pro Gly Ser Phe 420 425 430 AAG CAÁ TTT TGT GAG CTG GTT GGA CCA ATG AAC ATA GAG TTC AAA 1
Lys Gln Phe Cys Glu Leu Val Giy Pro Me Asn He Ser Glu Phe Lys 435 440 445 TAT AGA TGT AGC TCG GAA AAG GAG GCT GTT GTA CTA TAC AGT GTC GGA 1
Tyr Arg Cys Ser Ser Glu Lys Giu Ala Val Val Leu Tyr Ser Val Gly 450 455 460 GTT CAC ACÁ GCT GGA GAG AAA GCA CTA CAG AAG AGA ATG GAA TCT 1
Val His Thr Ala Gly Glu Leu Lys Ala Leu Gln Lys Arg Met Glu Ser
465 470 475 480 rrt CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT GAC TTA GTG AAA GAT 1
Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp Leu Val Lys Asp 485 490 495 CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT ACT GTT GGA GAC GAG GTT 1
His Leu Cys Tyr Leu Me Gly Gly Arg Ser Thr Val Gly Asp Glu Val 500 505 510
CTA TGC CGA TTC ACC TTT T" ^ GAG AGA /*•»"•** GGT GCT CTA ATG AAC ™"p?~ 1
Leu Cys Arg Phe Thr Phe Pro Giu Arg Pro Gly Ala Leu Met Asn Phe 515 520 525 TTG GA.C CT t^t r AGT CCA CGG TGG AAC ATC ACC CTT TTC CAT .TAC CAT 1
Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu Phe His Tyr His 530 535 540 GGA CAG GGT GAG ACG AAT GTu CTG GTC GGG ATC CAÁ GTC CCC 1
Gly Gln Gly Glu Thr Giv Ala Asn Val Leu Val Gly He Gln Val Pro
545 550 555 560
GAG CAÁ GP-? ATG GAG GAA AAA AAC CGA GCT AAA GCT CTT GGA TAC 1
Glu Gin Glu Me Glu Phe Lys Asn Arg Ala Lys Ala Leu Glv Tyr 565 570 575 GAC TAC TTC TTA GTA AGT GAT GAC GAC T—<t* TTT AAG CTT CTG ATG CAC 1
Asp Tyr Phe Leu Val Ser Asp Asp Asp Tyr Phe Lys Leu Leu Me His 580 585 590 TGA 1
(2) INFORMACIÓN PARA LA SEC ID NO: 3:
[i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 2304 nucleótidos (609 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 3:
ATG GGC GAG CTC GGT ACC CGG GGA TCC TCT AGA ACT AGT GGA TCC CCC Met Gly Glu Leu Glv Thr Arg Gly Ser Ser Arg Thr Ser Gly Ser Pro
1 5 10 15
GGG CTG CAG GAA TTC GGC ACG AGG ACG GCG CA TCC TCT CTC CGT AGC
Gly Leu Gln Glu Phe Giy Thr Arg Thr Ala Gln Ser Ser Leu Arg Ser 20 25 30 CAC ATT CAC CGT CCA TCA AAA CCA GTG GTC GGA TTC ACT CAC TTC TCC
His He His Arg Pro Ser Lys Pro Val Val Gly Phe Thr His Phe Ser
- 40 45 TCC CGT TCT CGG ATC GCA GTG GCG GTT CTG TCC CGA GAT GAA ACÁ TCT
Ser Arg Ser Arg He Ala Val Ala Val Leu Ser Arg Aso Glu Thr Ser
50 55 60
ATG ACT CCA CCG CCT CCA AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT M<=t Th1* Pro Pro Pro Dro Lvs Leu Pro Leu Pro Arg Leu Lys Val Ser ' 65 - 0 " 75 80 CCG AAT TCG TTG CAÁ i ew* CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA
Pro Asn Ser Leu Gln Tyr Pro Ala Gly Tyr Leu Gly Ala Val Pro Glu 85 90 95
CGT ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GPJ GCT ATG GAG TAT
Thr Asn Glu Ala Glu Asn Gly Ser He Ala Arg Glu Ala Met Glu Tyr
100 105 110 TTG ACG AAT ATA TCC ACT AAG GTT TAC GAC ATC GCC ATT GAG TCA
Leu Thr Asn He Leu Ser Thr Lys Val Tyr Asp He Ala He Glu Ser 115 120 125 CCA CTC CAÁ TTG GCT ^G AAG CTA TCT AAG AGA TTA GGT GTT CGT ATG
Pro Leu Gln Leu Ala Lys Lys Leu Ser Lys Arg Leu Gly Val Arg Met 130 135 1 0 TAT ' 'CTT AAA AGA GAA TTG CAÁ CCT GTA r^ ~ r* TCG TTT AAG CTT CGT
Tyr Leu Lys Arg Glu Asp Leu Gln Pro Val Phe Ser Phe Lys Leu Arg
145 150 155 160
GGA GCT TAC AAT ATG ATG AAA CTT CCA GCA GAT CAÁ GCA ??A
Gly Ala Tyr Asn Met Met Val Lys Leu Pro Ala Asp Gln Leu Ala Lys 165 170 175
GGA GTT ATC TGC TCA GCT GGA AAC CAT GCT CAÁ GGA GTT GCT TTA
Gly Val He Cys Ser Ser Ala Gly Asn His Ala Gln Gly Val. Ala Leu
180 185 190 TCT GCT AGT AAA CTC GGC TGC ACT GCT GTG ATT GTT ATG CCT GTT ACG
Ser Ala Ser Lys Leu Gly Cys Thr Ala Val He Val Me Pro Val Thr 195 200 205 ACT CCT GAG ATA AAG TGG tnr. GCT GTA GAG AAT TTG GGT GCA ACG GTT
Thr Pro Glu He Lys Trp Gln Ala Val Glu Asn Leu Gly Ala Thr Val 210 215 220 GTT CTT TTC GGA GAT TCG TAT GAT CAÁ GCA CA GCA CAT GCT AAG ATA
Val Leu Phe Gly Asp Ser Tyr Asp Gln Ala Gln Ala His Ala Lys He 225 230 235 240
CGA GCT GAA GAA GAG GGT CTG ACG TTT ATA CCT CCT TTT GAT CAC CCT
Arg Ala Glu Glu Glu Gly Leu Thr Phe He Pro Pro Phe Asp His Pro 245 250 255
GAT GTT ATT GCT GGA CAÁ GGG ACT GTT GGG ATG GAG ATC ACT CGT CAG
Asp Val He Ala Gly Gln Gly Thr Val Gly Met Glu He Thr Arg Gln 260 265 270 UU . AAG GGT CCA TTG CAT GCT ATA GTG CCA GTT GGT GGT GGT GGT
Ala Lys Giv Pro Leu His Ala He ? e Val Pro Val Gly Gly Gly Gly 275 280 285 TTA ATA GCT GGT ATT GCT GCT AAG AGG GTT TCT CCC GAG GTG Leu He Ala Gly He Ala Ala Tyr Val Lys Arg Val Ser Pro Glu Val 290 295 300 AAG GGT GTA GAA CCA GCT GAC GCA AAT GCA ATG GCT TTG TCG
Lys He lie Gly Val Glu Pro Ala Asp Ala Asn Ala Met Ala Leu Ser
305 310 315 320
CtG CAT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGG GGA TTT GCA 1
Leu His His Gly Glu Arg Val He Leu Aso Gln Val Gly Gly Phe Ala 325 33*0 335 GAT GGT GTA GCA GTT AAA GAA GAA GAG ACT T"J"T' CGT ATA AGC i
Asp Giy Val Ala Val Lys Glu v'a . Gly p. ? 1 * Glu -"' Phe Aro He Ser 340 345 35Ó AGA AAT CTA ATG GAT GGT GTT GTT ^T GTC ACT CGT GAT GCT r-iTT TGT 1
Arg Asn Ala He Cys GCA TCA ATA AAG GAT ATG GAG GAG AAA CGG AAC ATA TTG GAA CCA .
Ala Ser He Lys Asp Met ?he Glu Glu Lys Arg Asn lie Leu Glu Pro 370 375 380 GCA GGG GCT CTT GCA CTC GGA GCT GAG TAC X . AAA TAT T.AT 1
Ala Gly Ala Leu Ala Leu Ala Gly Ala Glu Al T r Cys Lys Tyr Tyr
385 390 395 400
GGC CTA AAG GAC GTG AAT GTC GTA ATA ACC AGT GGC GCT AAC ATG 1
Gly Leu Lys Asp Val Asn Val Val Ala lie Thr Ser Gly Ala Asn Me 405 410 415 AAC TTT GAC AAG CTA AGG ATT 1 ACÁ G.AA CTC GCC AAT GTC GGT AGG
Asn Phe Asp Lvs Leu Arg He Val Thr Glu Leu Ala Asn Val Gly Arg 420 425 430 CA CAG GAA GCT GTT CTT GCT ACT ATG CCG GAA CCT GGA AGC 1
Gin Gin Glu Ala Val Leu Ala Thr Leu Met Pro Glu Lys Pro Gly Ser 435 440 445 TTT AAG CAÁ TTT TGT GAG CTG GTT GGA CCA ATG AAC ATA AGC GAG TTC - Phe Lys Gln Phe Cys Glu Leu Val Gly Pro Met A.s He Ser Glu Phe 450 455 460 TGT AGC TCG GAA AAG GAG GCT GTT GTA CTA TAC AGT GTC
Lys Tyr Arg Cys Ser Ser Glu Lys Giu Ala Val Val Leu Tyr Ser Val
465 470 475 480 GGA GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA CAG AAG AGA ATG GAA
Gly Val His Thr Ala Gly Glu Leu Lys Ala Leu Gln Lys Arg Met Glu 485 490 495 TCT TCT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT GAC TTA GTG AAA Ser Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp Leu Val Lys 500 505 510 GAT CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT ACT GTT GGA GAC GAG 1
Asp His Leu Cys Tyr Leu Met Gly Gly Arg Ser Thr Val Gly Asp Glu 515 520 525 GTT CTA TGC CGA TTC ACC TTT CCC GAG AGA CCT GGT GCT CTA ATG AAC 1
Val Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala Leu Met Asn 530 535 540 TTC TTG GAC TCT TTC AGT CCA CGG TGG AAC ATC ACC CTT TTC CAT TAC 1
Phe Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu Phe His Tvr
545 550 555 560
CAT GGA CAG GGT GAG ACG GGC GCG AAT GTG CTG GTC GGG ATC CAÁ GTC 1
His Gly Gln Gly Glu Thr Giy Ala Asn Val Leu Val Gly He Gln Val 565 570 575 CCC GAG CAÁ GAA ATG GAG GAA TTT AAA AA.C CGA GCT AAA GCT CTT GGA 1
Pro Glu Gln Glu Met Glu Glu Phe Lys A.sn Arg Ala Lys Ala Leu Gly 580 535 590 TAC GAC TAC TTC TTA GTA AGT GAT GAC GAC TAT TTT AAG CTT. CTG ATG 1
Tyr Asp Tyr Phe Leu Val Ser ASD Asp Asp Tyr Phe Lys Leu Leu Met 595 600 605 CAC TGA 1
His 609
(2) INFORMACIÓN PARA LA SEC ID NO: 4:
(i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1509 nucleótidos (502 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 4
GAA GCT ATG GAG TAT TTG ACG .AAT ATA CTG TCC ACT AAG TAC GAC
Glu Ala Met Glu Tyr Leu Thr Asn He Leu Ser Thr Lys Val Tyr Asp
1 5 10 15
ATC GCC ATT GAG TCA CCA CTC CAÍ TTG i .AAG AAG CTA TCT AAG AGA
He Ala He Glu Ser Pro Leu Gl: Leu Ala Lys Lys Leu Ser Lys Arg 20 25 30 TTA GGT GTT CGT ATG TAT CTT AAA AGA GAA GAC TTG CAÁ CCT GTA TTC
Leu Gly Val Arg Met Tyr Leu Lvs Arg Giu Asp Leu Gin Pro Val Phe 35 40 45 1 TTT AAG CTT CGT GGA GCT TAC AAT ATG ATG GTG AAA CTT CCA GCA
Ser Phe Lys Leu Arg Gly Ala Tyr Asn Met Met Val Lys Leu Pro Ala 50 55 60 GAT CAÁ TTG GCA AAA GGA GTT ATC TGC TCT TCA GCT GGA AAC CAT GCT
Asp Gln Leu Ala Lys Gly Val He Cys Ser Ser Ala Giy Asn His Ala
65 70 75 80
CAÁ GGA GTT GCT TTA TCT GCT AGT AAA CTC GGC TGC ACT Gv, X GTG ATT
Gln Gly Val Ala Leu Ser Ala Ser Lys Leu Gly Cys Thr Ala Val He 85 90 95
GTT ATG CCT GTT ACG ACT CCT GAG ATA AAG TGG CA GCT GTA GAG AAT
Val Met Pro Val Thr Thr Pro Giu He Lys Trp Gin Ala Val Glu Asn 100 105 110 TTG GGT GCA ACG GTT GTT CTT T'"""" GGA GAT TCG GAT CAÁ GCA CAÁ
Leu Gly Ala Thr Val Val Leu Phe Giy Asp Ser Tyr Aso Gln Ala Gln 115 120 125 GCA CAT AAG ATA CC-A GCT GAA GAA GAG ATA CCT
Ala His Ala Lys He Arg Ala Glu Giu Glu Gly Leu T r Phe He Pro 130 135 140 CCT TTT GAT CAC CCT GAT GTT ATT GCT GGA CA GGG GTT GGG ATG
Pro Phe Asp His 'Pro Asp Val He Ala Giy Gln Giy Thr Val Gly Met
145 150 155 160
GAG ATC ACT CGT CAG GCT J IJ Í CCA TTG CAT GCT ATA TTT GTG CCA
Glu He Thr Arg Gln Ala Lys Gly Pro Leu His Ala ~ T Phe Val Pro 165 170 175 GTT GGT GGT GGT GGT TTA ATA GCT GGT ATT GCT GCT TAT GTG AAG AGG
Val Gly Gly Gly Gly Leu He Ala Gly He Ala Ala Tyr Val Lys Arg 180 185 190 GTT TCT CCC GAG GTG AAG ATC ATT GGT GTA GAA CCA GCT GAC GCA AAT Val Ser Pro Giu Val Lys He He Gly Val Glu Pro Ala Aso Ala Asn 195 200 205
GCA ATG GCT TTG TCG CTG CAT CAC GAG AGG GTG ATA TTG GAC CAG Ala Met Ala Leu Ser Leu His His Gly Glu Arg Val He Leu .Asp Gln 210 215 220 GTT GGG GGA TTT GCA GAT GGT GTA GCA GTT AAA GAA GTT GGT GAA GAG 7
Val Gly Gly Phe Ala ASD Gly Val Ala Val Lvs Glu Val Gly Glu Glu
225 230 235 240
ACT TTT CGT ATA AGC AGA AAT CTA ATG GAT GGT GTT GTT CTT GTC ACT 7
Thr P e Arg He Ser Arg Asn Leu Met Asp Gly Val Val Leu Val Thr 245 250 255 CGT GAT GCT ATT TGT GCA TCA ATA AAG GAT ATG TTT GAG GAG AAA CGG 8
Arg Asp Ala He Cys Ala Ser He Lys Asp Met Phe Glu Glu Lys Arg 260 2*65 270 AAC ATA TTG GAA CCA GCA GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA 8
Asn He Leu Glu Pro Ala Gly Ala Leu Ala Leu Ala Giy Ala Glu Ala 275 280 285 TAC r-ir f AAA TAT TAT GGC CTA AAG GTC- AAT GTC GTA GCC ATA ACC 9
Tyr Cys Lys Tyr Tyr Gly Leu Lys Asp Val Asn Val Val Ala He Thr 290 295 300 AGT, GGC GCT AAC ATG AAC TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC 9
Ser Giy Ala Asn Met Asn Phe Asp Lys Leu Arg He Val Thr Glu Leu
305 310 315 320
GCC AAT GTC GGT AGG CA CAG GAA GCT GTT CTT ACT CTC ATG CCG 1
Ala Asn Val Gly Arg Gln Gln Glu Ala Val Leu Ala Thr Leu Met Pro 325 330 335 GAA AAA CCT GGA AGC TTT AAG CAÁ TTT TGT GAG CTG GTT GGA CCA ATG 10
Glu Lys Pro Gly Ser Phe Lys Gln Phe Cys Glu Leu Val Glv Pro Met 340 345 350 AAC ATA AGC GAG TTC AAA TAT TGT AGC TCG GAA AAG GAG GCT GTT 1
Asn He Ser Glu Phe Lys Tyr Arg Cys Ser Ser Glu Lys Glu Ala Val 355 360 365 GTA CTA TAC AGT GTC GGA GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA Val Leu Tyr Ser Val Gly Val His Thr Ala Gly Glu Leu Lys Ala Leu 370 375 380 CAG AAG AGA ATG GAA TCT TCT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC 1
Gln Lvs Arg Met Glu Ser Ser Gln Leu Lys Thr Val Asn Leu Thr Thr
385 " 390 395 400
AGT GAC TTA GTG AAA GAT CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT 1
Ser Asp Leu Val Lys Asp His Leu Cys Tyr Leu Met Gly Gly Arg Ser 405 410 415
ACT GTT GGA GAC GAG GTT CTA TGC CGA TTC ACC TTT CCC GAG AGA CCT .
Thr Val Gly Aso Glu Val Leu Cvs Arg Phe Thr Phe Pro Glu Arg Pro 420 425 430 GGT GCT CTA ATG AAC TTC TTG GAC TCT TTC AGT CCA CGG TGG AAC ATC 1
Gly Ala Leu Met Asr. Phe Leu Asp Ser Phe Ser Pro Arg Tro Asn He 435 44*0 445 ACC CTT TTC CAT TAC CAT GGA CAG GGT GAG ACG GGC GCG AAT GTG CTG 1 Thr Leu Phe His Tyr His Gly Glr. Giy Glu Thr Gly Ala Asn Val Leu 450 455 460 GTC GGG ATC CAÁ GTC CCC GAG CA GAA ATG GAG GAA TTT AAA AAC CGA 1
Val Gly He Gln Val Pro Glu Gln Glu Met Glu Giu Phe Lys Asn Arg
465 470 475 430
GCT AAA GCT CTT GGA TAC GAC TAC — - x/-? vji? HUÍ GAT GAC GAC TAT 14
Ala Lys Ala Leu Gly Tvr Aso Tyr Phe Leu Val Ser Asp Asp Asp Tyr 485 490 ' -495 TTT AAG CTT CTG ATG CAC TGA 15
Phe Lvs Leu Leu Met His 500
'2) INFORMACIÓN PARA LA SEC ID NO: 5:
(i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1620 nucleótidos (539 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 5:
AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT CCG AAT TCG TTG CAÁ TAC Lys Leu Pro Leu Pro Arg Leu Lys Val Ser Pro Asn Ser Leu Gln Tyr 1 5 10 15
CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA CGT ACG AAC GAG GCT GAG Pro Ala Gly Tyr Leu Gly Ala Val Pro Glu Arg Thr Asn Glu Ala Glu 20 25 30 AAC GGA AGC ATC GCG GAA GCT ATG GAG TAT TTG ACG AAT ATA CTG TCC Asn Gly Ser He Ala Glu Ala Met Glu Tyr Leu Thr Asn He Leu Ser 35 4C 45
ACT AAG GTT TAC GAC ATC GCC ATT GAG TCA CCA CTC CAÁ TTG GCT AAG Thr Lys Val Tyr Asp He Ala He Glu Ser Pro Leu Gln Leu Ala Lys 50 55 60 AAG CTA TCT AAG AGA TTA GGT GTT CGT ATG TAT CTT AAA AGA GAA GAC Lys Leu Ser Lys Arg Leu Gly Val Arg Met Tyr Leu Lys Arg Glu Asp 65 70 " 75 80
TTG CAÁ CCT GTA TTC TCG TTT AAG CTT CGT GGA GCT TAC AAT ATG ATG Leu Gln Pro Val Phe Ser Phe Lys Leu Arg Gly Ala Tyr Asn Met Met 85 90 95
GTG AAA CTT CCA GCA GAT CAÁ TTG GC.A AAA GGA GTT ATC TGC TCT TCA Val Lys Leu Pro Ala Asp Gln Leu Ala Lys Gly Val He Cys Ser Ser 100 105 110 GCT GGA AAC CAT GCT CAÁ GGA GTT GCT TTA TCT GCT AGT AAA CTC GGC Ala Gly Asn His Ala Gin Gly Val Ala Leu Ser Ala Ser Lys Leu Gly 115 120 ' 125 TGC ACT GCT GTG ATT GTT ATG CCT GTT ACG ACT CCT GAG ATA AAG TGG Cys Thr Ala Val He Val Met Pro Val Thr Thr Pro Giu He Lys Trp 130 135 140 CAÁ GCT GTA GAG AAT TTG GGT GC.A ACG GTT GTT CTT TTC GGA GAT TCG Gln Ala Val Glu Asn Leu Gly Ala Thr Val Val Leu Phe Gly Asp Ser 145 150 155 160 TAT GAT CAÁ GCA CAÁ GCA CAT GCT AAG ATA CGA GCT GAA GAA GAG GGT
Tyr A.sp Gln Ala Gln Ala His Ala Lys He Arg Ala Giu Glu Glu Gly 165 170 175
CTG ACG TTT ATA CCT CCT TTT GAT v-r-.v- CCT GAT GTT ATT GCT GGA CAÁ
Leu Thr Phe He Pro Pro Phe Asp His Pro Asp Val He Ala Gly Gln 180 185 190 GGG ACT GTT GGG ATG GAG ATC ACT CGT CAG GCT AAG GGT CCA TTG CAT
Gly Thr Val Gly Met Glu He Thr Arg Gln Ala Lys Gly Pro Leu His 195 200 205 ?
GCT ATA TTT GTG CCA GTT GGT GGT GGT GGT TTA ATA GCT GGT ATT GCT
Ala He Phe Val Pro Val Gly Gly Gly Gly Leu He Ala Gly He Ala 210 215 220 GCT TAT GTG AAG AGG GTT TCT CCC GAG GTG AAG ATC ATT GGT GTA GAA
Ala Tyr Val Lys Arg Val Ser Pro Glu Val Lys He He Gly Val Glu
225 230 235 240
CCA GCT GAC GCA AAT GCA ATG GCT TTG TCG CTG CAT CAC GGT GAG AGG
Pro Ala Asp Ala Asn Ala Met Ala Leu Ser Leu His Kis Gly Glu Arg 245 250 255
GTG A TA TTG GAC CAG GGG GGA TTT GCA GAT GGT GTA GCA GTT AAA
Val le Leu Aso Gin Val Gly Giy Phe Ala Asp Gly Val Ala Val Lvs 26*0 265 GAA GTT GGT GAA GAG ACT TTT CGT ATA AGC AGA AAT CTA ATG GAT GGT Glu Val Glv Glu Glu Thr Arg Asn Leu Met Asp Giv
275 280 285 GTT GTT CTT GTC ACT CGT ?X (j i r.- i J.G- GCA TCA ATA AAG GAT ATG Val Val Leu Val Thr Arg Asp Ala He Cvs Ala Ser He Lys Aso Met 290 29*5 300 TTT GAG GAG AAA CGG AAC ATA TTG GAA CCA GCA GGG GCT CTT GCA CTC Phe Glu Glu Lys Arg Asn lie Leu Glu Pro Ala Gly Ala Leu Ala Leu 305 " " 310 315 320
GCT GGA GCT GAG GCA TAC GGC - ln AAG GAC GTG AAT Ala Gly A.la Giu Ala Tyi Cvs Lys Tyr Tvr Giy Leu Lys Asp Val Asn 330 -* -. D
GTC GTA GCC •- r* * TTT GAC A.AG CTA AG
Val Val Ala He hr Ser Giy Ala Asn Met Asn Phe Asp Lys Leu Ar: 340 345 350 ATT GTG ACÁ GAA CTC GCC AAT GTC GGT AGG CAG GAA GCT GTT C71 He Val Thr Giu Leu Ala Asn Val Giy Arg Gln Gin Glu Ala Val Leí 355 360 365 GCT ACT CTC ATG CAÁ T"T"T TGT GAG
Ala Thr Leu Met Pro Giu Lvs Pro Gly Ser Phe Lvs Gln Phe Cys Glu 370 375 380 CTG GTT GGA CCA ATG AAC ATA AGC GAG TTC AAA TAT AGA TGT AGC TCG .
Leu Val Gly Pro Met Asn He Ser Giu no Lys Tyr Arg Cys Ser Ser 385 390 395 400
GAA AAG GAG GCT GTT GTA CTA TAC AGT GTC GGA GTT CAC ACÁ GCT GGA 1 Glu Lvs Glu Ala Val Val Leu Tyr Ser Val Gly Val His Thr Ala Gly 405 410 415 GAG CTC AAA GCA CTA AAG AGA ATG GAA - V-T TCT CAÁ CTC AAA ACT 1
Glu Leu Lys Ala Leu Gln Lys Arg Me Glu Ser Ser Gin Leu Lys Thr 420 425 430 GTC A-AT CTC ACT ACC AGT GAC TTA GTG GAT CAC CTG TGT TAC TTG Val Asn Leu Thr T r Ser Asp Leu Val Ly= Asp His Leu Cys Tyr Leu 435 440 445 GGA GGA AGA TCT ACT G T GGA GAC GAG GTT CTA TGC CGA TTC ACC 1 Met Gly Gly Arg Ser Thr Val Giy Asp Glu Val Leu Cys Arg P Thr 450 455 460
TTT CCC GAG AGA CCT GGT GCT r~ T . A.TG AAC TTC TTG GAC TCT TTC AGT
Phe Pro Glu Arg Pro Giy Ala Leu Ke Asn Phe Leu Asp Ser Phe Ser
465 470 475 480
CCA CGG TGG AAC ATC ACC CTT TC TP.C CAT GGA CAG GGT GAG ACG
Pro Arg Trp Asn He Thr Leu Phe His Tyr His Giy Gln Gly Glu Thr 485 490 495 GGC GCG AAT GTG CTG GTC GGG A.TC CA GTC CCC GAG CAÁ GAA ATG GAG
Giy Ala Asn Val Leu Val Giy He Gln Val Pro Glu Gln Glu Met Glu 500 505 510 GAA TTT AAA AAC CGA GCT AAA GCT CTT GGA TAC GAC TAC TTC TTA GTA Glu Phe Lys Asn Arg Ala Lys Ala Leu Gly Tyr Asp Tyr Phe Leu Val 515 520 525 AGT GAT GAC GAC ? T T X AAG CTT ATG CAC TGA Ser Asp Asp Asp Tyr Phe Lvs Leu Leu Met His 530 535
(2) INFORMACIÓN PARA LA SEC ID NO: 6:
(i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1599 nucleótidos (532 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 6:
r-H VJVJ _ j , l
Lys Glv Ala
1 15 GTA CCA GAA CGT ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GAA GCT Val Pro Glu Arg Thr Asn Glu Ala Glu Asn Gly Ser He Ala Glu Ala 20 25 30 ATG GAG TAT TTG ACG AAT ATA CTG TCC ACT AAG GTT TAC GAC ATC GCC 1
Met Glu Tyr Leu Thr Asn He Leu Ser Thr Lys Val Tyr Asp He Ala 35 40 45 ATT GAG TCA CCA CTC CA TTG GCT AAG AAG CTA TCT AAG AGA TTA GGT 1
He Glu Ser Pro Leu Gln Leu Ala Lys Lvs Leu Ser Lys Arg Leu Gly 50 55 * 60
GTT CGT A G TAT CTT AAA AGA GAA CCT GTA TTC TCG TTT
Val Arg Met Tyr Leu Lvs Arg Glu Asp Leu Gin Pro Val P e Ser Phe
65 70 75 80
AAG CTT CGT GGA GCT TAC .AAT ATG ATG GTG AAA CTT CCA GCA n x CAÁ
Lys Leu Arg Giy Ala Tyr As Met M Val Lys Leu Pro Ala Aso Gln 85 90 95
TTG GCA AAA GGA GTT ATC TGC TCT - ,? GCT GGA AAC CAT GCT CAÁ GGA
Leu Ala Lys' Giv Val He Cys Ser Ser Aia Gly Asn His Ala Gln Gly 10Ó 105 110 GTT GCT TTA GCT AGT AAA CTC GGC TGC ACT GCT xb ATT GTT ATG
Val Ala Leu Ser Ala Ser Lys Leu Giy Cys Thr Aia Val He Val Met 115 120 125 CCT GTT ACG ACT CCT GAG ATA AAG TGG CAÁ GCT GTA GAG AAT TTG GGT
Pro Val Thr Thr Pro Giu He Lys Trp Gln Aia Val Glu Asn Leu Gly 130 135 140 GCA ACG GTT GTT CTT TTC GGA GAT TCG TAT GAT CAÁ GCA GCA CAT
Ala Thr Val Val Leu Phe Gly As? Ser Tyr Asp Gln Ala Gln Ala His
145 150 155 160
GCT AAG ATA CGA GCT GAA GAA Gr-.vr GGT -Tvj ACG TTT ATA CCT CCT TTT
Ala Lys He Arg Aia Glu Glu Glu Gly Leu Thr Phe He Pro Pro Phe 165 170 175
GAT CAC CCT GAT GTT ATT GCT GC-A CA GGG ACT GTT GGG ATG- GAG ATC
Asp Kis Pro Aso Val He Ala Giy Gln Gly Thr Val Gly Met Glu He 130 135 190 ACT CGT CAG GCT AAG GGT CC. T"*G CAT GCT Thr Arg Gln Ala Lys Gly Pro Leu His Ala He Phe Val Pro Val Gly 195 200 205 GGT GGT- GGT TTA ATA GCT GGT ATT GCT GCT TA.T GTG AAG AGG GTT TCT
Giy Gly Gly Leu He Ala Gly He Ala Ala Tyr Val Lys Arg Val Ser 210 215 220 CCC GAG GTG AAG ATC ATT GGT GTA GAA CCA GCT GAC GCA AAT GCA ATG
Pro Giu Val Lys He He Gly Val Glu Pro Ala Asp Ala Asn Ala Met
225 230 235 240
GCT TTG TCG CTG CAT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGG
Ala Leu Ser Leu His Kis Gly Glu Arg Val He Leu Asp Gln Val Gly 245 250 255
GGA TT GCA GAT GGT GTA GCA GTT AAA GAA GTT X GAA GAG ACT TTT
Gly Phe Ala Asp Gly Val Ala Val Lvs Glu Val Gly Giu Glu Thr Phe 26*0 2*65 270 CGT ATA AGC AGA AAT CTA ATG GAT GGT GTT GTT CTT GTC ACT CGT GAT 8
Arg He Ser Arg Asn Leu Met Aso Giy Val Val Leu Val Thr Arg Asp 275 23*0 235 GCT ATT TGT GCA TCA ATA AAG GAT ATG TTT GAG GAG AAA CGG AAC ATA 9
Ala He Cys Ala Ser He Lys Asp Met Phe Glu Glu Lys Arg Asn He
290 295 300 TTG GAA CCA GCA GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA TAC TGT 9
Leu Glu Pro Ala Gly Ala Leu Ala Leu Ala Gly Ala Glu Ala Tyr Cys
305 310 315. 320
AAA TAT TAT GGC CTA AAG GAC GTG AAT GTC GTA GCC ATA ACC AGT GGC 10
Lys Tyr Tyr Gly Leu Lys Asp Val Asn Val Val Ala He Thr Ser Gly 325 330 335 GCT AAC ATG AAC TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC GCC AAT 10 Aia Asn Me Asn Phe Asp Lys Leu Aro He Val Thr Glu Leu Ala Asn 340 345 350 GTC GGT AGG CAÁ CAG GAA GCT GTT CTT GCT ACT CTC ATG CCG GAA AAA .1
Val Gly Are Gln Gin Glu Ala Val eu Ala Thr Leu Met Pro Giu Lys 355 360 365 CCT GGA AGC -TTT AAG CAÁ TTT TGT CTG GTT GGA CCA ATG AAC ATA 11
Pro Gly Ser Phe Lys Gln Phe Cys Giu Leu Val Gly Pro Met Asn He 370 375 380 AGC GAG TTC AAA i i-. i AGA TGT ? C TCG GAA AAG GAG GCT GTT GTA CTA 12
Ser Glu Phe Lys Tyr Arg Cys Ser Ser Glu Lvs Glu Ala Val Val Leu
385 39Ó 395 400
TAC AGT GTC GGA GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA CAG AAG 12
Tyr Ser Val Gly Val His Thr Ala Gly Glu Leu Lys Ala Leu Gln Lys 405 410 415 AGA ATG GAA TCT TCT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT GAC 12
Á g- Me Glu Ser Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp 420 425 430 TTA GTG AAA GAT CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT ACT GTT 13
Leu Val Lys Asp His Leu Cys Tyr Leu Met Giy Gly Arg Ser Thr Val 435 440 445 GGA GAC GAG GTT CTA TGC CGA TTC ACC TTT CCC GAG AGA CCT GGT GCT 13
Gly Asp Glu Val Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala 450 455 460 CTA ATG AAC TTC TTG GAC TCT TTC AGT CCA CGG TGG AAC ATC ACC CTT 1 Leu Met Asn Phe Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu
465 47*0 475 480 TTC CAT TAC CAT GGA CAG GGT GAG ACG GGC GCG AAT GTG CTG GTC GGG Phe His Tyr His Gly GIn Gly Glu Thr Gly Ala Asn Val Leu Val Glv 435 490 495
ATC CAÁ .GTC CCC GAG CAÁ GAA ATG GAG GAA TTT AAA AAC CGA GCT "AAA lie Gln Val Pro Glu Gln Giu Met Giu Glu Phe Lys Asn Ar'g A^ a Lvs 500 505 510 '
GCT CTT GGA TAC GAC TAC TTC TTA GTA AGT GAT GAC GAC TAT TTT AAG Ala Leu Giy Tyr Asp Tyr Phe Leu Val Ser Aso Aso Asp Tv Phe Lvs 515 520 525 " CTT CTG ATG CAC TGA Leu Leu Met His 530
(2) INFORMACIÓN PARA LA SEC ID NO: 7: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 720 nucleótidos (240 aminoácidos)
(B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 7:
TCA ATA AAG GAT ATG TTT GAG GAG AAA CGG AAC ATA TTG GAA CCA GCA Ser He Lys Asp Met Phe Glu Glu Lys Arg Asn He Leu Glu Pro Ala 10 15
GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA TAC TGT AAA TAT TAT GGC Gly Ala Leu Ala Leu Ala Gly Ala Glu Ala Tyr Cys Lys Tyr Tyr Gly 20 25 30 CTA AAG GAC GTG AAT GTC GTA GCC ATA ACC AGT GGC GCT AAC ATG AAC Leu Lys Asp Val A=n Val Val Ala He Thr Ser Gly Ala Asn Met Asn 35 40 45 TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC GCC AAT GTC GGT AGG CAÁ
Phe A=p Lys Leu Arg He Val Thr Glu Leu Ala Asn Val Gly Arg Gln 50 55 60 CAG GAA GCT GTT CTT GCT ACT CTC ATG CCG GAA AAA CCT GGA AGC TTT
Gln Gíu Ala Val Leu Ala Thr Leu Met Pro Glu Lys Pro Giy Ser Phe
65 70 75 80
AAG CAÁ TTT TGT GAG CTG GTT JVJ? CCA ATG AAC ATA AGC GAG TTC ?AA
Lys Gln Phe Cys Glu Leu Val Giy Pro Met Asn He Ser Glu Phe -ys 85 90 95
TAT AGA TGT AGC TCG GAA AAG GCT GTT GTA CTA TAC AGT GTC GGA
Tyr Arg Cys Ser Ser Glu Lys Giu Ala Val Val Leu Tyr Ser Val Gly 100 105 110 GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA CAG AAG AGA ATG GAA TCT
Val His Thr Ala Gly Glu Leu L s Ala Leu Gln Lys Arg Met Glu Ser 115 120 125 CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT GAC TTA GTG AAA GAT
Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp Leu Val Lys Asp 130 135 140 CAC CTG TGT TAC TTG ATG GGA G A AGA ACT GTT GGA GAC GAG GTT
His Leu Cys Tyr Leu Met Gly Gly Arg Ser Thr Val Gly Asp- Glu Val
145 150 155 160
CTA TGC CGA TTC ACC TTT CCC GAG AGA CCT GGT GCT CTA ATG AAC TTC
Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala Leu Met Asn Phe 165 170 175
TTG GAC TCT TTC AGT CCA CGG TGG AAC ATC ACC CTT TTC CAT TAC CAT
Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu Phe His Tyr His 180 185 190 GGA CAG GGT GAG ACG GGC Gv.G AAT GTG CTG GTC GGG ATC CAÁ GTC CCC
Gly Gln Gly Glu Thr Giy Ala Asn Val Leu Val Gly He Gln Val Pro 195 200 205 GAG CAÁ GAA ATG GAA TTT AAA AAC CGA GCT AAA GCT CTT GGA TAC
Glu Gln Glu Met Glu Glu Phe Lys Asn Arg Ala Lys Ala Leu Giy Tyr 210 215 220 GAC TAC TTC TTA GTA AGT GAT GAC TAT TTT AAG CTT CTG ATG CAC
Asp Tyr Phe Leu Val Ser Asp Asp Asp Tyr Phe Lys Leu Leu Met His
225 230 235 240 INFORMACIÓN PARA LA SEC ID NO: 8:
(i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 81 nucleótidos (27 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 8:
GTC AAT CTC ACT ACC AGT GAC TTA GTG AAA GAT CAC CTG TGT TAC TTG 4
Val Asn Leu Tnr Thr Ser Asp Leu Val Lys ASD His Leu Cys Tvr Leu
1 5 10 is ATG GGA GGA AGA TCT ACT GTT GGA GAC GAG GTT Met Giy Gly Arg Ser Thr Val Gly Aso Glu Val 20 " 25
(2) INFORMACIÓN PARA LA SEC ID NO: 9:
(i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 75 nucleótidos (25 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 9:
TGG AAC ATC ACC CTT TTC CAT TAC CAT GGA CAG GGT GAG ACG GGC GCG 4 Trp Asn He Thr Leu Phe His Tyr His Gly Gln Gly Glu Thr Gly Ala 10 15 AAT GTG CTG GTC GGG ATC CAÁ GTC CCC Asn Val Leu Val Gly He Gin Val Pro 20 25
(2) INFORMACIÓN PARA LA SEC ID NO: 10: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1635 nucleótidos (545 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal ( ii ) T I PO DE MOLÉCULA: ADNc
( xi ) DESCRI PCIÓN DE LA SECUENCIA : SEC ID NO : 10 :
ATG ACT CCA CCG CCT CCA AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT
Met Thr Pro Pro Pro Pro Lys Leu Pro Leu Pro Arg Leu Lys Val Ser
1 5 10 15
CCG AAT TCG TTG v^.~_.-? T.AC CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA
Pro Asn Ser Leu Gln Tyr Pro Ala Glv Tyr Leu Gly Ala Val Pro Glu 20 25 30 CGT ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GAA GCT ATG GAG TAT
Arg Thr Asn Glu Ala Glu Asn Gly Ser He Ala Giu Ala Met Glu Tyr 35 40 45 TTG ACG AAT ATA CTG TCC ACT AAG GTT TAC GAC ATC GCC ATT GAG TCA
Leu Thr Asn He Leu Ser Thr Lys Val Tyr Asp He Ala He Glu Ser 50 55 60 CCA CTC CAÁ TTG GG AAG AAG CTA xC. AAG AGA TTA GGT GTT CGT ATG
Pro Leu Gin Leu Ala Lys Lys Leu Ser Lys Arg Leu Gly Val Arg Met
65 70 75 80
TAT CTT AAA AGA GAA GAC TTG CCT GTA TTC TCG TT AAG CTT CGT
Tyr Leu Lys Arg Glu Asp Leu Gin Pro Val Phe Ser Phe Lys Leu Arg 85 90 95
GGA GCT TAC AAT ATG ATG GTG AAA CTT CCA GCA GAT CAÁ TTG GCA AAA
Gly Ala Tyr Asn Met Met Val Lys Leu Pro Ala Asp Gln Leu Ala Lys 100 105 110 GGA GTT ATC TGC TCT TCA GCT GGA AAC CAT GCT CAÁ GGA GTT GCT TTA
Giy Val He Cys Ser Ser Ala Gly Asn His Aia Gln Gly Val Ala Leu 115 120 125 TCT GCT AGT AAA CTC GGC TGC ACT GCT GTG ATT GTT ATG CCT GTT ACG
Ser Ala Ser Lys Leu Gly Cys Thr Ala Val He Val Met Pro Val Thr 130 135 140 ACT CCT GAG ATA AAG TGG CAÁ GCT GTA GAG AAT TTG GGT GCA ACG GTT
Thr Pro Glu He Lys Tro Gln Ala Val Glu Asn Leu Gly Ala Thr Val
145 15*0 155 160 GTT CTT TTC GGA GAT TCG TAT GAT CAÁ GCA CAÁ GCA CAT GCT AAG ATA
Val Leu Phe Gly Aso Ser Tyr Asp Gln Ala Gin Ala His Ala Lys He 165 170 175 CGA GCT GAA GAA GGT CTG ACG TTT ATA CCT CCT TTT GAT CAC CCT Arg Ala Glu Glu Glu Gly Leu Thr Phe He Pro Pro Phe Asp His Pro 180 185 19*0 GAT GTT ATT GCT GGA CA GGG ACT GTT GGG ATG GAG ATC ACT CGT CAG Asp Val He Ala Gly GIn Gly Thr Val Gly Met Giu He Thr Arg Gln 195 200 205 GCT AAG GGT CCA TTG CAT GCT ATA TT GTG CCA GTT GGT GGT oo X GGT
Ala Lys Gly Pro Leu His Ala He Phe Val Pro Val Gly Gly Gly Gly 210 215 220 TTA ATA GCT GGT J rr"V GCT GCT TAT GTG AAG AGG GTT TCT CCC GAG GTG
Leu He Ala Giy He Ala Aia Tyr Val Lys Arg Val Ser Pro Giu Val
225 230 235 240
AAG X GTA GAA CCA GCT GAC GCA A_AT GCA ATG GCT TTG TCG
Lys He He Gly Val Glu Pro Aia Asp Ala Asn Ala Met Ala Leu Ser 245 250 255 CTG C.AT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGG GGA TTT GCA
Leu His Hís Gly Glu Arg Val He Leu Asp Gln Val Gly Gly Phe Ala 260 265 270 GAT GGT GTA GCA GTT AAA GAA GTT oo GAA GAG ACT TTT CGT ATA AGC
Asp Giy Val Ala Val Lys Glu Val Gly Giu Glu Thr Phe Arg He Ser 275 280 285 AGA AAT CTA ATG GAT V3 * GTT GTT CTT GTC ACT CGT GAT GCT ATT TGT
Arg Asn Leu Met Asp Gly Val Val Leu Val Thr Arg Asp Ala He Cys 2S0 295 300 GCA TCA ATA AAG VJ? TTT GAG AAA AAC ATA TTG GAA CCA Ala Ser He Lys Asp Met Phe Glu Glu Lys Arg Asn He Leu Glu Pro
305 310 315 320
GCA GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA TAC TGT AAA TAT TAT 1
Ala Gly Ala Leu Aia Leu Ala Gly Aia Glu Ala Tyr Cys Lys Tyr Tyr 325 330 335 GGC CTA AAG GAC GTG AAT GTC GTA GCC ATA ACC AGT GGC GCT AAC ATG 1
Gly Leu Lys Asp Val Asn Val Val Ala He Thr Ser Gly Ala Asn Met 340 345 350 AAC TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC GCC AAT GTC GGT AGG 1
Asn Phe Asp Lys Leu Arg He Val t- »- Giu Leu Ala Asn Val Gly Arg 355 360 365 CAÁ CAG GAA GCT GTT CTT GCT ACT CTC ATG CCG GAA AAA CCT GGA AGC 1
Gln Gln Glu Ala Val Leu Ala Thr Leu Met Pro Glu Lys Pro Gly Ser 370 375 380 TTT AAG CAÁ TTT TGT GAG CTG GTT GGA CCA ATG AAC ATA AGC GAG TTC 1
Phe Lys Gln Phe Cys Glu Leu Val Gly Pro Met Asn lie Ser Glu Phe 385 3S0 395 400
AAA TAT AGA TGT AGC TCG GAA AAG GAG GCT X GTA CTA TAC AGT GTC 1
Lys Tyr Arg Cys Ser Ser Glu Lys Glu Ala Val Val Leu Tyr Ser Val 405 410 415 ?
GGA GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA CAG AAG AGA ATG GAA 1
Gly Val His Thr Ala Gly Glu Leu Lys Ala Leu Gln Lys Arg Met Glu 420 425 430 TCT TCT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC rt i GAC TTA GTG AAA 1 Ser Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp Leu Val Lys 435 440 445 GAT CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT ACT GTT GGA GAC GAG 1
Asp His Leu Cys Tyr Leu Met Gly Gly Arg Ser Thr Val Gly Asp Glu 450 455 460 GTT CTA TGC CGA TTC ACC TTT CCC GA.G AGA CZT GGT GCT CTA ATG AAC 1
Val Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala Leu Met Asn
465 470 475 480
TTC TTG GAC TTC AGT CCA CGG TGG AAC ATC ACC CTT TTC CAT TAC 1
Phe Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu Phe His Tyr 485 490 495 CAT GGA CAG GGT GAG ACG ^ GCG AAT GTG CTG GTC GGG ATC CAÁ GTC 1
His Gly Gln Gly Glu Thr Gly Ala Asn Val Leu Val Gly He Gln Val 500 505 510 CCC GAG CAÁ GAA ATG GAG GAA TTT AAA AAC CGA GCT AAA GCT CTT GGA 1
Pro Glu Gln Glu Met Glu Glu Phe Lys Asn Arg Ala Lys Ala Leu Gly .515 520 525 TAC GAC TAC TTC TTA GTA AGT GAT GAC GAC TAT TTT AAG CTT CTG ATG 1
Tyr Asp Tyr Phe Leu Val Ser A.sp Asp Asp Tyr Phe Lys Leu Leu Met 530 535 540 CAC TGA His 545 Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.
Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes
Claims (50)
1. Un polinucleótido aislado, caracterizado porque comprende una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
2. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 2.
3. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 3.
4. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 4.
5. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 5.
6. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 6.
7. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 7.
8. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 8.
9. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 9.
10. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 10.
11. Un polinucleótido, caracterizado porque comprende una secuencia de nucleótidos seleccionada del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
12. Un polinucleótido, caracterizado porque tiene una secuencia de nucleótidos que codifica una enzima de treonina deshidratasa/desaminasa insensible a la retroalimentación, funcional y porque se hibridiza bajo condiciones moderadamente estrictas con un elemento seleccionado del grupo que consiste de la secuencia de nucleótidos descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
13. Una secuencia de nucleótidos que codifica una secuencia de aminoácidos seleccionada del grupo que consiste de la secuencia de aminoácidos descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10 y las secuencias de aminoácidos substancialmente similares a las mismas.
14. Un método para producir células resistentes a los análogos estructurales de la isoleucina, caracterizado porque comprende: colocar en una célula una construcción que comprende en la dirección 5' a 3' de la transcripción un promotor funcional en la célula, una primera secuencia de nucleótidos que codifican un péptido de transito operable fijado al promotor, una segunda secuencia de nucleótidos que codifica una forma insensible a la retroalimentación, mutante, de la treonina desaminasa/deshidratasa fijada operativamente a la primera secuencia, y una región de terminación funcional en la célula fijada operativamente a la segunda secuencia; y hacer crecer la célula transformada por lo cual las primera y segunda secuencias de nucleótidos son expresadas para proporcionar un polipéptido del precursor; en donde el polipéptido del precursor permite que la célula sea resistente a los análogos estructurales de la isoleucina.
15. El método de conformidad con la reivindicación 14, caracterizado porque el polipéptido del precursor comprende una secuencia de aminoácidos seleccionada del grupo que consiste de la secuencia de aminoácidos descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10 y las secuencias de aminoácidos substancialmente similares a las mismas.
16. El método de conformidad con la reivindicación 14, caracterizado porque la célula se selecciona del grupo que consiste de una célula de la planta, una célula bacteriana, una célula fungosa y una célula de levadura.
17. Una célula, caracterizada porque se produce de acuerdo con el método de conformidad con la reivindicación 14.
18. Una construcción de ADN, caracterizada porque comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es substancialmente resistente a la inhibición de la retroalimentación.
19. La construcción de ADN de conformidad con la reivindicación 18, caracterizada porque la secuencia de nucleótidos tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
20. La construcción de ADN de conformidad con la reivindicación 18, caracterizada porque el promotor es un promotor de una planta.
21. La construcción de ADN de conformidad con la reivindicación 18, caracterizada porque el promotor tiene una identidad substancial con un promotor de treonina deshidratasa/desaminasa natural .
22. Un vector útil para transformar una célula, el vector está caracterizado porque comprende una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
23. Una planta transformada con el vector de conformidad con la reivindicación 22, o la progenie de la misma, la planta está caracterizada porque es capaz de expresar la secuencia de nucleótidos.
24. La planta de conformidad con la reivindicación 23, caracterizada porque la planta se selecciona del grupo que consiste de gimnospermas, arroz, trigo, cebada, centeno, maíz, papa, zanahoria, camote, frijol, arveja, achicoria, lechuga, col, coliflor, brócoli, nabo, rábano, espinaca, espárrago, cebolla, ajo, berenjena, pimienta, apio, chayóte, calabaza, calabacín, pepino, manzana, pera, membrillo, melón, ciruela, cereza, durazno, melocotón, albaricoque, fresa, uva, frambuesa, zarzamora, pina, aguacate, papaya, mango, banana, soya, tabaco, tomate, sorgo y caña de azúcar.
25. Un microorganismo transformado con el vector de conformidad con la reivindicación 22, o la progenie del mismo, el microorganismo está caracterizado porque es capaz de expresar la secuencia de nucleótidos.
26. El microorganismo de conformidad con la reivindicación 25, caracterizado porque el microorganismo es una célula de una levadura.
27. El microorganismo de conformidad con la reivindicación 25, caracterizado porque el microorganismo es una célula bacteriana.
28. El microorganismo de conformidad con la reivindicación 25, caracterizado porque el microorganismo es una célula fungosa.
29. Una célula, caracterizada porque tiene incorporada en la misma una secuencia de nucleótidos extraña que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
30. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es un microorganismo .
31. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es una célula bacteriana.
32. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es una célula fungosa.
33. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es una célula de levadura.
34. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es una célula vegetal.
35. Una planta que tiene incorporada en su genoma una construcción de ADN extraña que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la ?EC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
36. Una célula, caracterizada porque tiene incorporada en su genoma una secuencia de nucleótidos extraña que codifica una treonina deshidratasa/desaminasa que es substancialmente resistente a la inhibición de la retroalimentación .
37. Un método, caracterizado porque comprende: incorporar en un genoma de la planta una construcción de ADN para proporcionar una planta transformada, la construcción comprende un promotor enlazado operativamente a una secuencia de nucleótidos que tiene una identidad substancial con respecto a un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10; en donde la planta transformada es capaz de expresar la secuencia de nucleótidos.
38. Un método, caracterizado porque comprende: proporcionar un vector que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es resistente a la inhibición de la retroalimentación, en donde el promotor regula la expresión de la secuencia de nucleótidos en una célula de la planta huésped; y transformar una planta de blanco u objetivo con el vector para proporcionar una planta transformada, la planta es capaz de expresar la secuencia de nucleótidos.
39. El método de conformidad con la reivindicación 38, caracterizado porque la treonina deshidratasa/desaminasa comprende una secuencia de aminoácidos que tiene una similaridad substancial con un elemento seleccionado del ' grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
40. El método de conformidad con la reivindicación 38, caracterizado porque . la secuencia de nucleótidos tiene una identidad substancial con la secuencia de nucleótidos de la SEC ID NO: 2.
41. Una planta transgénica, caracterizada porque se obtiene de conformidad con el método de la reivindicación 38 o la progenie de la misma.
42. Un método para seleccionar transformantes potenciales, caracterizado porque comprende: proporcionar una pluralidad de células, en donde al menos una de las células tiene en su genoma una secuencia de nucleótidos extraña que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID N0:2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10, y poner en contacto la pluralidad de las células con un substrato que comprende un análogo estructural de isoleucina, tóxica; en donde las células que comprenden la secuencia de nucleótidos extraña, expresable, son capaces de crecer en el substrato, y en donde las células que no comprenden la secuencia de nucleótidos extraña, expresable, son incapaces de crecer en el substrato.
43. Un método para incorporar confiablemente una primera secuencia de nucleótidos extraña, expresable, en una célula de blanco u objetivo, caracterizado porque comprende : proporcionar un vector que comprende un promotor enlazado operativamente a un primer polinucleótido primario y un segundo polinucleótido, que comprende una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10; transformar la célula de blanco u objetivo con el vector para proporcionar una célula transformada; y poner en contacto la célula con un substrato que comprende la L-O-metiltreonina; en donde las células transformadas exitosamente son capaces de crecer en el substrato, y en donde las células transformadas no exitosamente son incapaces de crecer en el substrato.
44. Un método de conformidad con la reivindicación 43, caracterizado porque la célula se selecciona del grupo que comprende una célula vegetal, una célula de levadura, una célula bacteriana y una célula fungosa.
45. Un método para hacer crecer una pluralidad de plantas en la ausencia de plantas indeseables, caracterizado porque comprende: proporcionar una pluralidad de plantas, cada una teniendo en su genoma una secuencia de nucleótidos extraña que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es resistente a la inhibición de la retroalimentación; hacer crecer la pluralidad de las plantas en un substrato; e introducir una cantidad preseleccionada de un análogo estructural de isoleucina en el substrato.
46. Un método de conformidad con la reivindicación 45, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.
47. El método de conformidad con la reivindicación 45, caracterizado porque el análogo es la L-O-metiltreonina .
48. Un método, caracterizado porque comprende: proporcionar una secuencia de nucleótidos que tiene una identidad substancial con la secuencia de nucleótidos descrita en la SEC ID N0:1 o una porción de la misma; y mutar la secuencia de modo que la secuencia codifica una treonina deshidratasa/desaminasa insensible a la retroalimentación; en donde la mutación comprende la mutagénesis dirigida al sitio.
49. El método de conformidad con la reivindicación 48, caracterizado porque la treonina deshidratasa/desaminasa insensibles a la retroalimentación comprende un aminoácido diferente del tipo silvestre en la localización de aminoácidos que corresponde a la localización 452 de la SEC ID NO: 2, en la localización de aminoácidos que corresponde a la localización 497 de la SEC ID NO: 2.
50. Un método, caracterizado porque comprende: proporcionar un vector que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es resistente a la inhibición de la retroalimentación, en donde el promotor regula la expresión de la secuencia de nucleótidos en una célula huésped; y transformar una célula de blanco u objetivo con el vector para proporcionar una célula transformada, la célula transformada es capaz de expresar la secuencia de nucleótidos . RESUMEN DE LA INVENCIÓN La presente invención se refiere a métodos y materiales en el campo de la biología molecular y a la regulación de la síntesis de polipéptidos a través de la ingeniería genética de las plantas y/o los microorganismos. Más particularmente, la invención se refiere a secuencias de nucleótidos aisladas recientemente, a secuencias de nucleótidos que tienen una identidad substancial con la misma y a los equivalentes de la misma, así como a los polipéptidos codificados por la misma. La invención también involucra la introducción de secuencias de nucleótidos extrañas en el genoma de una planta y/o microorganismo, en donde la introducción de la secuencia de nucleótidos efectúa un incremento en la resistencia del transformante a los análogos estructurales de la isoleucina tóxicos. Las secuencias inventivas por lo tanto pueden ser utilizadas como marcadores moleculares excelentes para seleccionar los transformantes exitosos, por lo cual se reemplazan los genes resistentes a los antibióticos utilizados en la técnica previa. Los transformantes hospedan una secuencia de nucleótidos que comprende un promotor enlazado operativamente a una secuencia de nucleótidos de la invención, demostraron niveles incrementados de producción de isoleucina, por lo cual se proporciona una fuente de nutrientes mejorada.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US60/052,096 | 1997-07-10 | ||
US60/074,875 | 1998-02-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA00000336A true MXPA00000336A (es) | 2001-05-07 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7022895B2 (en) | Plant amino acid biosynthetic enzymes | |
US6563025B1 (en) | Nucleotide sequences encoding anthranilate synthase | |
AU770361B2 (en) | Genes and vectors for conferring herbicide resistance in plants | |
US7038108B2 (en) | Polynucleotide encoding lysyl-tRNA synthetase from Zea mays | |
HU222085B1 (hu) | Kiméragének és eljárások kukorica-, szójabab- és repcemagvak lizintartalmának növelésére | |
WO1999005902A1 (en) | Transgenic plants tolerant of salinity stress | |
AU759068B2 (en) | Methods and compositions for producing plants and microorganisms that express feedback insensitive threonine dehydratase/deaminase | |
US7195887B2 (en) | Rice 1-deoxy-D-xylulose 5-phosphate synthase and DNA encoding thereof | |
WO2000047747A2 (en) | Maize glutathione-s-transferase enzymes | |
US5962229A (en) | Maize glutathione-S-transferase enzymes | |
US6204039B1 (en) | Plant isocitrate dehydrogenase homologs | |
US6171839B1 (en) | Soybean glutathione-S-transferase enzymes | |
WO1998056934A1 (en) | Plant transcription coactivators with histone acetyltransferase activity | |
WO1999041395A1 (en) | Methods and compositions for producing plants and microorganisms that express feedback insensitive threonine dehydratase deaminase | |
US6168954B1 (en) | Soybean glutathione-S-transferase enzymes | |
MXPA00000336A (es) | Metodos y composiciones para producir plantas y microorganismos que expresan la treonina deshidratasa/desaminasa insensible a la retroalimentacion | |
WO2000006749A2 (en) | Sulfur metabolism enzymes | |
EP1117811A1 (en) | Soybean glutathione-s-transferase enzymes | |
US6906242B2 (en) | Gene involved in pyrimidine biosynthesis in plants | |
US7112722B2 (en) | Plant genes encoding pantothenate synthetase | |
US6441271B1 (en) | Plant histidine biosynthetic enzymes | |
EP1117810A1 (en) | Maize glutathione-s-transferase enzymes | |
US6855867B1 (en) | Plant glutamine amidotransferase homologs | |
US7192758B2 (en) | Polynucleotides encoding phosphoribosylanthranilate isomerase | |
US20030104409A1 (en) | Vitamin B metabolism proteins |