MXPA99005320A - Cepas de vih-1 que no son del grupo m, ni son del grupo o, fragmentos y uso - Google Patents
Cepas de vih-1 que no son del grupo m, ni son del grupo o, fragmentos y usoInfo
- Publication number
- MXPA99005320A MXPA99005320A MXPA/A/1999/005320A MX9905320A MXPA99005320A MX PA99005320 A MXPA99005320 A MX PA99005320A MX 9905320 A MX9905320 A MX 9905320A MX PA99005320 A MXPA99005320 A MX PA99005320A
- Authority
- MX
- Mexico
- Prior art keywords
- leu
- gly
- glu
- lys
- arg
- Prior art date
Links
- 241000713772 Human immunodeficiency virus 1 Species 0.000 claims abstract description 31
- 230000003321 amplification Effects 0.000 claims abstract description 21
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 20
- 230000000405 serological Effects 0.000 claims abstract description 20
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 17
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 17
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 11
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 5
- 238000003745 diagnosis Methods 0.000 claims abstract description 5
- 230000002163 immunogen Effects 0.000 claims abstract description 5
- 230000001177 retroviral Effects 0.000 claims abstract description 3
- 150000007523 nucleic acids Chemical group 0.000 claims description 102
- 108020004707 nucleic acids Proteins 0.000 claims description 98
- 241000700605 Viruses Species 0.000 claims description 28
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 26
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 26
- 210000002966 Serum Anatomy 0.000 claims description 22
- 201000009910 diseases by infectious agent Diseases 0.000 claims description 22
- 102000004965 antibodies Human genes 0.000 claims description 21
- 108090001123 antibodies Proteins 0.000 claims description 21
- 229920001850 Nucleic acid sequence Polymers 0.000 claims description 13
- 239000000427 antigen Substances 0.000 claims description 12
- 102000038129 antigens Human genes 0.000 claims description 12
- 108091007172 antigens Proteins 0.000 claims description 12
- 241000702620 H-1 parvovirus Species 0.000 claims description 10
- 239000012472 biological sample Substances 0.000 claims description 10
- 239000003999 initiator Substances 0.000 claims description 10
- 241000725303 Human immunodeficiency virus Species 0.000 claims description 8
- 210000004698 Lymphocytes Anatomy 0.000 claims description 8
- 241001430294 unidentified retrovirus Species 0.000 claims description 7
- 238000000338 in vitro Methods 0.000 claims description 6
- 102000033147 ERVK-25 Human genes 0.000 claims description 5
- 238000009396 hybridization Methods 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 5
- 239000000523 sample Substances 0.000 claims description 5
- 102000015141 vpr Gene Products Human genes 0.000 claims description 5
- 108010092799 EC 2.7.7.49 Proteins 0.000 claims description 4
- 230000001900 immune effect Effects 0.000 claims description 4
- 229920000160 (ribonucleotides)n+m Polymers 0.000 claims description 3
- 101700011961 DPOM Proteins 0.000 claims description 2
- 101710029649 MDV043 Proteins 0.000 claims description 2
- 229920000272 Oligonucleotide Polymers 0.000 claims description 2
- 101700061424 POLB Proteins 0.000 claims description 2
- 101700054624 RF1 Proteins 0.000 claims description 2
- 230000000295 complement Effects 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 244000005700 microbiome Species 0.000 claims description 2
- 230000000877 morphologic Effects 0.000 claims description 2
- 238000006116 polymerization reaction Methods 0.000 claims description 2
- 235000008984 brauner Senf Nutrition 0.000 claims 1
- 244000275904 brauner Senf Species 0.000 claims 1
- 208000005721 HIV Infections Diseases 0.000 abstract description 6
- 241000713340 Human immunodeficiency virus 2 Species 0.000 abstract description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 32
- 108010015792 glycyllysine Proteins 0.000 description 30
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 29
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 29
- 108010013835 arginine glutamate Proteins 0.000 description 29
- 108010008355 arginyl-glutamine Proteins 0.000 description 28
- 235000001014 amino acid Nutrition 0.000 description 27
- 108010062796 arginyllysine Proteins 0.000 description 27
- 108010061238 threonyl-glycine Proteins 0.000 description 27
- 108010009298 lysylglutamic acid Proteins 0.000 description 26
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 24
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 24
- 229940014598 TAC Drugs 0.000 description 24
- 108010054155 lysyllysine Proteins 0.000 description 24
- PMGDADKJMCOXHX-BQBZGAKWSA-N Arg-Gln Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PMGDADKJMCOXHX-BQBZGAKWSA-N 0.000 description 23
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 23
- 108010078144 glutaminyl-glycine Proteins 0.000 description 23
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 22
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 22
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 21
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 21
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 20
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 20
- 108010092854 aspartyllysine Proteins 0.000 description 20
- 108010034529 leucyl-lysine Proteins 0.000 description 20
- LQJAALCCPOTJGB-YUMQZZPRSA-N (2S)-1-[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 19
- LZDNBBYBDGBADK-KBPBESRZSA-N (2S)-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 19
- VBKIFHUVGLOJKT-UHFFFAOYSA-N Asparaginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(N)=O VBKIFHUVGLOJKT-UHFFFAOYSA-N 0.000 description 19
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 19
- MRVYVEQPNDSWLH-UHFFFAOYSA-N Glutaminyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O MRVYVEQPNDSWLH-UHFFFAOYSA-N 0.000 description 19
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 19
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 19
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 19
- 108010060035 arginylproline Proteins 0.000 description 19
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 19
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 18
- BQVUABVGYYSDCJ-ZFWWWQNUSA-N Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-ZFWWWQNUSA-N 0.000 description 18
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 18
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 18
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 18
- 108010057821 leucylproline Proteins 0.000 description 18
- 108010017391 lysylvaline Proteins 0.000 description 18
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 17
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 17
- 108010066427 N-valyltryptophan Proteins 0.000 description 17
- XXDVDTMEVBYRPK-XPUUQOCRSA-N Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O XXDVDTMEVBYRPK-XPUUQOCRSA-N 0.000 description 17
- 108010077245 asparaginyl-proline Proteins 0.000 description 17
- 229920003013 deoxyribonucleic acid Polymers 0.000 description 17
- 108010010147 glycylglutamine Proteins 0.000 description 17
- 108010050848 glycylleucine Proteins 0.000 description 17
- 108010025306 histidylleucine Proteins 0.000 description 17
- XNSKSTRGQIPTSE-UHFFFAOYSA-N Arginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCCNC(N)=N XNSKSTRGQIPTSE-UHFFFAOYSA-N 0.000 description 16
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 16
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 16
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 16
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 16
- 108010064235 lysylglycine Proteins 0.000 description 16
- QLROSWPKSBORFJ-BQBZGAKWSA-N pro glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 16
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 15
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 15
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 15
- ONWMQORSVZYVNH-UHFFFAOYSA-N Tyrosyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UHFFFAOYSA-N 0.000 description 15
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 15
- 125000000539 amino acid group Chemical compound 0.000 description 15
- 101700042113 tap Proteins 0.000 description 15
- 108010020532 tyrosyl-proline Proteins 0.000 description 15
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 14
- TWXZVVXRRRRSLT-UHFFFAOYSA-N Asparaginyl-Cysteine Chemical compound NC(=O)CC(N)C(=O)NC(CS)C(O)=O TWXZVVXRRRRSLT-UHFFFAOYSA-N 0.000 description 14
- OMSMPWHEGLNQOD-UHFFFAOYSA-N Asparaginyl-Phenylalanine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UHFFFAOYSA-N 0.000 description 14
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 14
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 14
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 14
- 241000880493 Leptailurus serval Species 0.000 description 14
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 14
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 14
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 14
- 108010093581 aspartyl-proline Proteins 0.000 description 14
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine zwitterion Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 14
- 108010037850 glycylvaline Proteins 0.000 description 14
- 108010070643 prolylglutamic acid Proteins 0.000 description 14
- 108010053725 prolylvaline Proteins 0.000 description 14
- 108010038745 tryptophylglycine Proteins 0.000 description 14
- 108010073969 valyllysine Proteins 0.000 description 14
- SITLTJHOQZFJGG-XPUUQOCRSA-N α-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 14
- XUUXCWCKKCZEAW-YFKPBYRVSA-N 2-[[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 13
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 13
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 13
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 13
- 108010077515 glycylproline Proteins 0.000 description 13
- 108010085325 histidylproline Proteins 0.000 description 13
- 108010005942 methionylglycine Proteins 0.000 description 13
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 12
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 12
- SSHIXEILTLPAQT-UHFFFAOYSA-N Glutaminyl-Aspartate Chemical compound NC(=O)CCC(N)C(=O)NC(CC(O)=O)C(O)=O SSHIXEILTLPAQT-UHFFFAOYSA-N 0.000 description 12
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 12
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 12
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 12
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 12
- RZEQTVHJZCIUBT-UHFFFAOYSA-N Serinyl-Arginine Chemical compound OCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-UHFFFAOYSA-N 0.000 description 12
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 12
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 12
- UBAQSAUDKMIEQZ-QWRGUYRKSA-N Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBAQSAUDKMIEQZ-QWRGUYRKSA-N 0.000 description 12
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 12
- 108010077112 prolyl-proline Proteins 0.000 description 12
- MPZWMIIOPAPAKE-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-4-(diaminomethylideneamino)butyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CCCN=C(N)N MPZWMIIOPAPAKE-UHFFFAOYSA-N 0.000 description 11
- NTQDELBZOMWXRS-UHFFFAOYSA-N Aspartyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(O)=O NTQDELBZOMWXRS-UHFFFAOYSA-N 0.000 description 11
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 11
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 11
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 11
- XUJNEKJLAYXESH-REOHCLBHSA-N L-cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 11
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 11
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 11
- 108010068380 arginylarginine Proteins 0.000 description 11
- KZNQNBZMBZJQJO-YFKPBYRVSA-N gly pro Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 11
- 235000018102 proteins Nutrition 0.000 description 11
- 108010026333 seryl-proline Proteins 0.000 description 11
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 10
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 10
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 10
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 10
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 10
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 10
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 10
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 10
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 10
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 10
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 10
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 10
- DZHDVYLBNKMLMB-ZFWWWQNUSA-N Trp-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 DZHDVYLBNKMLMB-ZFWWWQNUSA-N 0.000 description 10
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 10
- 108010089804 glycyl-threonine Proteins 0.000 description 10
- 108010036413 histidylglycine Proteins 0.000 description 10
- 108010018006 histidylserine Proteins 0.000 description 10
- 108010053037 kyotorphin Proteins 0.000 description 10
- 108010090894 prolylleucine Proteins 0.000 description 10
- OPINTGHFESTVAX-UHFFFAOYSA-N γ-glutamyl-Arginine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N OPINTGHFESTVAX-UHFFFAOYSA-N 0.000 description 10
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 9
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 9
- UKGGPJNBONZZCM-WDSKDSINSA-N Aspartyl-L-proline Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 9
- ARPVSMCNIDAQBO-UHFFFAOYSA-N Glutaminyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CCC(N)=O ARPVSMCNIDAQBO-UHFFFAOYSA-N 0.000 description 9
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 9
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 9
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 9
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 9
- WSDOHRLQDGAOGU-UHFFFAOYSA-N Histidinyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WSDOHRLQDGAOGU-UHFFFAOYSA-N 0.000 description 9
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 9
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 9
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 9
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 9
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 9
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 9
- 125000000267 glycino group Chemical group [H]N([*])C([H])([H])C(=O)O[H] 0.000 description 9
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 9
- 108010004914 prolylarginine Proteins 0.000 description 9
- 108010051110 tyrosyl-lysine Proteins 0.000 description 9
- VKVDRTGWLVZJOM-DCAQKATOSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 8
- MGHKSHCBDXNTHX-UHFFFAOYSA-N 4-amino-5-[(4-amino-1-carboxy-4-oxobutyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-UHFFFAOYSA-N 0.000 description 8
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 8
- QJMCHPGWFZZRID-UHFFFAOYSA-N Asparaginyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC(N)=O QJMCHPGWFZZRID-UHFFFAOYSA-N 0.000 description 8
- AYKQJQVWUYEZNU-UHFFFAOYSA-N Cysteinyl-Asparagine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC(N)=O AYKQJQVWUYEZNU-UHFFFAOYSA-N 0.000 description 8
- WXOFKRKAHJQKLT-UHFFFAOYSA-N Cysteinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CS WXOFKRKAHJQKLT-UHFFFAOYSA-N 0.000 description 8
- CLSDNFWKGFJIBZ-UHFFFAOYSA-N Glutaminyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CCC(N)=O CLSDNFWKGFJIBZ-UHFFFAOYSA-N 0.000 description 8
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 8
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 8
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 8
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 8
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 8
- 108010079364 N-glycylalanine Proteins 0.000 description 8
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 8
- GVUVRRPYYDHHGK-UHFFFAOYSA-N Prolyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C1CCCN1 GVUVRRPYYDHHGK-UHFFFAOYSA-N 0.000 description 8
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 8
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 8
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 8
- KAFKKRJQHOECGW-JCOFBHIZSA-N Thr-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(O)=O)=CNC2=C1 KAFKKRJQHOECGW-JCOFBHIZSA-N 0.000 description 8
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 8
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 8
- MFEVVAXTBZELLL-UHFFFAOYSA-N Tyrosyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-UHFFFAOYSA-N 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 7
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 7
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 7
- HHSJMSCOLJVTCX-UHFFFAOYSA-N Glutaminyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCC(N)=O HHSJMSCOLJVTCX-UHFFFAOYSA-N 0.000 description 7
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 7
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 7
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 7
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 7
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 230000004069 differentiation Effects 0.000 description 7
- VPZXBVLAVMBEQI-VKHMYHEASA-N gly ala Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 7
- 238000000034 method Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- QXRNAOYBCYVZCD-BQBZGAKWSA-N (2S)-6-amino-2-[[(2S)-2-aminopropanoyl]amino]hexanoic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 6
- AAKRWBIIGKPOKQ-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 6
- SITWEMZOJNKJCH-UHFFFAOYSA-N Alanyl-Arginine Chemical compound CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 6
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 6
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 6
- VGRHZPNRCLAHQA-UHFFFAOYSA-N Aspartyl-Asparagine Chemical compound OC(=O)CC(N)C(=O)NC(CC(N)=O)C(O)=O VGRHZPNRCLAHQA-UHFFFAOYSA-N 0.000 description 6
- FKBFDTRILNZGAI-UHFFFAOYSA-N Aspartyl-Cysteine Chemical compound OC(=O)CC(N)C(=O)NC(CS)C(O)=O FKBFDTRILNZGAI-UHFFFAOYSA-N 0.000 description 6
- WYVKPHCYMTWUCW-UHFFFAOYSA-N Cysteinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CS WYVKPHCYMTWUCW-UHFFFAOYSA-N 0.000 description 6
- OELDIVRKHTYFNG-UHFFFAOYSA-N Cysteinyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CS OELDIVRKHTYFNG-UHFFFAOYSA-N 0.000 description 6
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 6
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 6
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 6
- WRPDZHJNLYNFFT-UHFFFAOYSA-N Histidinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WRPDZHJNLYNFFT-UHFFFAOYSA-N 0.000 description 6
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 6
- KFKWRHQBZQICHA-STQMWFEESA-N Leu-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 6
- MUMXFARPYQTTSL-BQBZGAKWSA-N Met-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O MUMXFARPYQTTSL-BQBZGAKWSA-N 0.000 description 6
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 6
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 6
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 6
- FFOKMZOAVHEWET-UHFFFAOYSA-N Serinyl-Cysteine Chemical compound OCC(N)C(=O)NC(CS)C(O)=O FFOKMZOAVHEWET-UHFFFAOYSA-N 0.000 description 6
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 6
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 6
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 6
- MYVYPSWUSKCCHG-JQWIXIFHSA-N Trp-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 MYVYPSWUSKCCHG-JQWIXIFHSA-N 0.000 description 6
- GRQCSEWEPIHLBI-UHFFFAOYSA-N Tryptophyl-Asparagine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-UHFFFAOYSA-N 0.000 description 6
- NZCPCJCJZHKFGZ-UHFFFAOYSA-N Tryptophyl-Glutamine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CCC(N)=O)C(O)=O)=CNC2=C1 NZCPCJCJZHKFGZ-UHFFFAOYSA-N 0.000 description 6
- ZSXJENBJGRHKIG-UHFFFAOYSA-N Tyrosyl-Serine Chemical compound OCC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UHFFFAOYSA-N 0.000 description 6
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 6
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 6
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 6
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 6
- 230000002068 genetic Effects 0.000 description 6
- 108010079547 glutamylmethionine Proteins 0.000 description 6
- 108010020688 glycylhistidine Proteins 0.000 description 6
- 108010028295 histidylhistidine Proteins 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 6
- 108010080629 tryptophan-leucine Proteins 0.000 description 6
- 108010044292 tryptophyltyrosine Proteins 0.000 description 6
- 230000003612 virological Effects 0.000 description 6
- NJMYZEJORPYOTO-UHFFFAOYSA-N γ-glutamyl-Proline Chemical compound NC(=O)CCC(N)C(=O)N1CCCC1C(O)=O NJMYZEJORPYOTO-UHFFFAOYSA-N 0.000 description 6
- UKKNTTCNGZLJEX-UHFFFAOYSA-N γ-glutamyl-Serine Chemical compound NC(=O)CCC(N)C(=O)NC(CO)C(O)=O UKKNTTCNGZLJEX-UHFFFAOYSA-N 0.000 description 6
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 5
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 5
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 5
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 5
- XZFYRXDAULDNFX-UHFFFAOYSA-N Cysteinyl-Phenylalanine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 5
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 5
- JZOYFBPIEHCDFV-UHFFFAOYSA-N Glutaminyl-Histidine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 JZOYFBPIEHCDFV-UHFFFAOYSA-N 0.000 description 5
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 5
- CTCFZNBRZBNKAX-UHFFFAOYSA-N Histidinyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 CTCFZNBRZBNKAX-UHFFFAOYSA-N 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- JXNRXNCCROJZFB-RYUDHWBXSA-N L-tyrosyl-L-arginine Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JXNRXNCCROJZFB-RYUDHWBXSA-N 0.000 description 5
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 5
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 5
- JPNRPAJITHRXRH-UHFFFAOYSA-N Lysyl-Asparagine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC(N)=O JPNRPAJITHRXRH-UHFFFAOYSA-N 0.000 description 5
- 241000282577 Pan troglodytes Species 0.000 description 5
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 5
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 5
- APIDTRXFGYOLLH-VQVTYTSYSA-N Thr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O APIDTRXFGYOLLH-VQVTYTSYSA-N 0.000 description 5
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 5
- YKRQRPFODDJQTC-UHFFFAOYSA-N Threoninyl-Lysine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CCCCN YKRQRPFODDJQTC-UHFFFAOYSA-N 0.000 description 5
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 5
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- SIGGQAHUPUBWNF-UHFFFAOYSA-N γ-glutamyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CCC(N)=O SIGGQAHUPUBWNF-UHFFFAOYSA-N 0.000 description 5
- RXGLHDWAZQECBI-SRVKXCTJSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- ULXYQAJWJGLCNR-YUMQZZPRSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 4
- GJSURZIOUXUGAL-UHFFFAOYSA-N 2-((2,6-Dichlorophenyl)imino)imidazolidine Chemical compound ClC1=CC=CC(Cl)=C1NC1=NCCN1 GJSURZIOUXUGAL-UHFFFAOYSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- OSASDIVHOSJVII-UHFFFAOYSA-N Arginyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CCCNC(N)=N OSASDIVHOSJVII-UHFFFAOYSA-N 0.000 description 4
- BNODVYXZAAXSHW-UHFFFAOYSA-N Arginyl-Histidine Chemical compound NC(=N)NCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 BNODVYXZAAXSHW-UHFFFAOYSA-N 0.000 description 4
- RGGVDKVXLBOLNS-UHFFFAOYSA-N Asparaginyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CC(N)=O)N)C(O)=O)=CNC2=C1 RGGVDKVXLBOLNS-UHFFFAOYSA-N 0.000 description 4
- YHDXIZKDOIWPBW-UHFFFAOYSA-N Cysteinyl-Glutamine Chemical compound SCC(N)C(=O)NC(C(O)=O)CCC(N)=O YHDXIZKDOIWPBW-UHFFFAOYSA-N 0.000 description 4
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 4
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 4
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 4
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 4
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 4
- FBTYOQIYBULKEH-ZFWWWQNUSA-N His-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 FBTYOQIYBULKEH-ZFWWWQNUSA-N 0.000 description 4
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 4
- NTISAKGPIGTIJJ-IUCAKERBSA-N Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C NTISAKGPIGTIJJ-IUCAKERBSA-N 0.000 description 4
- PESQCPHRXOFIPX-RYUDHWBXSA-N Met-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-RYUDHWBXSA-N 0.000 description 4
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 4
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 4
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 4
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 4
- HXNYBZQLBWIADP-UHFFFAOYSA-N Prolyl-Cysteine Chemical compound OC(=O)C(CS)NC(=O)C1CCCN1 HXNYBZQLBWIADP-UHFFFAOYSA-N 0.000 description 4
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 4
- PEEAINPHPNDNGE-JQWIXIFHSA-N Trp-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 PEEAINPHPNDNGE-JQWIXIFHSA-N 0.000 description 4
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 4
- TYYLDKGBCJGJGW-WMZOPIPTSA-N Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 TYYLDKGBCJGJGW-WMZOPIPTSA-N 0.000 description 4
- DXYQIGZZWYBXSD-UHFFFAOYSA-N Tryptophyl-Proline Chemical compound C=1NC2=CC=CC=C2C=1CC(N)C(=O)N1CCCC1C(O)=O DXYQIGZZWYBXSD-UHFFFAOYSA-N 0.000 description 4
- YBRHKUNWEYBZGT-UHFFFAOYSA-N Tryptophyl-Threonine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(C(O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-UHFFFAOYSA-N 0.000 description 4
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 4
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 4
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 210000004027 cells Anatomy 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 108010044655 lysylproline Proteins 0.000 description 4
- 238000007857 nested PCR Methods 0.000 description 4
- 108010029384 tryptophyl-histidine Proteins 0.000 description 4
- 108010084932 tryptophyl-proline Proteins 0.000 description 4
- 108010045269 tryptophyltryptophan Proteins 0.000 description 4
- 108010009962 valyltyrosine Proteins 0.000 description 4
- DSTWKJOBKSMVCV-UWVGGRQHSA-N (2S)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DSTWKJOBKSMVCV-UWVGGRQHSA-N 0.000 description 3
- PJYSOYLLTJKZHC-GUBZILKMSA-N (2S)-5-amino-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-carboxypropanoyl]amino]-5-oxopentanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 3
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 3
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 3
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 3
- QCWJKJLNCFEVPQ-WHFBIAKZSA-N Asn-Gln Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O QCWJKJLNCFEVPQ-WHFBIAKZSA-N 0.000 description 3
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 3
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 3
- ZARXTZFGQZBYFO-JQWIXIFHSA-N Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(O)=O)=CNC2=C1 ZARXTZFGQZBYFO-JQWIXIFHSA-N 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 3
- 241001200922 Gagata Species 0.000 description 3
- NIKBMHGRNAPJFW-UHFFFAOYSA-N Histidinyl-Arginine Chemical compound NC(=N)NCCCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 NIKBMHGRNAPJFW-UHFFFAOYSA-N 0.000 description 3
- MAJYPBAJPNUFPV-UHFFFAOYSA-N Histidinyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 MAJYPBAJPNUFPV-UHFFFAOYSA-N 0.000 description 3
- IGRMTQMIDNDFAA-UHFFFAOYSA-N Lysyl-Histidine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UHFFFAOYSA-N 0.000 description 3
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 3
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 3
- KNPVDQMEHSCAGX-UHFFFAOYSA-N Phenylalanyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KNPVDQMEHSCAGX-UHFFFAOYSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N Phenylalanyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 3
- 102100017875 S100A8 Human genes 0.000 description 3
- 101710023380 S100A8 Proteins 0.000 description 3
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 3
- 108010006785 Taq Polymerase Proteins 0.000 description 3
- 101710042194 Trpgamma Proteins 0.000 description 3
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 3
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 3
- 108010036533 arginylvaline Proteins 0.000 description 3
- 230000000875 corresponding Effects 0.000 description 3
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 3
- 108010084389 glycyltryptophan Proteins 0.000 description 3
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 3
- 108010068488 methionylphenylalanine Proteins 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 102000015609 tat Gene Products Human genes 0.000 description 3
- 229920000511 telomere Polymers 0.000 description 3
- 108010078580 tyrosylleucine Proteins 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- ZQFAGNFSIZZYBA-UHFFFAOYSA-N γ-glutamyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CCC(N)=O)N)C(O)=O)=CNC2=C1 ZQFAGNFSIZZYBA-UHFFFAOYSA-N 0.000 description 3
- POTCZYQVVNXUIG-BQBZGAKWSA-N (2S)-1-[2-[[(2S)-2-amino-3-carboxypropanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 2
- YFBBUHJJUXXZOF-UWVGGRQHSA-N (2S)-1-[2-[[(2S)-2-azaniumyl-4-methylpentanoyl]amino]acetyl]pyrrolidine-2-carboxylate Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 2
- FAQVCWVVIYYWRR-WHFBIAKZSA-N (2S)-2-[[(2S)-2,5-diamino-5-oxopentanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-carboxybutanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- CGHXMODRYJISSK-NHCYSSNCSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 2
- XMAUFHMAAVTODF-STQMWFEESA-N (2S)-2-[[(2S)-2-amino-3-(1H-imidazol-5-yl)propanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 2
- KYPMKDGKAYQCHO-RYUDHWBXSA-N (2S)-2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-4-methylsulfanylbutanoic acid Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 2
- BVZABQIRMYTKCF-JSGCOSHPSA-N (2S)-2-[[(2S)-2-azaniumyl-3-(1H-indol-3-yl)propanoyl]amino]-4-methylsulfanylbutanoate Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCSC)C(O)=O)=CNC2=C1 BVZABQIRMYTKCF-JSGCOSHPSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N (2S)-2-[[(2S,3R)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N (2S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]-3-phenylpropanoate Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N (2S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]-4-methylpentanoate Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N (2S)-4-amino-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-phenylpropanoyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N (2S)-4-amino-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- LCNASHSOFMRYFO-WDCWCFNPSA-N (2S)-5-amino-2-[[(2S,3R)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]-5-oxopentanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 2
- MVORZMQFXBLMHM-QWRGUYRKSA-N (2S)-6-amino-2-[[(2S)-2-[(2-aminoacetyl)amino]-3-(1H-imidazol-5-yl)propanoyl]amino]hexanoic acid Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N (3S)-3-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N (4S)-4-amino-5-[[(2S)-1-[[(1S)-1-carboxy-2-methylpropyl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N (4S)-4-amino-5-[[(2S)-1-[[(1S)-1-carboxy-2-methylpropyl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-oxopentanoic acid Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- RFCVXVPWSPOMFJ-UHFFFAOYSA-N 2-[(2-azaniumyl-3-phenylpropanoyl)amino]-4-methylpentanoate Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-UHFFFAOYSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N 2-[[(2S)-2-[[(2S)-2-azaniumyl-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetate Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- HKTRDWYCAUTRRL-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-2-(1H-imidazol-5-yl)ethyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-UHFFFAOYSA-N 0.000 description 2
- 206010000565 Acquired immunodeficiency syndrome Diseases 0.000 description 2
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 2
- JQDFGZKKXBEANU-UHFFFAOYSA-N Alanyl-Cysteine Chemical compound CC(N)C(=O)NC(CS)C(O)=O JQDFGZKKXBEANU-UHFFFAOYSA-N 0.000 description 2
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 2
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 2
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 2
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 2
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 2
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 2
- SJUXYGVRSGTPMC-UHFFFAOYSA-N Asparaginyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CC(N)=O SJUXYGVRSGTPMC-UHFFFAOYSA-N 0.000 description 2
- IQTUDDBANZYMAR-UHFFFAOYSA-N Asparaginyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(N)=O IQTUDDBANZYMAR-UHFFFAOYSA-N 0.000 description 2
- 210000004369 Blood Anatomy 0.000 description 2
- RGTVXXNMOGHRAY-UHFFFAOYSA-N Cysteinyl-Arginine Chemical compound SCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RGTVXXNMOGHRAY-UHFFFAOYSA-N 0.000 description 2
- SYELGNBERZZXAG-UHFFFAOYSA-N Cysteinyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CS)N)C(O)=O)=CNC2=C1 SYELGNBERZZXAG-UHFFFAOYSA-N 0.000 description 2
- XIPZDANNDPMZGQ-UHFFFAOYSA-N Glutaminyl-Cysteine Chemical compound NC(=O)CCC(N)C(=O)NC(CS)C(O)=O XIPZDANNDPMZGQ-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 2
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine zwitterion Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 2
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- DVCSNHXRZUVYAM-BQBZGAKWSA-N Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 2
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 2
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 2
- XBZOQGHZGQLEQO-IUCAKERBSA-N Lys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN XBZOQGHZGQLEQO-IUCAKERBSA-N 0.000 description 2
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 2
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 2
- RVKIPWVMZANZLI-ZFWWWQNUSA-N Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-ZFWWWQNUSA-N 0.000 description 2
- UASDAHIAHBRZQV-YUMQZZPRSA-N Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N UASDAHIAHBRZQV-YUMQZZPRSA-N 0.000 description 2
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 2
- WEDDFMCSUNNZJR-WDSKDSINSA-N Met-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O WEDDFMCSUNNZJR-WDSKDSINSA-N 0.000 description 2
- XYVRXLDSCKEYES-JSGCOSHPSA-N Met-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 XYVRXLDSCKEYES-JSGCOSHPSA-N 0.000 description 2
- JMEWFDUAFKVAAT-UHFFFAOYSA-N Methionyl-Asparagine Chemical compound CSCCC(N)C(=O)NC(C(O)=O)CC(N)=O JMEWFDUAFKVAAT-UHFFFAOYSA-N 0.000 description 2
- 210000003819 Peripheral blood mononuclear cell Anatomy 0.000 description 2
- OZILORBBPKKGRI-RYUDHWBXSA-N Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 OZILORBBPKKGRI-RYUDHWBXSA-N 0.000 description 2
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 2
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 2
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 2
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 2
- KLAONOISLHWJEE-UHFFFAOYSA-N Phenylalanyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KLAONOISLHWJEE-UHFFFAOYSA-N 0.000 description 2
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 2
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 2
- BEPSGCXDIVACBU-UHFFFAOYSA-N Prolyl-Histidine Chemical compound C1CCNC1C(=O)NC(C(=O)O)CC1=CN=CN1 BEPSGCXDIVACBU-UHFFFAOYSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- PBUXMVYWOSKHMF-WDSKDSINSA-N Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO PBUXMVYWOSKHMF-WDSKDSINSA-N 0.000 description 2
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 2
- SBMNPABNWKXNBJ-UHFFFAOYSA-N Serinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CO SBMNPABNWKXNBJ-UHFFFAOYSA-N 0.000 description 2
- 102100001172 TPPP Human genes 0.000 description 2
- CUTPSEKWUPZFLV-UHFFFAOYSA-N Threoninyl-Cysteine Chemical compound CC(O)C(N)C(=O)NC(CS)C(O)=O CUTPSEKWUPZFLV-UHFFFAOYSA-N 0.000 description 2
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 2
- NQIHMZLGCZNZBN-PXNSSMCTSA-N Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)N)C(O)=O)=CNC2=C1 NQIHMZLGCZNZBN-PXNSSMCTSA-N 0.000 description 2
- KBUBZAMBIVEFEI-UHFFFAOYSA-N Tryptophyl-Histidine Chemical compound C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 KBUBZAMBIVEFEI-UHFFFAOYSA-N 0.000 description 2
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 2
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 2
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 2
- YSGSDAIMSCVPHG-YUMQZZPRSA-N Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C YSGSDAIMSCVPHG-YUMQZZPRSA-N 0.000 description 2
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 230000002860 competitive Effects 0.000 description 2
- 238000002856 computational phylogenetic analysis Methods 0.000 description 2
- 230000037029 cross reaction Effects 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001747 exhibiting Effects 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 2
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 2
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- 108010008671 glycyl-tryptophyl-methionine Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 108010034507 methionyltryptophan Proteins 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 230000003287 optical Effects 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010073101 phenylalanylleucine Proteins 0.000 description 2
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 230000002194 synthesizing Effects 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N (2S)-1-[2-[[(2S)-2-azaniumylpropanoyl]amino]acetyl]pyrrolidine-2-carboxylate Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- RGDKRCPIFODMHK-HJWJTTGWSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-aminopropanoyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-(1H-imidazol-5-yl)propanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RGDKRCPIFODMHK-HJWJTTGWSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N (2S)-2-[[(2S,3R)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]propanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 1
- FSHURBQASBLAPO-WDSKDSINSA-N Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)N FSHURBQASBLAPO-WDSKDSINSA-N 0.000 description 1
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- ALZVPLKYDKJKQU-XVKPBYJWSA-N Ala-Tyr Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ALZVPLKYDKJKQU-XVKPBYJWSA-N 0.000 description 1
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 1
- ROWCTNFEMKOIFQ-YUMQZZPRSA-N Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N ROWCTNFEMKOIFQ-YUMQZZPRSA-N 0.000 description 1
- 229960001230 Asparagine Drugs 0.000 description 1
- 241000020089 Atacta Species 0.000 description 1
- 241000726103 Atta Species 0.000 description 1
- 241000282556 Cercocebus atys Species 0.000 description 1
- 229920000453 Consensus sequence Polymers 0.000 description 1
- ZSRSLWKGWFFVCM-WDSKDSINSA-N Cys-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O ZSRSLWKGWFFVCM-WDSKDSINSA-N 0.000 description 1
- HAYVTMHUNMMXCV-UHFFFAOYSA-N Cysteinyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CS HAYVTMHUNMMXCV-UHFFFAOYSA-N 0.000 description 1
- LVNMAAGSAUGNIC-UHFFFAOYSA-N Cysteinyl-Histidine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 LVNMAAGSAUGNIC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 102100011545 GGT2 Human genes 0.000 description 1
- 101700064794 GGT2 Proteins 0.000 description 1
- 241000560056 HIV-1 group O Species 0.000 description 1
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 1
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- 241000714259 Human T-lymphotropic virus 2 Species 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 101700012498 JOIN Proteins 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- 101700021119 LEUC Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000581002 Murex Species 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 1
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 108060006943 RdRp Proteins 0.000 description 1
- 101710042981 SHMT1 Proteins 0.000 description 1
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 1
- 241000532784 Thelia <leafhopper> Species 0.000 description 1
- OHGNSVACHBZKSS-KWQFWETISA-N Trp-Ala Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](C)C([O-])=O)=CNC2=C1 OHGNSVACHBZKSS-KWQFWETISA-N 0.000 description 1
- SMDQRGAERNMJJF-UHFFFAOYSA-N Tryptophyl-Cysteine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CS)C(O)=O)=CNC2=C1 SMDQRGAERNMJJF-UHFFFAOYSA-N 0.000 description 1
- OYOQKMOWUDVWCR-RYUDHWBXSA-N Tyr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OYOQKMOWUDVWCR-RYUDHWBXSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000001058 adult Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 230000036436 anti-hiv Effects 0.000 description 1
- 230000000798 anti-retroviral Effects 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000020411 cell activation Effects 0.000 description 1
- 230000001413 cellular Effects 0.000 description 1
- 238000007374 clinical diagnostic method Methods 0.000 description 1
- 238000010192 crystallographic characterization Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drugs Drugs 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 230000002727 hyperosmolar Effects 0.000 description 1
- 230000002458 infectious Effects 0.000 description 1
- 238000009114 investigational therapy Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000000869 mutational Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000000803 paradoxical Effects 0.000 description 1
- 230000001991 pathophysiological Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000001105 regulatory Effects 0.000 description 1
- 108010004093 retinal S antigen peptide M Proteins 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- DXJZITDUDUPINW-UHFFFAOYSA-N γ-glutamyl-Asparagine Chemical compound NC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O DXJZITDUDUPINW-UHFFFAOYSA-N 0.000 description 1
Abstract
La presente invención se refiere a cepas retrovirales del grupo de VIH-1 que no es del grupo M, ni del O, en particular una cepa designada YBF30, sus fragmentos y también sus usos como un reactivo de diagnóstico y un agente inmunogénico. Los virus de VIH-1 que difieren tanto del grupo M y del grupo O, exhiben las siguientes características:*poca o ninguna reactividad serológica con respecto a las proteínas de los grupos M y O y fuerte reactividad serológica con respecto a las proteínas que se derivan de la cepa YBF30 de acuerdo con la invención o la cepa VIS de CPZGAB;*ausencia de la amplificación genómica cuando se usan iniciadores en las regiones env y gag y los grupos de VIH-1 de M y O;*amplificación genómica en presencia de los iniciadores que se derivan de la cepa YBF30, de acuerdo con la invención;homología de los productos del gen de cubierta que es mayor al 70%con respecto a la de la cepa YBF30.
Description
CEPAS DE VIH-1 QUE NO SON DEL GRUPO M, NI SON DEL GRUPO O, FRAGMENTOS Y USO
La presente invención se refiere a cepas retrovirales del grupo de VIH- 1 que no son del grupo M, ni son del grupo O, en particular una cepa designada YBF30, a sus fragmentos y a sus usos como un reactivo de diagnóstico y como un agente inmunogénico. El virus de inmunodeficiencia adquirido humano VIH-1 y VIH-2 son retrolentivirus, dichos virus se encuentran en un gran número de primates Africanos. Estos virus parecen tener un antecesor común ; sin embargo, es un difícil prejuzgar el período en el cual estos diferentes virus se separan de su precursor. Otros virus que son más distantes, pero que no pertenecen al mismo grupo, se encuentran en otros mamíferos (ungulados y felinos) . Todos estos virus están asociados con infecciones larga; una ausencia de síntomas es la regla en monos que se infectan de manera natural. Mientras que el origen de VIH-2 parece ser claro tomando en cuenta esta fuerte homología con el virus de Sooty Mangabey (África Occidental), no se ha encontrado ningún virus estrechamente relacionado con VI H-1 en monos. Los virus más estrechamente relacionados son los virus encontrados en dos chimpancés (VIS de CPZGAB, VIS de ANT). Se ha encontrado que todos los lentivirus exhiben variabilidad genética substancial y el estudio filogenético de estas variantes, obtenido de un número de diferentes lugares geográficos, ha permitido que se distingan 8 subtipos diferentes (ciados) de VI H-1 , todos lo cuales son equidistantes uno del otro. Los ciados únicamente son una representación matemática de la expresión de la variabilidad: análisis fenéticos, que se basa en ios aminoácidos en lugar de en los ácidos nucleicos, da diferentes resultados (Korber y otros, 1994) . La demostración de subtipos es de acuerdo con un análisis filogenético el cual hasta la fecha no ha tenido ninguna correlación patofisiológica pero, en su lugar, si ha tenido una correspondencia geográfica. Esto se debe a que cada subtipo principalmente se encuentra en un área geográfica particular. El subtipo B es predominante en Europa y en los Estados Unidos mientras que dos subtipos, es decir E y B, se encuentran en Tailandia y hay una fuerte correlación entre el modo de transmisión el cual, de hecho, corresponde a una población particular y al subtipo encontrado. Todos los ciados se han encontrado en África y su distribución a través del resto del mundo refleja una probabilidad de encontrarse entre personas indulgentes con comportamiento de alto riesgo. El ciado principal, el cual es principal debido a que está presente en proporciones substanciales en África, es el ciado A. Un grado bastante mayor de variabilidad se ha encontrado en algunos países Africanos (G. Myers, 1994; P. M. Sharp y otros, 1994). Se han caracterizado varios subtipos en los países del África Occidental Central tal como en la República Africana Central (Murphy y otros, 1993) y Camerún (Nkengasong y otros, 1994). Finalmente, se han caracterizado pacientes quienes son portadores de variantes virales de VIH-1 , cuyos sueros han tenido problemas de detección por equipos particulares que se encuentran en el mercado Francés y cuyos grupos confirmatorios en el Occidente han sido atípicos (Loussert-Ajaka y otros, 1994; Simón y otros, 1994; Solicitud Internacional de PCT WO 96/27013). El análisis de estas variantes ha confirmado el hecho de que los virus de VI H tipo 1 deben subdividirse en dos grupos, es decir, el grupo M (principal) y un grupo O (aislado), el cual incluye estos aislados, como lo ha propuesto Charneau y otros, 1994. El análisis de la relación de mutaciones sinónimas/mutaciones no sinónimas llevado a cabo en las secuencias de los virus del grupo O conocido indica que este grupo nuevo también es antiguo, aún si no es más antiguo que el grupo M (Loussert-Ajaka y otros, 1995). Su baja prevalencia hasta la fecha, es decir 8% de pacientes infectados con VI H-1 en Camerún (Zekeng y otros, 1994) y 18 casos caracterizados en Francia, se piensa que se debe a factores que son puramente epidemiológicos. Estos grupos de VI H-1 forman un árbol el cual tiene la forma de una estrella doble (Figuras 9 a 19). Dos aislados, es decir, VIS de GPZGAB, caracterizado de un chimpancé de Gabón (Huet y otros, 1990) y VIS de CPZANT, caracterizado de un chimpancé en el Zoológico de Antwerp, tiene secuencias de organizaciones genéticas que están relacionadas muy estrechamente con VI H- 1 pero que no caen en cualquiera de estos dos grupos y forman dos nuevas ramas en el árbol filogenético. La demostración de nuevas variantes es importante para desarrollar reactivos suficientemente sensibles y específicos para detectar infecciones por VI H , es decir reactivos que no conducen a resultados falsos-negativos o falsos-positivos o para desarrollar composiciones que protegen con respecto a los subtipos que no pertenecen al grupo M o al grupo O . Consecuentemente, el solicitante por sí mismo tiene el objetivo de proveer una cepa que no pertenece al grupo M o al grupo O, así como secuencias derivadas de esta cepa, que son adecuadas para detectar variantes de VH I- 1 que no pertenecen al grupo M o al grupo O y que no conducen obtener resultados que son falsos-negativos o falsos-positivos. Con el fin de hacer esto los inventores, en particular han establecido un algoritmo para diferenciarse entre ellos y confirmar las infecciones de VI H- 1 del grupo M y g rupo O , permitiendo así seleccionar las variantes que no pertenecen al grupo M o al grupo O. La presente invención se refiere a una cepa de VI H- 1 que no pertenece al grupo M o al grupo O que exhibe características morfológicas e inmunológicas de los retrovirus que se depositaron el 2 de Julio 1 996 bajo el número 1- 1753 (designado YB F30) en la Colección Nacional de Cultivos de Microorganismos , comprendida en el Instituto Pasteur.
Se entiende que la variante que no es M, ni es O es un VIH tipo 1 que no puede ser reconocido serológica y molecularmente por pertenecer a cualquiera de estos grupos. La presente invención también se refiere a la secuencia completa de nucleótidos de la cepa como se definió antes (SEQ ID No. 1) así como a fragmentos de ácidos nucleicos que por lo menos son de 10 nucleótidos de tamaño y que se derivan de dicha cepa. Los fragmentos de este tipo que se pueden mencionar son: -YBF 30 LTR (SEQ ID No.2), -YBF 30 GAG (SEQ ID No. 3) (gen gag), -YBF 30 POL (SEQ ID No. 5) (gen pol), -YBF 30 VIF (SEQ ID No. 7) (gen vif), -YBF 30 VPR (SEQ ID No. 9) (gen vpr) -YBF 30 VPU (SEQ ID No. 11) (gen vpu), -YBF 30 TAT (SEQ ID No. 13) (gen tat), -YBF 30 REV (SEQ ID No. 15) (gen rev), -YBF 30 ENV gp160 (SEQ ID No. 17) (gen env), -YBF 30 NEF (SEQ ID No. 19) (gen nef) -las SEQ ID Nos. 21-57, también designadas, respectivamente, YLG, LPBS.1, GAG Y AS1.1, GAG Y AS1, GAG 6, GAG Y S1, GAG Y S1.1, GAG Y S1.2, YRT AS1.3, YRT AS1.2, YRT AS1.1, YRT 2, YRT AS1, YRT 2.1, YRT 2.2, YRT 2.3, YRT 2.4, 4481-1, 4481-2, 4235.1, 4235.2, 4235.3, 4235.4, SK69.6, SK69.5, SK69.4, SK69.3, SK69.2, SK69.1, SK68.1, SK68.2, SK68.3, LSI, AS1.3, LSI AS1.2, LSI AS1.1, LSI A1, YLPA, así como cualquier secuencia que no es idéntica a una de las secuencias de nucleótidos anteriores o no es complementaria a una de estas secuencias pero sin embargo es capaz de hibridizarse específicamente con una secuencia de ácidos nucleicos derivada de un virus VI H-1 que no es del grupo M, ni del grupo O. Dichas secuencias se pueden usar en la identificación específica de un VIH-1 que no es M, ni es O, y como reactivos de diagnósticos, ya sean solos o combinados con otros reactivos, para la identificación diferencial de cualquier VI H-1 . Estas secuencias, en particular, se pueden emplear en pruebas de diagnóstico que comprenden una hibridización directa con la secuencia viral que será detectada o una amplificación de dicha secuencia viral, con estas pruebas usando, como iniciadores o como sondas, un oligonucleótido que comprende por lo menos 10 nucleótidos y que se incluye en cualquiera de las secuencias anteriores, en particular una de las secuencias mencionadas antes, SEQ I D Nos. 21 -57. La presente invención también se refiere a virus de VIH-1 que se caracterizan porque difieren del grupo M y del grupo O y exhiben las siguientes características: poca o ninguna reactividad serológica con respecto a las proteínas de los grupos M y O y fuerte reactividad serológica con respecto a proteínas que se derivan de la cepa YBF30 o la cepa VIS de CPZGAB;
ausencia de amplificación genómica cuando se usan iniciadores en las regiones env y gag de virus VIH-1 y de los grupos M y O; amplificación genómica en presencia de iniciadores que se derivan de la cepa YBF30, como se definió antes; y homología de los productos del gen de cubierta que es >70% con respecto a la cepa YBF30. La invención también se refiere al uso de las secuencias descritas antes para implementar un método de hibridización y/o amplificación de genes de las secuencias de ácidos nucleicos del tipo de VIH-1 , estos métodos siendo aplicables en el diagnóstico in-vitro de la infección potencial de un individuo con un virus del tipo de VI H-1 que no es M, ni es O. Este método de diagnóstico in-vitro se llevó a cabo usando una muestra biológica (suero o linfocito circulantes) y comprende. . un paso de extraer el ácido nucleico el cual será detectado y que pertenece al genoma del virus, dicho virus posiblemente puede estar presente en la muestra biológica, y, en donde es apropiado, un paso para tratar el ácido nucleico usando una transcriptasa inversa, si este ácido nucleico está en forma de ARN. . por lo menos un ciclo que comprende los pasos de desnaturalizar el ácido nucleico, de hibridizarlo con por lo menos una secuencia de acuerdo con la invención y en donde es apropiado, extender el híbrido, el cual se ha formado en presencia de reactivos adecuados (agente de polimerización, tal como ADN polimerasa y d NTP) , y . u n paso para detectar la presencia posible del ácido nucleico que pertenece al genoma de un virus del tipo de VI H- 1 que no es M , ni es O. Las siguientes condiciones se emplean para la RCP usando los i niciadores derivados de la cepa YBF30: - extraer el AD N linfocítico por medio de la técnica de fenol/cloroformo y cuantificarla por espectrofotometría a una longitud de onda de 260 nm . Todas las amplificaciones se llevaron a cabo usando un termociclizador de Perkin Elmer 2400. - la RCP de 9kb de largo se llevó a cabo usando un equipo de RCP XL (Perkin El mer) de acuerdo con las condiciones del fabricante y usando el d NTP, las soluciones reguladoras provistas y el "iniciador en caliente" de Perkin Elmer; los ciclos de amplificación de este RCP de largo son : . 1 ciclo de desnaturalización durante 2 minutos a 94°C. . después 16 ciclos; 1 5 segundos a 94°C, 1 5 segundos a 55°C, 8 minutos a 68°C, . después 24 ciclos: 1 5 segundos a 94°C, 1 5 segundos a 55°C,
8 minutos a 68°C, agregando 1 5 minutos adicionales (incrementación) a cada ciclo. - las RCP anidadas se llevaron a cabo en los productos de amplificación de los RCP largas. Las condiciones para llevar a cabo las RCP anidadas son la siguientes.
. "Sistema de RCP de Alta Fidelidad Expandido" Solución reguladora de Taq polimerasa y enzima de Boehringer Mannheim de acuerdo con las instrucciones del fabricante, dNTP y "inicio en caliente" de Perkin Elmer, . 200 µmoles de cada dNTP, 20 pmoles de cada iniciador de acuerdo con la invención, 5 µl de ADN, 10 µl de 10 x solución reguladora de RCP y 2.6 unidades de Taq polimerasa en un volumen de 100 µl. . amplificación: un ciclo de 2 minutos a 94°C seguido por 38 ciclos: 15 segundos a 94°C, 15 segundos a 55°C, un tiempo de elongación a 72°C que varía de acuerdo con el tamaño del producto de RCP que será amplificado (de 30 segundos a 2 minutos) y un ciclo de elongación final de 10 minutos a 72°C. El producto amplificado preferiblemente se detecta por secuenciación directa. La invención también se refiere a un péptido o un fragmento del péptido que se caracteriza por que se puede expresar una cepa de VI H-1 que no es del grupo M, ni del O usando una secuencia de nucleótidos como se definió antes, y porque es capaz de: (1 ) reconocerse por anticuerpos que se inducen por un virus de VI H- 1 que no es del grupo M, ni del O, como se definió antes, en particular la cepa YBF30 o una variante de esta cepa, y que está presente en una muestra biológica que se obtiene después de una infección con una cepa de VI H-1 que no es M, ni es O, y/o (2) de inducir la producción de anticuerpos de VI H-1 anti-grupos que no son M ni O.
Los péptidos de este tipo que se pueden mencionar son, en particular, aquellos que se derivan de la cepa YBF30, en particular: aquella se expresa por el gen gag (SEQ ID No. 4), aquellos que se expresan por el gen pol (SEQ ID No. 6), aquellos que se expresan por el gen vif (SEQ ID No. 8), aquellos que se expresan por el gen vpr (SEQ ID No. 12), aquellos que se expresan por el gen tat (SEQ ID No. 14), aquellos que se expresan por el gen rev (SEQ ID No. 16), aquellos que se expresan por el gen env (SEQ ID No. 18), o uno de sus fragmentos tales como un fragmento de la región del bucle V3, es decir, CTRPGNNTGGQVQIGPAMTFYNIEKIVGDIRQAYC (SEQ ID No. 58), y que se expresan por el gen nef (SEQ ID No. 20), o un fragmento de estos péptidos que son capaces de reconocer los anticuerpos que se producen durante una infección con un VIH-1 que no es del grupo M, ni del O como se definió antes. La invención también se refiere a composiciones inmunogénicas que comprenden uno o más productos de traslación de las secuencias de nucleótidos de acuerdo con la invención y/o uno de los péptidos como se definió antes, obtenido, en particular, por medios sintéticos. La invención también se refiere a los anticuerpos que se dirigen contra uno o más de los péptidos descritos antes y a su uso para implementar métodos para el diagnóstico diferencial, en particular in-vitro, de la infección de un individuo con un virus del tipo de VIH-1 que usa métodos que son conocidos por los expertos.
La presente invención abarca todos los péptidos que son capaces de reconocerse por anticuerpos que se aislan de suero infeccioso, el cual se obtiene después de una infección con una cepa de VI H-1 que no es del grupo M, ni del O y los péptidos que son capaces de reconocerse por un anticuerpo de acuerdo con la invención. La invención además se refiere a un método para el diagnóstico in-vitro de un virus de VIH-1 que no es del grupo M, ni del O, cuyo método se caracteriza por que comprende hacer que una muestra biológica, la cual se ha tomado de un paciente, se ponga en contacto con anticuerpos de acuerdo con la Reivindicación 10, que posiblemente se puede combinar con anticuerpos de anti-VIS de CPZGAB y detectar los complejos inmunológicos que se forman entre los antígenos de VIH-1 , que posiblemente estén presentes en la muestra biológica, y dichos anticuerpos. La invención también se refiere a un equipo para diagnosticar VI H-1 , cuyo equipo se caracteriza por que incluye por lo menos un reactivo de acuerdo con la invención . Aparte de las provisiones que se han descrito antes, la invención también comprende otras provisiones que serán evidentes a partir de la siguiente descripción y que se refiere a ejemplos para implementar el método que es el tema de la presente invención y también los dibujos anexos, en los cuales: -Las Figuras 1 a 7, ilustran la ubicación de los diferentes iniciadores en el genoma de la cepa YBF30;
-La Figura 8, ilustra la organización genómica de la cepa YBF30; -Las Figuras 9 a 16, describen el análisis filogenético de diferentes genes de la cepa YBF30 comparado con el grupo de VIH- 1 M y el grupo de VIH-1 O (Figura 9: gen Itr, Figura 10, gen gag, Figura 1 1 : gen tat, Figura 12: gen rev, Figura 13: gen vif, Figura 14: gen env gp120, Figura 15: gen env gp41 , Figura 16: gen net, Figura 17: gen pol, Figura 18: gen vpr, Figura 19: gen vpu); -La Figura 20, ilustra la distancia genética porcentual entre YBF30 y VI H-1 /VIS de VIS DE CPZGAB. Desde luego, se deberá entender, sin embargo, que estos ejemplos se dan únicamente a manera de ilustrar el tema principal de la invención, lo cual no constituye ninguna limitación de ninguna manera. EJEMPLO: Obtener una variante de VIH-1 que no es M, ni es O de acuerdo con la invención (YBF30) y sus usos. En particular, esto fue posible en relación con el estudio de epidemiología de infección con virus de inmunodeficiencia adquirido en humanos (VIH) en Camerún, lo cual epidemiológicamente es especialmente paradójico. En este país, la diversidad de las cepas es notoria dado que se han reportado la mayoría de los subtipos del grupo M (principal) de virus de VI H-1 conocidos hasta la fecha. Los casos de infección con virus de VIH-1 altamente divergentes del grupo O (O para aislado) se han reportado, casi exclusivamente en pacientes de origen Cameroniano. También se han reportado casos de infección con los subtipos de VI H-2, HTLV-1 y HTLV-2 A y B. Tomando como una base los resultados de las valoraciones serológicas y genotípicas, los inventores establecieron un algoritmo para diferenciar y confirmar infecciones con virus de VI H-1 de los grupos M y O con el fin de seleccionar variantes que no son del grupo M ni del O. Estos métodos se aplicaron a muestras que se enviaron al Laboratorio de Referencia Nacional para infecciones de VIH en Yaoundé y se hizo posible caracterizar un aislado de VI H altamente divergente y definir las herramientas para caracterizar un nuevo grupo de VI H-1 , tomando en cuenta las homologías que se observaron entre esta cepa humana YBF30 y la cepa de simios de VIS de CPZGAB. I- Manera de caracterizar serológicamente la variante de YBF30 durante el estudio epidemiológico. 1 ) Recopilación de muestras: Se estudiaron todos los sueros de pacientes adultos que se enviaron al laboratorio de referencia de Yaoundé en 1994 y 1995 para detectar o confirmar una infección de VI H (n = 8831 ). 2) Diferenciación serológica entre VI H-1 del grupo M y del grupo O, y selección de variantes: Si hubo detección positiva de anticuerpos anti-VI H (mezcla de
EIA de VIH-1 y VIH-2 mezclados indirectamente Génélavia, Sanofi-Pasteur, París, Francia), esto se combinó con una prueba de EIA basada en el principio de competencia con un antígeno específico del grupo M (Wellcozyme Rec H IV-1 , Murex, Dartford, U K) . Si la prueba de VI H-1 de Rec de Wellcozyme competitiva es positiva, con una relación para la reactividad en densidad óptica (DO) con el valor de umbral o de corte (CO) es mayor que 5 (CO/DO
> 5), el suero se consideró por ser VI H-1 positivo, un resultado que deberá confirmarse en una nueva muestra. La elección de una relación de reactividad que es mayor a 5 para considerar la prueba competitiva por ser una prueba para confirmar la infección con VI H-1 está basada en la experiencia adquirida por el laboratorio de virología del hospital de Bichat: las 7200 muestras que reaccionaron con una relación > 5 dieron un análisis de Western de VI H-1 fuertemente positivos (WB, New Lav Blot 1 , SDP, Mames la Coquette). Aparte de los casos de seroconversión con VIH-1 , las muestras que se confirmaron por ser VIH-positivas y que dieron una relación de Wellcozyma de < 5 corresponden a infecciones con VI H-2 o infecciones con VI H-1 del grupo O u otras variantes de VI H-1 . Con el fin de eliminar las reacciones falsas-positivas cuando se llevó a cabo una detección de EIA mezclada, las muestras que dieron una relación de CO/DO < 5 se probaron sistémicamente con una tercera generación de EIA VIH-1 /VI H-2 mezclados (Enzygnost Plus, Marburg, Germany) que incluye antígenos de los grupos de VI H-1 M y O (gp41 recombinante de la cepa MVP5180). Si fue positiva esta prueba, se llevó a cabo entonces una prueba rápida que discrimina el VIH-1 y VIH-2 (Multispot, SDP, Mames la Coquette) y un análisis de Western (WB, New Lav Blot 1 ó 2, SDP). 3) Confirmación serológica de infecciones con variantes de VI H-1 y del grupo O y VIH- 1 Todas las muestras que dieron una relación de CO/DO menor a
, y que se han diferenciado por ser positivas por AW (criterio positivo: 2 ENV +/- POL +/- GAG o 1 ENV + POL +/- GAG) y VI H-1 , se probaron con una prueba de manchas de puntos usando antígenos de péptidos de las regiones V3 y transmembrana (InnoLia, Innogenetics, Ghent, Belgium) . 4) Aislamiento retrovíral de las cepas del grupo O y variantes. Las células mononucleares de sangre periférica (CMSP) de los pacientes seropositivos se aislaron por gradiente de Ficoll-Hypaque en Camerún y se almacenaron y transportaron a París en nitrógeno líquido. Después de congelación, los CMSP de los pacientes se cocultivaron junto con linfocitos de donadores Caucásicos seronegativos. La replicación viral en los sobrenadantes del cultivo se demostró detectando actividad de transcriptasa inversa y llevando a cabo pruebas para detectar el antígeno p24 (p24 policlonal Elavia, SDP) durante un período de un mes. 5) Secuencias: Los productos de RCP se visualizaron en geles de agarosa de una concentración de 1 a 1 .4%, dependiendo del tamaño de los fragmentos, precipitados en 3M de acetato de sodio (1 : 10) y 3 volúmenes de etanol absoluto, se incubaron a -80°C durante 30 minutos y después se centrifugaron a 13, 000 rpm durante 20 minutos. La pella se secó y después se absorbió en 10 µl de agua destilada (Sigma). La purificación se llevó a cabo en un "equipo de Extracción de Gel Qiaquick" (Qiagen) de acuerdo con las instrucciones del fabricante; los productos se secuenciaron en un secuenciador de ADN automático (Applied Biosystems, Inc. , Foster City, CA) usando un equipo Terminador de Colorante de Applied Biosystem, como se describió previamente (Loussert-Ajaka y otros 1995); las secuencias de nucleótidos se analizaron en un software Navegador de Secuencias (Applied Biosystems) y se alinearon usando software GeneWorks. 6) Análisis filogenétícos: Las secuencias se alinearon usando software CLUSTAL para alineaciones múltiples y absorción, como la matriz de referencia, las alineaciones de la recopilación de las secuencias de VI H contenidas por Laboratory of Biology y Theoretical Biophysics, Los Alamos, New México, 87545 USA. Los análisis filogenéticos se llevaron a cabo usando software PHYLI P; las distancias se calcularon en primer lugar usando DNADIST, después de lo cual se llevaron a cabo análisis filogenéticos usando NEIGBOR JOIN I NG o FITCH ; finalmente, los árboles se extrajeron usando DRAWTREE (Figuras 9 a 19). Los porcentajes de distancias genéticas también se muestran en la Figura 20.
SEQBOOT primero que todo se uso para los análisis de "autoarrastre", seguido por DNADIST y N EIGBOR JOI N ING o FITCH . Finalmente, el autoarrastre se obtuvo usando CONSENS. I I - Resultados de la investigación para detectar virus de VI H del grupo O y variantes: Se encontraron que 174 muestras, de 3193 muestras fueron positivas en el tamizado, se consideraron por ser del grupo O o grupo M con reactividad serológica anormal o como variantes. I I I - Detección de una muestra aue no pertenece al grupo O ni al grupo M exhibiendo reactividad serológica 174 sueros que fueron VI H- 1 positivos por AW (Análisis Western) , pero reactivo con una relación de CO/DO de < 5 en el EIA competitivo, se probaron por análisis de puntos LIA diferencial en los péptidos V3 del grupo M, grupo O y VIS de CPZGAB: - 7 no reaccionaron con ninguno de los péptidos representados
(M, O o VIS de CPZGAB). La ausencia de cualquiera activación de células no permite que llegue a ninguna conclusión. - 82 dieron una reactividad con respecto a por lo menos uno de los péptidos que corresponde al bucle V3 o a las cepas del grupo O. La frecuencia de las reacciones cruzadas es baja y restringida a los epítopes que correspondieron a las regiones V3 consensúales (1 1 %) y a las regiones V3 de VIS de CPZGAB (43%). - 84 sueros no reaccionaron con las epítopes del grupo O. La mayoría de estas muestras se obtuvieron de pacientes que exhiben síndrome de SIDA (75/84).
- un suero, que se tomo de un paciente Cameroniano (NJ) reacciona exclusivamente con el péptido de VIS de CPZGAB. Esta reactividad aislada con respecto a un antígeno de VIS de CPZGAB nunca se describió previamente. Dado que los linfocitos se recopilaron del paciente, es posible continuar con la caracterización virológica de esta cepa, que se llamo YBF30. IV - Resultados de los exámenes serológicos y virológicos llevados a cabo en las primeras muestras formadas de este paciente (Mavo 1995) (suero No.: 95-6295). 1) Pruebas de ELISA Comerciales (valor de densidad óptica/umbral) Criterio de positividad: DO/CO > 1 Génélavia = > 15 Wellcozyme CO/DO = 1.55 Abbott Plus = >15 Behring Plus = 4.2 2) Análisis Western AW nuevo de Lav 1 Pasteur: 160+ + , 120 + + , 68 + + , 55 + , 41 + , 40+/-, 34 + + , 24 + + , 18 + 3) Análisis de puntos LIA Intergenéticos Negativo para todas las bandas del grupo O y el grupo M aparte de V3 de VIS de CPZGAB 4) Resultados de los exámenes serológicos de investigación llevados a cabo en péptidos gue son específicos para los grupos de M v O La técnica desarrollada por Profesor Francis Barin de! Virology Laboratory de Tours CH U fue modificada (Barin F. y otros 1996); se usaron péptidos de la región de transmembrana sintetizados (BioMérieux) para desarrollar una prueba de diferenciación entre los grupos de M y O. Esta técnica se basa en competencia de anticuerpo-unión entre los péptidos gp41 de transmembrana de los grupos O y M, que se depositaron en la fase sólida, y péptidos de transmembrana de gp41 ya sea del grupo O o del grupo M a una concentración superior en una fase de reacción de líquidos hiperosmolar. Los resultados se muestran en la siguiente Tabla I , en la cual CP corresponde bien al control de inhibición del 100% y CSP corresponde de inhibición al 0%. Tabla I Resultados de las diferenciaciones entre el grupo O y el grupo M para el suero 6295
Estos resultados demuestran que hay una fuerte unión con respecto a los péptidos de la fase sólida (CSP) y una inhibición notoria debido a la adición combinada de los péptidos de M y O (CP) , pero no hay diferenciación clara por el péptido M o el péptido O. Por lo tanto, es una evidencia serológica que las cepas de infección no pertenecen ni al grupo M ni al grupo O.
En vista de una reactividad aislada en el análisis de puntos InnoLia con respecto a los antígenos V3 de VIS de CPZGAB, sobre las mismas bases de competencia entre los péptidos, se estudio el suero poniendo en competencia a los péptidos de gp41 M gp41 O y VIS de CPZGAB de gp41 . El uso de suero del chimpancé llamado "Amandine" (donado por M. Peeters, quien aisló la cepa de VIS de CPZGAB, SI DA 1992) permitió inicialmente que se validará esta técnica. En la Tabla I I , los valores inferiores (DO) indican el valor más alto de unión a los antígenos. Tabla II Resultados de las diferenciaciones entre el grupo O o grupo M y
VIS de CPZGAB usando suero de Chimpancé de Amandine y el suero 6295
La reactividad del suero de "Amandine" confirma y valida la prueba de acuerdo con la invención y muestra que, mientras el suero del paciente reaccione idénticamente con respecto a los péptidos de M y VIS de CPZGAB, no exhibe una reacción cruzada con el péptido O.
Estos resultados demuestran que los grupos del péptido M gp41 y gp41 de VI S de CPZGAB ejercen una inhibición similar del suero en el suero del paciente. Los antígenos de la cepa infectante dieron origen así a anticuerpos que reconocen a péptidos del grupo M y gp41 de VI S de CPZGA B en una forma similar. 4) Resultados obtenidos del aislamiento de li nfocitos (muestreo de Mavo de 1995) Se aisló un retrovirus usando técnicas normales de linfocitos que se emplearon el 22 de Mayo de 1 995. El cultivo cuando la línea celular MT2 muestra que la cepa YBF30 no forma ningún espacio in icial (NSI) . V - Resultados de los exámenes serológicos llevados a cabo en la segunda muestra de sangre (Noviembre de 1 995) (suero No . 95-3371 ) 1 ) Análisis de puntos LIA de I nnogenética Negativa para todas las bandas , aparte de V3 de VIS de CPZGAB. 2) Resu ltados de los exámenes serológicos de investigación llevados a cabo en los péptidos específicos para los g rupos M y O . La Tabla I I muestra los resultados de diferenciaciones entre el grupo O y el grupo M y gp41 de VIS de CPZGAB usando el suero 3371 . Tabla lll Resultados de las diferenciaciones entre el grupo O o grupo M y VIS de CPZGAB usando el suero 3371
Estos resultados confirman, en esta nueva muestra de sangre (tomado del mismo paciente en la etapa terminal de la enfermedad), que el péptido gp41 de VIS de CPZGAB inhibe notoriamente el suero del paciente. Los antígenos de la cepa de infección, por lo tanto, inducen al anticuerpo que reconoce preferencialmente el péptido gp41 de VIS de CPZGAB. 3) Resultados del aislamiento de linfocitos (el muestreo de sangre de Noviembre de 1995 (95-3371 -YBF31 )). Se aisló un retrovirus, usando técnicas normales de los linfocitos que se muestrearon en Noviembre de 1995 y se llamaron YBF31 ; los elementos de secuencias fueron idénticos a los de YBF30. VI - Amplificación genómica y secuencias de YBF30 El ADN para todas las manipulaciones de RCP, se extrajo de las células obtenidas al final de cultivo positivo. La RCP llevada a cabo usando iniciadores de VI H-1 del grupo O es negativa en las diferentes regiones probadas (faf, pol, env). Similarmente, las llevadas a cabo son de los iniciadores que son específicos para VIH- 1 del grupo M también son negativos.
Las condiciones de amplificación e hibridización para los RCP del grupo O son aquellos descritos en Lossert-Ajaka, 1995. Las condiciones de amplificación e hibridización para las RCP del grupo M son aquellos descritos por los autores citados más adelante. Estos iniciadores del grupo M se localizaron de acuerdo con la secuencia HXBW de VIH-1 como sigue: -en env gp120. ED3/ED12 (posición 5956-5985; 7822-7792), ES5/ED14 (6556-6581; 7690-7931); ED5/ED12; ED3/ED14; ES7/ES8 (7001-7020; 7667-7647) (Delwart y otros, Science 1993; 262: 1257-1261). -En env gp41: primero RCP, ED3/M29, seguido por un RCP anidado, M28/M29 (7785-7808; 8099-8124); M28/M29 tiene las siguientes secuencias: M28: CGGTTCTT(AG)GGAGCAGC(ACT)GGAAGCA, M29: T(CT)T(ACGT)TCCCA(CT)T(AT)(CT)A(AGT)CCA(AGT)GTCAT; SK68/SK69 (Ou y otros, Science, 1988; 239: 295-297). -en gag: Sistemas de Amplicor Roche Diagnostics; iniciadores gag anidados (Loussert-Ajaka y otros, Lancet 1995; 346: 912-913); SK38/SK39 (Ou y otros, Science, 1988; 239: 295-297). -en pol: A/NE1 (Boucher y otros, Lancet, 1990; 336: 585-590);
Pol3/Pol4 (Lauré y otros, Lancet, 1988, ii, 538-541). Solamente las RCP llevadas a cabo usando los iniciadores H
Pol (4235/4538) son positivas, siendo seguido por un RCP anidada usando los iniciadores 4237/4481 (Fransen y otros, Molecular and Cellular Probes 1994; 8: 317-322). Se secuenció este fragmento de H Pol, que se localizó en la integrasa (260 pb) . La amplificación utilizando los iniciadores de H POL y se hizo posible debido al exceso de virus. Esto se debe a que el ADN que se uso se extrajo de células al final del cultivo fuertemente positivo (transcriptasa inversa > 100,000 cpm). No es posible amplificar el ADN que se extrajo de células frescas sin el cocultivo debido al gran número de desigualdades entre los iniciadores de HPOL (especialmente en la región 3') y la secuencia del aislado de YBF30. La conservación de este extremo 3' es muy importante para la actividad de extensión de la polimerasa Taq. 1 - Secuencia del gen pol: con el uso de iniciadores muy degenerados para amplificación, por RT-RCP, el ARN extraído del sobrenadante de cultivo positivo dio una amplificación positiva. Estos son iniciadores que son comunes para todos los retrovirus (Donehower y otros, J . Virol Methods 1990; 28: 33-46) y se localizaron en la región de transcriptasa del gen pol. Los análisis del fragmento después de la secuenciación hicieron posible generar un iniciador específico, es decir, YRT2 (SEQ I D No. 32) , del aislado de YBF30 y para amplificar el gen de pol usando el iniciador Hpol 4481 (Fransen y otros, 1994; loe. cit.) como el iniciador de contrasentido. El fragmento se secuenció sintetizando iniciadores específicos como se requirió para cada fragmento generado (Figura 1 ). 2 - Secuencia del gen de env: el segundo enfoque fue llevar a cabo un RCPIargo (XL-RCP, Perkin Elmer), amplificando así todos los virus (9000 pb) usando los iniciadores situados en LTR: LPBS 1 (SEQ ID NO. 22); LSiGi, seguido por una RCP anidada de 6000 pb usando YRT2 (SEQ I D No. 32)/SK69 y secuenciar toda la cubierta siguiendo el mismo procedimiento. La región de gp41 se secuenció usando una RCP anidada y ampliando los iniciadores SK68/LSiGi . 3 - Secuencia del gen de gag: uso de una RCP anidada, logrado por medio de una RCP larga (LPBS 1 /LSiGi), empleando los iniciadores Gag 5 y Gag 1 1 i y generación a partir de estos iniciadores específicos, según se requiera, con el fin de ir a lo largo del genoma viral. Vi l - Resultados de las secuenciaciones La cepa YBF30 se secuenció completamente (ver lista de secuencias). La cepa YBF31 de Noviembre de 1995 se secuenció en parte, y la ausencia de variación significativa confirma la validez de secuencias de YBF30. VI H - Péptidos de sintetización de la región del bucle V3 de la cepa YBF30. El estudio de las secuencias de la región del bucle V3 hizo posible sintetizar el péptido correspondiente y comparar los aminoácidos de esta región de la cepa YBF30 con aquellas de los subtipos M y cepas O. Las secuencias de los péptidos son: YBF30: SEQ I D No. 58 VIS de CPZGAB: CH RPG N NTRGEVQIGPGMTFYN l ENVYG DTRSAYC (SEQ I D No. 59) GRU PO O: CI RPGN RTYRN LQIGPGMTFYNVEIATGDI RKAFC (SEQ ID No. 60) GRUPO M: CTRPNNNTRKSVRIGPGQAFYATGDIIGDIRQAHC
(SS-TIPO A) (SEQ ID No. 61). El péptido se sintetizó, partiendo con dos asparaginas de la región 5' del bucle, y se uso de acuerdo con el mismo principio de acuerdo como se describió previamente (ver IV 4), a saber en competencia en relación con los péptidos del grupo M, el grupo O y VIS de CPZGAB. Los resultados mostrados en la Tabla IV confirman la naturaleza original de esta cepa y la distribución posible de estas cepas, dado que los resultados serológicos favorecen la infección del tipo YBF30 en Camerún. Además, un estudio de 200 sueros VIH-1 positivo seleccionados de Camerún proveen diferencia de un nuevo caso que exhibe un perfil similar al de YBF30. Tabla IV Estudio de la reactividad dei suero 200
suero de VIS DE CPZ ANT La reactividad de los sueros 953371 y 956295, correspondiente al paciente del cual se aisló la cepa YBF30, con el péptido de VIS de CPZ, se confirmó en esta nueva prueba. La reactividad inferior con respecto a su antígeno V3 es usual durante las últimas etapas de la enfermedad. Sin embargo, esta reactividad sigue siendo mayor que la surgida con respecto al péptido M . Otro paciente Cameroniano (suero 967321 ) exhibe el mismo perfil de la reactividad de péptidos.
Referencias: * Barin F. y otros, Aids Research and Human Retroviruses, 1996, 12, 13, 1279-1289, Diversity of Antibody Binding to V3 Peptides Representing Consensus Sequences of HIV Type 1 Genotypes A to E: An Approach for HIV Type 1 Serological Subtyping. * Chameau P., Borman AM., Quillent C, Guétard D., Chamaret S., Cohén J., Rémy G., Montagnier L., and F. Clavel, Virology, 1994, 205, 247-253, Isolation and envelope sequence of a highly divergent HIV-1 isolate: definition of a new HIV-1 group. * Descamps D., Collin G., Loussert-Ajaka I., Saragosti S., Simón F. And F. Brun-Vezinet. AIDS, 1995, 9, 977-978, HIV-1 group O sensitivity to antiretroviral drugs. * Huet, T., Cheynier R., Meyerhans A., Roelants G., and S. Wain- Hobson, Nature, 1990, 345, 356-359, Genetic organization of a chimpanzee lentivirus related to HIV-1. * Korber BTM., Maclnnes K., Smith R. and G. Myers, J. Virol., 1994, 68, 6730-6744, Mutational trends in V3 loop protein sequences observed in different genetic lineages of HIV-1. * Loussert-Ajaka I., Ly TD., Chaix ML, Ingrand D., Saragosti S., Couroucé AM., Brun-Vezinet F. and F. Simón, Lancet, 1994, 343,
1393-1394, HIV-1/HIV-2 seronegativity in HIV-1 subtype O infected patients. * Loussert-Ajaka I., Chaix ML., Korber B., Letourneur F., Gomas E., Alien E., Ly TD., Brun-Vezinet F., Simón F. and Saragosti, J.
Virol., 1995, 69, 5640-5649, Variability of HIV type 1 group O strains isolated from Cameroonian patients living in FRANCE.
Murphy, E., B. Korber, Georges-Courbot, MC, You B., Pinter A.,
Cook D., Kienky MP., Georges A., Mathiot C, Barré-Sinoussi F., and M. Girard, AIDS Res. Hum. Retroviruses, 1993, 9, 997-1006,
Diversity of V3 región sequences of human immunodeficiency viruses type 1 from the Central African Republic. G. Myers, Aids Res. Hum. Retrovir., 1994, 10, 11, 1317-1324,
Tenth Anniversary Perspectives on AIDS. Nkengasong, J.N., Janssens W., Heyndrickx L., Fransen K.,
Ndumbe PM., Motte J., Leonaers A., Ngolle M., Ayuk J., Piot P., and G. Van der Groen, AIDS, 1994, 8, 1405-1412, Genotypic subtypes of HIV-1 in Cameroon. Sharp P.M. y otros., AIDS, 1994, 8, suppl. 1, S27-S42, Origins and diversity of human immunodeficiency viruses. Simón, F., T.D. Ly, A. Baillou-Beaufils, V. Schneider-Fauveau, J.
De Saint-Martin, I. Loussert-Ajaka, M.L. Chaix, S. Saragosti,
A.M. Couroucé, D. Ingrand, C. Janot, and F. Brun-Vezinet. AIDS,
1994, 8, 1628-1629. Sensitivity of screening kits for anti-HIV-1 subtype O antibodies. Zekeng, L., L. Gurtler, E. Afane Ze, A. Sam-Abbenyi, G. Mbouni,
Essomba, E. Mpoudi-Ngolle, M. Monny-Lobbe, J.B. Tapko, and L.
Kaptue, AIDS, 1994, 8, 1626-1628, Prevalence of HIV-1 subtype
O infection in Cameroon: preliminary results.
Como es evidente a partir de lo anterior, la invención no se limita de ninguna manera por estas modalidades que se han descrito más explícitamente. Al contrario, abarca todas las variantes que puedan surgir para la persona experta sin alejarse del contexto o alcance de la presente invención .
LISTA DE SECUENCIAS (1) INFORMACIÓN GENERAL: (i) SOLICITANTE (A) NOMBRE: INSTITUT NATIONAL DE LA SANTE Y OTROS DE LA RECHERCHE MEDÍCALE - INSERM (B) CALLE: 101 rué DE TOLBIAC (C) ESTADO: PARÍS (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 75654 CEDEX 13
(A) NOMBRE: PUBLIQUE-HOSPITAUX DE PARÍS (B) CALLE: 3 avenue Victoria (C) ESTADO: PARÍS (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 75100 RP
(A) NOMBRE: INSTITUT PASTEUR (B) CALLE: 28 rué du Docteur Roux (C) ESTADO: PARÍS (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 75724 Cédex 15
(A) NOMBRE: MAUCLERE Phillippe (B) CALLE: 2 rué Buhan (C) ESTADO: BODEAUX (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 33000
(A) NOMBRE: LOUSSERT-AJAKA Iblissam
(B) CALLE: 26 avenue de la République (C) ESTADO: SARTROUVILLE (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 78500
(A) NOMBRE: SIMÓN Francois (B) CALLE: 8 rué Germain Pilón (C) ESTADO: PARÍS (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 75018
(A) NOMBRE: SARAQOSTI Sentob (B) CALLE: 69 bis rué de Billancourt (C) ESTADO: BOULOGNE BILLANCOURT
(E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 92100
(A) NOMBRE: BARRE-SINOUSSI Francoise
(B) CALLE: 104 Le Carpicorne, 50 rué d'Erevan
(C) ESTADO: ISSY LES MOULINEAUX (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 92130 (ii) TITULO DE LA INVENCIÓN: CEPAS DE VIH-1 QUE NO SON DEL GRUPO M, Ni SON DEL GRUPO O, FRAGMENTOS Y USO (iii) NÚMERO DE SECUENCIAS: 61 (iv) FORMA LEÍBLE POR COMPUTADORA (A) TIPO DE MEDIO: Disco Flexible (B) COMPUTADORA: PC compatible con IBM (C) SISTEMA DE OPERACIÓN: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Reléase #1.0, Versión #1.30 (OEB) (2) INFORMACIÓN PARA SEQ ID NO: 1: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 9183 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 1:
CTTCTCGCTT GTACTGGGTC TCTCTTGCTG GACCAGATTA GAGCCTGGGA GCTCTCTGGC 60 TAGCAGGGAA CCCACTGCTT AAGCCTCAAT AAAGCTTGCC TTGAGTGCTA AAGTGGTGTG 120 TGCCCATCC TTCGGTAACT CTGGTACCTA GAGATCCCTC AGACCATCTA GACTGAGTGA 180 AAAATCTCTA GCAGTGGCGC CCGAACAGGG ACTTGAAAAC GAAAGTAGAA CCGGAGGCTG 240 AATCTCTCGA CGCAGGACTC GGCTCGTTGG TGCACACAGC GAGAGGCGAG GCGGCGGAAG 300 TGTGAGTACG C_AATTTTGAC TGGCGGTGGC CAGAAAGTAG GAGAGAGGAT GGGTGCGAGA 360 GCGTCAGTGT TAACAGGGGG AAAATTAGAT CAATGGGAAT CAATTTATTT GAGACCAGGG 420 GGAAAGAAAA AATACAGAAT GAAACATTTA GTATGGGCAA GCAGGGAGCT GGAAAGATTC 480 GCTTGTAACC CAGGTCTCAT GGACACAGCG GACGGCTGTG CCAAGTTACT AAATCAATTA 540 GAACCAGCTC TCAAGACAGG GTCAGAAGAA CTGCGCTCTT TATATAACGC TCTAGCAGTT 600 CTTTATTGTG TCCATAGTAG GATACAGATA CACAACACAC AGGAAGCTTT GGACAAGATA 660 AAAGAGAAAC AGGAACAGCA CAAGCCCGAG CCAAAAAACC CAGAAGCAGG GGCAGCGGCA 720 GCAACTGATA GCAATATCAG TAGGAATTAT CCTCTAGTCC AGACTGCTCA AGGACAAATG 780 GTACATCAGC CGCTGACACC CAGAACCTTA AATGCTTGGG TGAAAGTGAT AGAGGAGAAG 840 GCCTTTAGTC CAGAAGTAAT ACCAATGTTT ATGGCCTTGT CAGAAGGGGC AACGCCCTCA 900 GATCTAAATA CTATGTTAAA TACAGTAGGG GGACATCAGG CAGCAATGCA GATGCTGAAG 960 GAAGTCATCA ATGAGGAAGC AGCAGACTGG GATAGGACAC ATCCAGTCCC TGTGGGACCA 1020 CTACCCCCAG GGCAACTGAG AGACCCTAGA GGAAGTGATA TAGCAGGAAC AACTAGCACC 1080 CTGGCAGAAC AGGTGGCTTG GATGACTGCT AATCCTCCTG TTCCAGTAGG AGATATTTAT 1140 AGAAGATGGA TAGTCCTGGG GTTAAACAGA ATTGTGAGAA TGTATAGTCC TGTCAGCATT 1200 CTAGAGATCA AACAAGGACC AAAAGAACCC TTCAGAGACT ATGTAGACAG GTTCTACAAA 1260 ACTCTAAGAG CAGAGCAGGC AACACAGGAA GTAAAGAATT GGATGACAGA AACACTCTTA 1320 GTACAAAATG CAAACCCAGA TTGTAAACAG CTCCTAAAAG CATTAGGGCC AGGAGCTACC 1380 TTAGAAGAGA TGATGACGGC CTGCCAGGGA GTGGGGGGAC CAGCACATAA GGCAAGAGTG 1440
CTAGCAGAGG CTATGTCACA GGTGCAGCAG CCAACAACTA GTGTCTTTGC ACAAAGGGGA 1500 AACTTTAAAG GCATAAGGAA ACCCATTAAA TGTTTCAATT GTGGCAAAGA GGGCCATTTG 1560 GCAAGAAACT GTAAGGCCCC TAGAAGAGGA GGCTGTTGGA AGTGTGGGCA AGAAGGACAT 1620 CAAATGAAAG ATTGTAAAAA TGAAGGAAGA CAGGCTAATT TTTTAGGGAA GAGCTGGTCT 1680 CCCTTCAAAG GGAGACCAGG AAACTTCCCC CAGACAACAA CAAGGAAAGA GCCCACAGCC 1740 CCGCCACTAG AGAGTTATGG GTTTCAC-GAG GAGAAGAGCA CACAGGGGAA GGAGATGCAG 1800 GAGAACCAGG AGAGGACAGA GAACTCTCTG TACCCACCTT TAACTTCCCT CAGATCACTC 1860 TTTGGCAACG ACCCGTCATC ACAGTAAAAA TAGGGAAAGA AGTAAGAGAA GCTCTTTTAG 1920 ATACAGGAGC TGATGATACA GTAATAGAAG AGCTACAATT AGAGGGAAAA TGGAAACCAA 1980 AAATGATAGG AGGAATTGGA GGATTTATCA AAGTGAGACA ATATGATAAT ATAACAGTAG 2040 ACATACAGGG AAGAAAAGCA GTTGGTACAG TATTAGTAGG ACCAACACCT GTTAATATTA 2100 TAGGAAGAAA TCTTTTAACC CAGATTGGCT GTACTTTAAA TTTTCCAATA AGTCCTATTG 2160 AAACTGTACC AGTAAAATTA AAACCAGGAA TGGATGGCCC AAAGGTAAAA CAATGGCCTT 2220 TGACAACAGA AAAAATAGAG GCATTAAGAG AAATTTGTAC AGAAATGGAA AAGGAAGGAA 2280 AAATTTCTAG AATAGGGCCT GAGAATCCAT ATAACACTCC AATTTTTGCT ATAAAAAAGA 2340 AAGATAGCAC TAAATGGAGA AAATTAGTAG ATTTCAGGGA ATTAAATAAA AGGACCCAAG 2400 ATTTTTGGGA AGTGCAGCTA GGAATTCCAC ATCCAGCAGG ATTAAAGCAG AAAAAATCAG 2460 TGACAGTTTT GGATGTAGGA GATGCTTATT TTTCATGTCC CTTGGACAAA GATTTTAGAA 2520 AGTATACAGC TTTTACCATA CCTAGTATAA ACAATGAGAC ACCTGGTATT AGATACCAGT 2580 ATAATGTGCT GCCACAAGGC TGGAAAGGGT CACCAGCAAT TTTTCAGAGT ACAATGACAA 2640 AAATTCTAGA ACCATTCAGA GAGAAACATC CAGAGATAAT CATTTACCAG TACATGGATG 2700 ACCTCTATGT GGGATCTGAC TTAGAAGTAG CACAACATAG AGAGGCAGTA GAAGACCTTA 2760 GAGATCATCT TTTGAAGTGG GGCTTTACGA CCCCTGACAA AAAACATCAG AAGGAACCCC 2820 CGTTCCTCTG GATGGGATAT GAACTCCATC CAGACAAATG GACAGTCCAG CCAATAAAGT 2880 TACCAGAAAA GGATGTATGG ACTGTCAATG ATATACAGAA ATTAGTAGGA AAGTTAAATT 2940 GGGCAAGTCA GATCTATCCA GGAATCAGAG TAAAACAGCT CTGTAAATTA ATCAGAGGAA 3000 CCAAAGCTT GACAGAAGTA GTCAACTTTA CAGAAGAAGC AGAATTAGAA CTAGCAGAAA 3060 ACAGGGAGAT ATTAAAAGAA CCCCTGCATG GAGTC ATTA TGACCCAGGA AAAGAATTAG 3120 TAGCAGAAAT TCAAAAGCAA GGACAAGGTC AGTGGACATA TCAGATTTAT CAGGAGTTAC 3180 ATAAAAATTT AAAAACAGGA AAGTATGCAA AAATGAGATC TGCCCATACT AATGATATAA 32 0 AACAGTTAGT TGAAGTGGTA AGGAAAGTGG CAACAGAAAG TATAGTAATT TGGGGAAAGA 3300 CTCCTAAATT TAGATTACCA GTACAAAAGG AAGTGTGGGA GGCATGGTGG ACCGATCATT 3360 GGCAAGCAAC TTGGATTCCT GAGTGGGAAT TTGTCAACAC TCCTCCCCTT GTAAAATTAT 3420 GGTATCAGTT AGAAACAGAG CCAATCAGTG GGGCAGAAAC TTTCTATGTA GATGGAGCAG 3480 CTAATAGGGA AACAAAATTG GGAAAAGCAG GTTTTGTGAC AGATAGGGGA AGACAOAAAG 3540 TGGTCTCTAT TGCAGACACC ACCAATCAAA AGGCTGAGTT ACAAGCTATC CT ATGGCCT 3600 TACAAGAGTC AGGACGGGAT GTAAACATAG TCACTGACTC TCAGTATGCT ATGGGAATAA 3660 TTCATTCACA GCCAGATAAA AGTGAATCAG AATTGGTGAG CCAAATAATA GAAGAGCTCA 3720 TAAAAAAGGA AAGAGTTTAT CTCTCTTGGG TACCTGCACA TAAAGGTATT GGAGGAAATG 3780 AGCAGGTAGA CAAATTAGTT AGCTCAGGAA TTAGAAAAAT ATTATTCCTA GATGGTATAG 3840 AAAAAGCCCA AGAAGATCAT GACAGATATC ACAGCAATTG GAAAGCAATG GCCAGTGATT 3900 TTAACTTACC CCCCATAGTG GCAAAAGAAA TAGTAGCCAG CTGTGACAAA TGCCAGCTAA 3960 AAGGGGAAGC CATGCATGGA CAGGTCAATT GTAGTCCAGG AGTGTGGCAA TTAGATTGTA 4020 CACACTTAGA GGGAAAAATC ATCCTTGTGG CGGTCCATGT GGCCAGTGGC TACTTAGAAG 4080 CAGAAGTTAT TCCTGCAGAG ACAGGACAGG AAACAGCATA TTTTATTTTA AAGTTAGCTG 4140 GAAGATGGCC AGTAAAAGTT ATACACACTG ATAATGGATC CAATTTCACT AGTGCCACTG 4200 TAAAAGCAGC CTGTTGGTGG GCAAATATCA AACAGGAATT TGGGATACCC TACAATCCTC 4260 AAAGTCAGGG AGCAGTAGAG TCCATGAATA AAGAATTAAA GAAAATTATA GGACAAATCA 4320 GAGATCAAGC AGAACATCTA AAGACAGCAG TGCAAATGGC GG TTTCATT CACAATTTTA 4380 AAAGAAAAGG GGGGATTGGG GGGTACACTG CAGGGGAAAG AATAATAGAC ATAATAGCAA 4440 CAGACATACA GAC-VACAAAT TTACAAACAC AAATTTTAAA AGTTCAAAAT TTTCGGGTTT 4500 ATTACAGAGA CAGCAGAGAT CCCATTTGGA AAGGACCAGC CAAACTTCTG TGGAAAGGAG 4560 AAGGGGCAGT GGTAATTCAA GATAACGGGG ATATAAAAGT AGTCCCACGT AGGAAAGCAA 4620 AAATAATTAG GGATTATGGA AAACAGATGG CAGGTGATGG TTGTGTGGCA AGTGGACAGG 4680 ATGAAAATCA GGAAATGGAA TAGCTTAGTA AAACATCATA TGTATGTGTC AAAAAAGGCA 4740 AAAGGATGGT ATTATAGACA TCATTATGAA ACACATCACC CAAAAATAAG TTCAGAAGTA 4800 CATATCCCAG TAGGTCAGGC AAGATTAGTG ACAGTCACTT ATTGGGGGCT AACAACAGGA 4860 GAACAGTCTT GGCATCTAGG ACATGGAGTA TCCATAGAAT GGAGACTAAG AAAATACAAG 4920 ACACAAGTTG ATCCTGAAAT GGCAGACAAG CTAATACATC TTCATTATTT TGATTGTTTT 4980 ACAGCCTCTG CCATAAGGCA AGCGGTCTTA GGGAGACCAG TATTACCTAG GTGTGAATAT 5040 CCAGCAGGGC ACAAACAGGT AGGCACCCTA CAATATCTAG CACTAACAGC CTGGGTGGGA 5100 GCAAAGAAGA GAAAGCCACC CTTACCTAGT GTGACTAAGC TAACAGAAGA TAGATGGAAC 5160 GAGCACCAGA AGATGCAGGG CCACAGAGGG AACCCTATAA TGAATGGGCA CTAGAATTAT 5220 TAGAAGAATT AAAAAATGAA GCTGTGCGCC ATTTTCCAAG GATTTGGCTA CATGGGTTAG 5280 GACAACACAT CTATAACACA TATGGAGACA CCTGGGAGGG GGTAGAGGCA ATTATCAGGA 5340 TACTACAACA ATTACTGTTT ATCCATTATA GGATTGGCTG CCAGCACAGC AGAATAGGGA 5400 TCACTCCTCA AAGGAGAAGG AATGGAACCA GTAGATCCTA GATTAGAGCC CTGGAATCAT 5460 CCAGGAAGCC AACCTAAAAC AGCTTGCAAT AATTGCTATT GTAAAAGATG TTGCTATCAC 5520 TGCTTATATT GCTTCACAAA GAAAGGCTTA GGCATCTCAT ATGGCAGGAA GAAGCGGAGT 5580 CAACGACGAA GAACTCCTCA GAGCAGTAAG AGTCATCAAG ATCTTATACC AGAGCAGTAA 5640 GTAAAACCTG TATATATGCT GTCATTGGGA TTCATAGCGT TAGGAGCAGC AGTTAGCATA 5700 GCAGTAATAG TCTGGGCATT ACTATATAGA GAATATAAGA AAATAAAATT GCAGGAAAAA 5760 ATAAAACACA TAAGACAGAG AATAAGAGAA AGAGAAGAAG ATAGTGGCAA TGAAAGTGAT 5820 GGGGATGCAG AGTGGTTGGA TGGGGATGAA GAGTGGTTGG TTACTCTTCT ATCTTCTAGT 5880 AAGCTTGATC AAGGTAATTG GGTCTGAACA ACATTGGGTA ACAGTGTACT ATGGGGTACC 5940 ' AGTATGGAGA GAAGCAGAGA CAACTCTTTT CTGTGCTTCA GATGCTAAAG CCCATAGTAC 6000 AGAGGCTCAC AACATCTGGG CCACACAAGC ATGTGTTCCT ACTGATCCCA ATCCACAAGA 6060 AGTGCTATTA CCCAATGTAA CTGAAAAATT TAATATGTGG GAAAATAAAA TGGCAGACCA 6120 AATGCAAGAG GATATTATCA GTCTGTGGGA ACAGAGCTTA AAGCCCTGTG TTAAATTAAC 6180 CCCATTATGT GTAACTATGC TTTGTAACGA TAGCTATGGG GAGGAAAGGA ACAATACAAA 6240 TATGACAÁCA AGAGAACCAG ACATAGGATA CAAACAAATG AAAAATTGCT CATTCAATGC 6300 AACCACTGAG CTAACAGATA AAAAGAAGCA AGTTTACTCT CTGTTTTATG TAGAAGATGT 6360 AGTACCAATC AATGCCTATA ATAAAACATA TAGGCTAATA AATTGTAATA CCACAGCTGT 6420 GACACAAGCT TGTCCTAAGA CTTCCTTTGA GCCAATTCCA ATACATTACT GTGCACCACC 6480 AGGCTTTGCC ATTATGAAAT GTAATGAAGG AAACTTTAGT GGAAATGGAA GCTGTACAAA 6540 TGTGAGTACT GTACAATGCA CACATGGAAT AAAGCCAGTG ATATCCACTC AGTTAATCCT 6600 AAATGGAAGC TTAAATACAG ATGGAATTGT TATTAGAAAT GATAGTCACA GTAATCTGTT 6660 GGTGCAATGG AATGAGACAG TGCCAATAAA TTGTACAAGG CCAGGAAATA ATACAGGAGG 6720 ACAGGTGCAG ATAGGACCTG CTATGACATT TTATAACATA GAAAAAATAG TAGGAGACAT 6780 TAGACAAGCA TACTGTAATG TCTCTAAAGA ACTATGGGAA CCAATGTGGA ATAGAACAAG 6840 AGAGGAAATA AAGAAAATCC TGGGGAAAAA CAACATAACC TTCAGGGCTC GAGAGAGGAA 6900 TGAAGGAGAC CTAGAAGTGA CACACTTAAT GTTCAATTGT AGAGGAGAGT TTTTCTATTG 6960 TAACACTTCC AAATTATTTA ATGAGGAATT ACTTAACGAG ACAGGTGAGC CTATTACTCT 7020 GCCTTGTAGA ATAAGACAGA TTGTAAATTT GTGGACAAGG GTAGGAAAAG GAATTTATGC 7080 ACCACCAATT CGGGGAGTTC TTAACTGTAC CTCCAATATT ACTGGACTGG TTCTAGAATA 7140 TAGTGGTGGG CCTGACACCA AGGAAACAAT AGTATATCCC TCAGGAGGAA ACATGGTTAA 7200 TCTCTGGAGA CAAGAGTTGT ATAAGTACAA AGTAGTTAGC ATAGAACCCA TAGGAGTAGC 7260 ACCAGGTAAA GCTAAAAGAC GCACAGTGAG TAGAGAAAAA AGAGCAGCCT TTGGACTAGG 7320 TGCGCTGTTT CTTGGGTTTC TTGGAGCAGC AGGGAGCACT ATGGGCGCAG CGTCAATAAC 7380 GCTGACGGTA CAGGCCCGGA CATTATTATC TGGGATAGTG CAACAGCAGA ATATTCTGTT 7 40 GAGAGCAATA GAGGCGCAAC AACATTTGTT GCAACTCTCA ATCTGGGGC TTAAACAGCT 7500 CCAGGCAAAA GTCCTTGCTA TAGAAAGATA CCTTAGGGAT CAGCAAATCC TAAGTCTATG 7560 GGGCTGCTCA GGAAAAACAA TATGCTATAC CACTGTGCCT TGGAATGAGA CTTGGAGCAA 7620 CAATACCTCT TATGATACAA TCTGGAATAA TTTAACCTGG CAACAATGGG ATGAGAAAGT 7680 AAGAAACTAT TCAGGTGTCA TTTTTGGACT TATAGAACAG GCACAAGAAC AACAGAACAC 7740 AAATGAGAAA TCACTCTTGG AATTGGATCA ATGGGACAGT CTGTGGAGCT GGTTTGGTAT 7800 TACAAAATGG CTGTGGTATA TAAAAATAGC TATAATGATA GTAGCAGGCA TTGTAGGCAT 7860 AAGAATCATA AGTATAGTAA TAACTATAAT AGCAAGAGTT AGGCAGGGAT ATTCTCCCCT 7920 TTCGTTGCAG ACCCTTATCC CAACAGCAAG GGGACCAGAC AGGCCAGAAG AAACAGAAGG 7980 AGGCGTTGGA GAGCAAGACA GAGGCAGATC CGTGCGATTA GTGAGCGGAT TCTCAGCTCT 8040 TGTCTGGGAG GACCTCCGGA ACCTGTTGAT CTTCCTCTAC CACCGCTTGA CAGACTCACT 8100 CTTOATACTG AGGAGGACTC TGGAACTCCT GGGACAGAGT CTCAGCAGGG GACTGCAACT 8160 ACTGAATGAA CTCAGAACAC ACTTGTGGGG AATACTTGCA TATTGGGGAA AAGAGTTAAG 8220 GGATAGTGCT ATCAGCTTGC TTAATACAAC AGCTATTGTA GTAGCAGAAG GAACAGATAG 8280 GATTATAGAA TTAGCACAAA GAATAGGAAG GGGAATAT A CACATACCTA GAAGAATCAG 8 40 ACAAGGCCTA GAAAGAGCAC TGATATAAGA TGGGAAAGAT TTGGTCAAAG AGCAGCCTAG 8400 TAGGATGGCC AGAAATCAGA GAAAGAATGA GAAGACAAAC GCAAGAACCA GCAGTAGAGC 8460 CAGCAGTAGG AGCAGGAGCA GCTTCTCAAG ATCTAGCTAA TCGAGGGGCC ATCACCATAA 8520 GAAATACTAG AGACAATAAT GAAAGTATAG CTTGGCTAGA AGCACAAGAA GAAGAAGAGG 8580 AAGTAGGCTT TCCAGTACGC CCTCAGGTAC CATTAAGGCC AATAACCTAT AAACAGGCTT 8640 TTGATCTTTC CTOCTTTTTA AAAGATAAGG GGGGACTGGA AGGGCTAGTT TGGTCCAGAA 8700 AAAGGCAAGA TATTCTAGAC CTCTGGATGT ATCACACACA AGGCATCCTC CCTGACTGGC 8760 ATAACTACAC ACCAGGGCCA GGAATTAGAT ACCCCGTAAC CTTTGGATGG TGCTTCAAAC 8820 TAGTACCATT GTCAGCTGAA GAAGTAGAAG AGGCTAATGA AGGAGACAAC AATGCCCTCT 8880 TACACCCCAT ATGTCAACAT GGAGCAGATG ATGATCATAA AGAAGTGTTG GTGTGGCGAT 8940 TTGACAGCTC CCTAGCAAGA AGACATGTAG CAAGAGAGCT GCATCCGGAG TTTTACAAGA 9000 ACTGCTGACA AGGGACTTTA CTGCTGACAA GGGACTTTAT ACTTGGGGAC TTTCCGCCAG 9060 GGACTTTCCA GGGAGGTGTG GTTGGGGGAG TGGCTTGCCC TCAGAGC GC ATAAAAGCAG 9120 CCGCTTCTCG CTTGTACTGG GTCTCTCTTG CTGGACCAGA TTAGAGTCTG GGAGCATATT 9180 GGG 9183 (2) INFORMACIÓN PARA SEQ ID NO: 2: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 813 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 2:
TTGGAAGGGC TAGTTTGGTC CAGAAAAAGG CAAGATATTC TAGACCTCTG GATGTATCAC 60
ACACAAGGCA TCCTCCCTGA CTGGCATAAC TACACACCAG GGCCAGGAAT TAGATACCCC 120
GTAACCTTTG GATGGTGCTT CAAACTAGTA CCATTGTCAG CTGAAGAAGT AGAAGAGGCT 180
AATGAAGGAG ACAACAATGC CCTCTTACAC CCCATATGTC AACATGGAGC AGATGATGAT 240
CATAAAGAAG TGTTGGTGTG GCGATTTGAC AGCTCCCTAG CAAGAAGACA TGTAGCAAGA 300
GAGCTGCATC CGGAGTTTTA CAAGAACTGC TGACAAGGGA CTTTACTGCT GACAAGGGAC 360
TTTATACTTG GGGACTTTCC GCCAGGGACT TTCCAGGGAG GTGTGGTTGG GGGAGTGGCT 420
TGCCCTCAGA GCTGCATAAA AGCAGCCGCT TCTCGCTTGT ACTGGGTCTC TCTTGCTGGA 480
CTATACAGAT TAGAGCCTGG GAGCTCTCTG GCTAGCAGGG AACCCACTGC TTAAGCCTCA 540
ATAAATACAG CTTGCCTTGA GTGCTAAAGT GGTGTGTGCC CATCCATTCG GTAACTCTGG 600
TACCTAGAGA ATCCCTCAGA CCATCTAGAC TGAGTGAAAA ATCTCTAGCA GTGGCGCCCG 660
AACAGGGACT TAGTTGAAAA CGAAAGTAGA ACCGGAGGCT GAATCTCTCG ACGCAGGACT 720
CGGCTCGTTG GTGCACACAG CGAGAGGCGA GGCGGCGGAA GTGTGAGTAC GCAATTTTGA 780
CTGGCGGTGG CCAGAAAGTA GGAGAGAGGG AGG 813
(2) INFORMACIÓN PARA SEQ ID NO: 3: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 1539 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (¡x) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..1536 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 3:
ATG GGT GCG AGA GCG TCA GTG TTA ACÁ GGG GGA AAA TTA GAT CAÁ TGG 48 Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gln Trp 1 5 10 15 GAA TCA ATT TAT TTG AGA CCA GGG GGA AAG AAA AAA TAC AGA ATG AAA 96 Glu Ser He Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 20 25 30
CAT TTA GTA TGG GCA AGC AGG GAG CTG GAA AGA TTC GCT TGT AAC CCA 144 His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 35 40 45 GGT CTC ATG GAC ACÁ GCG GAC GGC TGT GCC AAG TTA CTA AAT CAÁ TTA 192 Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gln Leu 50 55 60 GAA CCA GCT CTC AAG ACÁ GGG TCA GAA GAA CTG CGC TCT TTA TAT AAC 240 Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 65 70 75 80
GCT CTA GCA GTT CTT TAT TGT GTC CAT AGT AGG ATA CAG ATA CAC AAC 288 Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg He Gln He His Asn 85 90 95 ACÁ CAG GAA GCT TTG GAC AAG ATA AAA GAG AAA CAG GAA CAG CAC AAG 336 Thr Gln Glu Ala Leu Asp Lys He Lys Glu Lys Gln Glu Gln His Lys 100 105 110 CCC GAG CCA AAA AAC CCA GAA GCA GGG GCA GCG GCA GCA ACT GAT AGC 384 Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 115 120 125 AAT ATC AGT AGG AAT TAT CCT CTA GTC CAG ACT GCT CAÁ GGA CAÁ ATG 432 Asn He Ser Arg Asn Tyr Pro Leu Val Gln Thr Ala Gln Gly Gln Met 130 135 140 (C) FORMA DE H ILO: sencillo (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉCU LA: ADN (genómico) (ix) CARACTE RÍSTICA (A) NOMBRE/CLAVE: CDS (B) U B ICACIÓN : 1 ..1536 (xi) DESCR I PCIÓ N DE LA SECU ENCIA: SEQ I D NO: 3:
ATG GGT GCG AGA GCG TCA GTG TTA ACÁ GGG GGA AAA TTA GAT CAÁ TGG 48 Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gln Trp 1 5 10 15 GAA TCA ATT TAT TTG AGA CCA GGG GGA AAG AAA AAA TAC AGA ATG AAA 96 Glu Ser He Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 20 25 30
CAT TTA GTA TGG GCA AGC AGG GAG CTG GAA AGA TTC GCT TGT AAC CCA 144 His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 35 40 45 GGT CTC ATG GAC ACÁ GCG GAC GGC TGT GCC AAG TTA CTA AAT CAÁ TTA 192 Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gln Leu 50 55 60 GAA CCA GCT CTC AAG ACÁ GGG TCA GAA GAA CTG CGC TCT TTA TAT AAC 240 Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 65 70 75 80
GCT CTA GCA GTT CTT TAT TGT GTC CAT AGT AGG ATA CAG ATA CAC AAC 288 Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg He Gln He His Asn 85 90 95 ACÁ CAG GAA GCT TTG GAC AAG ATA AAA GAG AAA CAG GAA CAG CAC AAG 336 Thr Gln Glu Ala Leu Asp Lys He Lys Glu Lys Gln Glu Gln His Lys 100 105 110 CCC GAG CCA AAA AAC CCA GAA GCA GGG GCA GCG GCA GCA ACT GAT AGC 384 Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 115 120 125 AAT ATC AGT AGG AAT TAT CCT CTA GTC CAG ACT GCT CAÁ GGA CAÁ ATG 432 Asn He Ser Arg Asn Tyr Pro Leu Val Gln Thr Ala Gln Gly Gln Met 130 135 140 GAA ACÁ CTC TTA GTA CAÁ AAT GCA AAC CCA GAT TGT AAA CAG CTC CTA 1008 Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Gln Leu Leu 325 330 335 AAA GCA TTA GGG CCA GGA GCT ACC TTA GAA GAG ATG ATG ACG GCC TGC 1056 Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 340 345 350 CAG GGA GTG GGG GGA CCA GCA CAT AAG GCA AGA GTG CTA GCA GAG GCT 1104 Gln Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 355 360 365 ATG TCA CAG GTG CAG CAG CCA ACÁ ACT AGT GTC TTT GCA CAÁ AGG GGA 1152 Met Ser Gln Val Gln Gln Pro Thr Thr Ser Val Phe Ala Gln Arg Gly 370 375 380 AAC TTT AAA GGC ATA AGG AAA CCC ATT AAA TGT TTC AAT TGT GGC AAA 1200 Asn Phe Lys Gly He Arg Lys Pro He Lys Cys Phe Asn Cys Gly Lys 385 390 395 400
GAG GGC CAT TTG GCA AGA AAC TGT AAG GCC CCT AGA AGA GGA GGC TGT 1248 Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 405 410 415 TGG AAG TGT GGG CA GAA GGA CAT CAÁ ATG AAA GAT TGT AAA AAT GAA 1296 Trp Lys Cys Gly Gln Glu Gly His Gln Met Lys Asp Cys Lys Asn Glu 420 425 430 GGA AGA CAG GCT AAT TTT TTA GGG AAG AGC TGG TCT CCC TTC AAA GGG 1344 Gly Arg Gln Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 435 440 445 AGA CCA GGA AAC TTC CCC CAG ACÁ ACÁ ACÁ AGG AAA GAG CCC ACÁ GCC 1392 Arg Pro Gly Asn Phe Pro Gln Thr Thr Thr Arg Lys Glu Pro Thr Ala 450 455 460 CCG CCA CTA GAG AGT TAT GGG TTT CAG GAG GAG AAG AGC ACÁ CAG GGG 1440 Pro Pro Leu Glu Ser Tyr Gly Phe Gln Glu Glu Lys Ser Thr Gln Gly 465 470 475 480 AAG GAG ATG CAG GAG AAC CAG GAG AGG ACÁ GAG AAC TCT CTG TAC CCA 1488 Lys Glu Met Gln Glu Asn Gln Glu Arg Thr Glu Asn Ser Leu Tyr Pro 485 490 495 CCT TTA ACT TCC CTC AGA TCA CTC TTT GGC AAC GAC CCG TCA TCA CAG 1536 Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gln 500 505 510 TAA 1539
(2) I N FORMAC IÓN PARA SEQ I D NO: 4: (i) CARACTERÍSTICAS DE LA SECUEN CIA (A) LONG ITU D: 512 aminoácidos (B) TI PO: aminoácido (C) FORMA DE H I LO : sencillo (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉC U LA : prote ína (xi) DESCRI PC IÓ N DE LA SECU ENC IA: S EQ I D NO : 4 :
Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gln Trp 1 5 10 15
Glu Ser He Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 20 25 30 His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 35 40 45 Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gln Leu 50 55 60 Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 65 70 75 80- Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg He Gln He His Asn 85 90 95
Thr Gln Glu Ala Leu Asp Lys He Lys Glu Lys Gln Glu Gln His Lys
100 105 110 Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 115 120 125 Asn He Ser Arg Asn Tyr Pro Leu Val Gln Thr Ala Gln Gly Gln Met 130 135 140 Val His Gln Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val 145 150 155 160
He Glu Glu Lys Ala Phe Ser Pro Glu Val He Pro Met Phe Met Ala 165 170 175
Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr 180 185 190 Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Val He Asn 195 200 205 Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro 210 215 220 Leu Pro Pro Gly Gln Leu Arg Asp Pro Arg Gly Ser Asp He Ala Gly 225 230 235 240
Thr Thr Ser Thr Leu Ala Glu Gln Val Ala Trp Met Thr Ala Asn Pro 245 250 255 Pro Val Pro Val Gly Asp He Tyr Arg Arg Trp He Val Leu Gly Leu 260 265 270 Asn Arg He Val Arg Met Tyr Ser Pro Val Ser lie Leu Glu He Lys 275 280 285 Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys 290 295 300 Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met Thr 305 310 315 320
Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Gln Leu Leu 325 330 335
Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 340 345 350 Gln Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 355 360 365 Met Ser Gln Val Gln Gln Pro Thr Thr Ser Val Phe Ala Gln Arg Gly 370 375 380 Asn Phe Lys Gly He Arg Lys Pro He Lys Cys Phe Asn Cys Gly Lys 385 390 395 400
Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 405 410 415
Trp Lys Cys Gly Gln Glu Gly His Gln Met Lys Asp Cys Lys Asn Glu 420 425 430 Gly Arg Gln Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 435 440 445 Arg Pro Gly Asn Phe Pro Gln Thr Thr Thr Arg Lys Glu Pro Thr Ala 450 455 460 Pro Pro Leu Glu Ser Tyr Gly Phe Gln Glu Glu Lys Ser Thr Gln Gly 465 470 475 480
Lys Glu Met Gln Glu Asn Gln Glu Arg Thr Glu Asn Ser Leu Tyr Pro 485 490 495
Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gln 500 505 510
(2) INFORMACIÓN PARA SEQ ID NO: 5: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 3045 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉCU LA: ADN (genómico) (ix) CARACTE RÍSTICA (A) NOMBRE/CLAVE: CDS (B) U BICACIÓN : 1 ..3042 (xi) DESCRI PCIÓ N DE LA SECU ENCIA: SEQ I D NO: 5: TTT TTT AGG GAA GAG CTG GTC TCC CTT CA AGG GAG ACC AGG AAA CTT 48 Phe Phe Arg Glu Glu Leu Val Ser Leu Gln Arg Glu Thr Arg Lys Leu 515 520 525 CCC CCA GAC AAC AAC AAG GAA AGA GCC CAC AGC CCC GCC ACT AGA GAG 96 Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu 530 535 540 TTA TGG GTT TCA GGA GGA GAA GAG CAC ACÁ GGG GAA GGA GAT GCA GGA 144 Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly 545 550 555 560
GAA CCA GGA GAG GAC AGA GAA CTC TCT GTA CCC ACC TTT AAC TTC CCT 192 Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 565 570 575 CAG ATC ACT CTT TGG CAÁ CGA CCC GTC ATC ACÁ GTA AAA ATA GGG AAA 240 Gln He Thr Leu Trp Gln Arg Pro Val He Thr Val Lys He Gly Lys 580 585 590 GAA GTA AGA GAA GCT CTT TTA GAT ACÁ GGA GCT GAT GAT ACÁ GTA ATA 288 Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val He 595 600 605 GAA GAG CTA CAÁ TTA GAG GGA AAA TGG AAA CCA AAA ATG ATA GGA GGA 336 Glu Glu Leu Gln Leu Glu Gly Lys Trp Lys Pro Lys Met He Gly Gly 610 615 620 ATT GGA GGA TTT ATC AAA GTG AGA CAÁ TAT GAT AAT ATA ACÁ GTA GAC 384 He Gly Gly Phe He Lys Val Arg Gln Tyr Asp Asn He Thr Val Asp 625 630 635 640 ATA CAG GGA AGA AAA GCA GTT GGT ACÁ GTA TTA GTA GGA CCA ACÁ CCT 432 He Gln Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 645 650 655 GTT AAT ATT ATA GGA AGA AAT CTT TTA ACC CAG ATT GGC TGT ACT TTA 480 Val Asn He He Gly Arg Asn Leu Leu Thr Gln He Gly Cys Thr Leu 660 665 670 AAT TTT CCA ATA AGT CCT ATT GAA ACT GTA CCA GTA AAA TTA AAA CCA 528 Asn Phe Pro He Ser Pro He Glu Thr Val Pro Val Lys Leu Lys Pro 675 680 685 GGA ATG GAT GGC CCA AAG GTA AAA CAÁ TGG CCT TTG ACÁ ACÁ GAA AAA 576 Gly Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Thr Glu Lys 690 695 700 ATA GAG GCA TTA AGA GAA ATT TGT AC GAA ATG GAA AAG GAA GGA AAA 624 He Glu Ala Leu Arg Glu He Cys Thr Glu Met Glu Lys Glu Gly Lys 705 710 715 720
ATT TCT AGA ATA GGG CCT GAG AAT CCA TAT AAC ACT CCA ATT TTT GCT 672 He Ser Arg He Gly Pro Glu Asn Pro Tyr Asn Thr Pro He Phe Ala 725 730 735 ATA AAA AAG AAA GAT AGC ACT AAA TGG AGA AAA TTA GTA GAT TTC AGG 720 He Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 740 745 750 GAA TTA AAT AAA AGG ACC CAÁ GAT TTT TGG GAA GTG CAG CTA GGA ATT 768 Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly He 755 760 765 CCA CAT CCA GCA GGA TTA AAG CAG AAA AAA TCA GTG ACÁ GTT TTG GAT 816 Pro His Pro Ala Gly Leu Lys Gln Lys Lys Ser Val Thr Val Leu Asp 770 775 780 GTA GGA GAT GCT TAT TTT TCA TGT CCC TTG GAC AAA GAT TTT AGA AAG 864 Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 785 790 795 800 TAT ACÁ GCT TTT ACC ATA CCT AGT ATA AAC AAT GAG ACÁ CCT GGT ATT 912 Tyr Thr Ala Phe Thr He Pro Ser He Asn Asn Glu Thr Pro Gly He 805 810 815 AGA TAC CAG TAT AAT GTG CTG CCA CAÁ GGC TGG AAA GGG TCA CCA GCA 960 Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala 820 825 830 ATT TTT CAG AGT ACÁ ATG ACÁ AAA ATT CTA GAA CCA TTC AGA GAG AAA 1008 He Phe Gln Ser Thr Met Thr Lys He Leu Glu Pro Phe Arg Glu Lys 835 840 845 CAT CCA GAG ATA ATC ATT TAC CAG TAC ATG GAT GAC CTC TAT GTG GGA 1056 His Pro Glu He He He Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly 850 855 860 TCT GAC TTA GAA CTA GCA CAÁ CAT AGA GAG GCA GTA GAA GAC CTC AGA 1104
Ser Asp Leu Glu Leu Ala Gln His Arg Glu Ala Val Glu Asp Leu Arg 865 870 875 880 GAT CAT CTT TTG AAG TGG GGC TTT ACG ACC CCT GAC AAA AAA CAT CAG 1152 Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Aso Lys Lys His Gln 885 890 * 895 AAG GAG CCC CCG TTC CTC TGG ATG GGA TAT GAA CTC CAT CCA GAC AAA 1200 Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 900 905 910 TGG ACÁ GTC CAG CCA ATA AAG TTA CCA GAA AAG GAT GTA TGG ACT GTC 1248 Trp Thr Val Gln Pro He Lys Leu Pro Glu Lys ASD Val Trp Thr Val 915 920 925 AAT GAT ATA CAG AAA TTA GTA GGA AAG TTA AAT TGG GCA AGT CAG ATC 1296
Asn Asp He Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln He 930 935 940 TAT CCA GGA ATC AGA GTA AAA CAG CTC TGT AAA TTA ATC AGA GGA GCC 1344 Tyr Pro Gly He Arg Val Lys Gln Leu Cys Lys Leu He Arg Gly Ala 945 950 955 960
AGA GCT TTG ACÁ GAA GTA GTC AAC TTT ACÁ GAA GAA GCA GAA TTA GAA 1392 Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 965 970 975 CTA GCA GAA AAC AGG GAG ATA TTA AAA GAA CCC CTG CAT GGA GTC TAT 1440 Leu Ala Glu Asn Arg Glu He Leu Lys Glu Pro Leu His Gly Val Tyr 980 985 990 TAT GAC CCA GGA AAA GAA TTA GTA GCA GAA ATT CAÁ AAG CAÁ GGA CAÁ 1488 Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu He Gln Lys Gln Gly Gln 995 1000 1005 GGT CAG TGG ACÁ TAT CAG ATT TAT CAG GAG TTA CAT AAA AAT TTA AAA 1536 Gly Gln Trp Thr Tyr Gln He Tyr Gln Glu Leu His Lys Asn Leu Lys 1010 1015 1020 ACÁ GGA AAG TAT GCA AAA ATG AGA TCT GCC CAT ACT AAT GAT ATA AAA 1584 Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp He Lys 1025 1030 1035 1040
CAG TTA GTT GAA GTG GTA AGG AAA GTG GCA ACÁ GAA AGT ATA GTA ATT 1632
Gln Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser He Val He 1045 1050 1055 TGG GGA AAG ACT CCT AAA TTT AGA TTA CCA GTA CAÁ AAG GAA GTG TGG 1680 Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gln Lys Glu Val Trp 1060 1065 1070 GAG GCA TGG TGG ACC GAT CAT TGG CAÁ GCA ACT TGG ATT CCT GAG TGG 1728 Glu Ala Trp Trp Thr Asp His Trp Gln Ala Thr Trp He Pro Glu Trp 1075 1080 1085 GAA TTT GTC AAC ACT CCT CCC CTT GTA AAA TTA TGG TAT CAG TTA GAA 1776
Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu 1090 1095 1100 ACÁ GAG CCA ATC AGT GGG GCA GAA ACT TTC TAT GTA GAT GGA GCA GCT 1824 Thr Glu Pro He Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 1105 1110 1115 1120
AAT AGG GAA ACÁ AAA TTG GGA AAA GCA GGT TTT GTG ACÁ GAT AGG GGA 1872 Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 1125 1130 1135 AGA CAG AAA GTG GTC TCT ATT GCA GAC ACC ACC AAT CAÁ AAG GCT GAG 1920
Arg Gln Lys Val Val Ser He Ala Asp Thr Thr Asn Gln Lys Ala Glu 1140 1145 1150 TTA CAÁ GCT ATC CTT ATG GCC TTA CAÁ GAG TCA GGA CGG GAT GTA AAC 1968 Leu Gln Ala He Leu Met Ala Leu Gln Glu Ser Gly Arg Asp Val Asn 1155 1160 1165 ATA GTC ACT GAC TCT CAG TAT GCT ATG GGA ATA ATT CAT TCA CAG CCA 2016 He Val Thr Asp Ser Gln Tyr Ala Met Gly He He His Ser Gln Pro 1170 1175 1180 GAT AAA AGT GAA TCA GAA TTG GTG AGC CAÁ ATA ATA GAA GAG CTC ATA 2064 Asp Lys Ser Glu Ser Glu Leu Val Ser Gln He He Glu Glu Leu He 1185 1190 1195 1200
AAA AAG GAA AGA GTT TAT CTC TCT TGG GTA CCT GCA CAT AAA GGT ATT 2112 Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 1205 1210 1215 GGA GGA AAT GAG CAG GTA GAC AAA TTA GTT AGC TCA GGA ATT AGA AAA 2160 Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 1220 1225 1230 ATA TTA TTC CTA GAT GGT ATA GAA AAA GCC CAÁ GAA GAT CAT GAC AGA 2208 He Leu Phe Leu Asp Gly He Glu Lys Ala Gln Glu Asp His Asp Arg 1235 1240 1245 TAT CAC AGC AAT TGG AAA GCA ATG GCC AGT GAT TTT AAC TTA CCC CCC 2256 Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 1250 1255 1260 ATA GTG GCA AAA GAA ATA GTA GCC AGC TGT GAC AAA TGC CAG CTA AAA 2304 He Val Ala Lys Glu He Val Ala Ser Cys Asp Lys Cys Gln Leu Lys 1265 1270 1275 1280
GGG GAA GCC ATG CAT GGA CAG GTC AAT TGT AGT CCA GGA GTG TGG CAÁ 2352
Gly Glu Ala Met His Gly Gln Val Asn Cys Ser Pro Gly Val Trp Gln 1285 1290 1295 TTA GAT TGT ACÁ CAC TTA GAG GGA AAA ATC ATC CTT GTG GCG GTC CAT 2400 Leu Asp Cys Thr His Leu Glu Gly Lys He He Leu Val Ala Val His 1300 1305 1310 GTG GCC AGT GGC TAC TTA GAA GCA GAA GTT ATT CCT GCA GAG ACÁ GGA 2448 Val Ala Ser Gly Tyr Leu Glu Ala Glu Val He Pro Ala Glu Thr Gly 1315 1320 1325 CAG GAA ACÁ GCA TAT TTT ATT TTA AAG TTA GCT GGA AGA TGG CCA GTA 2496 Gln Glu Thr Ala Tyr Phe lie Leu Lys Leu Ala Gly Arg Trp Pro Val 1330 1335 1340 AAA GTT ATA CAC ACT GAT AAT GGA TCC AAT TTC ACT AGT GCC ACT GTA 2544 Lys Val He His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 1345 1350 1355 1360
AAA GCA GCC TGT TGG TGG GCA AAT ATC AAA CAG GAA TTT GGG ATA CCC 2592 Lys Ala Ala Cys Trp Trp Ala Asn He Lys Gln Glu Phe Gly He Pro 1365 1370 1375 TAC AAT CCT CAÁ AGT CAG GGA GCA GTA GAG TCC ATG AAT AAA GAA TTA 2640 Tyr Asn Pro Gln Ser Gln Gly Ala Val Glu Ser Met Asn Lys Glu Leu 1380 1385 1390 AAG AAA ATT ATA GGA CAÁ ATC AGA GAT CA GCA GAA CAT CTA AAG ACÁ 2688 Lys Lys He He Gly Gln He Arg Asp Gln Ala Glu His Leu Lys Thr 1395 1400 1405 GCA GTG CAÁ ATG GCG GTT TTC ATT CAC AAT TTT AAA AGA AAA GGG GGG 2736 Ala Val Gln Met Ala Val Phe He His Asn Phe Lys Arg Lys Gly Gly 1410 1415 1420 ATT GGG GGG TAC ACT GCA GGG GAA AGA ATA ATA GAC ATA ATA GCA ACÁ 2 84 He Gly Gly Tyr Thr Ala Gly Glu Arg He He Asp He He Ala Thr 1425 1430 1435 1440
GAC ATA CAG ACÁ ACÁ AAT TTA CAÁ ACÁ CA ATT TTA AAA GTT CAÁ AAT 2832 Asp He Gln Thr Thr Asn Leu Gln Thr Gln He Leu Lys Val Gln Asn 1445 1450 1455 TTT CGG GTT TAT TAC AGA GAC AGC AGA GAT CCC ATT TGG AAA GGA CCA 2880 Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro He Trp Lys Gly Pro 1460 1465 1470 GCC AAA CTT CTG TGG AAA GGA GAA GGG GCA GTG GTA ATT CAÁ GAT AAC 2928 Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val He Gln Asp Asn 1475 1480 1485- GGG GAT ATA AAA GTA GTC CCA CGT AGG AAA GCA AAA ATA ATT AGG GAT 2976 Gly Asp He Lys Val Val Pro Arg Arg Lys Ala Lys He He Arg Asp 1490 1495 1500 TAT GGA AAA CAG ATG GCA GGT GAT GGT TGT GTG GCA AGT GGA CAG GAT 3024 Tyr Gly Lys Gln Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gln Asp 1505 1510 1515 1520
GAA AAT CAG GAA ATG GAA TAG 3045
Glu Asn Gln Glu Met Glu 1525
(2) I N FO RMACIÓN PARA SEQ I D NO: 6: (i) CARACTERÍSTICAS DE LA SECU ENCIA (A) LONG ITU D: 1014 aminoácidos (B) TI PO: aminoácido (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉCU LA: porteína (xi) DESCR I PC IÓ N DE LA SECU ENCIA: SEQ I D NO: 6: Phe Phe Arg Glu Glu Leu Val Ser Leu Gln Arg Glu Thr Arg Lys Leu 1 5 10 15 Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu 20 25 30 Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly 35 40 45 Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 50 55 60 Gln He Thr Leu Trp Gln Arg Pro Val He Thr Val Lys He Gly Lys 65 70 75 80
Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val He 85 90 95
Glu Glu Leu Gln Leu Glu Gly Lys Trp Lys Pro Lys Met He Gly Gly 100 105 110 He Gly Gly Phe He Lys Val Arg Gln Tyr Asp Asn He Thr Val Asp
115 120 125 He Gln Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 130 135 140 Val Asn He He Gly Arg Asn Leu Leu Thr Gln He Gly Cys Thr Leu 145 150 155 160
Asn Phe Pro He Ser Pro He Glu Thr Val Pro Val Lys Leu Lys Pro 165 170 175
Gly Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Thr Glu Lys 180 185 190 He Glu Ala Leu Arg Glu He Cys Thr Glu Met Glu Lys Glu Gly Lys 195 200 205 He Ser Arg He Gly Pro Glu Asn Pro Tyr Asn Thr Pro He Phe Ala 210 215 220 He Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 225 230 235 240
Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly He 245 250 255
Pro His Pro Ala Gly Leu Lys Gln Lys Lys Ser Val Thr Val Leu Asp 260 265 270 Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 275 280 285 Tyr Thr Ala Phe Thr He Pro Ser He Asn Asn Glu Thr Pro Gly He 290 295 300 Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala 305 310 315 320
He Phe Gln Ser Thr Met Thr Lys He Leu Glu Pro Phe Arg Glu Lys 325 330 335
His Pro Glu He He He Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly 340 345 350 Ser Asp Leu Glu Leu Ala Gln His Arg Glu Ala Val Glu Asp Leu Arg 355 360 365 Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gln 370 375 380 Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 385 390 395 400
Trp Thr Val Gln Pro He Lys Leu Pro Glu Lys Asp Val Trp Thr Val 405 410 415
Asn Asp He Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln He 420 425 430 Tyr Pro Gly He Arg Val Lys Gln Leu Cys Lys Leu He Arg Gly Ala 435 440 445 Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 450 455 460. Leu Ala Glu Asn Arg Glu He Leu Lys Glu Pro Leu His Gly Val Tyr 465 470 475 480
Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu He Gln Lys Gln Gly Gln 485 490 495
Gly Gln Trp Thr Tyr Gln He Tyr Gln Glu Leu His Lys Asn Leu Lys 500 505 510 Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp He Lys 515 520 525 Gln Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser He Val He
530 535 540 Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gln Lys Glu Val Trp 545 550 555 560
Glu Ala Trp Trp Thr A=p His Trp Gln Ala Thr Trp He Pro Glu Trp 565 570 575
Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu 580 585 590 Thr Glu Pro He Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 595 600 605 Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 610 615 620 Arg Gln Lys Val Val Ser He Ala Asp Thr Thr Asn Gln Lys Ala Glu 625 630 635 640
Leu Gln Ala He Leu Met Ala Leu Gln Glu Ser Gly Arg Asp Val Asn 645 650 655
He Val Thr Asp Ser Gln Tyr Ala Met Gly He He His Ser Gln Pro 660 665 '670 Asp Lys Ser Glu Ser Glu Leu Val Ser Gln He He Glu Glu Leu He 675 680 685 Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 690 695 700 Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 705 710 715 720
He Leu Phe Leu Asp Gly He Glu Lys Ala Gln Glu Asp His Asp Arg 725 730 735
Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 740 745 750 He Val Ala Lys Glu He Val Ala Ser Cys Asp Lys Cys Gln Leu Lys 755 760 765 Gly Glu Ala Met His Gly Gln Val Asn Cys Ser Pro Gly Val Trp Gln 770 775 780 Leu Asp Cys Thr His Leu Glu Gly Lys He He Leu Val Ala Val His 785 790 795 800
Val Ala Ser Gly Tyr Leu Glu Ala Glu Val He Pro Ala Glu Thr Gly 805 810 815
Gln Glu Thr Ala Tyr Phe He Leu Lys Leu Ala Gly Arg Trp Pro Val 820 825 830 Lys Val He His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 835 840 845 Lys Ala Ala Cys Trp Trp Ala Asn He Lys Gln Glu Phe Gly He Pro 850 855 860 Tyr Asn Pro Gln Ser Gln Gly Ala Val Glu Ser Met Asn Lys Glu Leu 8S5 870 875 880
Lys Lys He He Gly Gln He Arg Asp Gln Ala Glu His Leu Lys Thr 885 890 895
Ala Val Gln Met Ala Val Phe He His Asn Phe Lys Arg Lys Gly Gly 9Q0 905 910 He Gly Gly Tyr Thr Ala Gly Glu Arg He He Asp He He Ala Thr 915 920 925 Asp He Gln Thr Thr Asn Leu Gln Thr Gln He Leu Lys Val Gln Asn 930 935 940 Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro He Trp Lys Gly Pro 945 950 955 960
Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val He Gln Asp Asn 965 970 975
Gly Asp He Lys Val Val Pro Arg Arg Lys Ala Lys He He Arg Asp 980 985 990 Tyr Gly Lys Gln Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gln Asp 995 1000 1005 Glu Asn Gln Glu Met Glu 1010 (2) INFORMACIÓN PARA SEQ ID NO: 7: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 579 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..576 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 7: ATG GAA AAC AGA TGG CAG GTG ATG GTT GTG TGG CAÁ GTG GAC AGG ATG 48 Met Glu Asn Arg Trp Gln Val Met Val Val Trp Gln Val Asp Arg Met 1015 1020 1025 1030
AAA ATC AGG AAA TGG AAT AGC TTA GTA AAA CAT CAT ATG TAT GTG TCA 96 Lys He Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 1035 1040 1045 AAA AAG GCA AAA GGA TGG TAT TAT AGA CAT CAT TAT GAA ACÁ CAT CAC 1 4 Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 1050 1055 1060 CCA AAA ATA AGT TCA GAA GTA CAT ATC CCA GTA GGT CAG GCA AGA TTA 192 Pro Lys He Ser Ser Glu Val His He Pro Val Gly Gln Ala Arg Leu 1065 1070 1075 GTG ACÁ GTC ACT TAT TGG GGG CTA ACÁ ACÁ GGA GAA CAG TCT TGG CAT 240 Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gln Ser Trp His 1080 1085 1090 CTA GGA CAT GGA GTA TCC ATA GAA TGG AGA CTA AGA AAA TAC AAG ACÁ 288 Leu Gly His Gly Val Ser He Glu Trp Arg Leu Arg Lys Tyr Lys Thr 1095 1100 1105 1110
CAÁ GTT GAT CCT GAA ATG GCA GAC AAG CTA ATA CAT CTT CAT TAT TTT 336 Gln Val Asp Pro Glu Met Ala Asp Lys Leu He His Leu His Tyr Phe 1115 1120 1125 GAT TGT TTT ACÁ GCC TCT GCC ATA AGG CAÁ GCG GTC TTA GGG AGA CCA 384 Asp Cys Phe Thr Ala Ser Ala He Arg Gln Ala Val Leu Gly Arg Pro 1130 1135 1140 GTA TTA CCT AGG TGT GAA TAT CCA GCA GGG CAC AAA CAG GTA GGC ACC 432 Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gln Val Gly Thr 1145 1150 1155 CTA CAÁ TAT CTA GCA CTA ACÁ GCC TGG GTG GGA GCA AAG AAG AGA AAG 480 Leu Gln Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 1160 1165 1170 CCA CCC TTA CCT AGT GTG ACT AAG CTA ACÁ GAA GAT AGA TGG AAC GAG 528 Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 1175 1180 1185 1190
CAC CAG AAG ATG CAG GGC CAC AGA GGG AAC CCT ATA ATG AAT GGG CAC 576 His Gln Lys Met Gln Gly His Arg Gly Asn Pro He Met Asn Gly His 1195 1200 1205 TAG 579
(2) I N FORMACIÓN PARA SEQ I D NO: 8: (i) CARACTER ÍSTICAS DE LA SECU EN C IA (A) LONG ITU D: 192 aminoácidos (B) TI PO: aminoácidos (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉCU LA: proteína (xi) DESCRI PCIÓ N DE LA SECU ENCIA: SEQ I D NO: 8: Met Glu Asn Arg Trp Gln Val Met Val Val Trp Gln Val Asp Arg Met 1 5 10 15 Lys He Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 20 25 30 Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 35 40 45 Pro Lys He Ser Ser Glu Val His He Pro Val Gly Gln Ala Arg Leu 50 55 60 Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gln Ser Trp His 65 70 75 80 Leu Gly His Gly Val Ser He Glu Trp Arg Leu Arg Lys Tyr Lys Thr 85 90 95 Gln Val Asp Pro Glu Met Ala Asp Lys Leu He His Leu His Tyr Phe 100 105 110 Asp Cys Phe Thr Ala Ser Ala He Arg Gln Ala Val Leu Gly Arg Pro 115 120 125 Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gln Val Gly Thr 130 135 140 Leu Gln Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 145 150 155 160
Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 165 170 175 His Gln Lys Met Gln Gly His Arg Gly Asn Pro He Met Asn Gly His 180 185 190
(2) INFORMACIÓN PARA SEQ ID NO: 9: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 288 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..285 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 9:
ATG GAA CGA GCA CCA GAA GAT GCA GGG CCA CAG AGG GAA CCC TAT AAT 48 Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gln Arg Glu Pro Tyr Asn 195 200 205 GAA TGG GCA CTA GAA TTA TTA GAA GAA TTA AAA AAT GAA GCT GTG CGC 96 Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 210 215. 220 CAT TTT CCA AGG ATT TGG CTA CAT GGG TTA GGA CAÁ CAC ATC TAT AAC 144 His Phe Pro Arg He Trp Leu His Gly Leu Gly Gln His He Tyr Asn 225 230 235 240
ACÁ TAT GGA GAC ACC TGG GAG GGG GTA GAG GCA ATT ATC AGG ATA CTA 192 Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He He Arg He Leu 245 250 255 CAÁ CAÁ TTA CTG TTT ATC CAT TAT AGG ATT GGC TGC CAG CAC AGC AGA 240
Gln Gln Leu Leu Phe He His Tyr Arg He Gly Cys Gln His Ser Arg 260 265 270 ATA GGG ATC ACT CCT CAÁ AGG AGA AGG AAT GGA ACC AGT AGA TCC 285
He Gly He Thr Pro Gln Arg Arg Arg Asn Gly Thr Ser Arg Ser 275 280 285 TAG 288
(2) INFORMACIÓN PARA SEQ ID NO: 10: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 95 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 10:
Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gln Arg Glu Pro Tyr Asn 1 5 10 15 Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 20 25 30 His Phe Pro Arg He Trp Leu His Gly Leu Gly Gln His He Tyr Asn 35 40 45 Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He He Arg He Leu '50 55 60 Gln Gln Leu Leu Phe He His Tyr Arg He Gly Cys Gln His Ser Arg 65 70 75 80
He Gly He Thr Pro Gln Arg Arg Arg Asn Gly Thr Ser Arg Ser 85 90 95
(2) INFORMACIÓN PARA SEQ ID NO: 11: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 252 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..249 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 11:
ATG CTG TCA TTG GGA TTC ATA GCG TTA GGA GCA GCA GTT AGC ATA GCA 48 Met Leu Ser Leu Gly Phe He Ala Leu Gly Ala Ala Val Ser He Ala 100 105 110 GTA ATA GTC TGG GCA TTA CTA TAT AGA GAA TAT AAG AAA ATA AAA TTG 96 Val He Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys He Lys Leu 115 120 125 CAG GAA AAA ATA AAA CAC ATA AGA CAG AGA ATA AGA GAA AGA GAA GAA 14 Gln Glu Lys He Lys His He Arg Gln Arg He Arg Glu Arg Glu Glu 130 135 140 GAT AGT GGC AAT GAA AGT GAT GGG GAT GCA GAG TGG TTG GAT GGG GAT 192 Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 145 150 155 GAA GAG TGG TTG GTT ACT CTT CTA TCT TCT AGT AAG CTT GAT CAÁ GGT 2 0
Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gln Gly 160 165 170 175
AAT TGG GTC TGA 252
Asn Trp Val
(2) INFORMACIÓN PARA SEQ ID NO: 12: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 83 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 12:
Met Leu Ser Leu Gly Phe He Ala Leu Gly Ala Ala Val Ser He Ala 1 5 10 15 Val He Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys He Lys Leu 20 25 30 Gln Glu Lys He Lys His He Arg Gln Arg He Arg Glu Arg Glu Glu 35 40 45 Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 50 55 60 Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gln Gly 65 70 75 80
Asn Trp Val
(2) INFORMACIÓN PARA SEQ ID NO: 13: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 306 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..303 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 13:
ATG GAA CCA GTA GAT CCT AGA TTA GAG CCC TGG AAT CAT CCA GGA AGC 48 Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 85 90 95 CAÁ CCT AAA ACÁ GCT TGC AAT AAT TGC TAT TGT AAA AGA TGT TGC TAT 96 Gln Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 100 105 110 115
CAC TGC TTA TAT TGC TTC ACÁ AAG AAA GGC TTA GGC ATC TCA TAT GGC 144 His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly He Ser Tyr Gly 120 125 130 AGG AAG AAG CGG AGT CAÁ CGA CGA AGA ACT CCT CAG AGC AGT AAG AGT 192
Arg Lys Lys Arg Ser Gln Arg Arg Arg Thr Pro Gln Ser Ser Lys Ser 135 140 145 CAT CAÁ GAT CTT ATA CCA GAG CAG CCC TTA TCC CAÁ CAG CAÁ GGG GAC 240
His Gln Asp Leu He Pro Glu Gln Pro Leu Ser Gln Gln Gln Gly Asp 150 155 160 CAG ACÁ GGC CAG AAG AAA CAG AAG GAG GCG TTG GAG AGC AAG ACÁ GAG 288
Gln Thr Gly Gln Lys Lys Gln Lys Glu Ala Leu Glu Ser Lys Thr Glu 165 170 175 GCA GAT CCG TGC GAT TAG 306
(2) INFORMACIÓN PARA SEQ ID NO: 14: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 101 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 14:
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser
1 5 10 15 Gln Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 20 25 30 His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly He Ser Tyr Gly 35 40 45 Arg Lys Lys Arg Ser Gln Arg Arg Arg Thr Pro Gln Ser Ser Lys Ser 50 55 60 His Gln Asp Leu He Pro Glu Gln Pro Leu Ser Gln Gln Gln Gly Asp 65 70 75 80
Gln Thr Gly Gln Lys Lys Gln Lys Glu Ala Leu Glu Ser Lys Thr Glu 85 90 95 Ala Asp Pro Cys Asp 100
(2) INFORMACIÓN PARA SEQ ID NO: 15: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 369 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..366 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 15: ATG GCA GGA AGA AGC GGA GTC AAC GAC GAA GAA CTC CTC AGA GCA GTA 48 Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 105 110 115 AGA GTC ATC AAG ATC TTA TAC CAG AGC AGT TAT CCC AAC AGC AAG GGG 96
Arg Val He Lys He Leu Tyr Gln Ser Ser Tyr Pro Asn Ser Lys Gly 120 125 130 ACC AGA CAG GCC AGA AGA AAC AGA AGG AGG CGT TGG AGA GCA AGA CAG 144 Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gln 135 140 145 AGG CAG ATC CGT GCG ATT AGT GAG CGG ATT CTC AGC TCT TGT CTG GGA 192 Arg Gln He Arg Ala He Ser Glu Arg He Leu Ser Ser Cys Leu Gly 150 155 160 165
GGA CCT CCG GAA CCT GTT GAT CTT CCT CTA CCA CCG CTT GAC AGA CTC 240 Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 170 -175 180 ACT CTT GAT ACT GAG GAG GAC TCT GGA ACT CCT GGG ACÁ GAG TCT CAG 288 Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gln 185 190 195 CAG GGG ACT GCA ACT ACT GAA TGA ACT CAG AAC ACÁ CTT GTG GGG AAT 336 Gln Gly Thr Ala Thr Thr Glu * Thr Gln Asn Thr Leu Val Gly Asn 200 205 210 ACT TGC ATA TTG GGG AAA AGA GTT AAG GGA TAG 369
Thr Cys He Leu Gly Lys Arg Val Lys Gly 215 220
(2) INFORMACIÓN PARA SEQ ID NO: 16: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 122 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 16:
Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 1 5 10 15
Arg Val He Lys He Leu Tyr Gln Ser Ser Tyr Pro Asn Ser Lys Gly 20 25 30 Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gln 35 40 45 Arg Gln He Arg Ala He Ser Glu Arg He Leu Ser Ser Cys Leu Gly 50 55 60 Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 65 70 75 80
Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gln 85 90 95
Gln Gly Thr Ala Thr Thr Glu * Thr Gln Asn Thr Leu Val Gly Asn 100 105 110 Thr Cys He Leu Gly Lys Arg Val Lys Gly 115 120
(2) INFORMACIÓN PARA SEQ ID NO: 17: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 2550 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..2556 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 17:
ATG AAA GTG ATG GGG ATG CAG AGT GGT TGG ATG GGG ATG AAG AGT GGT 48 Met Lys Val Met Gly Met Gin Ser Gly Trp Met Gly Met Lys Ser Gly 125 130 135 TGG TTA CTC TTC TAT CTT CTA GTA AGC TTG ATC AAG GTA ATT GGG TCT 96 Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu He Lys Val He Gly Ser 140 145 150 GAA CAÁ CAT TGG GTA ACÁ GTG TAC TAT GGG GTA CCA GTA TGG AGA GAA 144 Glu Gln His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 155 160 165 170
GCA GAG ACÁ ACT CTT TTC TGT GCT TCA GAT GCT AAA GCC CAT AGT ACÁ 192 Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 175 180 185 GAG GCT CAC AAC ATC TGG GCC ACÁ CAÁ GCA TGT GTT CCT ACT GAT CCC 240 Glu Ala His Asn He Trp Ala Thr Gln Ala Cys Val Pro Thr Asp Pro 190 195 200 AAT CCA CAÁ GAA GTG CTA TTA CCC AAT GTA ACT GAA AAA TTT AAT ATG 288 Asn Pro Gln Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met 205 210 215 TGG GAA AAT AAA ATG GCA GAC CA ATG CAÁ GAG GAT ATT ATC AGT CTG 336 Trp Glu Asn Lys Met Ala Asp Gln Met Gln Glu Asp He He Ser Leu 220 225 230 TGG GAA CAG AGC TTA AAG CCC TGT GTT AAA TTA ACC CCA TTA TGT GTA 384 Trp Glu Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 235 240 245 250
ACT ATG CTT TGT AAC GAT AGC TAT GGG GAG GAA AGG AAC AAT ACÁ AAT 432 Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 255 260 265 ATG ACÁ ACÁ AGA GAA CCA GAC ATA GGA TAC AAA CAÁ ATG AAA AAT TGC 480 Met Thr Thr Arg Glu Pro Asp He Gly Tyr Lys Gln Met Lys Asn Cys 270 275 280 TCA TTC AAT GCA ACC ACT GAG CTA ACÁ GAT AAA AAG AAG CAÁ GTT TAC 528 Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gln Val Tyr 285 290 295 TCT CTG TTT TAT GTA GAA GAT GTA GTA CCA ATC AAT GCC TAT AAT AAA 576 Ser Leu Phe Tyr Val Glu Asp Val Val Pro He Asn Ala Tyr Asn Lys 300 305 310 ACÁ TAT AGG CTA ATA AAT TGT AAT ACC ACÁ GCT GTG ACÁ CAÁ GCT TGT 624 Thr Tyr Arg Leu He Asn Cys Asn Thr Thr Ala Val Thr Gln Ala Cys 315 320 325 330
CCT AAG ACT TCC TTT GAG CCA ATT CCA ATA CAT TAC TGT GCA CCA CCA 672 Pro Lys Thr Ser Phe Glu Pro He Pro He His Tyr Cys Ala Pro Pro 335 340 345 GGC TTT GCC ATT ATG AAA TGT AAT GAA GGA AAC TTT AGT GGA AAT GGA 720 Gly Phe Ala He Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 350 355 360 AGC TGT ACÁ AAT GTG AGT ACT GTA CAÁ TGC ACÁ CAT GGA ATA AAG CCA 768 Ser Cys Thr Asn Val Ser Thr Val Gln Cys Thr His Gly He Lys Pro 365 370 375 GTG ATA TCC ACT CAG TTA ATC CTA AAT GGA AGC TTA AAT ACÁ GAT GGA 816 Val He Ser Thr Gln Leu He Leu Asn Gly Ser Leu Asn Thr Asp Gly 380 385 390 ATT GTT ATT AGA AAT GAT AGT CAC AGT AAT CTG TTG GTG CAÁ TGG AAT 864 He Val He Arg Asn Asp Ser His Ser Asn Leu Leu Val Gln Trp Asn 395 400 405 410 GAG ACÁ GTG CCA ATA AAT TGT ACÁ AGG CCA GGA AAT AAT ACÁ GGA GGA 912 Glu Thr Val Pro He Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 415 420 425 CAG GTG CAG ATA GGA CCT GCT ATG ACÁ TTT TAT AAC ATA GAA AAA ATA 960 Gln Val Gln He Gly Pro Ala Met Thr Phe Tyr Asn He Glu Lys He 430 435 440 GTA GGA GAC ATT AGA CAÁ GCA TAC TGT AAT GTC TCT AAA GAA CTA TGG 1008 Val Gly Asp He Arg Gln Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 445 450 455 GAA CCA ATG TGG AAT AGA ACÁ AGA GAG GAA ATA AAG AAA ATC CTG GGG 1056 Glu Pro Met Trp Asn Arg Thr Arg Glu Glu He Lys Lys He Leu Gly 460 465 470 AAA AAC AAC ATA ACC TTC AGG GCT CGA GAG AGG AAT GAA GGA GAC CTA 1104 Lys Asn Asn He Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 475 480 485 490 GAA GTG ACÁ CAC TTA ATG TTC AAT TGT AGA GGA GAG TTT TTC TAT TGT 1152 Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 495 500 505 AAC ACT TCC AAA TTA TTT AAT GAG GAA TTA CTT AAC GAG ACÁ GGT GAG 1200 Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 510 515 520 CCT ATT ACT CTG CCT TGT AGA ATA AGA CAG ATT GTA AAT TTG TGG ACÁ 1248 Pro He Thr Leu Pro Cys Arg He Arg Gln He Val Asn Leu Trp Thr 525 530 535 AGG GTA GGA AAA GGA ATT TAT GCA CCA CCA ATT CGG GGA GTT CTT AAC 1296 Arg Val Gly Lys Gly He Tyr Ala Pro Pro He Arg Gly Val Leu Asn 540 545 550 TGT ACC TCC AAT ATT ACT GGA CTG GTT CTA GAA TAT AGT GGT GGG CCT 1344 Cys Thr Ser Asn He Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 555 560 565 570
GAC ACC AAG GAA ACÁ ATA GTA TAT CCC TCA GGA GGA AAC ATG GTT AAT 1392 Asp Thr Lys Glu Thr He Val Tyr Pro Ser Gly Gly Asn Met Val Asn 575 580 585 CTC TGG AGA CAÁ GAG TTG TAT AAG TAC AAA GTA GTT AGC ATA GAA CCC 1440 Leu Trp Arg Gln Glu Leu Tyr Lys Tyr Lys Val Val Ser He Glu Pro 590 595 600 ATA GGA GTA GCA CCA GGT AAA GCT AAA AGA CGC ACÁ GTG AGT AGA GAA 1488 He Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 605 610 615 AAA AGA GCA GCC TTT GGA CTA GGT GCG CTG TTT CTT GGG TTT CTT GGA 1536 Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 620 625 630 GCA GCA GGG AGC ACT ATG GGC GCA GCG TCA ATA ACG CTG ACG GTA CAG 1584 Ala Ala Gly Ser Thr Met Gly Ala Ala Ser He Thr Leu Thr Val Gln 635 640 645 650
GCC CGG ACÁ TTA TTA TCT GGG ATA GTG CAÁ CAG CAG AAT ATT CTG TTG 1632 Ala Arg Thr Leu Leu Ser Gly He Val Gln Gln Gln Asn He Leu Leu 655 660 665 AGA GCA ATA GAG GCG CAÁ CAÁ CAT TTG TTG CAÁ CTC TCA ATC TGG GGC 1680 Arg Ala He Glu Ala Gln Gln His Leu Leu Gln Leu Ser He Trp Gly 670 675 680 ATT AAA CAG CTC CAG GCA AAA GTC CTT GCT ATA GAA AGA TAC CTT AGG 1728 He Lys Gln Leu Gln Ala Lys Val Leu Ala He Glu Arg Tyr Leu Arg 685 690 695 GAT CAG CAÁ ATC CTA AGT CTA TGG GGC TGC TCA GGA AAA ACÁ ATA TGC 1776 Asp Gln Gln He Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr He Cys 700 705 710 TAT ACC ACT GTG CCT TGG AAT GAG ACT TGG AGC AAC AAT ACC TCT TAT 1824
Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 715 720 725 730 GAT ACÁ ATC TGG AAT AAT TTA ACC TGG CAÁ CAÁ TGG GAT GAG AAA GTA 1872 Asp Thr He Trp Asn Asn Leu Thr Trp Gln Gln Trp Asp Glu Lys Val 735 740 745 AGA AAC TAT TCA GGT GTC ATT TT GGA CTT ATA GAA CAG GCA CAÁ GAA 1920 Arg Asn Tyr Ser Gly Val He Phe Gly Leu He Glu Gln Ala Gln Glu 750 755 760 CAÁ CAG AAC AC AAT GAG AAA TCA CTC TTG GAA TTG GAT CAÁ TGG GAC 1968 Gln Gln Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gln Trp Asp 765 770 775 AGT CTG TGG AGC TGG TTT GGT ATT ACÁ AAA TGG CTG TGG TAT ATA AAA 2016 Ser Leu Trp Ser Trp Phe Gly He Thr Lys Trp Leu Trp Tyr He Lys 780 785 790 ATA GCT ATA ATG ATA GTA GCA GGC ATT GTA GGC ATA AGA ATC ATA AGT 2064 He Ala He Met He Val Ala Gly He Val Gly He Arg He He Ser 795 800 805 810 ATA GTA ATA ACT ATA ATA GCA AGA GTT AGG CAG GGA TAT TCT CCC CTT 2112
He Val He Thr He He Ala Arg Val Arg Gln Gly Tyr Ser Pro Leu 815 820 825 TCG TTG CAG ACC CTT ATC CCA ACÁ GCA AGG GGA CCA GAC AGG CCA GAA 2160 Ser Leu Gln Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 830 835 840 GAA ACÁ GAA GGA GGC GTT GGA GAG CA GAC AGA GGC AGA TCC GTG CGA 2208 Glu Thr Glu Gly Gly Val Gly Glu Gln Asp Arg Gly Arg Ser Val Arg 845 850 855 TTA GTG AGC GGA TTC TCA GCT CTT GTC TGG GAG GAC CTC CGG AAC CTG 2256 Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 860 865 870 TTG ATC TTC CTC TAC CAC CGC TTG ACÁ GAC TCA CTC TTG ATA CTG AGG 2304 Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 875 880 885 890
AGG ACT CTG GAA CTC CTG GGA CAG AGT CTC AGC AGG GGA CTG CAÁ CTA 2352 Arg Thr Leu Glu Leu Leu Gly Gln Ser Leu Ser Arg Gly Leu Gln Leu 895 900 905 CTG AAT GAA CTC AGA ACÁ CAC TTG TGG GGA ATA CTT GCA TAT TGG GGA 2400 Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 910 915 920 AAA GAG TTA AGG GAT AGT GCT ATC AGC TTG CTT AAT ACÁ ACÁ GCT ATT 2448 Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 925 930 935 GTA GTA GCA GAA GGA ACÁ GAT AGG ATT ATA GAA TTA GCA CAÁ AGA ATA 2496 Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gln Arg He 940 945 950 GGA AGG GGA ATA TTA CAC ATA CCT AGA AGA ATC AGA CAÁ GGC CTA GAA 2544 Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gln Gly Leu Olu 955 960 965 970 AGA GCA CTG ATA TAA 2559
Arg Ala Leu He
(2) I N FORMACIÓN PARA SEQ I D NO: 18: (i) CARACTER ÍSTICAS DE LA SECU EN C IA (A) LONG ITU D: 852 aminoácidos (B) TI PO: aminoácidos (D) TOPOLOGÍA: lineal (¡i) TI PO DE MOLÉCU LA: proteína (xi) DESCRI PCIÓN DE LA SECU ENCIA: SEQ I D NO: 18:
Met Lys Val Met Gly Met Gln Ser Gly Trp Met Gly Met Lys Ser Gly 1 5 10 15
Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu He Lys Val He Gly Ser 20 25 30 Glu Gln His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 35 40 45 Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 50 55 60 Glu Ala His Asn He Trp Ala Thr Gln Ala Cys Val Pro Thr Asp Pro 65 70 75 80
Asn Pro Gln Glu Val Leu Leu Pro Asn Val Thr Olu Lys Phe Asn Met 85 90 95
Trp Glu Asn Lys Met Ala Asp Gln Met Gln Glu Asp He He Ser Leu 100 105 110 Trp Glu Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val
115 120 125 Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 130 135 * 140 Met Thr Thr Arg Glu Pro Asp He Gly Tyr Lys Gln Met Lys Asn Cys 145 150 155 160
Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gln Val Tyr 165 170 175
Ser Leu Phe Tyr Val Glu Asp Val Val Pro He Asn Ala Tyr Asn Lys 180 185 190 Thr Tyr Arg Leu He Asn Cys Asn Thr Thr Ala Val Thr Gln Ala Cys 195 200 205 Pro Lys Thr Ser Phe Glu Pro He Pro He His Tyr Cys Ala Pro Pro 210 215 220 Gly Phe Ala He Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 225 230 235 240
Ser Cys Thr Asn Val Ser Thr Val Gln Cys Thr His Gly He Lys Pro 245 250 255
Val He Ser Thr Gln Leu He Leu Asn Gly Ser Leu Asn Thr Asp Gly 260 265 270 He Val He Arg Asn Asp Ser His Ser Asn Leu Leu Val Gln Trp Asn 275 280 285 Glu Thr Val Pro He Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 290 295 300
Gln Val Gln He Gly Pro Ala Met Thr Phe Tyr Asn He Glu Lys He 305 310 315 320 Val Gly Asp He Arg Gln Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 325 330 335
Glu Pro Met Trp Asn Arg Thr Arg Glu Glu He Lys Lys He Leu Gly 340 345 350 Lys Asn Asn He Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 355 360 365 Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 370 375 380 Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 385 390 395 400
Pro He Thr Leu Pro Cys Arg He Arg Gln He Val Asn Leu Trp Thr 405 410 415
Arg Val Gly Lys Gly He Tyr Ala Pro Pro He Arg Gly Val Leu Asn 420 425 430 Cys Thr Ser Asn He Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 435 440 445 Asp Thr Lys Glu Thr He Val Tyr Pro Ser Gly Gly Asn Met Val Asn 450 455 460 Leu Trp Arg Gln Giu Leu Tyr Lys Tyr Lys Val Val Ser He Glu Pro 465 470 475 «80
He Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 485 - 490 495
Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 500 505 510 Ala Ala Gly Ser Thr Met Gly Ala Ala Ser He Thr Leu Thr Val Gln 515 520 525 Ala Arg Thr Leu Leu Ser Gly He Val Gln Gln Gln Asn He Leu Leu 530 535 540 Arg Ala He Glu Ala Gln Gln His Leu Leu Gln Leu Ser He Trp Gly 545 550 555 560
He Lys Gln Leu Gln Ala Lys Val Leu Ala He Glu Arg Tyr Leu Arg 565 570 575
Asp Gln Gln He Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr He Cys 580 585 590 Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 595 600 605 Asp Thr He Trp Asn Asn Leu Thr Trp Gln Gln Trp Asp Glu Lys Val 610 615 620 Arg Asn Tyr Ser Gly Val He Phe Gly Leu He Glu Gln Ala Gln Glu 625 630 635 640
Gln Gln Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gln Trp Asp 645 650 655 Ser Leu Trp Ser Trp Phe Gly He Thr Lys Trp Leu Trp Tyr He Lys 660 665 670 He Ala He Met He Val Ala Gly He Val Gly He Arg He He Ser 675 680 685 He Val He Thr lie He Ala Arg Val Arg Gln Gly Tyr ser Pro Leu 690 695 700 Ser Leu Gln Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 705 710 715 720
Glu Thr Glu Gly Gly Val Gly Glu Gln Asp Arg Gly Arg Ser Val Arg 725 730 735
Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 740 745 750 Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 755 760 765 Arg Thr Leu Glu Leu Leu Gly Gln Ser Leu Ser Arg Gly Leu Gln Leu 770 775 780 Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 785 790 795 800
Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 805 810 815
Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gln Arg He 820 825 830 Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gln Gly Leu Glu 835 840 845 Arg Ala Leu He 850
(2) INFORMACIÓN PARA SEQ ID NO: 19: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 639 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) U BICACIÓ N : 1 ..636 (xi) DESCRI PCIÓN DE LA SECU ENC IA: SEQ I D NO: 19: ATG GGA AAG ATT TGG TCA AAG AGC AGC CTA GTA GGA TGG CCA GAA ATC 48 Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 855 860 865 AGA GAA AGA ATG AGA AGA CAÁ ACG CAÁ GAA CCA GCA GTA GAG CCA GCA 96 Arg Glu Arg Met Arg Arg Gln Thr Gln Glu Pro Ala Val Glu Pro Ala 870 875 880 GTA GGA GCA GGA GCA GCT TCT CAÁ GAT CTA GCT AAT CGA GGG GCC ATC 144 Val Gly Ala Gly Ala Ala Ser Gln Asp Leu Ala Asn Arg Gly Ala He 885 890 895 900
ACC ATA AGA AAT ACT AGA GAC AAT AAT GAA AGT ATA GCT TGG CTA GAA 192 Thr He Arg Asn Thr Arg Asp Asn Asn Glu Ser He Ala Trp Leu Glu 905 910 915 GCA CAÁ GAA GAA GAA GAG GAA GTA GGC TTT CCA GTA CGC CCT CAG GTA 240 Ala Gln Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val 920 925 930 CCA TTA AGG CCA ATA ACC TAT AAA CAG GCT TTT GAT CTT TCC TTC TTT 288 Pro Leu Arg Pro He Thr Tyr Lys Gln Ala Phe Asp Leu Ser Phe Phe 935 940 945 TTA AAA GAT AAG GGG GGA CTG GAA GGG CTA GTT TGG TCC AGA AAA AGG 336 Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 950 955 960 CAÁ GAT ATT CTA GAC CTC TGG ATG TAT CAC ACÁ CAÁ GGC ATC CTC CCT 384 Gln Asp He Leu Asp Leu Trp Met Tyr His Thr Gln Gly He Leu Pro 965 970 975 980
GAC TGG CAT AAC TAC ACÁ CCA GGG CCA GGA ATT AGA TAC CCC GTA ACC 432 Asp Trp His Asn Tyr Thr Pro Gly Pro Gly He Arg Tyr Pro Val Thr 985 990 995 TTT GGA TGG TGC TTC AAA CTA GTA CCA TTG TCA GCT GAA GAA GTA GAA 480 Phe Gly Tro Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 1000 1005 1010 GAG GCT AAT GAA GGA GAC AAC AAT GCC CTC TTA CAC CCC ATA TGT CAÁ 528 Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro He Cys Gln 1015 1020 1025 CAT GGA GCA GAT GAT GAT CAT AAA GAA GTG TTG GTG TGG CGA TTT GAC 576 His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 1030 1035 1040 AGC TCC CTA GCA AGA AGA CAT GTA GCA AGA GAG CTG CAT CCG GAG TTT 624 Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 1045 1050 1055 1060
TAC AAG AAC TGC TGA 639
Tyr Lys Asn Cys (2) INFORMACIÓN PARA SEQ ID NO: 20: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 212 aminoácidos (B) TIPO: ácido nucleico (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 20:
Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 1 5 10 15
Arg Glu Arg Met Arg Arg Gln Thr Gln Glu Pro Ala Val Glu Pro Ala 20 25 30 Val Gly Ala Gly Ala Ala Ser Gln Asp Leu Ala Asn Arg Gly Ala He 35 40 45 Thr He Arg Asn Thr Arg Asp Asn Asn Glu Ser He Ala Trp Leu Glu 50 55 60 Ala Gln Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val 65 70 75 80
Pro Leu Arg Pro He Thr Tyr Lys Gln Ala Phe Asp Leu Ser Phe Phe 85 90 95
Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 100 105 110 Gln Asp He Leu Asp Leu Trp Met Tyr His Thr Gln Gly He Leu Pro 115 120 125 Asp Trp His Asn Tyr Thr Pro Gly Pro Gly He Arg Tyr Pro Val Thr 130 135 140 Phe Gly Trp Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 145 150 155 160
Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro He Cys Gln 165 170 175
His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 180 185 190 Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 195 200 205 Tyr Lys Asn Cys 210
(2) INFORMACIÓN PARA SEQ ID NO: 21: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 20 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 21 ATTGCGTACT CACACTTCCG 20
(2) INFORMACIÓN PARA SEQ ID NO: 22: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 17 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 22: GGCAAGCAGG GAGCTGG 17
(2) INFORMACIÓN PARA SEQ ID NO: 23: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 23: TCCTTGAGCA GTCTGGAC 18
(2) INFORMACIÓN PARA SEQ ID NO: 24: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<iniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 24: GAACACCACC ATTAGCAG 18
(2) INFORMACIÓN PARA SEQ ID NO: 25: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 19 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 25: ACCAGAGGCT ATGTCACA 18
(2) INFORMACIÓN PARA SEQ ID NO: 26: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 19 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 26: TGTAAGGCC CTAGAAGA 19
(2) INFORMACIÓN PARA SEQ ID NO: 27: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 27: ACAGAGAACT CTCTGTAC 18 (2) INFORMACIÓN PARA SEQ ID NO: 28: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 28: AAGAAAAGCA GTTGGTAC 18
(2) INFORMACIÓN PARA SEQ ID NO: 29: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 17 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 29: TTTCTTCCCT GTATGTC 17
(2) INFORMACIÓN PARA SEQ ID NO: 30: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 30: GTTATATGGA TTCTCAGG 18
(2) INFORMACIÓN PARA SEQ ID NO: 31: (i) CARACTERÍSTICAS DE LA SECUENCIA • (A) LONGITUD: 19 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 31 TGGCAGCA TTATACTGG 19
(2) INFORMACIÓN PARA SEQ ID NO: 32: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 23 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 32: ATCATTACC AGTACATCCA CGA 23
(2) INFORMACIÓN PARA SEQ ID NO: 33: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 33: TGTCAGGGGT CGTAAAGC 18
(2) INFORMACIÓN PARA SEQ ID NO: 34: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 34:
TCCTCTGGAT GGGATATG 18
(2) INFORMACIÓN PARA SEQ ID NO: 35: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 35: TCTATCCAGG AATCAGAG 18
(2) INFORMACIÓN PARA SEQ ID NO: 36: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 36: AATGAGATCT GCCCATAC 18
(2) INFORMACIÓN PARA SEQ ID NO: 37: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 37: TGACAGATAC GGGAAGAC 18
(2) INFORMACIÓN PARA SEQ ID NO: 38: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 38: AACCGCCATT TGCACTCC 10
(2) INFORMACIÓN PARA SEQ ID NO: 39: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 39: ACATGGACCG CCACAAGG 18
(2) INFORMACIÓN PARA SEQ ID NO: 40: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 40: AGCAACAGAC ATACAGAC 18
(2) INFORMACIÓN PARA SEQ ID NO: 41: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 41 AAAGTAGTCC CACGTAGG 18
(2) INFORMACIÓN PARA SEQ ID NO: 42: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 42: ATATCCCAGT AGGTCAGG 18
(2) INFORMACIÓN PARA SEQ ID NO: 43: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 43: TCTAGCACTA ACAGCCTG 18 (2) INFORMACIÓN PARA SEQ ID NO: 44: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 44: ACTCTTACTG CTCTGAGG 18
(2) INFORMACIÓN PARA SEQ ID NO: 45: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 45: CCATACTACA CTGTTACC 18
(2) INFORMACIÓN PARA SEQ ID NO: 46: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 20 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 46: CATAGCTATC GTTACAAAGC 20
(2) INFORMACIÓN PARA SEQ ID NO: 47 : (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 47: TCATAATGGC AAGCCTG 18
(2) INFORMACIÓN PARA SEQ ID NO: 48: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 48: CTATTCCACA TTGGTTCC 18
(2) INFORMACIÓN PARA SEQ ID NO: 49: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 49: ATTCTAGAAC CAGTCCAG 18
(2) INFORMACIÓN PARA SEQ ID NO: 50: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 10 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 50: CCTTAGGGAT CAGCAAATCC 20
(2) INFORMACIÓN PARA SEQ ID NO: 51: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 51 TGGGACAGTC TGTGGAGC 18
(2) INFORMACIÓN PARA SEQ ID NO: 52: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 52: TTCTCAGCTC TTGTCTGG 18 (2) INFORMACIÓN PARA SEQ ID NO: 53: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 43: ATTAAGCAAG CTGATAGC 18
(2) INFORMACIÓN PARA SEQ ID NO: 54: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 16 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 54: TGTGCTTCTA GCCAAG 16
(2) INFORMACIÓN PARA SEQ ID NO: 55: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 55: GCTCCATGTT GACATATG 18
(2) INFORMACIÓN PARA SEQ ID NO: 56: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 17 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 56: AGAGAGACCC AGTACAAG 17
(2) INFORMACIÓN PARA SEQ ID NO: 57: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 20 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 57: ATAAAAGCAG CCGCTTCTCG 20
(2) INFORMACIÓN PARA SEQ ID NO: 58: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 35 aminoácidos (B) TIPO: aminoácido (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: péptido
Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly Gln Val Gln He Gly Pro 1 5 10 15 Ala Met Thr Phe Tyr Asn He Glu Lys He Val Gly Asp He Arg Gln 20 25 30 Ala Tyr Cys 35 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 58:
(2) INFORMACIÓN PARA SEQ ID NO: 59: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 35 aminoácidos (B) TIPO: aminoácido (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: péptido (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 59:
Cys His Arg Pro Gly Asn Asn Thr Arg Gly Glu Val Gln He Gly Pro 1 5 10 15 Gly Met Thr Phe Tyr Asn He Glu Asn Val Tyr Gly Asp Thr Arg Ser 20 25 30 Ala Tyr Cys 35
(2) INFORMACIÓN PARA SEQ ID NO: 60: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 35 aminoácidos (B) TIPO: aminoácido (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: péptido (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 60:
Cys He Arg Pro Gly Asn Arg Thr Tyr Arg Asn Leu Gln He Gly Pro
1 5 10 15
Gly Met Thr Phe Tyr Asn Val Glu He Ala Thr Gly Asp He Arg Lys 20 25 30 Ala Phe Cys 35
(2) INFORMACIÓN PARA SEQ ID NO: 61: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 35 aminoácidos (B) TIPO: aminoácido (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: péptido (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 61 Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Val Arg He Gly Pro 1 5 10 15
Gly Gln Ala Phe Tyr Ala Thr Gly Asp He He Gly Asp He Arg Gln 20 25 30 Ala His Cys 35
Claims (14)
- REIVIN DICACION ES 1 . Cepa de V1 H-1 que no es del grupo M, ni del O, la cual exhibe las características morfológicas e inmunológicas del retrovirus que se depositó el 2 de Julio de 1996 bajo el número I-1753 (designado YBF30) en el equipo de la Colección Nacional de Cultivos de Microorganismos contenida por el Instituto Pasteur.
- 2. Secuencias de ácidos nucleicos, caracterizadas porque se derivan de la cepa de acuerdo con la reivindicación 1 .
- 3. Secuencias de ácidos nucleicos de acuerdo con la reivindicación 2, caracterizadas porque que se seleccionan del grupo que consiste de las siguientes secuencias: la secuencia de nucleótidos completa de la cepa de acuerdo con la reivindicación 1 (SEQ I D No. 1 ) así como los fragmentos de ácidos nucleicos que se derivan de dicha cepa: (SEQ I D No. 2), (SEQ I D No. 3), (SEQ I D No. 5), (SEQ I D No. 7), (SEQ I D NO.9) , (SEQ I D No. 1 1 ), (SEQ I D No. 13) , (SEQ I D No. 15) , (SEQ I D No. 17), (SEQ I D No. 19) y las secuencias SEQ I D No. 21 -57, y también cualquier secuencia que no es idéntica a una de las secuencias de nucleótidos anteriores, o que no es complementaria a una de estas secuencias, pero que sin embargo es capaz de hibridrizarse con una secuencia de ácidos nucleicos que se derivan de un virus de VI H-1 que no es del grupo M ni del O.
- 4. Oligonucleótido, caracterizado porque se selecciona de las secuencias SEQ I D No. 21 a 57, y porque es capaz de usarse como un iniciador o como una sonda para detectar VIH-1 de acuerdo con la reivindicación 1 ó reivindicación 5.
- 5. Virus de VI H-1 , caracterizados porque difieren del grupo M y del grupo O y exhiben las siguientes características: poca o ninguna reactividad serológica con respecto a las proteínas de los grupos M y O y fuerte reactividad serológica con respecto a proteínas que se derivan de la cepa YBF30 de acuerdo con la reivindicación 1 o la cepa VIS de CPZGAB; ausencia de amplificación genómica cuando se usan iniciadores en las regiones env y gag de virus VI H- 1 y de los grupos M y O; amplificación genómica en presencia de iniciadores que se derivan de la cepa YBF30, de acuerdo con la reivindicación 4; y homología de los productos del gen de cubierta que es >70% con respecto a la cepa YBF30.
- 6. Método para diagnosticar in vitro un virus de V1 H-1 del grupo que no es del grupo M, ni del O por medio de hibridización y/o amplificación de genes, cuyo método se llevó a cabo usando una muestra biológica (suero o linfocito en circulación) y se caracteriza porque comprende: . un paso de extraer el ácido nucleico el cual será detectado y que pertenece al genoma del virus, cuyo virus posiblemente puede estar presente en la muestra biológica, y, en donde es apropiado, un paso de tratar el ácido nucleico usando una transcriptasa inversa, si este ácido nucleico está en forma de ARN . . por lo menos un ciclo que comprende los pasos de desnaturalizar el ácido nucleico, de hibridizarse con por lo menos una secuencia de acuerdo reivindicación 3 o reivindicación 4 y cuando es apropiado, extender el híbrido, el cual se ha formado en presencia de reactivos adecuados (agente de polimerización, tal como ADN polimerasa y dNTP), y . un paso para detectar la presencia posible del ácido nucleico que pertenece al genoma de un virus del tipo de VI H-1 que no es del grupo M, ni del O.
- 7. Péptido, caracterizado porque se expresa por una cepa de VIH- 1 que no es del grupo M, ni del O de acuerdo con la reivindicación 1 o reivindicación 3 o usando una secuencia de nucleótidos de acuerdo con la reivindicación 3 y porque es capaz de (1 ) reconocerse por anticuerpos que se inducen por un virus de VIH-1 que no es del grupo M, ni del O de acuerdo con la reivindicación 1 o reivindicación 5, o una variante de este virus, y que está presente en una muestra biológica que se obtiene después de una infección con una cepa que no es del grupo M, ni del O, y/o (2) inducir la producción de anticuerpos de VI H- 1 anti-grupo que no es del grupo M, ni del O.
- 8. Péptido de acuerdo con la reivindicación 7, caracterizado porque se selecciona del que se expresa por el gen gag (SEQ I D No. 4), aquellas que se expresa por el gen pol (SEQ I D No. 6) , aquel que se expresa por el gen vif (SEQ I D No. 8) , aquel que se expresa por el gen vpr (SEQ I D No. 12), aquel que se expresa por el gen raí (SEQ I D No. 14) , aquel que se expresa por el gen rev (SEQ I D No. 16), aquel que se expresa por el gen env (SEQ I D No. 18) , o uno de sus fragmentos tal como un fragmento de la región del bucle V3 (SEQ I D No. 58), y del que se expresa por el gen nef (SEQ I D No. 20), o un fragmento de estos péptidos que son capaces de reconocer los anticuerpos que se producen durante una infección con un virus de VI H-1 de acuerdo con la reivindicación 1 ó reivindicación 5.
- 9. Composiciones inmunogénicas que comprenden uno o más productos de translación de secuencias de nucleótidos de acuerdo con la reivindicación 3 y/o uno de los péptidos de acuerdo con la reivindicación 7 o reivindicación 8.
- 10. Anticuerpos que se dirigen contra uno o más de los péptidos de acuerdo con la reivindicación 7 o reivindicación 8.
- 1 1. Método para el diagnóstico in-vitro de un virus de VI H-1 que no es del grupo M, ni del O, caracterizado porque comprende poner en contacto una muestra biológica que se ha retirado de un paciente, con anticuerpos de acuerdo con la reivindicación 10, que posiblemente se pueden combinar con anticuerpos de VIS anti-CPZGAB y detectar los complejos inmunológicos que se formaron entre los antígenos de VI H-1 , los cuales posiblemente estar presentes en la muestra biológica, y los anticuerpos.
- 12. Reactivo para diagnosticar un virus de VI H-1 que no es M, que no es O, caracterizado porque comprende una secuencia de acuerdo con cualquiera de las reivindicaciones 3, 4, 7 ó 8.
- 13. Método para tamizar y tipificar un virus de VI H-1 que no es del grupo M, ni del O, caracterizado porque comprende poner en contacto uno de los fragmentos de acuerdo con la reivindicación 3 ó reivindicación 4 con el ácido nucleico del virus que será tipificado y detectando el híbrido que se formó.
- 14. Equipo para diagnosticar un virus de VI H-1 que no es del grupo M, ni del O, caracterizado porque incluye por lo menos un reactivo de acuerdo con la reivindicación 12. RESU MEN Cepas retrovirales del grupo de VI H-1 que no es del grupo M, ni del O, en particular una cepa designada YBF30, sus fragmentos y también sus usos como un reactivo de diagnóstico y un agente inmunogénico. Los virus de VI H-1 que difieren tanto del grupo M y del grupo O, exhiben las siguientes características: poca o ninguna reactividad serológica con respecto a las proteínas de los grupos M y O y fuerte reactividad serológica con respecto a las proteínas que se derivan de la cepa YBF30 de acuerdo con la invención o la cepa VIS de CPZGAB; ausencia de la amplificación genomica cuando se usan iniciadores en las regiones env y gag y los grupos de VI H-1 de M y O; amplificación genomica en presencia de los iniciadores que se derivan de la cepa YBF30, de acuerdo con la invención; homología de los productos del gen de cubierta que es mayor al 70% con respecto a la de la cepa YBF30.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR96/15087 | 1996-12-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA99005320A true MXPA99005320A (es) | 2000-05-01 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8227185B2 (en) | Non-M, non-O HIV-1 strains, fragments and uses | |
US5773602A (en) | DNA fragments obtained from a novel human immunodeficiency virus designated LAVMAL | |
Willey et al. | Increase in soluble CD4 binding to and CD4-induced dissociation of gp120 from virions correlates with infectivity of human immunodeficiency virus type 1 | |
Desai et al. | Molecular cloning and primary nucleotide sequence analysis of a distinct human immunodeficiency virus isolate reveal significant divergence in its genomic sequences. | |
US7029679B2 (en) | Variant of LAV viruses | |
US6897301B2 (en) | Reference clones and sequences for non-subtype B isolates of human immunodeficiency virus type 1 | |
US6511801B1 (en) | HIV-1 group O antigens and uses thereof | |
US5824482A (en) | Purification, cloning, and characterization of a novel human immunodeficiency virus LAVMAL | |
MXPA99005320A (es) | Cepas de vih-1 que no son del grupo m, ni son del grupo o, fragmentos y uso | |
CA1340875C (en) | Variants of lav viruses their dna- and protein- components and their uses, particularly for diagnostic purposes and for the preparation of immunogenic compositions |