PL190220B1 - Sposób otrzymywania żywego Birnawirusa, wirus wytworzony tym sposobem oraz szczepionka zawierająca wymieniony wirus - Google Patents
Sposób otrzymywania żywego Birnawirusa, wirus wytworzony tym sposobem oraz szczepionka zawierająca wymieniony wirusInfo
- Publication number
- PL190220B1 PL190220B1 PL97332184A PL33218497A PL190220B1 PL 190220 B1 PL190220 B1 PL 190220B1 PL 97332184 A PL97332184 A PL 97332184A PL 33218497 A PL33218497 A PL 33218497A PL 190220 B1 PL190220 B1 PL 190220B1
- Authority
- PL
- Poland
- Prior art keywords
- virus
- ibdv
- rna
- leu
- segments
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000013518 transcription Methods 0.000 title claims description 21
- 230000035897 transcription Effects 0.000 title claims description 21
- 230000015572 biosynthetic process Effects 0.000 title claims 6
- 238000003786 synthesis reaction Methods 0.000 title claims 5
- 241000702626 Infectious bursal disease virus Species 0.000 claims abstract description 78
- 241000700605 Viruses Species 0.000 claims abstract description 71
- 239000002299 complementary DNA Substances 0.000 claims abstract description 47
- 208000015181 infectious disease Diseases 0.000 claims abstract description 26
- 229960005486 vaccine Drugs 0.000 claims abstract description 25
- 230000002458 infectious effect Effects 0.000 claims abstract description 20
- 239000002609 medium Substances 0.000 claims abstract description 12
- 239000001963 growth medium Substances 0.000 claims abstract 4
- 238000012545 processing Methods 0.000 claims abstract 3
- 208000027312 Bursal disease Diseases 0.000 claims abstract 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 70
- 210000004027 cell Anatomy 0.000 claims description 42
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 35
- 102000039446 nucleic acids Human genes 0.000 claims description 32
- 108020004707 nucleic acids Proteins 0.000 claims description 32
- 150000007523 nucleic acids Chemical class 0.000 claims description 32
- 210000003501 vero cell Anatomy 0.000 claims description 30
- 239000002245 particle Substances 0.000 claims description 27
- 239000013612 plasmid Substances 0.000 claims description 27
- 108020004414 DNA Proteins 0.000 claims description 23
- 238000001890 transfection Methods 0.000 claims description 17
- 241000287828 Gallus gallus Species 0.000 claims description 15
- 235000013330 chicken meat Nutrition 0.000 claims description 13
- 108090000623 proteins and genes Proteins 0.000 claims description 13
- 239000006228 supernatant Substances 0.000 claims description 12
- 102000004169 proteins and genes Human genes 0.000 claims description 11
- 101710081079 Minor spike protein H Proteins 0.000 claims description 10
- 238000000338 in vitro Methods 0.000 claims description 10
- 239000000047 product Substances 0.000 claims description 10
- 102000004190 Enzymes Human genes 0.000 claims description 9
- 108090000790 Enzymes Proteins 0.000 claims description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 9
- 244000144977 poultry Species 0.000 claims description 9
- 235000013594 poultry meat Nutrition 0.000 claims description 9
- 101710132601 Capsid protein Proteins 0.000 claims description 8
- 101710197658 Capsid protein VP1 Proteins 0.000 claims description 8
- 102000016911 Deoxyribonucleases Human genes 0.000 claims description 8
- 108010053770 Deoxyribonucleases Proteins 0.000 claims description 8
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 claims description 8
- 101710137500 T7 RNA polymerase Proteins 0.000 claims description 8
- 101710108545 Viral protein 1 Proteins 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 241000702263 Reovirus sp. Species 0.000 claims description 7
- 102000006382 Ribonucleases Human genes 0.000 claims description 7
- 108010083644 Ribonucleases Proteins 0.000 claims description 7
- 230000010076 replication Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 101710172711 Structural protein Proteins 0.000 claims description 5
- 239000007795 chemical reaction product Substances 0.000 claims description 5
- 210000001161 mammalian embryo Anatomy 0.000 claims description 5
- 239000002773 nucleotide Substances 0.000 claims description 5
- 125000003729 nucleotide group Chemical group 0.000 claims description 5
- 230000002441 reversible effect Effects 0.000 claims description 5
- 238000013519 translation Methods 0.000 claims description 5
- 230000003612 virological effect Effects 0.000 claims description 5
- 241001465754 Metazoa Species 0.000 claims description 4
- 108060004795 Methyltransferase Proteins 0.000 claims description 4
- 108010076039 Polyproteins Proteins 0.000 claims description 4
- 230000000890 antigenic effect Effects 0.000 claims description 4
- 230000002238 attenuated effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- 241000286209 Phasianidae Species 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000002255 vaccination Methods 0.000 claims description 3
- 241000711450 Infectious bronchitis virus Species 0.000 claims description 2
- 230000006378 damage Effects 0.000 claims description 2
- 230000012010 growth Effects 0.000 claims description 2
- 238000002955 isolation Methods 0.000 claims description 2
- 239000002243 precursor Substances 0.000 claims description 2
- 201000010099 disease Diseases 0.000 claims 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims 10
- 241001493065 dsRNA viruses Species 0.000 claims 10
- 108010067390 Viral Proteins Proteins 0.000 claims 4
- 241000702628 Birnaviridae Species 0.000 claims 3
- 230000033228 biological regulation Effects 0.000 claims 3
- 230000001419 dependent effect Effects 0.000 claims 3
- 238000013461 design Methods 0.000 claims 3
- 230000014509 gene expression Effects 0.000 claims 3
- 230000001506 immunosuppresive effect Effects 0.000 claims 3
- 230000007246 mechanism Effects 0.000 claims 3
- 230000003472 neutralizing effect Effects 0.000 claims 3
- 230000001717 pathogenic effect Effects 0.000 claims 3
- 238000011160 research Methods 0.000 claims 3
- 241001260012 Bursa Species 0.000 claims 2
- 241000282552 Chlorocebus aethiops Species 0.000 claims 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims 2
- 241000991587 Enterovirus C Species 0.000 claims 2
- 206010062016 Immunosuppression Diseases 0.000 claims 2
- 241000710921 Infectious pancreatic necrosis virus Species 0.000 claims 2
- 108700026244 Open Reading Frames Proteins 0.000 claims 2
- 241000702244 Orthoreovirus Species 0.000 claims 2
- 241000711798 Rabies lyssavirus Species 0.000 claims 2
- 241000702670 Rotavirus Species 0.000 claims 2
- 210000000234 capsid Anatomy 0.000 claims 2
- 210000002950 fibroblast Anatomy 0.000 claims 2
- 230000002163 immunogen Effects 0.000 claims 2
- 229940031551 inactivated vaccine Drugs 0.000 claims 2
- 238000004806 packaging method and process Methods 0.000 claims 2
- 238000011084 recovery Methods 0.000 claims 2
- 241000712461 unidentified influenza virus Species 0.000 claims 2
- 230000006648 viral gene expression Effects 0.000 claims 2
- 230000009447 viral pathogenesis Effects 0.000 claims 2
- 241000251468 Actinopterygii Species 0.000 claims 1
- 241000700663 Avipoxvirus Species 0.000 claims 1
- 208000035473 Communicable disease Diseases 0.000 claims 1
- 108020004635 Complementary DNA Proteins 0.000 claims 1
- 108091035707 Consensus sequence Proteins 0.000 claims 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims 1
- 241000233482 Drosophila X virus Species 0.000 claims 1
- 241000588724 Escherichia coli Species 0.000 claims 1
- 241000238631 Hexapoda Species 0.000 claims 1
- 206010061598 Immunodeficiency Diseases 0.000 claims 1
- 208000029462 Immunodeficiency disease Diseases 0.000 claims 1
- 241000237852 Mollusca Species 0.000 claims 1
- 208000010359 Newcastle Disease Diseases 0.000 claims 1
- 241000237502 Ostreidae Species 0.000 claims 1
- 108091005804 Peptidases Proteins 0.000 claims 1
- 239000004365 Protease Substances 0.000 claims 1
- 108010078762 Protein Precursors Proteins 0.000 claims 1
- 102000014961 Protein Precursors Human genes 0.000 claims 1
- 101000933967 Pseudomonas phage KPP25 Major capsid protein Proteins 0.000 claims 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 1
- 241001130226 Tellina virus Species 0.000 claims 1
- 241000255588 Tephritidae Species 0.000 claims 1
- 108020000999 Viral RNA Proteins 0.000 claims 1
- 239000000427 antigen Substances 0.000 claims 1
- 108091007433 antigens Proteins 0.000 claims 1
- 102000036639 antigens Human genes 0.000 claims 1
- 210000003719 b-lymphocyte Anatomy 0.000 claims 1
- 230000001413 cellular effect Effects 0.000 claims 1
- 150000001875 compounds Chemical class 0.000 claims 1
- 230000034994 death Effects 0.000 claims 1
- 238000011161 development Methods 0.000 claims 1
- 230000018109 developmental process Effects 0.000 claims 1
- 231100000676 disease causative agent Toxicity 0.000 claims 1
- 244000144992 flock Species 0.000 claims 1
- 230000007813 immunodeficiency Effects 0.000 claims 1
- 230000006698 induction Effects 0.000 claims 1
- 210000003734 kidney Anatomy 0.000 claims 1
- 210000003292 kidney cell Anatomy 0.000 claims 1
- 210000001165 lymph node Anatomy 0.000 claims 1
- 108020004999 messenger RNA Proteins 0.000 claims 1
- 244000005700 microbiome Species 0.000 claims 1
- 235000020636 oyster Nutrition 0.000 claims 1
- 230000008506 pathogenesis Effects 0.000 claims 1
- 210000001236 prokaryotic cell Anatomy 0.000 claims 1
- 230000008929 regeneration Effects 0.000 claims 1
- 238000011069 regeneration method Methods 0.000 claims 1
- 230000000717 retained effect Effects 0.000 claims 1
- 230000011664 signaling Effects 0.000 claims 1
- 241000114864 ssRNA viruses Species 0.000 claims 1
- 208000024891 symptom Diseases 0.000 claims 1
- 241000701447 unidentified baculovirus Species 0.000 claims 1
- 241001529453 unidentified herpesvirus Species 0.000 claims 1
- 230000029812 viral genome replication Effects 0.000 claims 1
- 239000013603 viral vector Substances 0.000 claims 1
- 210000002845 virion Anatomy 0.000 claims 1
- 235000013351 cheese Nutrition 0.000 description 206
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 72
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 67
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 54
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 49
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 49
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 48
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 35
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 25
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 21
- 239000002585 base Substances 0.000 description 21
- 108010050848 glycylleucine Proteins 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 12
- 230000000120 cytopathologic effect Effects 0.000 description 12
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 10
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- 108010061238 threonyl-glycine Proteins 0.000 description 10
- 108010065920 Insulin Lispro Proteins 0.000 description 9
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 9
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 108010089804 glycyl-threonine Proteins 0.000 description 9
- 108010057821 leucylproline Proteins 0.000 description 9
- 108010077112 prolyl-proline Proteins 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 7
- 108010087924 alanylproline Proteins 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 108010018625 phenylalanylarginine Proteins 0.000 description 7
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 6
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 6
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 108010068380 arginylarginine Proteins 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 108010053725 prolylvaline Proteins 0.000 description 6
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 5
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 5
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 5
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 5
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 5
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 5
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 5
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 5
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 5
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 5
- 108010085325 histidylproline Proteins 0.000 description 5
- 238000010166 immunofluorescence Methods 0.000 description 5
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 4
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 4
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 4
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 4
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 4
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 4
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 4
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 4
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 4
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 4
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 4
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 4
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 4
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 4
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 4
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 4
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 4
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 239000012894 fetal calf serum Substances 0.000 description 4
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 4
- 239000010410 layer Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 238000003757 reverse transcription PCR Methods 0.000 description 4
- 239000003381 stabilizer Substances 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- 241000023308 Acca Species 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 3
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 3
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 3
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 3
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 3
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 3
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 3
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 3
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 3
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 3
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 3
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 3
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 3
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 3
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 3
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 3
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 3
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 3
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 3
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 3
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 3
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N Leu-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 3
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 3
- HQXSFFSLXFHWOX-IXOXFDKPSA-N Lys-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N)O HQXSFFSLXFHWOX-IXOXFDKPSA-N 0.000 description 3
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- OZILORBBPKKGRI-RYUDHWBXSA-N Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 OZILORBBPKKGRI-RYUDHWBXSA-N 0.000 description 3
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 3
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 3
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 3
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 3
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 3
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 3
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 3
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 3
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 3
- QJIOKZXDGFZQJP-OYDLWJJNSA-N Trp-Trp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QJIOKZXDGFZQJP-OYDLWJJNSA-N 0.000 description 3
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 3
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 3
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 3
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 3
- 239000002671 adjuvant Substances 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 238000012869 ethanol precipitation Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 3
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 2
- YBPLKDWJFYCZSV-ZLUOBGJFSA-N Ala-Asn-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N YBPLKDWJFYCZSV-ZLUOBGJFSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 2
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 2
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 2
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 2
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 2
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 2
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 2
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 2
- DVUFTQLHHHJEMK-IMJSIDKUSA-N Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O DVUFTQLHHHJEMK-IMJSIDKUSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 2
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 2
- NXTYATMDWQYLGJ-BQBZGAKWSA-N Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CS NXTYATMDWQYLGJ-BQBZGAKWSA-N 0.000 description 2
- 241001200922 Gagata Species 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 2
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 2
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 2
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 2
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 2
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 2
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 2
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 2
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 2
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 2
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 2
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 229930182816 L-glutamine Natural products 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 2
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 2
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 2
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 2
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 2
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- MDSUKZSLOATHMH-UHFFFAOYSA-N N-L-leucyl-L-valine Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(O)=O MDSUKZSLOATHMH-UHFFFAOYSA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 2
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 2
- BSJCSHIAMSGQGN-BVSLBCMMSA-N Phe-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O BSJCSHIAMSGQGN-BVSLBCMMSA-N 0.000 description 2
- BELBBZDIHDAJOR-UHFFFAOYSA-N Phenolsulfonephthalein Chemical compound C1=CC(O)=CC=C1C1(C=2C=CC(O)=CC=2)C2=CC=CC=C2S(=O)(=O)O1 BELBBZDIHDAJOR-UHFFFAOYSA-N 0.000 description 2
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 2
- FDINZVJXLPILKV-DCAQKATOSA-N Pro-His-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O FDINZVJXLPILKV-DCAQKATOSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 2
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 2
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 2
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 2
- UCTIUWKCVNGEFH-OBJOEFQTSA-N Pro-Val-Gly-Pro Chemical compound N([C@@H](C(C)C)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 UCTIUWKCVNGEFH-OBJOEFQTSA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 2
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 2
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 2
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 2
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 2
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108010001244 Tli polymerase Proteins 0.000 description 2
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 2
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 2
- NLKUJNGEGZDXGO-XVKPBYJWSA-N Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLKUJNGEGZDXGO-XVKPBYJWSA-N 0.000 description 2
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 2
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 2
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 2
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 2
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 2
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 2
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- BCBFMJYTNKDALA-UFYCRDLUSA-N Val-Phe-Phe Chemical compound N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O BCBFMJYTNKDALA-UFYCRDLUSA-N 0.000 description 2
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 239000003651 drinking water Substances 0.000 description 2
- 235000020188 drinking water Nutrition 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- -1 for example Substances 0.000 description 2
- 229960002743 glutamine Drugs 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000003125 immunofluorescent labeling Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 238000012768 mass vaccination Methods 0.000 description 2
- 229960003531 phenolsulfonphthalein Drugs 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 210000001995 reticulocyte Anatomy 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 2
- QZNNVYOVQUKYSC-JEDNCBNOSA-N (2s)-2-amino-3-(1h-imidazol-5-yl)propanoic acid;hydron;chloride Chemical compound Cl.OC(=O)[C@@H](N)CC1=CN=CN1 QZNNVYOVQUKYSC-JEDNCBNOSA-N 0.000 description 1
- ALBODLTZUXKBGZ-JUUVMNCLSA-N (2s)-2-amino-3-phenylpropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1 ALBODLTZUXKBGZ-JUUVMNCLSA-N 0.000 description 1
- JFOWDKWFHZIMTR-RUCXOUQFSA-N (2s)-2-aminopentanedioic acid;(2s)-2,5-diamino-5-oxopentanoic acid Chemical compound OC(=O)[C@@H](N)CCC(N)=O.OC(=O)[C@@H](N)CCC(O)=O JFOWDKWFHZIMTR-RUCXOUQFSA-N 0.000 description 1
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- YRIZYWQGELRKNT-UHFFFAOYSA-N 1,3,5-trichloro-1,3,5-triazinane-2,4,6-trione Chemical compound ClN1C(=O)N(Cl)C(=O)N(Cl)C1=O YRIZYWQGELRKNT-UHFFFAOYSA-N 0.000 description 1
- LDGWQMRUWMSZIU-LQDDAWAPSA-M 2,3-bis[(z)-octadec-9-enoxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)C)OCCCCCCCC\C=C/CCCCCCCC LDGWQMRUWMSZIU-LQDDAWAPSA-M 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- IBAOFQIOOBQLHE-UHFFFAOYSA-N 2-amino-3,9-dihydropurin-9-ium-6-one;chloride Chemical compound Cl.N1C(N)=NC(=O)C2=C1N=CN2 IBAOFQIOOBQLHE-UHFFFAOYSA-N 0.000 description 1
- QDGAVODICPCDMU-UHFFFAOYSA-N 2-amino-3-[3-[bis(2-chloroethyl)amino]phenyl]propanoic acid Chemical compound OC(=O)C(N)CC1=CC=CC(N(CCCl)CCCl)=C1 QDGAVODICPCDMU-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 239000001763 2-hydroxyethyl(trimethyl)azanium Substances 0.000 description 1
- 101150009256 ACA5 gene Proteins 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- XAGIMRPOEJSYER-CIUDSAMLSA-N Ala-Cys-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XAGIMRPOEJSYER-CIUDSAMLSA-N 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 1
- ZSOICJZJSRWNHX-ACZMJKKPSA-N Ala-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@H](C)[NH3+] ZSOICJZJSRWNHX-ACZMJKKPSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 1
- LIWMQSWFLXEGMA-WDSKDSINSA-N Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)N LIWMQSWFLXEGMA-WDSKDSINSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- 241000272517 Anseriformes Species 0.000 description 1
- 101100332655 Arabidopsis thaliana ECA2 gene Proteins 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- WYBVBIHNJWOLCJ-IUCAKERBSA-N Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N WYBVBIHNJWOLCJ-IUCAKERBSA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- POZKLUIXMHIULG-FDARSICLSA-N Arg-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N POZKLUIXMHIULG-FDARSICLSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- KEZVOBAKAXHMOF-GUBZILKMSA-N Arg-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N KEZVOBAKAXHMOF-GUBZILKMSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- KWTQSFXGGICVPE-WCCKRBBISA-N Arginine hydrochloride Chemical compound Cl.OC(=O)[C@@H](N)CCCN=C(N)N KWTQSFXGGICVPE-WCCKRBBISA-N 0.000 description 1
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 1
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 1
- RGGVDKVXLBOLNS-JQWIXIFHSA-N Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)N)C(O)=O)=CNC2=C1 RGGVDKVXLBOLNS-JQWIXIFHSA-N 0.000 description 1
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- PJERDVUTUDZPGX-ZKWXMUAHSA-N Asp-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O PJERDVUTUDZPGX-ZKWXMUAHSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- HTSSXFASOUSJQG-IHPCNDPISA-N Asp-Tyr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HTSSXFASOUSJQG-IHPCNDPISA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 241000711404 Avian avulavirus 1 Species 0.000 description 1
- NOWKCMXCCJGMRR-UHFFFAOYSA-N Aziridine Chemical compound C1CN1 NOWKCMXCCJGMRR-UHFFFAOYSA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 101150116295 CAT2 gene Proteins 0.000 description 1
- 101100326920 Caenorhabditis elegans ctl-1 gene Proteins 0.000 description 1
- 101100228206 Caenorhabditis elegans gly-6 gene Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 235000019743 Choline chloride Nutrition 0.000 description 1
- RGTVXXNMOGHRAY-WDSKDSINSA-N Cys-Arg Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RGTVXXNMOGHRAY-WDSKDSINSA-N 0.000 description 1
- OCEHKDFAWQIBHH-FXQIFTODSA-N Cys-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N OCEHKDFAWQIBHH-FXQIFTODSA-N 0.000 description 1
- CEZSLNCYQUFOSL-BQBZGAKWSA-N Cys-Arg-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O CEZSLNCYQUFOSL-BQBZGAKWSA-N 0.000 description 1
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 1
- LHMSYHSAAJOEBL-CIUDSAMLSA-N Cys-Lys-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O LHMSYHSAAJOEBL-CIUDSAMLSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- QXNVGIXVLWOKEQ-UHFFFAOYSA-N Disodium Chemical compound [Na][Na] QXNVGIXVLWOKEQ-UHFFFAOYSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 1
- RKAQZCDMSUQTSS-FXQIFTODSA-N Gln-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RKAQZCDMSUQTSS-FXQIFTODSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- ARPVSMCNIDAQBO-YUMQZZPRSA-N Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ARPVSMCNIDAQBO-YUMQZZPRSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 1
- KFHASAPTUOASQN-JYJNAYRXSA-N Gln-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KFHASAPTUOASQN-JYJNAYRXSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 1
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- MIQCYAJSDGNCNK-BPUTZDHNSA-N Glu-Gln-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MIQCYAJSDGNCNK-BPUTZDHNSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 1
- ZGXGVBYEJGVJMV-HJGDQZAQSA-N Glu-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O ZGXGVBYEJGVJMV-HJGDQZAQSA-N 0.000 description 1
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 1
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 1
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 1
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 1
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- XMAUFHMAAVTODF-STQMWFEESA-N His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 1
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 1
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- 101000829958 Homo sapiens N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- UWBDLNOCIDGPQE-GUBZILKMSA-N Ile-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN UWBDLNOCIDGPQE-GUBZILKMSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- TUYOFUHICRWDGA-CIUDSAMLSA-N Ile-Met Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCSC TUYOFUHICRWDGA-CIUDSAMLSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 1
- 235000013878 L-cysteine Nutrition 0.000 description 1
- 239000004201 L-cysteine Substances 0.000 description 1
- IFQSXNOEEPCSLW-DKWTVANSSA-N L-cysteine hydrochloride Chemical compound Cl.SC[C@H](N)C(O)=O IFQSXNOEEPCSLW-DKWTVANSSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- 229930182844 L-isoleucine Natural products 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- 239000004395 L-leucine Substances 0.000 description 1
- 235000019454 L-leucine Nutrition 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- MDSUKZSLOATHMH-IUCAKERBSA-N Leu-Val Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C([O-])=O MDSUKZSLOATHMH-IUCAKERBSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- 241000208202 Linaceae Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- FSNCEEGOMTYXKY-JTQLQIEISA-N Lycoperodine 1 Natural products N1C2=CC=CC=C2C2=C1CN[C@H](C(=O)O)C2 FSNCEEGOMTYXKY-JTQLQIEISA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- DKTNGXVSCZULPO-YUMQZZPRSA-N Lys-Gly-Cys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O DKTNGXVSCZULPO-YUMQZZPRSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 1
- DRINJBAHUGXNFC-DCAQKATOSA-N Met-Asp-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O DRINJBAHUGXNFC-DCAQKATOSA-N 0.000 description 1
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 1
- MIAZEQZXAFTCCG-UBHSHLNASA-N Met-Phe-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 MIAZEQZXAFTCCG-UBHSHLNASA-N 0.000 description 1
- WEDDFMCSUNNZJR-WDSKDSINSA-N Met-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O WEDDFMCSUNNZJR-WDSKDSINSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- NSTPXGARCQOSAU-VIFPVBQESA-N N-formyl-L-phenylalanine Chemical compound O=CN[C@H](C(=O)O)CC1=CC=CC=C1 NSTPXGARCQOSAU-VIFPVBQESA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 101100126846 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) katG gene Proteins 0.000 description 1
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical group N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- OHUXOEXBXPZKPT-STQMWFEESA-N Phe-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 OHUXOEXBXPZKPT-STQMWFEESA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 1
- GZGPMBKUJDRICD-ULQDDVLXSA-N Phe-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O GZGPMBKUJDRICD-ULQDDVLXSA-N 0.000 description 1
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- ALJGSKMBIUEJOB-FXQIFTODSA-N Pro-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 ALJGSKMBIUEJOB-FXQIFTODSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- MCPXQHVVCPTRIM-HJOGWXRNSA-N Pro-Trp-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)[C@@H]1CCCN1 MCPXQHVVCPTRIM-HJOGWXRNSA-N 0.000 description 1
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 1
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 101710141795 Ribonuclease inhibitor Proteins 0.000 description 1
- 229940122208 Ribonuclease inhibitor Drugs 0.000 description 1
- 102100037968 Ribonuclease inhibitor Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 1
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- UIIMBOGNXHQVGW-DEQYMQKBSA-M Sodium bicarbonate-14C Chemical compound [Na+].O[14C]([O-])=O UIIMBOGNXHQVGW-DEQYMQKBSA-M 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241001455617 Sula Species 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- LKEKWDJCJSPXNI-IRIUXVKKSA-N Thr-Glu-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LKEKWDJCJSPXNI-IRIUXVKKSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 1
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- KAFKKRJQHOECGW-JCOFBHIZSA-N Thr-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(O)=O)=CNC2=C1 KAFKKRJQHOECGW-JCOFBHIZSA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- NDLHSJWPCXKOGG-VLCNGCBASA-N Thr-Trp-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N)O NDLHSJWPCXKOGG-VLCNGCBASA-N 0.000 description 1
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- GKUROEIXVURAAO-BPUTZDHNSA-N Trp-Asp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GKUROEIXVURAAO-BPUTZDHNSA-N 0.000 description 1
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 1
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 1
- GQHAIUPYZPTADF-FDARSICLSA-N Trp-Ile-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 GQHAIUPYZPTADF-FDARSICLSA-N 0.000 description 1
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 1
- DXYQIGZZWYBXSD-JSGCOSHPSA-N Trp-Pro Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(O)=O DXYQIGZZWYBXSD-JSGCOSHPSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 1
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- WPRVVBVWIUWLOH-UFYCRDLUSA-N Tyr-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPRVVBVWIUWLOH-UFYCRDLUSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 1
- CLEGSEJVGBYZBJ-MEYUZBJRSA-N Tyr-Thr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CLEGSEJVGBYZBJ-MEYUZBJRSA-N 0.000 description 1
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 1
- JAQGKXUEKGKTKX-HOTGVXAUSA-N Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 1
- MJUTYRIMFIICKL-JYJNAYRXSA-N Tyr-Val-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJUTYRIMFIICKL-JYJNAYRXSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- NXPDPYYCIRDUHO-ULQDDVLXSA-N Tyr-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 NXPDPYYCIRDUHO-ULQDDVLXSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- VDPRBUOZLIFUIM-GUBZILKMSA-N Val-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N VDPRBUOZLIFUIM-GUBZILKMSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- JYVKKBDANPZIAW-AVGNSLFASA-N Val-Arg-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N JYVKKBDANPZIAW-AVGNSLFASA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- AYHNXCJKBLYVOA-KSZLIROESA-N Val-Trp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N AYHNXCJKBLYVOA-KSZLIROESA-N 0.000 description 1
- KJFBXCFOPAKPTM-BZSNNMDCSA-N Val-Trp-Val Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 KJFBXCFOPAKPTM-BZSNNMDCSA-N 0.000 description 1
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- FHHZHGZBHYYWTG-INFSMZHSSA-N [(2r,3s,4r,5r)-5-(2-amino-7-methyl-6-oxo-3h-purin-9-ium-9-yl)-3,4-dihydroxyoxolan-2-yl]methyl [[[(2r,3s,4r,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl] phosphate Chemical compound N1C(N)=NC(=O)C2=C1[N+]([C@H]1[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=C(C(N=C(N)N4)=O)N=C3)O)O1)O)=CN2C FHHZHGZBHYYWTG-INFSMZHSSA-N 0.000 description 1
- DFPAKSUCGFBDDF-ZQBYOMGUSA-N [14c]-nicotinamide Chemical compound N[14C](=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-ZQBYOMGUSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 229960003767 alanine Drugs 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 1
- 229910000318 alkali metal phosphate Inorganic materials 0.000 description 1
- 229940087168 alpha tocopherol Drugs 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 229960004050 aminobenzoic acid Drugs 0.000 description 1
- APKFDSVGJQXUKY-INPOYWNPSA-N amphotericin B Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-INPOYWNPSA-N 0.000 description 1
- 239000010775 animal oil Substances 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 108010066988 asparaginyl-alanyl-glycyl-alanine Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- VEZXCJBBBCKRPI-UHFFFAOYSA-N beta-propiolactone Chemical compound O=C1CCO1 VEZXCJBBBCKRPI-UHFFFAOYSA-N 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229960005069 calcium Drugs 0.000 description 1
- FAPWYRCQGJNNSJ-UBKPKTQASA-L calcium D-pantothenic acid Chemical compound [Ca+2].OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O.OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O FAPWYRCQGJNNSJ-UBKPKTQASA-L 0.000 description 1
- 229960002079 calcium pantothenate Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 239000013553 cell monolayer Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 150000008280 chlorinated hydrocarbons Chemical class 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 229960003178 choline chloride Drugs 0.000 description 1
- SGMZJAMFUVOLNK-UHFFFAOYSA-M choline chloride Chemical compound [Cl-].C[N+](C)(C)CCO SGMZJAMFUVOLNK-UHFFFAOYSA-M 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 229960002433 cysteine Drugs 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- FFYPMLJYZAEMQB-UHFFFAOYSA-N diethyl pyrocarbonate Chemical compound CCOC(=O)OC(=O)OCC FFYPMLJYZAEMQB-UHFFFAOYSA-N 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- MWRBNPKJOOWZPW-CLFAGFIQSA-N dioleoyl phosphatidylethanolamine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(COP(O)(=O)OCCN)OC(=O)CCCCCCC\C=C/CCCCCCCC MWRBNPKJOOWZPW-CLFAGFIQSA-N 0.000 description 1
- 238000002845 discoloration Methods 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 210000002308 embryonic cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000003889 eye drop Substances 0.000 description 1
- 229940012356 eye drops Drugs 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 1
- 229960002449 glycine Drugs 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- IXCSERBJSXMMFS-UHFFFAOYSA-N hydrogen chloride Substances Cl.Cl IXCSERBJSXMMFS-UHFFFAOYSA-N 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 229940090044 injection Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 229960003136 leucine Drugs 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 229960003646 lysine Drugs 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- CJWXCNXHAIFFMH-AVZHFPDBSA-N n-[(2s,3r,4s,5s,6r)-2-[(2r,3r,4s,5r)-2-acetamido-4,5,6-trihydroxy-1-oxohexan-3-yl]oxy-3,5-dihydroxy-6-methyloxan-4-yl]acetamide Chemical compound C[C@H]1O[C@@H](O[C@@H]([C@@H](O)[C@H](O)CO)[C@@H](NC(C)=O)C=O)[C@H](O)[C@@H](NC(C)=O)[C@@H]1O CJWXCNXHAIFFMH-AVZHFPDBSA-N 0.000 description 1
- 239000007923 nasal drop Substances 0.000 description 1
- 229940100662 nasal drops Drugs 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- PGSADBUBUOPOJS-UHFFFAOYSA-N neutral red Chemical compound Cl.C1=C(C)C(N)=CC2=NC3=CC(N(C)C)=CC=C3N=C21 PGSADBUBUOPOJS-UHFFFAOYSA-N 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 229960002429 proline Drugs 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 229960000380 propiolactone Drugs 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 239000012474 protein marker Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 229960001153 serine Drugs 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- IFGCUJZIWBUILZ-UHFFFAOYSA-N sodium 2-[[2-[[hydroxy-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyphosphoryl]amino]-4-methylpentanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound [Na+].C=1NC2=CC=CC=C2C=1CC(C(O)=O)NC(=O)C(CC(C)C)NP(O)(=O)OC1OC(C)C(O)C(O)C1O IFGCUJZIWBUILZ-UHFFFAOYSA-N 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 229940054269 sodium pyruvate Drugs 0.000 description 1
- 229960002920 sorbitol Drugs 0.000 description 1
- 229940063673 spermidine Drugs 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 229960002898 threonine Drugs 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229960000984 tocofersolan Drugs 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 229960004441 tyrosine Drugs 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 235000004835 α-tocopherol Nutrition 0.000 description 1
- 239000002076 α-tocopherol Substances 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2720/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsRNA viruses
- C12N2720/00011—Details
- C12N2720/10011—Birnaviridae
- C12N2720/10051—Methods of production or purification of viral material
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S424/00—Drug, bio-affecting and body treating compositions
- Y10S424/816—Viral vaccine for avian species, e.g. poultry or other birds
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S424/00—Drug, bio-affecting and body treating compositions
- Y10S424/826—Bacterial vaccine for avian species, e.g. poultry or other birds
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Microbiology (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Oncology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Communicable Diseases (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
1 Sposób otrzymywania zywego Birnawirusa, w którym Birnawirusem jest wirus zakaznej choroby kalet- kowej (IBDV), znamienny tym, ze obejmuje nastepujace etapy. - otrzymanie cD N A segmentu A i segmentu B genomu Birnawirusa, - przetworzenie wym ienionego cDNA w celu wyprodukowania syntetycznych transkryptów RNA, gdzie wspomniane transkrypty RNA sa dodatnio polarnymi transkryptami RNA wspomnianych segmentów A i B, - dokonanie transfekcji komórek zywicielskich wspomnianymi syntetycznymi transkryptami RNA, - inkubacje wspomnianych komórek zywicielskich w pozywce kulturowej oraz - wyizolowanie zyw ego, zakaznego Birnawirusa ze wspomnianej pozywki kulturowej 7 Zywy, chimeryczny wirus zakaznej choroby kaletkowej (IBDV), gdzie wymieniony wirus jest wytwo- rzony sposobem, obejmujacym etapy - otrzymywania cD N A wirus zakaznej choroby kaletkowej (IBDV) segmentów A i B, - kopiowania wym ienionego cDNA w celu wytworzenia syntetycznych transkryptów RNA wymienionych segmentów A i B, - transfekcje komórki zywiciela wymienionymi transkryptami syntetycznego RNA, - inkubacji wymienionych komórek zywiciela w pozywce, oraz - wyizolowania zywego, chimerycznego wirus zakaznej choroby kaletkowej (IBDV) z wymienionej pozywki 9 Szczepionka, zawierajaca zywy, chimeryczny wirus zakaznej choroby kaletkowej (IBDV), znamienna tym, ze wspomniany wirus wytworzony jest sposobem, obejmujacym etapy - otrzymywania cD N A wirus zakaznej choroby kaletkowej (IBDV) segmentów A i B, - kopiowania wym ienionego cDNA w celu wytworzenia syntetycznych transkryptów RNA wymienionych segmentów A i B, - transfekcje komórki zywiciela wymienionymi transkryptami syntetycznego RNA, - inkubacji wymienionych komórek zywiciela w pozywce, oraz - wyizolowania zyw ego, chimerycznego wirus zakaznej choroby kaletkowej (IBDV) z wymienionej pozywki, w której wymieniony zywy chimeryczny Birnawirus jest przed podaniem pozbawiany aktywnosci lub oslabiany PL 190220 B 1 PL PL PL PL PL
Description
Przedmiotem wynalazku jest także szczepionka dla drobiu przeciw IBDV zawierająca ochronną ilość wyprodukowanego przez rekombinację wirusa lub jego części, w której wirus jest pozbawiony aktywności lub zmodyfikowany w taki sposób, ze nie jest on wirulentny.
Wirus może zostać pozbawiony aktywności za pomocą metod chemicznych lub fizycznych. Chemiczne pozbawienie aktywności może być dokonane poprzez poddanie wirusa działaniu np. enzymów, aldehydu mrówkowego, beta-propiolaktonu, iminy etylenowej lub jej pochodnej, rozpuszczalnika organicznego (chlorowanego węglowodoru) lub detergentu.
Jeżeli zachodzi taka potrzeba, substancja pozbawiająca aktywności może zostać zneutralizowana po pozbawieniu wirusa aktywności.
Fizyczne pozbawianie aktywności może zostać przeprowadzone przez poddanie wirusa promieniowaniu takiemu jak światło UV, promieniowaniu rentgenowskiemu łub promieniowaniu gamma.
Wirus może zostać atenuowany znanymi metodami, takimi jak wielokrotne pasazowanie, delecja sekwencji kwasu nukleinowego oraz ukierunkowana mutageneza, zarówno przed jak i po wyprodukowaniu zakaźnego wirusa w celu otrzymania wirusa, który zachowuje wystarczającą antygenowość a jednocześnie posiada zredukowaną wirulencję.
Akceptowalne fizjologicznie nośniki szczepionek dla drobiu są znane technice i nie zachodzi potrzeba ich dalszego opisu w niniejszym tekście.
Oprócz tego, ze nośnik musi być możliwy do fizjologicznego przyjęcia przez drób, nie może on ingerować w odpowiedź immunologiczną wywoływaną przez szczepionkę oraz/lub w wydzielanie przez nią produktu polipeptydowego.
Szczepionka według wynalazku może zawierać także inne dodatki, takie jak m. m. środki wspomagające i stabilizatory, w ilościach znanych technice. Środki wspomagające takie jak wodorotlenek glinu, fosforan glinu, oleje roślinne i zwierzęce itp., powinny być stosowane ze szczepionką w ilościach wystarczających do wzmocnienia immunologicznej odpowiedzi na IBDV. Ilość dodawanych do szczepionki środków wspomagających będzie zrózni190 220 cowana w zalezności od rodzaju środka, najczęściej sięga ona od około 0,1 do około 100 razy ciężar EBDV, najbardziej pożądana ilość to od około 1 do około 10 razy ciężar IBDV.
Szczepionka według wynalazku może także zawierać różne stabilizatory. Użyty może zostać każdy odpowiedni stabilizator, m.in. węglowodany takie jak D-sorbitol, mannitol, skrobia, sacharoza, dekstryna czy glukoza; białka takie jak albumina lub kazeina; oraz bufory jak alkaliczny fosforan metalu, itp. Stabilizator jest szczególnie korzystny gdy przygotowuje się preparat w postaci suchej szczepionki poprzez liofilizację.
Szczepionka według wynalazku może być podawana w każdy stosowny, znany sposób szczepienia drobiu m.in. przez nos, przez oczy, w zastrzyku, w pitnej wodzie, w pożywieniu, przez ekspozycję itp. Najlepiej aby szczepionka była podawana poprzez techniki masowego szczepienia takie jak umieszczanie szczepionki w wodzie pitnej lub przez rozpylanie w pomieszczeniu ze zwierzętami. W przypadku szczepienia w zastrzyku, szczepionkę najlepiej podawać pozajelitowo. Podanie pozajelitowe w powyższym znaczeniu oznacza szczepienie przez zastrzyk dożylny, podskórny, domięśniowy lub wewnątrzotrzewny.
Obecnie wynaleziona szczepionka jest podawana u drobiu w celu zapobiegania IBVD zarówno przed jak i po wylęgu. Najlepiej jest, gdy szczepionka podawana jest przed narodzeniem, i po 6 tygodniu życia. Do drobiu zalicza się m.in. kurczęta, koguty, kury, broilery, roastery, reproduktory, nioski, indyki i kaczki.
Szczepionka według wynalazku może być dostępna w sterylnych pojemnikach w postaci opakowań jednostkowych lub w innych ilościach Powinna być przechowywana w zamrożeniu, poniżej -20°C, najlepiej poniżej -70°C. Przed użyciem powinna być rozmrożona, zaraz po tym może być ponownie zamrożona. W celu podawania leku dla drobiu, wyprodukowany poprzez rekombinację wirus, może być zawieszony w nośniku w ilości około 104 do 107 pfu/ml, a bardziej preferowana ilość to około 105 do 106 pfu/ml w nośniku takim jak roztwór soli. Unieaktywniona szczepionka może zawierać antygenowy równoważnik 104 do 107 pfu/ml zawieszony w nośniku. Mogą być także stosowane inne nośniki, zgodnie ze znanym stanem nauki. Przykładami farmaceutycznie akceptowalnych nośników są rozcieńczalniki i chemicznie obojętne nośniki farmaceutyczne, znane technice. Najlepiej, aby nośnik lub rozcieńczalnik dał się pogodzić z podawaniem szczepionki przy pomocy technik masowego szczepienia Nośnik lub rozcieńczalnik może tez być zgodny z innymi metodami podawania szczepionki, takimi jak zastrzyk, krople do oczu, krople do nosa itp.
Przedmiot wynalazku może być także zastosowany do produkcji kombinacji szczepionki z materiałem IBDV. Materiał IBDV może być kombinowany z materiałem antygenowym wirusa Newcastle Disease Virus Infectious Bronchitis, wirusa Reo, wirusa Adeno i/lub wirusa Marek.
Powyższe zastosowania obecnego wynalazku są dalej opisane w przykładach. Wynalazek nie jest ograniczony do podanych przykładów i możliwe są różne odchylenia w przykładach znanych w nauce, nie mające bezpośredniego związku z dziedziną obecnego wynalazku.
Figura 1 jest schematycznym diagramem konstruktów cDNA używanych do syntezy pozytywnych cząsteczek ssRNAs wirusa IBDV za pomocą polimerazy T7 RNA. Konstrukt pUC19FLAD78 zawiera cDNA segmentu A szczepu D78 IBDV a zrekombinowany plazmid pUC18FLA23 zawiera pełnej długości cDNA segmentu A szczepu 23/82 IBDV. Segment A koduje poliproteinę (VP2-VP4-VP3) i ostatnio zidentyfikowane białko VP5. Plazmid pUC18FLBP2 zawiera cDNA szczepu P2 segmentu B, który koduje polimerazę RNA zalezną od RNA (VP1). Specyficzne sekwencje wirusa są podkreślone a sekwencja T7 promotora pisana kursywą. Miejsca restrykcyjne są pogrubione i zaznaczone. Miejsca przecięcia zlinearyzowanych plazmidów pokazano w postaci pionowych strzałek natomiast kierunki transkrypcji są zaznaczone poziomymi strzałkami.
Figura 2 pokazuje analizę zelu agarowego produktów reakcji transkrypcji które zostały użyte do transfekcji komórek Vero. Syntetyczne RNA transkrybowano in vitro przy użyciu polimerazy T7 RNA i zlinearyzowanych plazmidów, odpowiednio z pUC19FLAD78 (linie 2, 4 i 6), zawierającego cząsteczkę cDNA segmentu A szczepu D78 IBDV oraz z pUC18FLBP2 (linie 1, 3 i 5) zawierającego cDNA segmentu B szczepu P2. Po transkrypcji, mieszaniny reakcyjne były albo poddane działaniu DN-azy (linie 1 i 2), RN-azy (linie 3 i 4) lub pozostawio8
190 220 ne nieruszone (linie 5 i 6). Dwa μl produktów reakcji zostały przeanalizowane na 1% żelu agarozowym. Jako markera użyto lambda DNA, pocięte enzymami Hindlll/EcoR I.
Figura 3 pokazuje porównanie sekwencji nukleotydowych sklonowanych fragmentów RT-PCR z segmentów A i B chimerycznego szczepu 23A/P2B IBDV (tłusta czcionka) ze znanymi sekwencjami segmentów A i B odpowiednio szczepu 23/82 serotypu I i szczepu P2 serotypu I. Tożsame nukleotydy są połączone dwukropkiem.
Figura 4 pokazuje sekwencję DNA pUC18FLA23.
Figura 5 pokazuje sekwencję DNA pUC19FLAD78.
Figura 6 pokazuje sekwencję DNA pUC18FLBP2.
Przykłady
Wirusy i komórki.
Dwa szczepy serotypu IIBDV, osłabiony szczep P2 z Niemiec i szczep D78 szczepionki (Intervet International) oraz jeden szczep serotypu II, apatogeniczny szczep 23/82, zostały rozmnożone w komórkach embrionu kurczaka (CEC) oraz oczyszczone (Mundt, E, et al, Virology, 209, 10-18 (1995); Vakharia, VN, et al, Yirus Res, 31, 265-273 (1994)) Komórki Vero zostały wyhodowane w środowisku M199 uzupełnionym 5% fetal calf serum (FCS) oraz użyte w eksperymentach transfekcji. Dalsze rozmnażanie otrzymanego wirusa i badania immunofluorescencyjne były prowadzone w komórkach Vero (Mundt, E., et al, JGen Yirol, 76, 437-443, (1995)). Do analizy na płytkach wykorzystano pojedynczą warstwę komórek zarodkowych kurczaka (CEC) (Muller, H , et al , Viuus Rss, 4, 297-309 (1986)).
Konstrukcja klonów cDNAo pełnej długości'genomu IBDV.
Klony cDNAo segmentach A i B pełnej długości były przygotowywane niezależnie. Klon cDNA zawierający cały odcinek kodujący RNA segmentu A ze szczepu D78 został przygotowany przy zastosowaniu standardowych procedur i metod klonowania (Vakharia, V.N., et al., Virus Res., 31, 165-173 (1994)). Porównując sekwencje końcowe D78 z ostatnio opublikowanymi sekwencjami końcowymi innych szczepów IBDV (Mundt, E., et al., Virology, 209, 10-18 (1995)), zaobserwowano, ze klony D78 cDNA nie posiadały odpowiednio, pierwszych 17 i ostatnich 10 nukleotydów na każdym końcu 5' i 3' sekwencji. Dlatego, do budowy klonu cDNA o pełnej długości segmentu A, zsyntetyzowane zostały dwie pary starterów (A5'-D78, A5-IPD78 i A3'-IPD78) i użyte w reakcji PCR (tabela 1). Segmenty DNA zostały zamplifikowane zgodnie z protokołem dostawcy (New England Biolabs) przy użyciu „Deep Vent Polymerase” (polimerazy DNA o wysokiej wierności). Zamplifikowane fragmenty zostały wklonowane do miejsca EcoR I w wektorze pCRII (Invitrogen Corp.) aby otrzymać odpowiednio plazmidy pCRD78A5' i pCRD78A3'. W celu otrzymania plazmidu pUC19FLAD78 (SEQ ID NOS:27 AND 29), który zawiera pełnej długości kopię cDNA segmentu A kodującego wszystkie białka strukturalne (VP2, VP4 i VP3, SEQ iD NO:30) oraz niestrukturalne białko VP5 (SEQ ID NO:28) (fig. 1), każdy plazmid został przecięty enzymami EcoR I i Sal I, a otrzymane fragmenty zostały doligowane do wektora pUC19 przeciętego enzymem EcoR I.
Dwie pary starterów (A5'-23,A5IP23 i A3-23, A3-IP23; zobacz tabela 1) zostały zastosowane do odwrotnej transkrypcji (RT) dsRNA genomu wirusowego szczepu 23/82 z wykorzystaniem „SuperScript RT II” (odwrotna transkryptaza ze zredukowaną aktywnością RN-azy H, GIBCO/BRL). Produkty reakcji RT-PCR zostały oczyszczone przez ekstrakcję fenol/chloform i wytrącenie w etanolu. W celu otrzymania dwóch fragmentów cDNA ograniczonych przez odpowiednie pary starterów A5'-23, A5-IP23 i A3'-23, A3-IP23, produkty reakcji RT zostały zamplifikowane w reakcji PCR przy użyciu „Deep Vent polymerase”. Zarówno reakcja Rt jak i PCR zostały przeprowadzone zgodnie z protokołem dostawcy. Otrzymane fragmenty PCR mające tępe końce, zostały doligowane do wektora pUCIS przeciętego enzymem Sma I, co pozwoliło na otrzymanie plazmidów pUC23A5' i pUC23A3'. Koniec 3' segmentu A zawarty w plazmidzie pUC23A3 został następnie doligowany do plazmidu pUC23A5' porzeciętego eznymem Hind III-BsiB I, w celu utworzenia pełnej długości cDNA segmentu A szczepu 23/82. Otrzymany plazmid został nazwany pUC18FLA23 (SEQ ID NOS: 31 AND 33) (fig. 1) i koduje on białka strukturalne VP2, VP3 i VP4 (SEQ ID NO: 32) oraz niestrukturalne białko VP5 (SEQ ID NO: 34).
190 220
W celu otrzymania klonów cDNA segmentu B szczepu P2, stworzone zostały dwie pary starterów (B5'-P2, B5-IPP2 i B3'-P.2, B3-IPP2) zgodnie z opublikowanymi sekwencjami, po czym zostały one użyte do reakcji RT-PCR (tabela 1). Jako matrycy użyto genomowe dsRNA a fragmenty cDNA, zostały zamplifikowane zgodnie z protokołem dostawcy (Perkin-Elmer Cetus). W celu otrzymania klonów pBSP2B5' i pBSP2B3', zamplifikowane fragmenty, mające tępe końce, zostały doligowane do wektora pBS (Stratagene) przeciętego enzymem Sma I. Aby skonstruować pełnej długości klon segmentu B, najpierw sklonowano fragment 5' plazmidu pBSP2B5 w obszar między miejscami EcoR I i Pst I wektora pUCIS, co doprowadziło do otrzymania pUCP2B5'. Następnie, fragment 3' końcowy plazmidu pBSP2B3' został wstawiony między unikalne obszary Bgl II i Pst I plazmidu pUCP2B5', aż do otrzymania pełnej długości plazmidu pUC18FLBP2 (SEQ ID NO:25), który koduje białko VP1 (SEQ ID NO:26) (fig. 1). Plazmidy pUC18FLBP2, pUC18FLA23 ipUC19FLAD78 zostały całkowicie zsekwencjonowane przy użyciu systemu sekwencjonowania DNA „Sequenase” (U.S. Biochem.), dane sekwencyjne analizowane były przy użyciu programów „dNaSIS” (Pharmacja) lub „PC/Gene” (Intelligenetics). Integralność konstruktów o pełnej długości została sprawdzona w systemie transkrypcji in vitro i translacji w lizacie retikulocytów przy użyciu polimerazy T7 rNa (Promega).
Transkrypcja i translacja syntetycznych RNA.
Plazmidy pUC19FLAD 78, pUC18FLA23 i pUC18FLBP2 zostały przecięte odpowiednio enzymami BsrG I, Nsi I i Pst I (zobacz fig. 1), oraz wykorzystane jako matryca dla transkrypcji in vitro, z użyciem polimerazy T7 RNA (Promega). W skrócie, próby do cięcia enzymami zostały dostosowane do 0,5% SDS i poddane procesowi inkubacji z proteinazą K (0,5 mg/ml) przez 1 godzinę w temperaturze 37°C.
Zlinearyzowane matryce DNA (~3 ug) zostały odzyskane po wytrąceniu etanolem i dodane oddzielnie do mieszaniny reakcji transkrypcji (50 ul) zawierającej 40 mM Tris-HCl (pH 7,9), 10 mM NaCl, 6 mM MgCE, 2 mM spermidyny, po 0,5 mM ATP, CTP i UTP każdy, 0,1 mM GTP, 0,25 mM cap analog [m7G(5') PPP(5') G], 120 jednostek RN-azyny (inhibitor rybonukleazy), 150 jednostek polimerazy T7 RNA (Promega), oraz poddane procesowi inkubacji przez 1 godzinę w temperaturze 37°C.
Syntetyczne transkrypty RNA zostały oczyszczone przez ekstrakcję z mieszaniną fenol/chloroform i wytrącenie etanolem. Dla kontroli, produkty transkrypcji zostały poddane działaniu DNazy lub RNazy (Promega), przed przeprowadzeniem oczyszczania.
Komórki Vero hodowano, aż do 80% zgromadzenia się na 60 mm płytkach i jednokrotnie przepłukano buforowanym fosforanami roztworem solanki (PBS). Trzy ml „OPTI-MEM I” (środowisko zredukowanego płynu surowiczego zawierające bufor HEPES, dwuwęglan sodowy, hipoksantynę, tymidynę, pirogronian sodowy, L-glutaminę, pierwiastki śladowe, czynniki wzrostu i fenol J&&; z GIBCO/BRL) zostały dodane do warstwy komórek na powierzchni pożywki i komórki zostały poddane inkubacji w 37°C przez 1 godzinę w inkubatorze CO2. Równocześnie, 0,15 ml „OPTI-MEM I” zostało poddanych inkubacji z 1,25 ng z odczynnikiem „Lipofectin” (chlorek (N-[1-(2,3-dioleyloxy)propyl]-N,N,N-trimethylammoniowy i dwuoleoilofosfatydyletanolaminy, GIBCO/BRL) na 45 min. w rurze polistyrenowej w temperaturze pokojowej.
Syntetyczne transkrypty RNA obu segmentów, zawieszono w 0,15 ml wody traktowanej DEPC (diethyl pyrocarbonate), po czym zostały one dodane do mieszanki OPTI-MEMLipofectin, delikatnie zamieszane i poddane inkubacji w lodzie przez 5 min Po usunięciu „OPTI-MEM” z warstwy komórek znajdujących się na powierzchni pożywki w 60 mm szalkach i zastąpieniu go świeżym roztworem „OPTI-MEM” w ilości 1,5 ml, mieszaninę zawierającą kwas nukleinowy dodawano kroplami do komórek Vero i delikatnie zamieszano. Po dwóch godzinach inkubacji w 37°C mieszanina została zastąpiona środkiem M199 [CaCE (bezwodny), Fe(NO3)3, 9H2O, KCl, MgSO4 (bezwodny), NaCl, NałEPOflEO, NaHCO3, L-Alanina, L-Arginina HCl, kwas L-Aspartowy, L-Cysteina HCl H2O, L-Cysteina 2HC1, kwas L-Glutamowy, L-Glutamina, Glicyina, L-Histydyna HCl H2O, L-Hydroksyprolina, L-Isoleucyna, L- Leucyna, 1-Lizyna HCl, 1-Metionina, L-Fenyloalanina L-Prolina, L-Seryna, L-Threonina, L-Tryptofan, L-Tyrozyna 2 Na 2 H2O, L-Valina, Alpha tocoferol PO4 Na2, kwas
190 220
Ascorbinowy, Biotyn, Calferol, pantotenian wapnia D-Calcium, chlorek choliny, kwas foliowy, I-Inozytol, Menandion NaHSOa 3 H2O, Niacyna, amid kwasu nikotynowego, kwas p-aminobenzoesowy, Pyridoxyna HCl, Ryboflawina, Tiamine HCl, Yitamin A octan, Adenina SO4, kwas adenylinowy, ATP, Na2, Cholesterol, 2-Deoksy-D-Ryboza, d-Glucoza, Glutacjon, Guanina HCl, Hypoksantyna Na, Fenol Red Na, Ryboza, octan sodu (bezwodny), Tymina, Tween 80, Uracyl, i Ksantyna Na; z Mediatech, Inc] zawierającym 5% FCS (bez przepłukiwania komórek), a następnie komórki były inkubowane w temperaturze 37°C w pożądanych odstępach czasu.
Identyfikacja wygenerowanego wirusa IBDV.
Komórki CEC zostały zainfekowane przefiltrowanym (0,2 ul) supematantem z komórek Vero poddanych transfekcji z transkryptami pUC18FLA23 ipUC18FLP2B. W 16 godzin po infekcji, przeprowadzono izolację wszystkich kwasów nukleinowych z komórki (Mundt, E. et al., Virology, 209, 10-18 (1995)). Zaprojektowano startery zgodnie z opublikowanymi sekwencjami i przeprowadzono reakcję RT-PCR, a otrzymane fragmenty zostały sklonowane i zsekwencjonowane (Mundt, E. et al., Virology, 209, 10-18 (1995)). Dane sekwencji były analizowane przy użyciu programu „DNASIS”.
Immunofluorescencja.
Komórki Vero, hodowane na szkiełkach nakrywkowych do momentu 80% złączenia się, zostały zainfekowane supernatantami otrzymanymi z poddanych transfekcji komórek Vero (po rozmrożeniu) a następnie inkubowane w temperaturze 37°C przez dwa dni. Następnie komórki zostały przepłukane, utrwalone acetonem i poddane działaniu poliklonalnej króliczej surowicy przeciw-IBDV. Po przepłukaniu, komórki poddano reakcji z przeciwciałem goatanti-rabbit wyznakowanym fluoresceiną (Kirkegaard & Perry Lab.) i sprawdzone w mikroskopie fluorescencyjnym.
Analiza płytek.
Warstwa drugorzędowych komórek CEC, wzrastająca na płytkach 60 mm, została zaszczepiona supernatantami pochodzącymi z transfekowanych komórek Vero. Po 1 godzinie od zainfekowania, komórki zostały jednokrotnie przepłukane roztworem PBS i pokryte 0,8% Agarem noble (Difco) zawierającym 10% pożywkę tryptozo-fosforanową, 2% FCS, 0,112% NaHCO3, 103 jednostek penicyliny, 103 (ug/ml streptomycyny, 0,25 ug/ml fungizone, 0,0005% neutral red, 0,0015% phenol red. Komórki były inkubowane w temperaturze 37°C przez 2 do 3 dni, do czasu aż wzrost na płytkach mógł zostać zaobserwowany, a miejsca, gdzie nastąpiło zniszczenie komórek przez wirus policzone (Muller, H., et al., Yirus Res, 4, 297-309(1986)).
Konstrukcja klonów cDNAo pełnej długości.
W celu wykorzystania systemu odwrotnej genetyki dla wirusów dsRNA IBDV, skonstruowano dwa niezależne klony cDNA zawierające segment A szczepu D78 i segment B szczepu P2 (fig. 1). Każdy z plazmidów kodował albo prekursor białek strukturalnych (VP2, VP4, VP3) iVP5 albo tylko białko VP1 (zależną od RNA polimeraze RNA). Plazmid pUC18FLB2 poddany cięciu enzymem Pst I i transkrypcji in vitro przez polimerazę T7 RNA, mógł dać RNA zawierający poprawne końce 5' i 3'. Z kolei plazmid pUC19FLAD78 poddany cięciu enzymem BsrG I i transkrypcji dawał cząsteczkę RNA zawierająca poprawny koniec 5', ale z dodatkowymi czterema nukleotydami na końcu 3'. Przeprowadzona łącznie transkrypcja i translacja powyższych plazmidów w systemie retikulocytów królika, dała produkty białkowe, które były prawidłowo przetworzone i po przeprowadzeniu frakcjonowania w żelu SDSpoliakryloamidowym i autoradiografii okazało się, że migrowały łącznie z markerem białek IBDV (dane nie pokazane).
Transkrypcja, transfekcja i powstawanie wirusa zakaźnego.
Transkrypty pozytywnego RNA z segmentu A i B IBDV zostały osobno zsyntetyzowane in vitro przy pomocy polimerazy T7 RNA i przy użyciu zlinearyzowanych plazmidów cDNA o pełnej długości jako matryc (zob. fig 2). Mimo, ze dla segmentu B zostały zaobserwowane dwa rodzaje transkryptów RNA w neutralnym żelu (linie 1 i 5), to frakcjonowanie tych dwóch próbek w żelu denaturującym dało tylko jeden prążek specyficzny dla transkryptu (dane nie pokazane). W celu wykazania, ze transkrypty pozytywnego RNA obu segmentów były potrzebne dla wygenerowania wirusa zakaźnego, mieszaniny transkrypcyjne były inkubowane
190 220 z różnymi nukleazami, jak pokazano w fig. 2. Syntetyczne RNA odzyskane po poddaniu produktów transkrypcji działaniu DNazy (linie 1+2), RNazy (linie 3+4) lub nietraktowane (linie 5+6), zostały użyte do transfekcji komórek Vero. Jako ślepej próby użyto tylko Lipofektyny. Pięć dni po transfekcji, efekt cytopatyczny (CPE) widoczny był tylko w komórkach Vero poddanych transfekcji z połączonymi transkryptami niepotraktowanymi lub produktami transkrypcji poddanymi działaniu DNazy, ale nie z mieszaniną transkrypcyjną poddaną działaniu RNazy lub kontroli transfekowanej ślepą próbą. Ponadto żaden efekt CPE nie został wykryty po poddaniu komórek Vero transfekcji cząsteczkami RNA tylko segmentu A lub B (dane nie pokazane). Te wyniki pokazują, ze replikacja IBDV następowała po transfekcji komórek Vero cząsteczkami pozytywnego ssRNA obu segmentów IBDV. Aby sprawdzić, ze czynnikiem powodującym efekt CPE w komórkach Vero był naprawdę IBDV, poddane transfekcji komórki Vero były rozmrazane, a supematanty były oczyszczane przez wirowanie i użyte do zainfekowania komórek CEC lub komórek Vero. Komórki CEC zainfekowane supematantem wyprowadzonym z transfekowanych komórek Vero mieszaniną transkrypcyjną niepotraktowaną lub potraktowaną DNazą wykazały efekt CPE w dzień po inokulacji (tabela 2). Natomiast, żaden efekt CPE nie był wykrywalny, nawet po pięciu dniach inkubacji z supematantem z komórek Vero transfekowanych mieszaniną transkrypcyjną potraktowaną RNazą, mieszaniną segmentów A lub B nietraktowaną oraz w para-transfekowanych komórkach Vero. Podobnie, gdy komórki Vero na szkiełkach nakrywkowych zostały zainfekowane tymi samymi supematantami jak opisane powyżej i przebadane po 2 dniach przy pomocy barwienia immunofluorescencyjnego, pozytywny sygnał immunofluorescencji dały tylko supematanty wyprowadzone z komórek Vero transfekowanych mieszaninami transkrypcyjnymi, które były albo niepotraktowane w ogóle lub potraktowane DNazą (tabela 2).
Otrzymywanie transfekcyjnego wirusa.
W celu określenia momentu otrzymania wirusa zakaźnego, komórki Vero zostały poddane transfekcji z połączonymi transkryptami RNA segmentów A i B. Supematanty były poddane badaniu na obecność transfekcyjnego wirusa poprzez testy zakazalności i analizę płytek, w 4, 8, 16, 24, i 48 godziny po transfekcji, jak pokazano w tabeli 3. Nasze rezultaty wskazują, że wirus mógł być otrzymany juz w 36 godzin po transfekcji. Miano wirusa wynosiło
2,3-102 pfu/ml, które okazuje się spadać w próbkach otrzymanych później niz 48 godzin po transfekcji.
Generowanie wirusa chimerycznego.
Aby udowodnić, ze cząsteczki pozytywnego ssRNA obu segmentów IBDV są wystarczające do otrzymania wirusa zakaźnego, wygenerowano chimeryczny IBDV. Plazmid pUC18FLA23 zawierający sekwencję segmentu A pełnej długości pochodzącą ze szczepu serotypu II został zlinearyzowany przez cięcie enzymem Nsi I a ssRNA został zsyntetyzowany in vitro przy użyciu polimerazy T7 RNA. Transkrypt ssRNA posiada prawidłowy koniec 5' ale zawiera jedną dodatkową resztę na końcu 3'. Komórki Vero zostały poddane transfekcji cząsteczkami ssRNA segmentu A szczepu 23/82 serotypu II i cząsteczkami segmentu B szczepu P2 serotypu I. 5 dni po transfekcji, gdy widoczny był efekt CPE, supernatant został oczyszczony (po rozmrożeniu) i zastosowany do zainfekowania komórek CEC. Po drugim pasazowaniu w CEC, genomowe RNA wirusa zostało zanalizowane przez reakcję RT-PCR i sekwencjonowanie produktów PCR. Startery dla segmentu A zostały zaprojektowane tak, aby specyficznie amplifikować tylko sekwencje segmentu A pochodzące ze szczepu serotypu II. Startery dla segmentu B przyłączały się do sekwencji obu serotypów. Zamplifikowane produkty były klonowane i sekwencjonowane.
Otrzymane sekwencje segmentu A okazały się być identyczne ze znanymi sekwencjami segmentu A serotypu II szczepu 23/82, podczas gdy sekwencje segmentu B wykazały dokładną homologię do opublikowanych sekwencji segmentu B szczepu P2 serotypu I (fig. 3).
190 220
Tabela 1. Oligonukleotydy użyte do budowy pełnowymiarowych klonów cDNA z segmentów genomów IBDV A i B
190 220
Tabela 2
Wytwarzanie infekcji IBDV z syntetycznych RNA segmentów A i B
Transfekowany materiał | CPE | Immunfluorescencja |
ssRNA A+B, traktowany Dnase | + | + |
ssRNA A+B, traktowany Dnase | - | - |
ssRNA A+B, nietraktowany | + | + |
ssRNA A, nietraktowany | - | - |
ssRNA B, nietraktowany | - | - |
Tylko lipofektyna | - | - |
Komórki Vero były transfekowane syntetycznymi RNA segmentów A i B otrzymanymi w wyniku transkryptywnych reakcji, które były potraktowane lub niepotraktowane DNase lub RNase. Po upływie 5 dni, supernatanty zostały zebrane, oczyszczone przez odwirowanie i analizowane na obecność wirusa. Zakażalność uzyskanego wirusa została określona w CEC przez wystąpienie efektu cytopatycznego (CPE) w 1 -2 dni po sczepieniu. Specyficzność uzyskanego wirusa została określona przez immunofluorescencyjne barwienie zakażonych komórek Vero króliczym serum anty-IBDV.
Tabela 3
Uzyskiwanie wirusa w różnym czasie po transfekcji
Czas w godzinach po transfekcji | CPE | Immunofluorescencja | pfu/ml |
4 | - | - | 0 |
8 | - | - | 0 |
16 | - | - | 0 |
24 | - | - | 0 |
36 | + | + | 2,3 x 102 |
48 | + | + | 6,0 x 102 |
Jak opisano, komórki Vero były wszczepiane do segmentów A i B syntetycznych RNAs. Zakażalność i specyficzność uzyskanego wirusa były wykrywane odpowiednio przez CPE i CEC oraz immunofluorescencję odbarwienia w komórkach Vero. Monowarstwy drugorzędnego CEC były zastosowane do płytki porównawczej po zaszczepieniu komórek supematantami wywodzących się z transfekowanych komórek Vero. Przybliżone miano wirusa zostało obliczone na płytkach powstałych jednostek w mililitrach (pfu/ml).
190 220
LISTA SEKWENCJI (1) INFORMACJE OGÓLNE:
(i) ZGŁASZAJACY: VAKHARIA, Vikram N.
MUNDT, Egbert (ii) TYTUŁ WYNALAZKU: SPOSÓB WYTWARZANIA BIRNAVIRUSA
Z SYNTETYCZNYCH TRANSKRYPTORÓW RNA (iii) LICZBA SEKWENCJI: 34 (iv) ADRES DO KORESPONDENCJI:
(A) ADRESAT: NIKAIDO, MARMELSTEIN, MURRAY & ORAM
LLP (B) ULICA: 655 Fifteeth Street, N. W, Suite 330 - G Street Lobby (C) MIASTO: Washington (D) STAN: DC (E) PAŃSTWO: USA (F) KOD POCZTOWY: 20005-5701 (v) WYMAGANIA DO ODCZYTU:
- (A) TYP NOŚNIKA,: dyskietka FDD (B) KOMPUTER: kompatybilny z IBM PC (C) SYSTEM OPERACYJNY: PC-DOS/MS-DOS (D) OPROGRAMOWANIE: Patentin Release #1.0, Version #1.30 (vi) DANE BIEŻĄCEGO ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: US (B) DATA PRZYJĘCIA:
(C) KLASYFIKACJA:
(vii) DANE PEŁNOMOCNIKA/AGENTA:
(A) NAZWISKO: KITTS, Monica C.
(B) NUMER REJESTRACYJNY: 36,105 (C) NUMER UPRAWNIEŃ/ZEZWOLENIA: P8172-6002 (viii) INFORMACJE TELEKOMUNIKACYJNE:
(A) TELEFON: 202/638-5000 (B) TELEFAKS: 202/638-4810
190 220 (2) INFORMACJE O SEKWENCJI ID NO: 1:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 46 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: podwójna (D) TOPOLOGIA: kolista (ii) TYP CZĄSTECZKI: cDNA (xi) OPIS SEKWENCJI, numer identyfikacyjny sekwencji: 1:
GAATTCGGCT TTAATACGAC TCACTATAGG ATACGATCGG- TCTGAC 46 (2) INFORMACJE O SEKWENCJI ID NO: 2:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 41 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: podwójna (D) TOPOLOGIA: kolista (ii) TYP CZĄSTECZKI: cDNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 2
AATTGGATCC GTTCCCGCGT CCCCTGTACA AAGCCGAATT C 41 (3) INFORMACJE O SEQ ID NO: 3:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 36 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: podwójna (D) TOPOLOGIA, kolista (ii) TYP CZĄSTECZKI: cDNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji. 3:
CGGCGAATTC ATGCATAGGG GACCCGCGAA CGGATC 36 (4) INFORMACJE O SEQ ID NO: 416
190 220 (i) CHARAKTERYSTYKA SEKWENCJI · (A) DŁUGOŚĆ· 44 pary podstawowe (B) TYP· kwas nukleinowy (C) SKRĘTNOŚĆ· podwójna (D) TOPOLOGIA: kolista (ii) TYP CZĄSTECZKI· cDNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 4:
GTCAGACCGA TCGTATCCTA TAGTGAGTCG TATTAGAATT CTCT 44 (5) INFORMACJE O SEQ ID NO· 5· (i) CHARAKTERYSTYKA SEKWENCJI· (A) DŁUGOŚĆ· 33 pary podstawowe (B) TYP· kwas nukleinowy (C) SKRĘTNOŚĆ· podwójna (D) TOPOLOGIA· kolista (ii) TYP CZĄSTECZKI· cDNA (xi) OPIS SEKWENCJI- numer identyfikacyjny sekwencji· 5TTGCATGCCT GCAGGGGGCC CCCGCAGGCG AAG 33 (6) INFORMACJE O SEQ ID NO· 6· (i) CHARAKTERYSTYKA SEKWENCJI(A) DŁUGOŚĆ· 31 par podstawowych (B) TYP· kwas nukleinowy (C) SKRĘTNOŚĆ· podwójna (D) TOPOLOGIA kolista (ii) TYP CZĄSTECZKI· cDNA (xi) OPIS SEKWENCJI· numer identyfikacyjny sekwencji. 6
TCGTATCCTA TAGTGAGTCG TATTAGAATT C (7) INFORMACJE O SEQ ID NO 7· (i) CHARAKTERYSTYKA SEKWENCJI· (A) DŁUGOŚĆ 120 par podstawowych (B) TYP· kwas nukleinowy
190 220 (C) SKRĘTNOŚĆ- pojedyncza (D) TOPOLOGIA: liniowa (ii)TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwengj· 7:
GGAAGCCTGA GTGAGTTGAC TGACTACAGC TACAACGGGC TGATGTCAGC CACTGCGAAC 60
ATCAACGACA AGATCGGGAA CGTTCTAGTT GGAGAAGGGG TGACTGTTCT CAGTCTACCG 120 (8) INFORMACJE O SEQ ID NO: 8:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 120 par podstawowych (B) TYP· kwas nuklernowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 8:
GGAAGCCTGA GTGAGTTGAC TGACTACCAGC TACAACGGGC TGATGTCAGC CACTGCGAAC 60
ATCAACGACA AGATCGGGAA CGTTCTAGTT GGAGAAGGGGTGACTGTTCT
CAGTCTACC
119 (9) INFORMACJE O SEQ ID NO: 9:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 120 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI numer identyfikacyjny sekwencji· 9:
190 220 ^AA^d^A GTGAACTGAC AGATGTTAGC TACAATGGGT TGATGTCTGC AACAGCCAAC 60
ATCAACGACA AAATTGGGAA CGTCCTAGTA GGCGAAGGGG TCACCGTCCT CAGCTTACCC 120 (10) INFORMACJE O SEQ ID NO: 10:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 120 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: luiear (ii) TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI, numer identyfikacyjny sekwencji: 10·
TTTTCAATAG TCCACAGGCG CGAACGAAGA TCTCAGCAGC GTTCGGCATA AAGCCTACTG 60
CTGGACAAGA CGTGGAAGAA CTCTTGATCC CCAAAGTCTG GGTGCCACCT CACCATCCGC 120 (11) INFORMACJE O SEQ ID NO, 11:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 120 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji. 11:
TTTTCAACAG TCCACAGGCG CCAA<CCACGA TCTCAGCAGC GTTCGGCATA AAGCCTACTG 60
CTGGACAAGA CGTGGAAGAA CTCTTGATCC CTAAAGTTTG GGTGCCACCT GAGGATCCGC 120 (12) INFORMACJE O SEQ ID NO. 12190 220 (i) CHARAKTERYSTYKA SEKWENCJI· (A) DŁUGOŚĆ· 120 par podstawowych (B) TYP· kwas nukleinowy (C) SKRĘTNOŚĆ· pojedyncza (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI· DNA (xi) OPIS SEKWENCJI· numer identyfikacyjny sekwencji: 12·
TTTTCAACAG TCCACAGGCG CGAAGCACGA TCTCAGCAGC GTTCGGCATA AAGCCTACTG 60
CTGGACAAGA CGTGGAAGAA CTCTTGATCC CTAAAGTTTG GGTGCCACCT GAGGATCCGC 120 (13) INFORMACJE O SEQ ID NO· 13· (i) CHARAKTERYSTYKA SEKWENCJI· (A) DŁUGOŚĆ· 48 par podstawowych.
(B) TYP· kwas nukleinowy (C) SKRĘTNOŚĆ· pojedyncza (D) TOPOLOGIA· liniowa (ii) TYP CZĄSTECZKI- DNA (xi) OPIS SEKWENCJI· numer identyfikacyjny sekwencji· 13·
TAATACGACT CACTATAGGA TACGATCGGT CTGACCCCGG GGGAGTCA 48 (14) INFORMACJE O SEQ ID NO· 14· (i) CHARAKTERYSTYKA SEKWENCJI· (A) DŁUGOŚĆ· 44 pary podstawowe (B) TYP· kwas nukleinowy (C) SKRĘTNOŚĆ· pojedyncza (D) TOPOLOGIA· liniowa (n)TYP CZĄSTECZKI· DNA (xi) OPIS SEKWENCJI· numer identyfikacyjny sekwencji. 14·
AGAGAATTCT AATAGGACTC ACTATAGGAT ACGATCGGTC TGAC 44
190 220 (15) INFORMACJE O SEQ ID NO: 15:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 30 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (h) TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI, numer identyfikacyjny sekwencji· 15
TGTACAGGGG ACCCGCGAAC GGATCCAATT (16) INFORMACJE O SEQ ID NO: 16:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 36 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (ii)TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 16
CGGCGAATTC ATGCATAGGG GACCCGCGAA CGGATC 36 (17) INFORMACJE O SEQ ID NO: 17:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ. 20 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (n)TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 17
CGTCGACTAC GGGATTCTGG 20 (18) INFORMACJE O SEQ ID NO· 18:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ 20 par podstawowych (B) TYP. kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa
190 220 (ii)TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 18.
CAGAGGCAGT ACTCCGTCTG (19) INFORMACJE O SEQ ID NO: 19:
(i) CHARAKTERYSTYKA SEKWENCJI(A) DŁUGOŚĆ: 20 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: lineinowy (n)TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 19:
AGTCGACCGG ATTCTTGCTT (20) INFORMACJE O SEQ ID NO: 20:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 18 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (n)TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 20:
GAAGCTGTGC GAGAGGAC (21) INFORMACJE O SEQ ID NO: 21:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 44 pary podstawowe (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 21·
AGAGAATTCT AATACGACTC ACTATAGGAT ACGATGGGTC TGAC 44
190 220 (22) INFORMACJE O SEQ ID NO: 22:
(i) CHARAKTERYSTYKA SEKWENCJI.
(A) DŁUGOŚĆ: 33 pary podstawowe (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (n)TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwenqi: 22:
CGATCTGCTG CAGGGGGCCC CCGCAGGCGA AGG (23) INFORMACJE O SEQ ID NO: 23:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 24 pary podstawowe (B) TYP- kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA liniowa (n)TYP CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 23
CTTGAGACTC TTGTTCTCTA CTCC 24 (24) INFORMACJE O SEQ ID NO: 24:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 19 par podstawowych (B) TYP: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: liniowa (u)TYP CZĄSTECZKI· DNA (xi) OPIS SEKWENCJI, numer identyfikacyjny sekwencji. 7:
ATACAGCAAA GATCTCGGG 19 (25) INFORMACJE O SEQ ID NO: 25:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 2827 par podstawowych (B) TYP: kwas nukleinowy
190 220 (C) ZWOJOWOŚĆ· pojedyncza (D) TOPOLOGIA· kolista (u) RODZAJ CZĄSTECZKI· cDNA (ix) WŁAŚCIWOŚCI· (A) NAZWA/KLUCZ· cds (B) POŁOŻENIE. 112.2745 (xi) OPIS SEKWENCJI· numer identyfikacyjny sekwencji 25
GGATACGATG GGTCTGACCC TCTGGGAGTC ACGAATTAAC GTGGCTACTA GGGGCGATAC {0
CCGCCGCTGG CCGCCACGTT AGTGGCCC CTTCTTGATG ATTCTGCCAC C ATG AGT ΙΠ Met Ser
GAC | ATT | TTC | AAC | AGT | CCA | CCC | GGC | CCC | Ad | ACG | ACC | TCC. | GGC | GGC | TTT | 11^5; |
Asp | Ile | Phe | Asn | Ser | Pro | Gln | Ala | JAg | Ser | TTh | 11(2 | Ssu | Ala | Ala | PPh | |
S | H | 15 |
GGC Gly | ATA Ile 20 | AAG Lys | CCT ACT Pro Thr | GCC TGG aic Gly 22 | CCA. GAC GTG (GA (GA CCT TTT Ad CCC | 213 | ||||||||||
GGn 3Ap Vaa | Glu | Glu 30 | Leu | Ilu | 11(2 | Ppo | ||||||||||
ACA | GTT | TGC | GTG | CCA | CCC | TGC | GGC | CCC3 | (CC | GCC | Ad | CCC | ACG | CCG | CCG | 261 |
Lys | Val | Trp | Val | Pro | Pro | Glu | Alp | Pr a | Leu | la | Ser | Ppo | Ssu | Air | Lee | |
35 | 40 | 45 | 55 | |||||||||||||
GCA | AAG | TTC | CTC | AGA | GAG | GAC | Gd | TAC | TCA | GCC | TTG | CCC | CCC | ccc; | TTC | 309 |
ALa | Lys | Phe | Leu | Arg | Gic | JAn | Gly | Ty | Lys | vaa | Leu | GGn | Pr <5 | Ig | Ssu | |
55 | 60 | 65 | ||||||||||||||
CTG | CCC | GAG | AAT | GAG | GAG | TAT | GAG | ACC | ggac | (CCC | ATA | CC | CCA | GAC | TTA | 357 |
Leu | Pro | Glu | Asn | Glu | Glu | tyr | Glu | Thr | Asp | Gln | He | Lee | Poco | Alp | Leu | |
70 | 75 | 80 | ||||||||||||||
GCA | TGG | ATG | CGC | CAG | ATA | GAC | GGG | GCT | GTT | TTA | ACC | CCC | ACT | CTA | TCT | 4θ0> |
ALa | Trp | Met | Arg | Gln | Ile- | Glu | Gly | Ala | Val | Leu | Lys | Pro | Thr | Leu | Ser | |
85 | 90 | 99 | ||||||||||||||
CTC | CCT | ATT | GGA | GAT | CA3 | GAG | TAC | TTC | CCA | JAG | TAC | TAC | COC | ACA | CCC | 453 |
Leu | Pro | Ile | Gly | Asp | Gln | Glu | Tyr | Phe | Pro | Lys | ητ | Tyr | Pro | Thr | His | |
100 | 115, | 110 | ||||||||||||||
CGC | CCT | AGC | ACG | GAG | AAG | CCC | •ACT | GCG | TAC | CCG | CCC | GAC | ATC | GICA | CA | 501 |
Arg | Pro | Ser | Lys | Glu | Lys | Pro | Asn | la | Tjyc | Pro | Pro | Asp | Ile | Ala | Leu | |
115 | 120 | 125 | 130 |
190 220
CTC AAG CAG ATG | ATT TAC CTG | GTT Phe | CCC 0ee | CCG 0TT CCC GAG 0GC | AU GGA | 549 | ||||||||||
Leu Lys | Gln | Met | Ile Tyr 135 | LeL | CGn 140 | Cal | CPO | CGu | Ala | Cm 145 | CGu | |||||
GGC | CTA | AAG | GAT | GAA | GTA | ACC | CTC | TTG | ACC | CAA | AAC | ATA | GAC | MG | W | |
Cly | Leu | Lys | Asp | Glu | Val | Thr | Leu | Leu | Thr | Gln | Asn | Ile | Arg | Asp | Lys | |
150 | 155 | 160 | ||||||||||||||
GCC | TAT | GGA | AGT | GGG | ACC | TAC | ATC | GGA | GCA | GCC. | CAA | CGG | CCT | CGG | CGC | 645 |
Ala | Tyr | Gly | Ser | Gly | Thr | TjGT | Met | Gly | Gln | Ala | Am | c\ao | Ceu | Cal | Ml | |
165 | 170 | 117 | ||||||||||||||
ATG | AAG | GAG | GTC | GCC | ACT | GGA | AGA | AAC | CCA | AAC | MG | GAT | CCT | CTA | AAG | S93 |
Met | Lys | Glu | Val | Ala | Thr | Gly | Arg | Asn | Pro | Asn | Lys | Asp | Pro | Leu | Lys | |
180 | 185 | 190 | ||||||||||||||
CTG | GGG | TAC | ACT | TTT | GAG | AGC | ATC | GCG | CAG | CTA | CTT | GAC | ATC | ACA | CTA | 744 |
Leu | Gly | Tyr | Thr | Phe | Glu | Ser | Ile | Ala | Gln | Leu | Leu | Asp | Ile | Ghr | Leu | |
195 | 200 | 205 | 210 | |||||||||||||
CCG | GTA | GGC | CCA | CCC | GGT | GAG | GAT | GAC | AAG | CCC | TOG | GTG | CCA | CTC | ACA | 7&9 |
Pro | Val | Gly | Pro | Pro | Gly | Glu | Asp | Asp | Lys | Pro | Τη? | Val | Pro | Leu | Tlhr | |
215 | 220 | 225 | ||||||||||||||
AGA | GTG | CCV | TCA | CGG | ATG | TTG | GTG | CTG | ACG | GGA | GAC | GTA | GAT | GGC | GAC | 837 |
Arg | Val | Pro | Ser | Arg | Met | Leu | Val | Leu | Thr | Gly | Asp | Val | Asp | Gly | Asp | |
230 | 235 | 240 | ||||||||||||||
TGT | GAG | GTT | GAA | GAT | TAC | CTT | CCC | AAA | ATC | AAC | CTC | AAG | TCA | GCA | AGG | 885 |
Phe | Glu | Val | Glu | Asp | Tyr | Leu | Pro | Lys | Ile | Asn | Leu | Lys | Ser | Ser | Ser | |
245 | 25 0 | 255 | ||||||||||||||
GGA | CTA | CCA | TAT | GTA | GGT | CGC | ACC | AAA | GGA | GAG | ACA | ATT | TTG | GAG | ATG | 993 |
Gly | Leu | Pro | Tyr | Val | Gly | Arg | Thr | Lys | Gly | Glu | Thr | Ils | Gly | Glu | Met |
260 265 270
AGA GCT ATC TCA AAC CAG GTT | CTC AGA GAG CGA GCA ACA CTC GGG AAG | ||||||||||||||
Ile 275 | Ala | Ile | Ser | Asn | Gln 250 | Phe | Leu | Arg Glu | Leu 255 | Ser Thr | Leu | Leu | Lys 290 | ||
CM | GGG | GCA | TGT | ACA | MG | TTT | GCA | AAC | AAG | MG | MG | CTA | CTC | AGC | ATG |
Gln | Gly | Ala | Gly | Thr | Lys | Gly | Ser | Asn | Lys | Lys | Lys | Leu | Leu | Ser | Mec |
295 | 300 | 305 | |||||||||||||
TTA | AGG | TGG | TAG | GGG | TAC | GTA | TCA | TGC | CTT | TGG | TTT | CCA | MG | Gcr | |
Leu | Ser | Asp | Tyr | Top | Gyo | Leu | Ser | Cys | Gly | Leu | Leu | Phe | Pro | Lys | Ala |
310 | 315 | 320 | |||||||||||||
GM | ATT | TAC | GAC | MA | AGT | ACA | GGG | CTC | ACC | HG | ACC | CGG | AAC | AGA | TGG |
Glu | Arg | Tyr | Asp | Lys | Ser | Ghr | Grp | Leu | Thr | Lys | Ghr | Arg | Asn | Ile | Grp |
325 | 330 | 335 |
9S1
1029
1077
1125
190 220
TCA GCT CCA TCC CCA | ACA CAC CTC | ATG ATC | TCT ATG ATC ACC | TGG Trp | CCC Pro | 1173 | |||||||||
Ser | Ala 340 | Pro | Ser | Pro | Thr | His Leu 345 | Met | Ile | Ser | Ket 350 | Ile | Thr | |||
GTG | ATG | TCC | AAC | AGC | CCA | AAT AAC | GTG | TTG | AAC | ATT | GAA | GGG | TGT | CCA | 1221 |
Val | Met | Ser | Asn | Ser | Pro | Asn Asn | Val | Leu | Asn | Ile | Glu | Gly | Cys | Pro | |
355 | 3S0 | 365 | 370 | ||||||||||||
TCA | CTC | TAC | AAA | TTC | AAC | CCG TTC | AGA | GGA | GGG | TTG | AAC | AGG | ATC | GTC | 1269 |
Ser | Leu | Tyr | Lys | Phe | Aen | Pro Phe | Arg | Gly | Gly | Leu | Asn | Arg | Ile | Val | |
375 | 380 | 385 | |||||||||||||
GAG | TGG | ATA | TTG | GCC | CCG | GAA GAA | CCC | AAG | GCT | CTT | GTA | TAT | GCG | GAC | 1317 |
Glu | Trp | Ile | Leu | Ala | Pro | Glu Glu | Pro | Lys | Ala | Leu | Val | Tyr | Ala | Asp | |
390 | 395 | 400 | |||||||||||||
AAC | ATA | TAC | ATT | GTC | CAC | TCA AAC | ACG | TGG | TAC | TCA | ATT | GAC | CTA | GAG | 1355 |
Asn | Ile | Tyr | Ile | Val | His | Ser Asn | Thr | Trp | Tyr | Ser | Ile | Asp | Leu | Glu | |
405 | 410 | 415 | |||||||||||||
AAG | GGT | GAG | GCA | AAC | TGC | ACT CGC | CAA | CAC | ATG | CAA | GCC | GCA | ATG | TAC | 1413 |
Lys | Gly | Glu | Ala | Asn | Cys | Thr Arg | Gln | His | Met | Gln | Ala | Ala | Met | Tyr | |
420 | 425 | 430 | |||||||||||||
TAC | ATA | CTC | ACC | AGA | GGG | TGG TCA | GAC | AAC | GGC | GAC | CCA | ATG | TTC | AAT | 1461 |
Tyr | Ile | Leu | Thr | Arg | Gly Trp Ser | Asp | Asn | Gly Asp | Pro | Met | Phe | Asn | |||
435 | 440 | 445 | 450 | ||||||||||||
CAA | ACA | TGG | GCC | ACC | TTT | GCC ATG | AAC | ATT | GCC | CCT | GCT | CTA | GTG | GTG | 1509 |
Gln | Thr | Trp | Ala | Thr | Phe | Ala Met | Asn | Ile | Ala | Pro | Ala | Leu | Val | Val | |
455 | 460 | 465 | |||||||||||||
GAC | TCA | TCG | TGC | CTG | ATA | ATG AAC | CTG | CAA | ATT | AAG | ACC | TAT | GGT | CAA | 1557 |
Asp | Ser | Ser | Cys | Leu | Ile | Met Asn | Leu | Gln | Ile | Lys | Thr | Tyr | Gly | Gln | |
470 | 475 | 480 | |||||||||||||
GGC | AGC | GGG | AAT | GCA | GCC | ACG TTC | ATC | AAC | AAC | CAC | CTC | TTG | AGC | ACA | 1605 |
Gly | Ser | Gly | Asn | Ala | Ala | Thr Phe | Ile | Asn | Asn | His | Leu | Leu | Ser | Thr | |
485 | 490 | 49S | |||||||||||||
CTA | GTG | CTT | GAC | CAG | TGG | AAC CTG | ATG | AGA | CAG | CCC | AGA | CCA | GAC | AGC | 1653 |
Leu | Val | Leu | Asp | Gln | Trp | Asn Leu | Met | Arg | Gln | Pro | Arg | Pro | Asp | Ser | |
500 | 505 | SIO | |||||||||||||
GAG | GAG | TTC | AAA | TCA | ATT | GAG GAC | AAG | CTA | GGT | ATC | AAC | TTT | AAG | ATT | 1701 |
Glu | Glu | Phe | Lys | Ser | Ile | Glu Asp | Lys | Leu | Gly | Ile | Asn | Phe | Lys | Ile | |
515 | 520 | 525 | 530 | ||||||||||||
GAG | AGG | TCC | ATT | GAT | GAT | ATC AGG | GGC | AAG | CTG | AGA | CAG | CTT | GTC | CTC | 1748 |
Glu | Arg | ser | Ile | Asp | Asp | Ile Arg | Gly | Lys | Leu | Arg | Gln | Leu | Val | Leu | |
535 | 540 | 54S |
190 220
CTT GCA CCAA CCCc | GGG TAC CTG TGT GGG GGG GTT GAA CCA GAA CAA TCC | 1797 | ||||||||||||||
Leu Ala Gln | Pro 550 | Gly | Gyy | Leu | Ses | riy 555 | Gly Vi1 | Glu | Pro Glu Gln 560 | Ser | ||||||
AGC | CCA | ACT | GTT | GAG | CTT | GAC | CTA | CTA | GGG | TGG | TCA | GCT | ACA | TAC | AGC | 184.5 |
Ser | Pro | Thr | Val | Glu | Leu | Asp | Leu | Leu | GIl | Trp | Ser | Ala | Thr | Tyr | Ser | |
565 | 570 | 575 | ||||||||||||||
AAA | GAT | CTC | GGG | ATC | TAT | GTG | CCG | GTG | CTT | GAC | AAG | GAA | CGC | CTA | TTT | 1&93 |
Lys | Asp | Leu | Gly | Ile | Tyr | Val | Pro | Val | Leu | Asp | Lys | Glu | Arg | Leu | Phe | |
580 | 585 | 590 | ||||||||||||||
TGT | TCT | GCT | GCG | TAT | CCC | AAG | GGA | GTA | GAG | AAC | AAG | AGT | CTC | AAG | TCC | 1941 |
Cys | Ser | Ala | Ala | Tyr | Pro | Lys | Gly | Val | Glu | Asn | Lys | Ser | Leu | Lys | Ser | |
595 | 600 | 605 | 610 | |||||||||||||
AAA | GTC | GGG | ATC | GAG | CAG | GCA | TAC | AAG | GTA | GTC | AGG | TAT | GAG | GCG | TTG | 1133 |
Lys | Val | Gly | Ile | Glu | Gln | Ala | Tyr | Lys | Val | Val | Arg | Tyr | Glu | Ala | Leu | |
615 | 620 | 625 | ||||||||||||||
AGG | TTG | GTA | GGT | GGT | TGG | AAC | TAC | CCA | CTC | CTG | AAC | AAA | GCC | TGC | AAG | 2203 |
Arg | Leu | Val | Gly | Gly | Trp | Asn | Tyr | Pro | Leu | Leu | Asn | Lys | Ala | Cys | Lys | |
630 | 635 | 640 | ||||||||||||||
AAT | AAC | GCA | GGC | GCC | GCT | CGG | CGG | CAT | CTG | GAG | GCC | AAG | GGG | TTC | CCA | 2085 |
Asn | Asn | Ala | Gly | Ala | Ala | Arg | Arg | Hls | Leu | Glu | Ala | Lys | Gly | Phe | Pro | |
645 | 650 | 655 | ||||||||||||||
CTC | GAC | GAG | TTC | CTA | GCC | GAG | TGG | TCT | GAG | CTG | TCA | GAG | TTC | GGT | GAG | 2133 |
Leu | Asp | Glu | Phe | Leu | Ala | Glu | Trp | Ser | Glu | Leu | Ser | Glu | Phe | Gly | Glu | |
660 | 665 | 670 | ||||||||||||||
GCC | TTC | GAA | GGC | TTC | AAT | ATC | AAG | CTG | ACC | GTA | . ACA | TCT | GAG | AGC | CTA | 2181 |
Ala | Phe | Glu | Gly | Phe | Asn | Ile | Lys | Leu | Thr | Val | Thr | Ser | Glu | Ser | Leu | |
675 | 680 | 685 | 690 |
GCC Ala | GAA CTG AAC Glu Leu Asn | AAG Lys 695 | CCA GTA CCC CCC AAG CCC | CCA AAT GTC Pro Asn Val | AAC Asn 705 | AGA Arg | 2223 | |||||||||
Pro | Val | Pro | Pro | Lys 700 | Pro | |||||||||||
CCA | GTC | AAC | ACT | GGG | GGA | CTC | AAG | GCA | GTC | AGC | AAC | GCC | CTC | AAG | ACC | 2273 |
Pro | Val | Asn | Thr | Gly | Gly | Leu | Lvs | Ala | Val | Ser | Asn | Ala | Leu | Lys | Thr | |
710 | 715 | 720 |
GGT | CGG TAC | AGG | AAC | GAA | GCC | GGA | CTG | AGT | GGT | CTC | GTC | CTT | CTA | GCC | 2G25 |
Gly | Arg .Tyr | Arg | Asn | Glu | Ala | Gly | Leu | Ser | Gly | Leu | Val | Leu | Leu | Ala | |
725 | 730 | 735 | |||||||||||||
ACA | GCA AGA | AGC | CGT | CTG | CAA | GAT | GCA | GTT | AAG | GCC | AAG | GCA | GAA | GCC | 2373 |
Thr | Ala Arg | Ser | Arg | Leu | Gln | Asp | Ala | Val | Lys | Ala | Lys | Ala | Glu | Ale | |
740 | 745 | 750 |
190 220
GAG AAA Glu Lvs 755 | CTC Leu | CAC AAG | TCG AGG CAG GAG GGA | GCC GGG GAT GGA TGG CTC | 2421 | ||||||||||
His | Ly s | eer 770 | Ly s | Log | .Asg | Aa. | Ppl 770 | Aa. | AGl | Ga. | Trp | Phe 777 | |||
GAA AGA | TCA | GAA | ACA | CGC | GCA | GAC | CTT | CCT | GGA | JAGI | GCC | GAC | ATC | GCC | 2263 |
Glu Arg | Ser | Glu | Thr; | Lgu | S er | Asp | G eu | Leu | Glu | Lys | Ala | Asp | lis | Ala | |
775 | 778 | 785 | |||||||||||||
AGC AAG | GTC | GCC | CAC | TCT. | GCA | CTC | GTC | GAA | AAC. | AGC | GAC | GCC | CCT | GAA | 2557 |
Ser Lys | Val | Ala | His | S ss | All | L eu | Val | Glu. | TTu | Ssr | Ga. | Ala | Leu | Glu | |
790 | 775 | 800 | |||||||||||||
GCA GTT | CAG | TCG | ACA? | CCC | GGT | GAA | AAC | GCC | JAAG | TAC | COA | (GGA | GTC | AAG | 2550 |
Ala Val | Gln | Ser | Thr | S er | Vvl | Gyy | Ghr | Gro | Lys | Tyr | Pro | Glu | Val | Lys | |
805 | 810 | 815 | |||||||||||||
AAC CCA | CAG | ACC | GCC | TCC | AAA | GCC | GGT | GTT | GCGG | CTC | CCAC | CTG | TTT | GCC | 2201 |
Asn Pro | Gin | Thr | Ala | S er | Aa. | Cpl | rva | Val | Gly | Leu | His | Leu | Pro | Ala | |
820 | 825 | 830 | |||||||||||||
AAG AGA | GCC | ACC | GGT | GTC | CCA | GGC | GCT | CTT | CTC | GGA | GCA | GGA | GCG | AGC | 2666. |
Lys Arg | Ala | Thr | Gly | Val | G Gn | GAl | GAl | Leu | Leu | Gly | Ala | Gly | Thr | Ser | |
835 | 840 | 845 | 850 | ||||||||||||
AGA CCA | ATG | GGG | ATG | GAG | GGC | GCC | GAC | CGG | TCC | AAG | AAC | GCC | GCA | AAA | 2103 |
Arg Pro | Met | Gly | Met | Glu | A Al | gpl | GTh | .Arg | Ser | Lys | Asn | Ala | Val | Lys | |
855 | 880 | 055 | |||||||||||||
ATG GCC | AAA. | GGG | CGG | CAA | CGC | CAA | AAA | GAA | AAC | CGC | CAATAGTTAT | 275S | |||
Met Ala | Lys | Arg | Arg | Gln | Arg | Gln | Lll | GGu | Gse | Arg |
870 875
GATGGGAACC ACTCAAGAAG AGGACACTAA TCCCAGACCC CGTATCCCCG GCCTTCGCCT 2815
GCAAGAATCC CC 2827 (2) CHARAKTERYSTYKA SEKWENCJI (A) DŁUGOŚĆ. 878 aminokwasów (B) RODZAJ aminokwas (C) TOPOLOGIA; liniowa (ii) RODZAJ MOLEKUŁY· proteina (xi) OPIS SEKWENCJI· numer identyfikacyjny sekwencji· 26
Met Ser Asp He Ptie Asn Ser Pro Gin JALa Arg Ser Thr Ile Ser Ala
5 10 15
Ala Phe Gly Ile Lys Pro Thr Ala Gly Gin Asp Val Glu Glu Leu Leu
190 220
25 30
Ile | Pro | Lys ' 35 | Val | Trp | Val | Pro | Pro Glu 40 | Asp | Pro Leu . | Ala 45 | Ser | Pro | Ser |
Arg | Leu 50 | Ala | Lys | Phe | Leu | Arg 55 | Glu Asn | Gly | Tyr Lys ' 60 | Val | Leu | Gln | Pro |
Arg 65 | Ser | Leu | Pro | Glu | Asn 70 | Glu | Glu Tyr | Glu | Thr Asp 75 | Gln | Ile | Leu | Pro 80 |
Asp | Leu | Al a | Trp | Met 85 | Arg | Gln | Ile Glu | Gly 90 | Ala Val | Leu | Lys | Pro 95 | Thr |
Leu | Ser | Leu | Pro 100 | Ile | Gly | Asp | Gln Glu 105 | Tyr | Phe Pro | Lys | Tyr 110 | Tyr | Pro |
Thr | His | Arg 115 | Pro | Ser | Lys | Glu | Lys Pro 120 | Asn | Ala Tyr | Pro 125 | Pro | Asp | Ile |
Ala | Leu 130 | Leu | Lys | Gln | Met | Ile 135 | Tyr Leu | Phe | Leu Gln 100 | Val | Pro | Glu | Ala |
Asn 145 | Glu | Gly | Leu | Lys | Asp 150 | Glu | Val Thr | Leu | Leu Thr 155 | Gln | Asn | Ile | Arg 160 |
Asp | Lys | Ala | Tyr | Gly 165 | Ser | Gly | Thr Tyr | Met 170 | Gly Gln | Ala | Asn | Arg 175 | Leu |
Val | Ala | Met | Lys 180 | Glu | Val | Ala | Thr Gly 185 | Arg | Asn Pro | Asn | Lys 190 | Asp | Pro |
Leu | Lys | Leu 195 | Gly | Tyr | Thr | Phe | Glu Ser 200 | Ile | Ala Gln | Leu 205 | Leu | Asp | Ile |
Thr | Leu 210 | Pro | Val | Gly | Pro | Pro 215 | Gly Glu | Asp | Asp Lys 220 | Pro | Trp | Val | Pro |
Leu 225 | Thr | Arg | Val | Pro | Ser 230 | Arg | Met Leu | Val | Leu Thr 235 | Gly Asp | Val | Asp 200 | |
Gly | Asp | Phe | Glu | Val 245 | Glu | Asp | Tyr Lau | Pro 250 | Lys Ile | Asn | Leu | Lys 255 | Ser |
Ser | Ser | Gly | Leu 250 | Pro | Tyr | Val | Gly Arg 265 | Thr | Lys Gly | Glu | Thr 270 | Ile | Gly |
Glu | Met | Ile 275 | Ala | Ile | Ser | Asn | Gln Phe 280 | Leu | . Arg Glu | Leu 285 | Ser | Thr | Leu |
Leu | . Lys | Gln | . Gly | • Ala | . Gly Thr | • Lys Gly Ser | Asn Lys | Lys | Lys | Leu | i Leu |
190 220
290 295 300
Ser 305 | Met | Leu | Ser | Asp | Tyr Trp 310 | Tyr | Leu Ser Cis Gly Leu Leu Phe Prr | ||||||||
315 | 330 | ||||||||||||||
Lys | Ala | Glu | Arg | Tyr | Asp | Lys | Ser | Tir | Trp | Leu | Thr | Lys | Tihr | AArg | Asn |
325 | 330 | 335 | |||||||||||||
Ile | Trp | Ser | Ala | Pro | Ser | Pro | Tir | His | Leu | Met | Ile | Ser | Met | Ile | T!hr |
340 | 345 | 350 | |||||||||||||
Trp | Pro | VaU | Met | Ser | Asn | Ser | Pro | Asn | Asn | Val | Leu | Asn | Ile | Glu | Gly |
355 | 360 | 355 | |||||||||||||
Cys | Pro | Ser | Leu | Tyr- | Lys | Płee | Asn | Pro | Phe | Arg | Gly | Gly | Łeu | Asn | Mt) |
370 | 375 | 330 | |||||||||||||
Ile | VaU | Glu | Trp | Ile | Leu | Ala | Pro | Glu | Glu | Pro | Lys | Ala | Leu | Val | TTir |
385 | 390 | 395 | 400 | ||||||||||||
Ala | Asp | Asn | Ile | Tyr- | Ile | Val | His | Ser | Asn | Thr | Trp | Tyr | Ser | Ile | AAsp |
405 | 440 | 440 | |||||||||||||
Leu | Glu | Lys | G ty | Glu | -ALa | Asn | Cys | TThr | Arg | Gln | His | Met | Gln | -Aa | -Aa |
420 | 445 | 443 | |||||||||||||
Met | Tyr | Tyr: | I 1u | Leu | Thr | AArg | Gly | Τιρ | Ser | AA;p | Asn | Gty | AAp | Pro | MmI |
435 | 440 | 444 | |||||||||||||
Phe | Asn | Gln | Thr | Trp | AALa | TTr | Phe | Ala | Met | Asn | Ile | Ala | -Pro | Ala | Leu |
450 | 455 | 440 | |||||||||||||
VaT | Val | Asp | SSr | Ser | Cys | Leu | Ile | Mee | Asn | Leu | Gln | Ho | Lys | eur | Tyr |
465 | 470 | 475 | 440 | ||||||||||||
Gly | Gln | Gly | Ser | Gly | Asn | Ala | Ala | Tir | Phe | Ile | Asn | Asn | His | Leu | Leu |
48S | 450 | 495 | |||||||||||||
Ser | Thr | Leu | Val | Leu | Asp | Gln | Τη? | Asn | Leu | Met | Arg | Gln | Pro | Arg | Pro |
500 | 505 | 510 | |||||||||||||
Asp | Ser | du | C-lu | Phe | Lys | Ser | Ile | Glu | Asp | Lys | Leu | Gly | Ile | Asn | Phe |
SIS | 520 | 525 | |||||||||||||
Lys | Ile | Glu | Arg | Ser | Ile | Asp | Asp | Ile | Arg | Gly | Lys | Leu | Arg | Gln | Leu |
530 | 555 | 540 | |||||||||||||
Val | Leu | Leu | Ala | Gln | Puo | Gly | Ty- | leu | Ser | Gly | Gty | Ual | Glu | Pr o | Glu |
545 | 550 | 55- | 560 | ||||||||||||
Gln | Ser | Ser | Pro | Thr | Val | Glu | Leu | A:p | Leu | Leu | Gly | Trp | Ser | Ala | Thut |
190 220
565 570 575
Tyr | Ser | Lys | Asp 530 | Leu | Gly | Ile | Ty-r | Val 505 | Ppo | Val | Leu | Asp | Lys 560 | Glu | 5Ar |
Leu | Phe | CCs 595 | Ser | Ma | M.a | TTyr | Pro 600 | Lys | Gly | aal | Glu | Asn 605 | Lys | See | Leu |
Lys | Ser 610 | Lys | Val | Gly | Ile | Glu 615 | Gln | Ma | Tyr | Lys | aal 620 | Val | Mg | Tyc | Glu |
Ala 625 | Leu | Arg | Leu | V al | Gly 630 | Gly | Trp | Asn | ITyr | Pro 665 | Leu | Leu | Mn | Lys | Ml «40 |
Cys | Lys | Asn | Asn | Ala 645 | Gly | Ma | Ma | Arg | Mg 650 | His | Leu | Glu | Ala | Lys 655 | dl |
Phe | Pro | Leu | Asp 660 | Glu | Phe | Leu | Ma | Glu 665 | Τηρ | Ser | Glu | Leu | Se5 770 | Glu | Phe |
Gly | Glu | Ala 675 | Phe | Glu | Gly | Phe | Asn 660 | Ile | Lys | LeU | Thr | Vl5 660 | Th5 | Ser | Glu |
Ser | Leu 690 | Ala | Glu | Leu | Asn | Lys 695 | Pro | Val | Pro | P^o | Lys 700 | Pro | Pro | Asn | V3l |
Asn 705 | Arg | Pro | Val | Asn | hhr 711 | Gly | Gly | Leu | Lys | Ala 715 | Val | Ser | Asn | Ala | Leu 722 |
Lys | Thr | Gly | Arg | hyr 725 | Mg | 5An | Glu | Ma | Gly 773 | Leu | Ser | Gly | Leu | aal 735 | Llu |
Leu | Ala | hhr | Ala 740 | Arg | Ser | Arg | Leu | Gln 745 | AAp | Ma | Val | Lys | Ala 750 | Lyy | All |
Glu | Ala | Glu 755 | Lys | Leu | His | Lys | Ser 770 | Lys | Pro | Asp | Asp | Pro 765 | Asp | Ma | Alp |
Trp | Phu 770 | Glu | Mg | Ser | Glu | Thr 77 5 | Leu | Sur | Asp | Leu | Luu 700 | Glu | Lys | Ala | Asp |
Ilu 785 | Ma | Ser | Lys | Val | Ala 790 | His | Ser | Ala | Leu | Val 795 | Glu | Thr | Ser | Asp | Ma 800 |
Luu | Glu | Aia | Val | Gln 005 | Ser | Thr | Ser | aal | hyr 301 | hhr | Pro | Lys | iCr | Pro 801 | Glu |
aal | Lys | Asn | Pro 020 | Gln | Thr | Ala | Ser | Asn 805 | Pro | Val | aal | Gly | Leu 830 | His | Leu |
Pro Ala Lys Arg Ala Thr Gly Val Gln Ala Ala Leu Leu Gly Ala GXy
190 220
835 | 840 | 845 | |||||||||
Thr | Ser | Arg | Ppo | MM: | Gly | Met | GGu. AAa | Pro | Thr | Arg | Ser Lys .Asi JTa |
850 | 855 | 860 | |||||||||
Val | Lys | Met | AAa | lll | AAg | Arg | Gln Arg | Gln | Lys | Glu | Se a Arg |
865 870 87S (2) INFORMACJA o sekwencji o numerze identyfikacyjnym· 27 (2) CHARAKTERYSTYKA SEKWENCJI (D) DŁUGOŚĆ· 3261 parpodstawowych (E) RODZAJ: kwas nukleinowy (F) SKRĘTNOŚ: pojedyncza (G) TOPOLOGIA.
(ii) RODZAJ MOLEKUŁY: proteina (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 27
GGATACGATC GGTCTGACCC CGGGGG-^i^TC ACCCGGGGAC AGGCCGTCAA GGCCTTGTTC 60
CAGGATGGGA CTCTTCCTTT TACAACGCTA TCATTG ATG GTT AGT AGA GAT CAG 114
Met | Val 880 | Ser | Arg | Asp | Gln | |||||||||||
ATA | AAC | GAT | CGG | AGC | GAT | GAC | AAA | CCT | GCA | AGA | TCA | AAA | CCC | ACTA | GGA | 116 |
Thr 885 | Asn | Asp | Ar ęi | Ser | Asp 890 | Asp | Lys | Pro | Ala | Arg 895 | Ser | AAn | Pro | Thr | Aap 900 | |
TGT | TCC | GTT | CAT | ACG | GAG | CCT | TCT | GAT | GCC | AAC | AAC | CCG | AAC | GGC | GGT | 220 |
Cys | Ser | Val | His | Thr 905 | GGu | Pro | Ser | Asp | Ala 910 | Asn | Asn | AAg | Thr | Gly 915 | Val | |
CAT | TCC | GGA | CTG | OAC | CCT | GGA | GAA | GGA | GAC | TCT | GGG | CTC | AAA | GAC | CTC | 258 |
His | Ser | Gly | •AAg 920 | His | Pro | Gyy | Glu | Ala 925 | His | Ser | Gln | Val | A^ 930 | ΑΓρ | Leu | |
GAC | CTA | CAA | TTT | GAC | TGT | GG | ©AA | GAC | AG | GTC | AGG | GCC | AAT | TGT | CTT | Ϊ06 |
Asp | Leu | Gln 935 | Phe | JAp | Cys | GLv | Gyy 940 | His | Aao | VZa 1 | Agg | AAa 945 | AAJI | Cys | Lei’ | |
TTT | CCC | TGG | AAT | CCC | GGG | TTC | AAT | GTT | GGG | GCC | TAC | CTA | CTC | ACT | GCT. | 354 |
Phe | Pro 950 | Trp | Ili! | Pro | Tit? | Leu 955 | Asn | Cys | Gly | Cys | Ser 960 | Leu | His | iThr | \Al. |
190 220
GGG CAA Gly Gln 965 | TGG GGA CTA CAA GTT | CC Arg | TC GAT GGC CCC GGC TGG | CCC GGA Pro CTu 980 | 400 | |||||||
T:t | Glu | Leu Gln 970 | Val | Ser | Asp | Ala 975 | Pro Aap | Ccs | ||||
CCT ACC | GGC | CCG | TTA CCA | CTA | CTG | CAG | GCT | ACT | GAA TTC | CG | TCC CCA | 450 |
Pro Thr | Gly | Gln | Leu GGn | Leu | Leu | Gln | Ala | Ser | CTu Ser | Glu | Ser His | |
985 | 990 | 995 | ||||||||||
AGT GAG | GTC | CAA3 | CAC ACT | TCC | TGG | TG | CGT | TTA | TGC ACT· | «Λ | CCA CC | 498 |
Ser Hu | Val | Lys | His Thr | Ser | Trp | Trp | Arg | Leu | Ccs Thr | Lys | Arg Hhs | |
1000 | 1005 | 1010 | ||||||||||
CAT AAA | CGC | CGT | GAC CTT | CCA | AGG | AAG | CCT | GAG | TAlACTAACA l | AATA,ΓTAACT | 551 | |
His Lys | Arg | Arg | Asp Leu | Pro | Arg | Lys | Pro | Glu | ||||
1015 | 1020 |
ACA^TGtG^^TT GATGTCTGCA ACAGCCAACA TCAACGACAA AATTGGGAAC GTCCTAGTAG 611
GGGAA(^<^GGT CACCGTCCTC AGCTTACCCA CATCATATGA TCTTGGGTAT GTGAGGCTTG 671
GTGACCCCAT TCCCGCAATA GGGCTTGACC CAAA.AATGGT AGCCACATGT GACAGCAGTG 731
AClAACCCA | AGTCTACACC | ATlACTACA | CCGATCTTA | CCAATTCTC | TCCAGTACC | 791 |
AlCCAAATAA | AATAAClATC | ACCTATTCT | CAGCCACAT | TAlTACClTC | ACAlACCTCA | 851 |
ACATTAAGAA | AAlACTCATG | TTTCAAACAA | ACATCCACAA | CCTΓATACTA | AACACCACCl | 911 |
TCTACCTCAT | AAACTTTAAT | AAAACAlCGA | TUrCCCG | AGCTATAACC | ACAAlCAATA | 971 |
AACΓAACAAC | CAGCACCAAC | AACCTTATGC | CTTCATCT | TATAATTCCA | ACAlACAAAA | 1031 |
TAlCCClACC | AATCACATCC | ATClAACTAA | AAATAATAAC | CΓCCAllCT | AATAATClAA | 1091 |
CHAGATC | AATATCATAA | TCAAClAAlA | AAAACCTAAC | ACTCCGATC | CATAATAACA | 1151 |
ACTATCCAAA | G^CCCTCdT | CCCGTCCGC | TAATAACCTl | ACAAClAAlT | 1211 | |
CCCTCCTTAC | AATCACTAAA | ATAAACllCT | TCAlACTAlT | CCCAATCCT | AAlCTAAClA | 1271 |
HAACCTUT | TACAAlATAC | AACCAATTTA | ACCClAAAAC | ClTGlACTAC | ACAAlTTAA | 1331 |
TlCTAAATC | AAAGAACCAT | AAACCATCTA | ACCAAClAAA | AlATlCACTA | 1391 | |
ACΓ'TTCATAA | ATACTTCATG | AAAATAACCA | ACCTCACTC | TCcCCTAlAA | ATTACAAAAA | 1451 |
C^TTCCACTT | CAAAACTA | ATCCAAACCA | TlAAAlAAAT | lACTATACCA | ATAATCTCCA | 1511 |
CAT^C^TTCCC | ACCTACCACr | CCCCTAGCCC | lTACAATTGA | AAAlAATCTA | AlCTACCTAC | 1571 |
TAAACAlTAA | AACACAAACΓ | ACTTCAAGAl | CTACTCAAAC | dCCTCm | AAAAClAAAA | 1631 |
190 220
CTGCCTCAGG | CCGCATAAGG | CAGCTGACTC | TCGCCGCCGA | CAAGGGGTAC | GAGGTAGTCG | 1691 |
CGAATCTATT | CCAGGTGCCC | CAGAATCCCG | TAGTCGACGG | gattcttgct | TCACCTGGGG | 1751 |
TACTCCGCGG | TGCACACAAC | CTCGACTGCG | TGTTAAGAGA | GGGTGCCACG | CTATTCCCTG | 1811 |
TGGTTATTAC | GACAGTGGAA | GACGCCATGA | CACCCAAAGC | ATTGAACAGC | AAAATGTTTG | 1871 |
CTGTCATTGA | AGGCGTGCGA | GAAGACCTCC | AACCTCCATC | TCAAAGAGGA | TCCTTCATAC | 1931 |
GAACTCTCTC | TGGACACAGA | GTCTATGGAT | ATGCTCCAGA | TGGGGTACTT | CCACTGGAGA | 1991 |
CTGGGAGAGA | CTACACCGTT | GTCCCAATAG | ATGATGTCTG | GGACGACAGC | ATTATGCTGT | 2051 |
CCAAAGATCC | CATACCTCCT | ATTGTGGGAA | ACAGTGGAAA | TCTAGCCATA | GCTTACATGG | 2111 |
ATGTGTTTCG | ACCCAAAGTC | CCAATCCATG | TGGCTATGAC | GGGAGCCCTC | AATGCTTGTG | 2171 |
GCGAGATTGA | GAAAGTAAGC | TTTAGAAGCA | CCAAGCTCGC | CACTGCACAC | CGACTTGGCC | 2231 |
TTAGGTTGGC | TGGTCCCGGA | GCATTCGATG | TAAACACCGG | GCCCAACTGG | GCAACGTTCA | 2291 |
TCAAACGTTT | CCCTCACAAT | CCACOCGACT | GGGACAGGCT | CCCCTACCTC | AACCTACCAT | 2351 |
ACCTTCCACC | CAATGCAGGA | CGCCAGTACC | ACCTTGCCAT | GGCTGCATCA | GAGTTCAAAG | 2411 |
AGACCCCCGA | ACTCGAGAGT | GCCGTCAGAG | CAATGGAAGC | AGCAGCCAAC | GTGGACCCAC | 2471 |
TATTCCAATC | TGCACTCAGT | GTGTTCATGT | GGCTGGAAGA | GAATGGGATT | GTGACTGACA | 2531 |
TGGCCAACTT | CGCACTCAGC | GACCCGAACG | CCCATCGGAT | GCGAAATTTT | CTTGCAAACG | 2591 |
CACCACAAGC | AGGCAGCAAG | TCGCAAAGGG | CCAAGTACGG | GACAGCAGGC | TACGGAGTGG | 2651 |
AGGCTCGGGG | CCCCACACCA | GAGGAAGCAC | AGAGGGAAAA | AGACACACGG | ATCTCAAAGA | 2711 |
AGATGGAGAC | CATGGGCATC | TACTTTGCAA | CACCAGAATG | GGTAGCACTC | AATGGGCACC | 2771 |
GAGGGCCAAG | CCCCGGCCAG | CTAAAGTACT | GGCAGAACAC | ACGAGAAATA | CCGGACCCAA | 2831 |
ACGAGGACTA | TCTAGACTAC | GTGCATGCAG | AGAAGAGCCG | GTTGGCATCA | GAAGAACAAA | 2891 |
TCCTAAGGGC | agctacgtcg | ATCTACGGGG | CTCCAGGACA | GGCAGAGCCA | CCCCAAGCTT | 2951 |
TCATAGACGA | AGTTGCCAAA | GTCTATGAAA | TCAACCATGG | ACGTGGCCCA | AACCAAGAAC | 3011 |
AGATGAAAGA | TCTGCTCTTG | ACTGCGATGG | AGATGAAGCA | TCGCAATCCC | AGGCGGGCTC | 3071 |
TACCAAAGCC | CAAGCCAAAA | CCCAATGCTC | CAACACAGAG | ACCCCCTGGT | CGGCTGGGCC | 3131 |
GCTGGATCAG | GACCGTCTCT | GATGAGGACC | TTGAGTGAGG | CTCCTGGGAG | TCTCCCGACA | 3191 |
190 220 ccacccgcgc aggtgtggac accaattcgg ccttacaaca tccccccttg gatccgtttg cgggtcccct (2) INFORMACJA o sekwencji o numerze identyfikacyjnym: 28 (2) CHARAKTERYSTYKA SEKWENCJI (AjDŁUGOŚĆ: 145 aminokwasów (B) RODZAJ: aminokwas (D) TOPOLOGIA: liniowa TOPOLOGIA:
3250
3260 (ii) RODZAJ MOLEKUŁY: proteina (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 28
Met Val Ser 1 | Ast | Asp 5 | dn GUr Asn Asp Arg 00 | S er | Asp | A-p | Lys: | Pro 15 | Ala | ||||||
Arg | Sit | Asn | Ppt | Thr | Asp | Css | Ser | Val | His | TlVł | G lu | Pro | S er | Asp | Ala |
20 | 22 | 33 | |||||||||||||
Asn | Asn | Arg | Thr | Gly | Val | His | Ser | Gly | Arg | His | Pro | Gly | Glu | Ala | Hii |
35 | 40 | 45 | |||||||||||||
Ser | Glr | Val | Arg | -Asp | Leu | Asp | Leu | Gln | Phe | Asp | (Ces | Gly Gly | His | Act | |
50 | 55 | 60 | |||||||||||||
Val | Aat | ALa | Asn | Cys | Leu | PPh | Pro | Ttt | Ile | iTro | Trp | Leu | JAju | Cvs | Gly |
6 S | 70 | 75 | 00 | ||||||||||||
Cys | Sit | Leu | His | Thr | Aha | CUy | Gln | Trp | Glu | Leu | Gil | V-1 | U-g | S er | Asp |
05 | 90 | 95 | |||||||||||||
Ala | Pro | Asp | CCes | Pro | GTo | luo | Thr | Gly | G ln | Leu | Gln | Leu | Leu | Gln | -Le |
000 | 105 | 110 | |||||||||||||
Sit | Glu | Ser | Glu | Ser | His | Ser | to- | nu- | es- | His | Thr | Ser | Trp | Trp | Arg |
H5 | 22 - | 125 | |||||||||||||
Leu | Cys | -Thr | Lys | Arg | His | His | Lys | Arg | Arg | Asp | Leo | Pro | Arg | Lys | Pro |
030 | 105 | 040 |
Glu
045 (2) INFORMACJA o sekwencji o numerze identyfikacyjnym: 29 (2) CHARAKTERYSTYKA SEKWENCJI
190 220 (A) DŁUGOŚĆ : 3261 pary podttawowe (B) RODZAJ: KWAS NUKLEINOWY (C) ZWOJOWOŚĆ: pojedyncza (D) TOPOLOGIA: kolista (ii) RODZAJ CZĄSTECZKI: cDNA (ix) WŁAŚCIWOŚCI:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 131..3166 (xi)OPIS SEKWENCJI numer identyfikacyjny sekwencji: 29
GGATACGATC GGTCTGACCC CGGGGGCGGC ACCCGGGGCC AGGCCGTCAA σC^<^(CG^Cy:G^<C 66
GAGGATCGGA GTGGTGGTTG TACACCGCGC TCCTTGCGGG TTA1TACAGA TCAGACAAAC 122
CATGCGACGC ATC AGA AAC CTG CAA GAT CCC AGG CAA CAG ATT GTT CCG 116
Mec Thr Asn Leu Gln Asp Gln Thr Gln Gln Ile Val Pro
150 155
TTC Phe | ATA Ile 150 | CGG Arg | aga: ctc | CTG ATG CCC ACGA ACC GGG CCC ACC ATC ATT CCG | 2H | |||||||||||
Ser | Leu | Lee. | Met 115 | Pro | Thr | Thr | Gili | Pro 110 | Ala | Ser | Ile | Pro | ||||
CAG | GAC | ACC | CTG | GAG | AAG | CAC | ACT | CTC | JAG? | TCC. | GCC | ACC | AGC | ACC | TAC | 226 |
Asp | Asp | Thr | Leu | G lu | Lys | His | Thr | Leu | Arg | SSr | Glu | Ghe | Ser | Thr | Tyrr | |
175 | 118 | 118 | 110 | |||||||||||||
AAT | TTG | ACT | GTC5 | GCG3 | CCTC | ACA | CCC | TCA | GGG | CTA | ATT | GTC | TTT | TTC | CCT | 311 |
Asn | Leu | Tir- | V al | G ly | LTp | Tlur | Cly | Ser | Gly | Leu | Ile | Val | Phe | Ihl^e | Pro | |
195 | 200 | 205 | ||||||||||||||
GGA | TTC | CCT | GGC | T<TC | ATT | GTC | GCT | GCT | ccc: | TAC | ACA | CTG | CGT | GGC | AAT | 331 |
Cly | Phe | Pro | G Igi | S er | Ile | Val | Cly | Ala | His | TTla | Thr | Łw | Hn | Gly | Asn | |
210 | 215 | 220 | ||||||||||||||
GGG | AAC | TAC | AAG | TTC | GAT | <CTG | ATC | CTC | CTG | ACT | GCC | CAG | AAAC | CTA | GGG | 409 |
Gly | Asn | Tyr | Lys | P he | Asp | Gln | Met | Leu | leu | Thr | Ala | Gln | Asn | Leu | Pro | |
225 | 230 | 235 | ||||||||||||||
GCC | CCT | TAC | AAC | TAC | TGC | AGG | CTA | <CTG | AGT | CCCC | AGT | CTC | ACTA | GTC | A<G3 | 4S7 |
Ala | Ser | Tyr | Asn | Tyr | Cys | Arg | Leu | val | Ser | Arg | SeA | Leu | Thr | ViA | .Arg | |
240 | 245 | 250 | ||||||||||||||
TGC | CCG | ACA | CTT | CCT | GGT | GGC | CTT | TAT | GCC | CTA | JATC | GGC | ACC | ATT | AAG | 5CS |
Ser | Ser | Thr | Leu | Pro | G1 y | Gly | Val | Tyr | Ala | Leu | jA»n | Gly | Thr | IIs | Asn | |
255 | 220 | 265 | 220 | |||||||||||||
GCC | GTG | ACC | TTC | CAA | CCA | ACC | TCA | CTA | CAA | CTG | CCA | CAG | CGG | AGC | TAC | 553 |
190 220
Ala | VaL | Ghr | Phe | Gln 275 | Gly | Ser | Leu | Sso | Glu 280 | Leu | Cho | Asp | Val | Ser 285 | Tyr |
MT | GCT | TGA | AGC | GCC | GAC | AK. | CCC | MC | ATC | MC | GAC | 0AA | ATC | GCT | MC |
Asn | Gly | Le C | ee o | So C | aa c | Thr | CAa | Mn | Ile | Mn | Asp | Lys | He | Gly | Asn |
290 295 300
GCC | CTA | TAC | GGC | AM | CTC | CTC | ACC | GTC | CTC | AGC | ΤΓΑ | CCC | ACC! | TCA | TAT | £63 |
Val | Leu | Vl 0 | lSc | lic | lSc | Vl 0 | Tleć | Val | Leu | Ser | Leu | Pro | Tłuc | Ser | ||
305 | 310 | 315 |
GAC CTG GGC AAC GGC GGC | CTT Ceu 32S | CTT MC CCC Gly Asp Pro | ATT CCC GCA ATA | GCT Gly | :CGT Leu | 697 | ||||||||||
Asp Leu Gly | Tyr VvV | Mg | Ile | Pro 330 | Ala | I Ie | ||||||||||
320 | ||||||||||||||||
GAC | GCA | AM | GTA | GCC | ACA | TGT | GAC | AGC | AGT | G^C | ACT | CCG | AGA | CTC | 77S | |
Asp | Pro | Lys | Met | Val | Ala | Thr | cys | Mp | Ser | Ser | AAp | CAg | Phr | Arg | vaa | |
335 | 340 | 345 | 350 | |||||||||||||
TAC | ACC | ATA | ACT | GM | GCC | GAT | mt | TAC | CCA. | TTC | TCC. | TCC. | CGA | AAG | CGA. | 773 |
Cyr | GUt | Ile | TCur | CALa | CALa | Asp | A<s> | TCs? | Gln. | Phe | Ser | See | Gln | Gyr | Gln | |
355 | 360 | 365 | ||||||||||||||
CCA | CTT | GGG | GTA | AGA | ATC | AGA | <CTG | TTC | TCA | GCC | MC | ATA? | GAT | GGG | ATC | CM4 |
Pro | Gly | Gly | VaL | Thr | Ile | Thr | Leu | Phe | Ser | Ala | Asn | Ile | Asp | ALa | Ile | |
370 | 375 | 380 | ||||||||||||||
ACA | AGC | CTC | AGC | GTT | GGG | GGA | GAG | CTC | GAG | TTT | (CA | ACA | AGC | GAG | CAC | 889 |
Chr | Ser | Leu | Ser | VaL | Gly | Gly | Glu | Leu | Val | Phe | Gln | TCur | Ser | Vaa | His | |
385 | 390 | 395 | ||||||||||||||
GGC | CGG | CTA | CAG | CTG | GGC | AGC | ACC | GAC | CTC | AGA | CTC | TGAC | GAT | GCT | ACA | 9^3 |
Gly | Leu | VvV | Leu | Gly | Ala | Tho | He | Tyr | Leu | Ile | Gly | Phe | Asp | GLy | Tho | |
400 | 405 | 410 | ||||||||||||||
ACT | GGA | ATCC | ACC | AGG | GCT | GTG | GCC | GCA | one | MT | CTG | CCG | ACG | ACC | CTC | 985 |
Tho | vvL | Ile | Thr | Arg | CALa | Val | Kia | Ala | Asn | Mn | Gly | Lls | Thr | Tho | GGy | |
415 | 420 | 425 | 430 | |||||||||||||
ACC | GAC | MC | CTT | ATG | CCA | • CTC | MT | CCT? | GTG | ATT | CCA | AK | MC | GAG | ATA | 1P33 |
Chr | Asp | Asn | Leu | Mec | Pro | Phe | Asn | Leu | Va! | Ile | Ppo | The | Mn | Glu | ioa | |
435 | 440 | 445 | ||||||||||||||
ACC | GAG | CCA | ATC | ACA | TCC | ATC | AM | CTG | GAG | ATA | GTG | ACC | TCC | AM | AGT | 1081 |
Tho | Gln | Pro | I 1<s | Tho | Seg | Ils | Lys | Leu | Glu | Ile | Val | Tle: | Ser | Lys | Ser | |
450 | 455 | 460 |
CTG | CTG | CAG | GCA | GGG | GAT | CUG | ATG | TCA | TCT | TCG | GCA | AGA | GGG | AGC | CTA | 1129 |
Gly | Gly | Gln | ALa | GLy | Asp | Gln | Met | Seg | Top | Ser | Ala | Arg | Gly | Seo | Leu | |
465 | 470 | 475 |
190 220
GCA GTG ACG ATC CAC | TGG TGC 5AA GAT CCC. AGG GCC CCT: CGT CCC GTC | 1177 | ||||||||||||||
Ala | Val 400 | Tir- | I le | H ia | giy yi. 405 | Asn | GTr Pro | Gll | Ala 460 | Llu Mg | Pro | Gal | ||||
ACG | CTA | GTG | GCC | TAC | GIGA | AGG | GTG | GCCA | ACCA | GGA | TCC | GTC | GIT | ACG | GTC | 12:22 |
hhr | Luu | Val | Ala | Tyr | Glu | Arg | Val | Ala | Thr | Gly | Ssu· | Val | Val | Thr | Val | |
465 | 500 | 505 | 710 | |||||||||||||
gct | UG | GTG | AGC | AAC | TTC | -GAG | CTG | ATC | CCCI | IA.T | CCT | GJAA | CTA | GCCA | jaag | 1227 |
lla | Gly | Val | S er | Asn | Phr | Glu | ILUU | Ile | Pro | Mn | Pro | Glu | Leu | Ma | Lys | |
515 | 520 | 525 | ||||||||||||||
AAC | CTG | GTT | ACA | C5GA | TAC | TCC | CCGA | TTT | GAC | CCCC | GGA | TCC | ATG | MAC | TAC | 1132 |
Asn | Leu | Val | TM | Glu | Tyr | Gly | Mg | Phe | Mp | Pro | Gly | Ma | Met | Asn | Τι: | |
530 | S5S | 550 | ||||||||||||||
ACA | AAA | TTG | ATA | CTG | AGT | ATC | GAC | CCT | CTT | GGC | ATC | AAG | ACC | GTC | 1136 | |
Thr | Lys | Leu | I 1.B | Leu | Ser | Glu | Mg | Asp | Mg | Leu | Gly | Ile | Lys | Thr | Val | |
545 | 555 | 555 | ||||||||||||||
tgc | CCA | ACA | AGG | GAG | TAC | ACT | GAC | CTT | CGT | C-AA | TAC | TTC | ATG | GAG | GTG | 1441 |
Top | Pro | Thr | Arg | G lu | Tyr | •Thr | Asp | Phe | Mg | Glu | Tyr | Phe | Met | Glu | Val | |
560 | S56 | 557 | ||||||||||||||
GCC | GAC | CTCT | AAA | 5TC | 5CC | CTT | GAA | GTTT | GCC! | TCA | GCCA | TTC | GGC | CTC | jaaa | 1446 |
Ala | Asp | Leu | A is | GSU | Gro | Alu | Gyy | Ile | ALa | Gly | Gla | Phu | Gly | PPe | Ly! | |
575 | 550 | 585 | 556 | |||||||||||||
GAC | ATA | ATC | CCG | 5GC | aat | ATC | ATC | GTA | gct | git; | CCG | GTG | GTC | TCC | ACCA | 1151 |
Asp | Ile | liii | Arg | Ala | 5Ia | Mg | Mg | Ile | Ma | vai | Pro | a.a | Val | Ser | Thr | |
565 | 660 | 660 | ||||||||||||||
TTG | TTC | CCCC | CCC | ACC | GCT | CCC | CTA | GCC | CCAT | GCCA | ATT | GGG | GlAA | tct | GTA | 1156. |
Luu | Phu | Pro | P ro | Ala | Ala | Pro | Leu | Ma | His | Ala | Ile | Gly | Glu | Gly | Val | |
610 | 615 | 662 | ||||||||||||||
GAC | TAC | CTCT | CTG | TCC | GAT | GAG | GCCA | <CAG | GCT | GCT | TCCA | GGA | ACT | GCT | CGA | 1509 |
Asp | Tyr | Leu | Leu | Gly | 5lp | Glu | Ala | Gln | Ala | Ala | Ser | Gly | Thr | Ala | Moj | |
625 | 660 | 663 | ||||||||||||||
GCC | GCG | TTC | GGG | aaa | GGC | AGA | GCT | GCC | TCA | GGC | CGC | ATA | AGG | CAG | CTG | 1657 |
Ala | Ala | SSr | ag. | Gyy | Gla | Arg | Ala | Ala | Sur | Gly | Arg | Ilu | Arg | Gln | Leu | |
540 | 665 | 6S0 | ||||||||||||||
1CT | CTC | GCC | g CC | (GAC | HAG | GTC | TAC | GAG | GTA | GTC | GCG | Al.T | CTA | TTC | CAG | 1705 |
Tho | Luu | Ala | Al a | JA^J3 | Lys | Gly | Tti: | Glu | Val | Val | Ala | Asn | Leu | Phe | Gln | |
655 | 660 | 65 I | 670 | |||||||||||||
GTG | CCC | CCG | ’ AAT | CCC | GTA | GTC | GAC | GTC | ATT | CTT | GCT | TCA | CCT | GGG | GTA | 1753 |
ViI | Pro | dl | Asn. | Pro | Val | Val | Mp | Gly | Ile | Leu | Ala | Ser | Pro | Gly | Val |
675 660 6Β5
190 220
CTC CGC GGT Gd (CAC AAC CTC GAC TGC GTG TTA Ad GAG (G3T GCC ACG | isoi | |||||||||||||||
Leu Arg Gly G^l^^ His Asn Leu Asp | Cys Val Leu Arg Glu Gly Ala Tłrr | |||||||||||||||
690 | 595 | 700 | ||||||||||||||
CTA | TTC | CCT | GTG | GTT | ATT | ACG | Ad | GTG | GAA | GAT | GTT | ATG | Ad | CCC | AAA | 184S |
Leu | Phe | Pro | Val | Val | Ile | Tth· | TłhT | Val | Glu | Asp | Ala | Met | Thr | Pro | Lys | |
705 | 710 | 715 | ||||||||||||||
GCA | TTG | AAC | AGC | AAA | ATG | TTC | GCT | GTC | ATT | GAA | GGT | CTG | CGA | GAA | GAC | 1837 |
Ala | Leu | Asn | Ser | Lys | Met | Phe | Ala | Val | Ile | Glu | Gly | Val | Arg | Glu | Asp | |
720 | 725 | 730 | ||||||||||||||
CTT | CAA | CCT | CCA | TCT | CAA | AGA | GGA | TCT | TTC | ATA | TGA | ACT | CTC | TTT | GGA | 1945 |
Leu | Gln | Pro | Pro | Ser | Gln | Arg | Gly | Ser | Phe | Ile | Arg | Thr | Leu | Ser | Gly | |
705 | 740 | 745 | 750 | |||||||||||||
CAC | AGA | GTT | TAT | GGA | TAT | GTT | CCA | GAT | GGG | GTA | CTT | TTA | CTG | GAG | ACT | 1993 |
His | Arg | Val | Tyr | Gly | Tyr | Ala | Pro | Asp | Gly | Val | Leu | Pro | Leu | Glu | Thr | |
755 | 760 | 765 | ||||||||||||||
GGG | AGA | GAC | TAT | ACC | GTT | GTC | CCA | ATA | GAT | GAT | GTT | TGG | GAC | GAC | AGC | 22 04 |
Gly | Arg | Asp | Tyr | Thr | Val | Val | Pro | Ile | Asp | Asp | Val | Trp | Asp | Asp | Ser | |
770 | 775 | 780 | ||||||||||||||
ATT | ATG | CTG | TTT | AAA | GAT | CCC | ATA | CTT | TTT | ATT | GTG | GGA | AAC | AGT | GGA | 2208 |
Ile | Met | Leu | Ser | Lys | Asp | Pro | Ile | Pro | Pro | -Ile | Val | Gly | Asn | Ser | Gly | |
785 | 790 | 795 | ||||||||||||||
AAT | CTA | GCC | ATA | GCT | TAC | ATG | GAT | GTG | TTT | CGA | CCC | AAA | GTC | TCA | ATC | 2137 |
Asn | Leu | Ala | Ile | Ala | Tyr | Met | Asp | Val | Phe | Arg | Pro | Lys | Val | Pro | Ile | |
800 | 805 | 810 | ||||||||||||||
CAT | GTG | GTT | ATG | ACG | GGA | GCC | CTC | AAT | GCT | TGT | GGT | GAG | ATT | GAG | AAA | 2188 |
His | Val | Ala | Met | Thr | Gly | Ala | Leu | Asn | Ala | Cys | Gly | Glu | Ile | Glu | Lys | |
815 | 820 | 825 | 830 | |||||||||||||
GTA | AGC | TTT | AGA | . AGC | ACC | AAG | • ero | ' GCC | C ACT | GGT | . GAC | CGA | . CTT | <G3C | ' CTT | 2233 |
Val | Ser | Phe | Arg | Ser | TTu: | Lys | Leu | . All | . GTr | ' Aia | a His | Arg | ' Leu | . Gly | • Leu |
835 800 845
AGG TTG Arg Leu | GCT GGT | CTT GGA Pro Gly. | GCA . Ala | TTC (GAT GGA GUC AGC GGG CCC AAC TGG | 22G1 | |||||||||||
Ala | Gly 850 | Phe | (up Val inn 855 | Thr | Gly | Pro 860 | Asn | Trp | ||||||||
GTA | ACG | TTC | ATT | AAA | CGT | TTC | CCT | CAC | JAAT | Cd | TGT | GAC | TGG | GAC | AGG | 2329 |
Ala | Thr | Phe | Ile | Lys | Arg | Phe | Pro | His | Asn | Pro | Arg | Asp | Trp | Asp | Arg | |
865 | 870 | 875 | ||||||||||||||
CTT | TCT | TAC | CTT | AAC | CTA | Cd | TAC | CTT | CCA | CCC | AAT | GCA | GGA | CGT | CAG | 23 77 |
Leu | Pro | Tyr | Leu | Asn | Leu | Pro | -Tyr | Leu | Pro | Pro | Asn | Ala | Gly | Arg | Gln | |
880 | 88S | 890 |
190 220
TCC CAC CTT GCC ATG | GCT GCC TCC GCG TTC ACC GAG ACC CCC GAC | CTC Leu 910 | 244S | |||||||||||||
Tyr 395 | His | Leu | AUn | Met | Aln 900 | Ala | Ser | Glu | Phe | Lys 905 | Glu | Thr | Pro | Glu | ||
GAG | AGT | GCC | GTC | AGA | GCC | ATG | GAA | GCC | GCA | GCC | ACC | GTG | GAC | CCA | CTA | 2243 |
GlV | Ser | Ala | Vnl | Arg 905 | AUn | Met | Glu | Ala | Aln 920 | Ala | Asr | Vnl | Asp | Pro 925 | Leu | |
TTC | CCA | tct | GCC | CTC | AGT | GTG | TTC | ATG | TGG | CTG | GCA | GCG | CAT | GGG | ATT | 2221 |
Phe | Gln | Sit | AUn 93 0 | Leu | Ser | Val | Phe | Met 935 | Trp | Leu | Glu | Glu | Csn 940 | Gly | lie | |
GTG | ACT | GAC | ATG | GCC | ACC | TTC | GCA | CTC | CGC | GCC | CCG | ACC | GCC | CAT | CGG | 2253 |
Val | Thr | Asp 945 | Met | Ala | Asr | Phe | Ala 950 | Leu | Ser | Asp | Pro | Asr 955 | Aln | His | Arg | |
ATG | CGA | AAT | TTT | CTT | GCC | AAC | GCA | CCC | CAC | GCC | GGC | AGC | ACG | TCG | CAA | 2617 |
Met | Arg 960 | Asn | Phe | Leu | Ala | Asn 965 | Ala | Pro | Gln | Ala | Gly 979 | Ser | Lys | Ser | Gln | |
AGG | GCC | AAG | TAC | GGG | ACC | GCA | GGC | TAC | GGA | GTG | GAG | GCT | CGG | GGC | CCC | 2265 |
Arg 975 | Ala | Lys | Tyr | Gly | Thr 900 | AUn | Gly | Tyr | Gly | Vyl 905 | Glu | Ala | Arg | Gly | Pro 990 | |
CCC | CCA | GAG | GAA | GCC | CAG | AGG | GAA | AAC | GAC | ACA | CGG | J/lC | TCC | ACG | ACG | 2770 |
Thr | Pro | Glu | Glu | AUn 995 | Glr | Arg | Glu | Lys | Asp Thr 1000 | Arg | lie | Sit | Lys Lys H00 | |||
CTG | GAG | ACC | ATG | GGC | ATC | TAC | TTT | GCC | ACA | CCA | GAC | TGG | GTA | GCC | CTC | 2761 |
Met | Glu | Thr | Met Gly 0000 | He | Tyr | Phe | Ala Thr 1005 | Pro | Glu | Trp | Vnl AUa 1020 | Leu | ||||
CCT | GGG | CAC | CGA | GGG | CCA | AGC | CCC | GGC | CAG | CTC | ACG | TAC | TGG | CAG | ACC | 28 0 9 |
Csn | Gly | His Arg 0025 | Gly | Pro | Ser | Pro Gly 1030 | Glr | Leu | Lys | ryr Trp 1003 | Glr | Asn | ||||
ACC | CGC | GAC | ATA | CCG | GAC | CCC | CAC | GCG | GAC | TCT | CTA | GAC | TAC | GTG | CAT | 2^57 |
Thr | Arg Glu 0040 | lie | Pro | Asp | Pro Asr 1045 | Glu | Asp | Tyr | Leu Asp 1050 | Tyr | Val | His | ||||
GCC | GAG | CAG | AGC | CGG | TTG | GCC | TCA | GAC | GAC | CCC | ATC | CTA | AGG | GCA | GCT | 2905 |
Ala Glu 0055 | Lys | Sit | Arg | Leu Ala 10 60 | Ser | Glu | Glu | Gln Ile 1055 | Leu | Arg | Ala | AUn 1070 | ||||
ACG | TCG | ATC | TAC | GGG | GCT | CCA | GGA | CAG | GCA | GAG | CCA | CCC | CAA | GCT | TTC | 2353 |
Thr | ser | lie | Tyr | Gly Aln 0075 | Pro | Gly | Gln | AUn Glu 0000 | Pro | Pro | Glr | Ala Phe 1085 | ||||
ATA | GAC | GAA | GTT | GCC | AAA | GTC | TAT | GAA | ATC | CCC | CAT | GGC | CGT | GGC | CCA | 3000 |
ile | Asp | Glu | Vnl Ala !090 | Lys | Vnl | Tyr | Glu lie 1055 | Asn | Has | Gly | Arg Gly 1500 | Pro |
190 220
AAC Asn | CAA GAA CAG ATG AAA GAT | CTG CTC TTG ACT GCG ATG GAG ATG | AAG Lys | 3049 | |||||
Gln Glu Gln Mec 1105 | Lys | Asp | Leu Leu 1110 | Leu Thr | Ala Met Glu 1115 | Met | |||
CAT | CGC AAT CCC AGG | CGG | GCT | CTA CCA | AAG CCC | AAG CCA AAA | CCC | AAT | 3097 |
His | Arg Asn Pro Arg | Arg | Ala | Leu Pro | Lys Pro | Lys Pro Lys | Pro | Asn | |
1120 | 112S | 1130 | |||||||
GCT | CCA ACA CAG AGA | CCC | CCT | GGT CGG | CTG GGC | CGC TGG ATC | AGG | ACC | 3145 |
Ala | Pro Thr Gln Arg | Pro | Pro | Gly Arg | Leu Gly Arg Trp Ile | Arg | Thr | ||
1135 | 1140 | 114S | 1150 | ||||||
GTC | TCT GAT GAG GAC | CTT | GAG | TGAGGCTCCT GGGAGTCTCC CGACACCACC | 3196 | ||||
Val | Ser Asp Glu Asp | Leu | Glu |
1155
CGCGCAGGTG TGGACACCAA TTCGGCCTTA CAACATCCCA AATTGGATCC GTTCGCGC-GT 3256
CCCCT 3261 (2) INFORMACJA o sekwencji o numerze identyfikacyjnym: 30 (2) CHARAKTERYSTYKA SEKWENCJI (A) DŁUGOŚĆ: 1012 aminokwasów (B) RODZAJ: aminokwas (C) SKRĘTNOŚ: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ MOLEKUŁY: proteina (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 30
Met 4 A. | Thr | Asn | Leu | Gln 5 | Asp | Gln | Thr | Gln | Gln 10 | Ile | Val | Pro | Phe | Ile 15 | Arg |
Ser | Leu | Leu | Met 20 | Pro | Thr | Thr | Gly | Pro 25 | Ala | Ser | Ile | Pro | Asp 30 | Asp | Thr |
Leu | Glu | Lys 35 | His | Thr | Leu | Arg | Ser 40 | Glu | Thr | Ser | Thr | Tyr 45 | Asn | Leu | Thr |
Val | Gly 50 | Asp | Thr | Gly | Ser. | Gly 55 | Leu | Ile | Val | Phe | Phe 60 | Pro | Gly | Phe | Pro |
Gly 65 | Ser | Ile | Val | Gly | Ala 70 | His | Tyr | Thr | Leu | Gln 75 | Gly | Asn | Gly | Asn | Tyr 80 |
Lys | Phe | Asp | Gln | Met 35 | Leu | Leu | Thr | Ala | Gln 90 | Asn | Leu | Pro | Ala | Ser 95 | Tyr |
Asn | Tyr | Cys | Arg 100 | Leu | val | Ser | Arg | Ser 105 | Leu | Thr | Val | Arg | Ser 110 | Ser | Thr |
190 220
Leu Ppl Gly Gly Val 'jAnL Ala Leu Asn G1 y Thr Ile Asn Ala | Val | Thr | |||||||||||||
115 | 112 | 112 | |||||||||||||
Phe | Gln | GGy | G er | Leu | Ser | Glu | Leu | Thr | Asp | Val | Ssr | Tyr | JAn | Gly | Lee |
130 | 133 | 114 | |||||||||||||
Met | Ser | AAl | Ghr | Ala | Ad | Ile | Ad | Asp | Lys | Ile | Gly | Asn | Val | Leu | erl |
125 | 150 | 115 | HO | ||||||||||||
Gly | Glu | GGy | Val | Tbr | Val | Leu | Ser | Leu | Pr o | TłSf | S er | Ty | Asp | Leu | GGy |
105 | 170 | 175 | |||||||||||||
Ty· | Val | Arg | Leli | Gly | Asp | Pro | Ile | Pro | Al a | Ile | Gly | Leu | Asp | Pro | Ljs |
180 | :885 | 1^0 | |||||||||||||
Met | Val | Ala | Thr | Cyr | Asp | Ser | Ser | Asp | Aog | Pro | Aog | Val | Tyr | Tho | Ile |
195 | 200 | 205 | |||||||||||||
Tho | Ala | AGl | Asp | Asp | TAy | Gln | Phe | Ser | Se r | Gln | Tyr | llT | Lgi | PLa | lly |
210 | 215 | 220 | |||||||||||||
Val | Tho | Ile | Tiu | Leu | Phe | Ser | Ala | Asn | Ile | Ga. | 5A.a | Ile | Tło: | Ser | Leu |
225 | 220 | 223 | 224 | ||||||||||||
Ser | Val | Gly | Gly | Glu | Leu | Val | Phe | Gln | Thr | Ser | Val | His | Gly | Leu | vai |
245 | 2£i0 | 225 | |||||||||||||
Leu | GGl | Ala | Thr | Ile | Tyr | Leu | Ile | Gly | Phe | Asp | Gly | TIa | TGu | Gal | Ile |
200 | 220 | 220 | |||||||||||||
Thr | Aal | Ala | Val | A la | Ala | Asn | Asn | Gly | Leu | Thr | Tły | Gly | Thr | Asp | Asn |
275 | 228 | 228 | |||||||||||||
Leu | Met | Pro | Plne | Asn | Leu | Val | lll | Pro | Tho | Asn | GGl | Ale | TTr | Gln | Pro |
250 | 225 | 330 | |||||||||||||
Ile | Thr | Ser | Ile | Lys | Leu | Glu | Ile | Va5 | Thr | Ser | Lys | Ser | C^l^y Gly | Gln | |
305 | 310 | 315 | 320 | ||||||||||||
Ala | Gly | Asp | Gln | ie<^t | Ser | Trp | Ser | Ala | Arg | Gly | Ser | Leu | Air | Val | Tho |
325 | 33 0 | 335 | |||||||||||||
Ile | Hss | Gly | Gly | Ad | GA^r | Pro | Gly | Ala | Leu | Arg | Pro | Val | ghr | Geu | vai |
340 | 335 | 350 | |||||||||||||
Ala | Tyr | Glu | Arg | val | Ala | Thr | al. | Ser | Va 1 | Val | Tfcr | Val | Ala | GlV | lrT |
355 | 360 | 3 65 | |||||||||||||
Ser | Asn | Phe | Glu | Leu | Ile | Prr | Aa. | Gro | Glu | Leu | JA.a | Lys | Aa. | Leu | Val |
370 375 338
Thr Glu Tyr Gly Arg Phe Asp Ppr Gly Ala Met Asn Tyr Thr Lys Leu
190 220
385 | 390 | 395 | 400 |
IIs Lsa | Ser Giu Ata Asp . 405 | Arg Lsa Cly Ile Lys ' 440 | The Val Tep Pro Thr 441 |
Arg Clu | Tyr Thr Asp PPe . 420 | Arg Glu Tye Phe Met ' 425 | Glu Val Ala Ass Lls 440 |
Asn See | Peo Leu Lys Ile 435 | Ala AU/ Ala Phe Cly 440 | nie Lys Asp IIu Ha 445 |
Arg Ala 450 | Ile Arg Arg IIs | Ala Val Peo VaI VaI 455 | Ser Thr Leu Phe Pto 460 |
Peo Ala 465 | Alu Cro Leu Ala 470 | Hls Ala Ile Cly CUu 475 | AU/ Val Asp T/ru Leu 48 0 |
Lsu GU/ | As’ Alu Ala Gln 485 | Ala Ala Ser GUy The 499 | AIa Arg Ala Ala Ser 49S |
Gly Lys | Ala Arg Ala JALa 500 | Sem Gly Arg Ile Arg 505 | Gln Leu Thr Leu ASa 55^0 |
Ala Asp | Lys Gly Tyr Glu 515 | VaU VaI SUa Asn Leu 522 | Phe Gln Val Pro Gln 525 |
Asn Pre 530 | Cal Val Asp Gly | Ile Leu Ala Sls Sua 553 | Gly VsA AeC Lug Lly 554 |
Ala Hls 545 | Asn Leu Asp Cys 550 | VaU Leu Arg Glu Gly 5155 | Tla Thr Leu Phr Pro 550 |
Val Val | IIs The Thr VaI 565 | CUu Asp SUa Met Thr 557 | Peo Lys Tla Leu Asn 555 |
See III | Met Phe Ala Val 580 | IUs Glu AUy Val Arg 585 | Glu Asp Leu Gln Pro 590 |
Peo Ser | GUn Arg <Gl^y Ser 595 | Ehe Ile Arg The Leu 660 | Ser Gly His Arg Val 605 |
Tye Gly 610 | Tyr Ala Pato Asp | Gly spl Lei Lro Lsu 615 | Glu PAo SIi At- Cu/ 620 |
Tye Thr 625 | Val Val Pro He 630 | Asp Asp Val Tep Ssp 635 | Asp Ser Ile Met Lei 640 |
See Lys | Asp Pro Ile Pro 645 | Pro Ile Val Gly Asn 650 | . Ser Gly Asn Leu AUo 655 |
Ile Ala | . Tyr Met: Asp Val | Phe Arg PrP Sta CpA | cll m his roa eia |
660 665 670
190 220
Met | Thr | Gly 675 | Ala | Leu | Asn | Ala | Cys 689 | Gly | Glu | lle | Glu | Lys 685 | Val | Ser | Phe |
Arg | Ser 690 | Thr | Lys | Leu | Ala | Thr 699 | Ala | His | Arg | Leu | Gly 70(5 | Leu | Arg | Leu | Ala |
Gly 705 | Pro | Gly | Ala | Phe | Asp 710 | Val | Am | PTr | Ppo 715 | PAs | Pt? | Pto | Phr | PPe 771 | |
Ile | Lya | Arg | Phe: | Pro 725 | His | Asn | Pro | PAg | PAp 733 | Pt? | Pas | Alg | Pll | Pro 773 | Tyr |
Leu | Asn | Leu | P ro 740 | Pyr | Leu | Pro | Pro | Am 775 | Ala | Gly Mg | Gln | Tyr 750 | His | Leu | |
Ala | Met | Ala 755 | All | P er | Glu | PPe | Lys 767 | Glu | Thr | Pro | Glu | Leu 775 | Glu | Ser | Ala |
Val | Arg 770 | Ala | Met | Glu | Ala | Ala 775 | Ala | Mn | Val | Asp | OrP 778 | LeP | Phe | Gil. | Ser |
Ala 785 | Leu | Ser | Val | PPe | Met 790 | T:p> | Iyau | Glu | Glu | PAn 795 | Gly | PIl | Val | Thr | Asp 879 |
Met | Ala | Asn | Phe | A ll 805 | Leu | Ser | Alb | Pro | Asn 881 | Ala | His | Arg | Met | Art? 881 | Asn |
Phe | Leu | Ala | Am 820 | Ala | Pro | Gln | Ala | Gly 82S | Ser | Lys | ser | Gln | Arg 830 | Ma | Lys |
Tyr | Gly | Thr 83 S | Ala | Gly | Tyr | Gly | Val 840 | Glu | Ma | Arg | dl | Pro 885 | Thr | Pro | Glu |
Glu | Ala 850 | Gln | Arg | G lu | Lys | Asp 855 | TItt | Mg | liii | Ser | Lys 866 | Lyy | Met | Glu | Thr |
Met 865 | Gly | Ile | Tyr | PPe | Ma 77P | Thr | Pro | Gto | PT? | Pal 875 | Pll | Peu | Pm | Hu 880 | |
Arg | Gly | Pro | Ser | P PO 885 | Gly | Gin | Leu | Lys | Pyr 880 | Τη? | G ln | Asn | Thr | Arę? 895 | G to |
Ile | Pro | Asi? | Pro 900 | Asn | Glu | Asp | Tyr | Leu 905 | Asp | yg: | Val | His | Ma 910 | Gto | Lys |
Ser | Arg | Leu 915 | All | P er | G m | Pto | P to 920 | Ile | Leu | Arg | Ala | Ala 995 | Thr | Ser | Ile |
Tyr | Gly 930 | Ala | Pro | Gil | P to | Pto 935 | Pto | Pro | Pro | Gln | Ma 990 | Phe | Ile | Asp | Glu |
VaG Ala Lys Val Tyr Glu Ile Asn His Gly Arg Gly Pro Asn Gln Glu
190 220
005 | 050 | 055 | 060 | ||||||||||||
CUn | Met | Lys | Asp | Leu 965 | Lei | LSI | The | TIo | Met 970 | GUI | Met | Lys | Hls | Arg 975 | Asn |
Peo | Teg | Arg | Ala 980 | Leu | Peo | Lys | Peo | Lys 985 | Peo | Lys | Pro | Asn | Ala 990 | Pro | The- |
CUn | Teg | Pro 995 | Pro | Gl y | Arg | Leu | Gly Arg 1000 | Trp | Ile | Arg | Thr Val 1055 | Ser | Asp |
ilu Asp Leu Glu
1010 (2) INFORMACJA o sekwencji o numerze identyfikacyjnym: 31 (2) CHARAKTERYSTYKA SEKWENCJI (A) DŁUGOŚĆ· 3264 pary podstawowe (B) RODZAJ: kwas nukleinowy (C) SKRĘTNOŚĆ: pojedyncza (D) TOPOLOGIA: kolista (ii) RODZAJ MOLEKUŁY: cDNA (xi) OPIS SEKWENCJI numer identyfikacyjny sekwencji: 31
CGATAGCATG CGTGTGTCCG GiCΑcGTiTG ACGGGATGTG GCACTTCTTC 66
CTGGrTCGTT GTGGTGGTTG TCCTTG TTC CGG TCT AGA GTT CCG 111
Met VaU Ser Teg Ssp GUn
1015
TCA AAC GAT The Asn Asp | GCC Csrg | TGC Sss | TTC Asp | TAC ATT GGT STA CTT GCA CTC CTA TAA GAT | 116 | |||||||
Asp Lys 1002 | Pro | Asp | Gly | Ssa- HPs 1030 | Aoo Thr | Asp | ||||||
1020 | ||||||||||||
TGG | TCG GTT | CTG | TCC | AGC | CGT GGC | TTC | GCC | TCG | CCG GGA | CGC GTC | CGC | 210 |
C/s | SSA Val | His | Thr | Glu | Piro Ser | 0Cp | Alu. | Tnn | Tnp Arg | The CU/ | Val | |
1035 | 1040 | 0042 | 1050 | |||||||||
CTG | GCC GCT | GCT | CCG | CTA | CTT ATA | AST | CCC | CTC | Τϋ CAC | CCT GAC | GTG | 258 |
Hls | Ssa Gly | Arg | His | Pro | Gly Glu | Ala | His | The | Cln Val | Teg Tnn | Leu | |
1055 | 1060 | 1065 | ||||||||||
GAG | TTT CAT | CGG | CTC | GTT | GCT CTT | SAG | GGA | GC 0 | GCT TGC | TTT TCT | CTT | 306 |
190 220
Asp | Leu Gln | Leu Asp 1070 | Cys | Arg Gly | Tyr Arg Val Arg Thr Asn Cys Leu | |
1075 | 1080 | |||||
TTT | CCC TGG | ATT CCC | TGG | TTC AGT | TGT AGG TGC TCA CTA | CAC ACT GCA 354 |
Phe | Pro Trp Ile Pro 1085 | Trp | Phe Ser Cys Arg Cys Ser Leu His Thr Ala 1090 1095 | |||
GAG | CAG TGG | GAA CTA | CCA | ATT CGA | CCA GAT GCT CCT GAC | AGC GCA GAA 402 |
Glu | Gln Trp 1100 | Glu Leu | Pro | Ile Arg 1105 | Pro Asp Ala Pro Asp 1110 | Ser Ala Glu |
CCT | GCC TGC | CAG CTA | CAA | CTA CTG | CAG GCT AGT GAG CAG | GAG TCT AAC 450 |
Pro Ala Cys 1115 | Gln Leu | Gln Leu Leu 1120 | Gin Ala Ser Glu Gln 1125 | Glu Ser Asn 1130 | ||
CGT | ACG GTC | AAG CAC | ACT | CCC TGG | TGG CGT TTA TGC ACT | AAA CGG AAC 458 |
Arg | Thr Val | Lys His Thr 1135 | Pro Trp | Trp Arg Leu Cys Thr 1140 | Lys Arg Asn 1145 | |
CAT His | AAA CGC Lys Arg | AGT GAC Ser Asp 1150 | CTT Leu. | CCA CGG Pro Arg | AAG CCT GAG TGAGTTGACT GACTACAGCT 551 Lys Pro Glu 1155 |
ACAACGGGCT GATGTCAGCC ACTGCGAACA TCAACGACAA GATCGGGAAC GTTCTAGTTG 611
GAGAAGGGGT GACTGTTCTC AGTCTACCGA CTTCATATGA CCTTAGTTAT GTGAGACTCG 671
GTGACCCCAT CCCCGCAGCA GGACTCGACC CGAAGTTGAT GGCCACGTGC GACAGTAGTG 731
ACAGACCCAG AGTCTACACC ATAACAGCTG CAGATGAATA CCAATTCTCG TCACAACTCA 791
TCCCGAGTGG CGTGAAGACC ACACTGTTCT CCGCCAACAT CGATGCTCTC ACCAGCTTCA 851
GCGTTGGTGG TGAGCTTGTC TTCAGCCAAG TAACGATCCA AAGCATTGAA GTGGACGTCA 911
CCATTCACTT CATTGGGTTT GACGGGACAG ACGTAGCAGT CAAGGCAGTT GCAACAGACT 971
TTGGGCTGAC AACTGGGACA AACAACCTTG TGCCATTCAA CCTGGTGGTC CCAACAAATG 1031
AGATCACCCA GCCCATCACT TCCATGAAAC TAGAGGTTGT GACCTACAAG ATTGGCGGCA 1091
CCGCTGGTGA CCCAATATCA TGGACAGTGA GTGGTACACT AGCTGTGACG GTGCACGGAG 1151
GCAACTACCC TGGGGCTCTC CGTCCTGTCA CCCTGGTGGC CTATGAACGA GTGGCTGCAG 1211
GATCTGTTGT CACAGTTGCA GGGGTGAGCA ACTTCGAGCT AATCCCCAAC CCTGAGCTTG 1271
CAAAGAACCT AGTTACAGAG TATGGCCGCT TTGACCCCGG AGCAATGAAC TACACCAAAC 1331
TAATACTGAG TGAGAGAGAT CGTCTAGGCA TCAAGACAGT CTGGCCCACC AGGGAGTACA 13 91 CCGATTTCAG GGAGTACTTC ATGGAGGTTG CAGATCTCAA CTCACCCCTA AAGATTGCAG 1451
190 220
GAGCATTTGG | CTTTAAGGAC | ATAATCCGAG | CCATTCGGAA | GATTGCGGTG | CCAGTGGTAT | 1511 |
CCACACTCTT | CCCTCCAGCT | GCACCCCTAG | CACATGCAAT | CGGAGAAGGT | GTAGACTACC | 1571 |
TCCTGGGCGA | CGAGGCCCAA | GCAGCCTCAG | GGACAGCTCG | AGCCGCGTCA | GGAAAAGCTA | 1631 |
GAGCTGCCTC | AGGACGAATA | AGGCAGCTAA | CTCTCGCAGC | TGACAAGGGG | TGCGAGGTAG | 16 51 |
TCGCCAACAT | GTTCCAGGTG | CCCCAGAATC | CCATTGTTGA | TGGCATTCTG | GCATCCCCAG | 1751 |
GAATCCTGCG | TGGCGCACAC | AACCTCGACT | GCGTGCTATG | GGAGGGAGCC | ACTCTTTTCC | 1811 |
CTGTTGTCAT | TACGACACTC | GAGGATGAGC | TGACCCCCAA | GGCACTGAAC | AGCAAAATGT | 1871 |
TTGCTGTCAT | TGAAGGTGTG | CGAGAGGACC | TCCAGCCTCC | ATCCCAACGG | GGATCCTTCA | 1931 |
TTCGAACTCT | CTCTGGCCAT | AGAGTCTATG | GCTATGCCCC | AGACGGAGTA | CTGCCTCTGG | 1991 |
AGACCGGGAG | AGACTACACC | gttgtcccaa | TTGATGATGT | GTGGGACGAT | AGCATAATGC | 2051 |
TGTCGCAGGA | CCCCATACCT | CCAATCATAG | GGAACAGCGG | CAACCTAGCC | ATAGCATACA | 2111 |
TGGATGTCTT | CAGGCCCAAG | GTCCCCATCC | ACGTGGCTAT | GACAGGGGCC | CTCAATGCCC | 2171 |
GCGGTGAGAT | CGAGAGTGTT | ACGTTCCG3A | GCACCAAACT | CGCCACAGCC | CACCGACTTG | 2231 |
GCATGAAGTT | AGCTGGTCCT | GGAGCCTATG | ACATTAATAC | AGGACCTAAC | TGGGCAACGT | 2291 |
TCGTCAAACG | TTTCCCTCAC | AATCCCCGAG | ACTGGGACAG | GTTGCCCTAC | CTCAACCTTC | 2351 |
CTTATCTCCC | ACCAACAGCA | GGACGTCAGT | TCCATCTAGC | CCTGGCTGCC | TCCGAGTTCA | 2411 |
AAGAGACCCC | AGAACTCGAA | . GACGCTGTGC | GCGCAATGGA | . TGCCGCTGCA | AATGCCGACC | 2471 |
CATTGTTCCG CTCAGCTCTC CAGGTCTTCA TGTGGTTGGA AGAAAACGGG ATTGTGACCG 2S31
ACATGGCTAA CTTCGCCCTC AGCGACCCAA ACGCGCATAG GATGAAAAAC TTCCTAGCAA 2531
ACGCACCCCA GGCTGGAAGC AAGTCGCAGA GGGCCAAGTA TGGCACGGCA GGCTACGGAG 2651
TGGAGGCTCG AGGCCCCACA CCAGAAGAGG CACAGAGGGA AAAAGACACA CGGATCTCCA 2711
AGAAGATGGA AACAATGGGC ATCTACTTCG CGACACCGGA ATGGGTGGCT CTCAACGGGC 2771
ACCGAGGCCC AAGCCCCGGC CAACTCAAGT ACTGGCAAAA CACAAGAGAA ATACCAGAGC 2331
CCAATGAGGA CTACCCAGAC TATGTGCACG CGGAGAAGAG CCGGTTGGCG TCAGAAGAAC 2831 AGATCCTACG GGCAGCCACG TCGATCTACG GGGCTCCAGG ACAGGCTGAA CCACCCCAGG 2951 CCTTCATAGA CGAGGTCGCC AGGGTCTATG AAATCAACCA TGGGCGTGGT CCAAACCAGG 3011
190 220
ACTACATGAA GGACCCGCCC | CCACACCAAG GlTTCCAAGT CTΑCCTCCGΑ | 3071 |
TTACATAAAA GCTAGAGTTA | AAACCAATGG CrCΑCTAΑlG AGAACTTTGT GAACCGCCCG | 3131 |
GTTCCCCGAC CA.GGACCGCC | ATCAACACCG ACTCGAGTCG CCACATCCGG lGCTCATACG | 3191 |
ACACTATCCG TCAACGCGCC | AAAACAACTA CCCAC'CTCAA TACATAAAAA CCGACAACCG | 3251 |
CCCTCGCCCT CCT | 3264 |
(2) INFORMACJA o sekwencji o numerze identyfikacyjnym. 32 (2) CHARAKTERYSTYKA SEKWENCJI (A) DŁUGOŚĆ 145 aminokwasów (B) RODZAJ: aminokwas ^TOPOLOGIA:
(ii) RODZAJ MOLEKUŁY: proteina (xi) OPIS SEKWENCJI· numer identyfikacyjny sekwencji: 32
Met 1 | Val | Ser | Aug | AAp 5 | GGn | Ghr | GAsn | ASp | Arg 11 | Ser | ASp | AS>p | Lys | Pro 15 | Gip |
Gly | Ser | His | Pro 20 | Thr | Asp | Cys | Ser | V«Q. 22 | His | Thr | Glu | Pro | See 33 | Gap | GAa |
Asn | Asp | Arg 35 | Thr | Gly | Val | His | Ser 40 | Gly | Arg | His | Pro | Gly 45 | Glu | Ala | His |
Thr | Gln 50 | Val | Arg | Asn | Leu | Asp 55 | Leu | Gln | Leu | Asp | Cys 60 | Arg | Gly | Tyr | Arg |
Val 65 | Arg | Thr | Asn | Tys | Leu 70 | Phe | Pro | Trp | Ile | Pro 75 | Trp | Phe | Ser | Cys | Arg 80 |
Cys | Ser | Leu | His | Thr 85 | Ala | Glu | Gln | Trp | Glu 90 | Leu | Pro | Ile | Arg | Pro 95 | ^;p |
Ala | Pro | Asp | Ser 100 | Ala | Glu | -Pro | Ala | (A^lS 115 | Gln | Leu | Gln | Leu | Leu 110 | Gln | Ala |
Ser | Glu | Gln 115 | Glu | Ser | Asn | Arg | Thr 120 | Val | Lys | His | Thr | Pro 125 | Trp | Trp | Arg |
Leu | Cys 130 | Thr | Lys | Arg | Asn | His 13 5 | Lys | Arg | Ser | Asp | Leu 110 | Pro | Arg | Lys | Pro |
Glu
145
190 220 (2) INFORMACJA o sekwencji o numerze identyfikacyjnym· 33 (2) CHARAKTERYSTYKA SEKWENCJI (A) DŁUGOŚĆ· 3264 pacy podstawowe (B) RODZAJ· kwas nukleinowy (C) SKRĘTNOŚ· pojedyncza (D) TOPOLOGIA.· kolista (U) RODZAJ MOLEKUŁY· proteina (xi) OPIS SEKWENCJI· numer identyfikacyjny sekwencji· 33
TTATATTATT GGTCTGACCC TTTTTTATTC ACCCllGGAC ATlCTATCAT TGC-CTGlTC 50
TTTTTTTTAA CTCCTCThTC TGCTGTACTA TCGTTTATTG TTATTAGATC TTCAACCAAC 120
GATTTCATTG ATG ACA AAC CTG ATG GAT CAC ACC CAA CAG ATT GTTT CCG 169
Mut Thr Asn Luu Met Asp His Tho Gln Gln Ilu aal Poo
150 155
ThC ATA | CGG Arg | AGC CTh TT G TT G CAG CCG CCG GGG I CC GlC | GTT Isi | gt? Ile | CCG Pro | 221 | |||||||||
Phu | Ile 160 | Sur | Luu | UeG | ue i 16S | hri | ThG | ThG | gg. | Gro Gla 170 | |||||
GAC | GAC | ACC | CTG | GAG | AAG | (CAC | ACA | CTC | AGT | CCG | AAG CCI | CTG | ACT | TAC | 225 |
Asp | Asp | Thr | Leu | Glu | L^s | Hia | Thi | Leu | Arg | Sit | uGt SGs | Se r | Thr | ΊΤΓ | |
175 | 180 | 180 | 116 | ||||||||||||
AAC | TTG | ACT | GTA | ttt | ATG | CAG | TlG | CAG | TlG | CCT | GiT att | GTT | GTTT | CCC | 331 |
Asn | Luu | Tho | aal | Gly | spj | ThG | IsI | dy | um | IGv IIP | UGe | UGe | Pro | ||
165 | 200 | 205 | |||||||||||||
TTA | TTC | CCT | ttt | TCA | ThG | TAG | TTG | CTG | ACG | TAC | GAC ATT | GCA | AGT | AAT | 361 |
Gly | Phu | Pro | Gly | Sur | Val | Vvl | Gly | Ala | Hie | Gyr | Thr Leu | Gln | SUh | Ssu | |
210 | 215 | 220 | |||||||||||||
TTG | AAC | TAC | CAA | TTC | ACG | ATG | TTG | TCG | TTG | ACCA | G^G (CA | AAC | TTT | CTT | 403 |
Gly | Asn | Tyr | Gln | Phu | spj | Ug | Ue G | UuG | UuT | hGl | aGg gii | Giy | uiu | Pro | |
225 | 230 | 235 | |||||||||||||
GCC | AGC | TAC | AAC | TAC | TCG | GGG | TAG | TTG | TCG | AKT | AGT (CA | ACC | TTA | CGT | 457 |
l.l | Suo | Tyr | Asn | Tyr | Iss | hri | UuG | la G | Uri | Ais | Sil uit | SGv | ?Gl | Aas | |
240 | 245 | 250 |
190 220
TCA AGC Ser Ser 255 | ACA Thr | CTC CCT GGT GGC GTT | TAT GCA Tyr Ala | CTA AAC GGA ACC ATA AAC Leu Asn Gly Thr Ile Asn | 505 | |||||||||||
Leu | Pro | Gly 260 | Gly | Val | ||||||||||||
265 | 270 | |||||||||||||||
GCA | GTG | ACC | TTC | CAC | GGA | AGC | CTG | AGT | GAG | TTG | ACT | GAC | TAC | AGC | TAC | 553 |
Ala | Val | Thr | Phe | His | Gly | Ser | Leu | Ser | Glu | Leu | Thr | Asp | Tyr | Ser | Tyr | |
275 | 280 | 285 | ||||||||||||||
AAC | GGG | CTG | ATG | TCA | GCC | ACT | GCG | AAC | ATC | AAC | GAC | AAG | ATC | GGG | AAC | •601 |
Asn | Gly | Leu | Met | Ser | Ala | Thr | Ala | Asn | Ile | Asn | Asp | Lys | Ile | Gly | Asn | |
290 | 295 | 300 | ||||||||||||||
GTT | CTA | GTT | GGA | GAA | GGG | GTG | ACT | GTT | CTC | AGT | CTA | CCG | ACT | TCA | TAT | 649 |
Val | Leu | Val | Gly | Glu | Gly | Val | Thr | Val | Leu | Ser | Leu | Pro | Thr | Ser | Tyr | |
305 | 310 | 315 | ||||||||||||||
GAC | CTT | AGT | TAT | GTG | AGA | CTC | GGT | GAC | CCC | ATC | CCC | GCA | GCA | GGA | CTC | 697 |
Asp | Leu | Ser | Tyr | Val | Arg | Leu | Gly | Asp | Pro | Ile | Pro | Ala | Ala | Gly | Leu | |
320 | 325 | 330 | ||||||||||||||
GAC | CCG | AAG | TTG | ATG | GCC | ACG | TGC | GAC | AGT | AGT | GAC | AGA | CCC | AGA | GTC | 745 |
Asp | Pro | Lys | Leu | Met | Ala | Thr | Cys | Asp | Ser | Ser | Asp | Arg | Pro | Arg | Val | |
335 | 340 | 345 | 350 | |||||||||||||
TAC | ACC | ATA | ACA | GCT | GCA | GAT | GAA | TAC | CAA | TTC | TCG | TCA | CAA | CTC | ATC | 793 |
Tyr | Thr | Ile | Thr | Ala | Ala | Asp | Glu | Tyr | Gln | Phe | Ser | Ser | Gln | Leu | Ile | |
355 | 360 | 365 | ||||||||||||||
CCG | AGT | GGC | GTG | AAG | ACC | ACA | CTG | TTC | TCC | GCC | AAC | ATC | GAT | GCT | CTC | 841 |
Pro | Ser | Gly | Val | Lys | Thr | Thr | Leu | Phe | Ser | Ala | Asn | Ile | Asp | Ala | Leu | |
370 | 375 | 380 | ||||||||||||||
ACC | AGC | TTC | AGC | GTT | GGT | GGT | GAG | CTT | GTC | TTC | AGC | CAA | GTA | ACG | ATC | 889 |
Thr | Ser | Phe | Ser | Val | Gly | Gly | Glu | Leu | Val | Phe | Ser | Gln | Val | Thr | Ile | |
385 | 390 | 395 | ||||||||||||||
CAA | AGC | ATT | GAA | GTG | GAC | GTC | ACC | ATT | CAC | TTC | ATT | GGG | TTT | GAC | GGG | 93 7 |
Gln | Ser | Ile | Glu | Val | Asp | Val | Thr | Ile | His | Phe | Ile | Gly | Phe | Asp | Gly | |
400 | 405 | 410 | ||||||||||||||
ACA | GAC | GTA | GCA | GTC | AAG | GCA | GTT | GCA | ACA | GAC | TTT | GGG | CTG | ACA | ACT | 9BS |
Thr | Asp | Val | Ala | Val | Lys | Ala | Val | Ala | Thr | Asp | Phe | Gly | Leu | Thr | Thr | |
415 | 420 | 425 | 430 | |||||||||||||
GGG | ACA | AAC | AAC | CTT | GTG | CCA | TTC | AAC | CTG | GTG | GTC | CCA | ACA | AAT | GAG | 1033 |
Gly | Thr | Asn | Asn. | Leu | Val | Pro | Phe | Asn | Leu | Val | Val | Pro | Thr | Asn | Glu | |
435 | 440 | 445 | ||||||||||||||
ATC | ACC | CAG | CCC | ATC | ACT | TCC | ATG | AAA | CTA | GAG | GTT | GTG | ACC | TAC | AAG | 1081 |
Ile | Thr | Gln | Pro | Ile | Thr | Ser | Met | Lys | Leu | Glu | Val | Val | Thr | Tyr | Lys | |
450 | 455 | 460 |
190 220
ATT GGC GGC ACC GCT GGT GAC CCA ATA TCA TGG ACA GTG AGT GGT ACA Ile Gly Gly Thr Ala Gly Asp Pro Ile Ser Trp Thr Val Ser Gly Thr | 1123 | |||
465 | 470 | 475 | ||
CTA GCT | GTG ACG GTG CAC | GGA GGC | AAC TAC CCT GGG GCT CTC CGT CCT | 1177 |
Leu Ala | Val Thr Val His | Gly Gly | Asn Tyr Pro Gly Ala Leu Arg Pro | |
430 | 485 | 490 | ||
GTC ACC | CTG GTG GCC TAT | GAA CGA | GTG GCT GCA GGA TCT GTT GTC ACA | 1225 |
Val Thr | Leu Val Ala Tyr | Glu Arg | Val Ala Ala Gly Ser Val Val Thr | |
495 | 500 | 505 S10 | ||
GTT GCA | GGG GTG AGC AAC | TTC GAG | CTA ATC CCC AAC CCT GAG CTT GCA | 1273 |
Val Ala | Gly Val Ser Asn | Phe Glu | Leu Ile Pro Asn Pro Glu Leu Ala | |
515 | 520 525 | |||
AAG AAC | CTA GTT ACA GAG | TAT GGC | CGC TTT GAC CCC GGA GCA ATG AAC | 1321 |
Lys Asn | Leu Val Thr Glu | Tyr Gly Arg Phe Asp Pro Gly Ala Met Asn | ||
530 | 535 540 | |||
TAC ACC | AAA CTA ATA CTG | AGT GAG | AGA GAT CGT CTA GGC ATC AAG ACA | 1369 |
Tyr Thr | Lys Leu Ile Leu | Ser Glu | Arg Asp Arg Leu Gly Ile Lys Thr | |
545 | 550 | 555 | ||
GTC TGG | CCC ACC AGG GAG | TAC ACC | GAT TTC AGG GAG TAC TTC ATG GAG | 1417 |
Val Trp | Pro Thr Arg Glu | Tyr Thr | Asp Phe Arg Glu Tyr Phe Met Glu | |
560 | 565 | 570 | ||
GTT GCA | GAT CTC AAC TCA | CCC CTA | AAG ATT GCA GGA GCA TTT GGC TTT | 1465 |
Val Ala | Asp Leu Asn Ser | Pro Leu | Lys Ile Ala Gly Ala Phe Gly Phe | |
575 | 580 | 585 S90 | ||
AAG GAC | ATA ATC CGA GCC | ATT CGG | AAG ATT GCG GTG CCA GTG GTA TCC | 1513 |
Lys Asp | Ile Ile Arg Ala | Ile Arg | Lys Ile Ala Val Pro Val Val Ser | |
595 | 600 605 | |||
ACA CTC | TTC CCT CCA GCT | GCA CCC | CTA GCA CAT GCA ATC GGA GAA GGT | 1561 |
Thr Leu | Phe Pro Pro Ala | Ala Pro | Leu Ala His Ala Ile Gly Glu Gly | |
610 | 615 620 | |||
GTA GAC | TAC CTC CTG GGC | GAC GAG | GCC CAA GCA GCC TCA GGG ACA GCT | 1609 |
Val Asp | Tyr Leu Leu Gly | Asp Glu | Ala Gln Ala Ala Ser Gly Thr Ala | |
625 | 630 | 535 | ||
CGA GCC | GCG TCA GGA AAA | . GCT AGA | . GCT GCC TCA GGA CGA ATA AGG CAG | 1657 |
Arg Ala | Ala Ser Gly Lys | Ala Arg | Ala Ala Ser Gly Arg Ile Arg Gln | |
640 | 645 | 650 | ||
CTA ACT | ' CTC GCA GCT GAC | : AAG GGG | ; TGC GAG GTA GTC GCC AAC ATG TTC | 1705 |
Leu Thr | Leu Ala Ala Asp | i Lys Gly Cys Glu Val Val Ala Asn Mat Phe |
655 660 665 670
190 220
CAG GTG CCC CCG | ACT Asn 575 | CCC ATT GTT GAT GGC ATT CTG GCA TCC | CCC Pro 605 | GGA Gly | 1775 | |||||||||||
Glr Vnl | Pro | Gln | Pro | Ile | Val | Asp | cle 600 | Ile | Leu | Ala | Ser | |||||
ATC | CTG | CGT | GGC | ACA | CCC | ACC | CTC | ACC | TGC | GTG | CAA | TCG | AAC | GAA | CCC | 1580 |
Ile | Leu | Arg | Gly | AUa | His | Asn | Leu | Cap | cys | Vyl | Leu | Trp | Glu | Gly | Aly | |
690 | 695 | 700 | ||||||||||||||
ACT | CTT | TTC | CCT | GTT | GTC | ATT | CCG | CCA | CTC | GCC | CAA | ACG | CAG | ACC | CCC | H04 |
Thr | Leu | PIi | Pro | Val | Val | Ile | ThT | Thr | Leu | Clu | Asp | Glu | Leu | Thr | Pro | |
705 | 710 | 710 | ||||||||||||||
CCG | GCA | CTG | ACC | CAC | CCC | ATG | TTT | GCT | GTC | ATA | CCA | CGT | AAA | CGA | AAG | 106 9 |
Lys | AU y | Leu | Asn | Ser | Lys | Met | Phe | Ala | Val | Ile | Clu | ciy | Vnl | Arg | Alu | |
720 | 772 | 773 | ||||||||||||||
GCC | CTC | CCG | CCT | CCA | TCC | CCA | CGA | GGA | TCC | TAC | ATT | CCA | ACA | CTC | TCT | H94 |
Asp | Leu | Gln | Pro | Pro | Ser | Gln | Crg | Gly | Ser | Phe | Ile | Arg | Thr | Leu | Ser | |
735 | 774 | US | 750 | |||||||||||||
GGC | CAT | CGA | GTC | TAT | GGC | TAT | GCC | CCC | CAC | GAA | GTC | CTA | CCT | CAC | CCG | 1999 |
Gly | His | Arg | Val | Tyr | Gly | Tyr | Ala | Pro | Asp | Gly | Vyl | Leu | Pro | Leu | Alu | |
755 | 770 | 776 | ||||||||||||||
ACC | GGG | AGA | GAC | TAC | ACC | CCT | GTC | CCA | ATT | GCC | GAT | TTC | T-G | GAC | ccrc | lll - |
Thr | Gly | ŻATJ | Acp | Tyr | TIr | Val | Val | Pra | -la | Pro | Asp | UeC | p-c | Asp | Asp | |
770 | 777 | 770 | ||||||||||||||
CGC | ATA | ATG | CTG | TCA | CAG | GAC | CCC | ATA | CCA | CGA | ATC | AAA | GCA | AAC | AGC | 2 08 9 |
Ser | Ile | Met | Leu | Sit | Aln | Asp | Pro | Ile | Pro | Pro | Ile | Ile | Cly | Asn | Ser | |
7δ5 | 790 | 799 | ||||||||||||||
GGC | AAC | CTA | GCC | ATA | ACC | TAC | ATA | CAT | GTC | TTC | CCC | CCC | AAG | GTC | CCC | 213- |
Gly | Asn | Leu | AUn | Ile | AUa | Tyr | Met | Asp | Val | Phe | Crg | Pro | Lys | Val | Pro | |
000 | 805 | 810 | ||||||||||||||
CTC | CAC | GTG | GCT | ATA | ACC | GGA | GCC | CTC | ACA | GCC | CGC | CAA | GAC | ATC | CAC | 21BS |
Ile | His | Val | Aln | Met | Thr | Gly | AUa | Leu | Csn. | Ala | Arg | ciy | Glu | Ile | Alu | |
905 | 820 | 825 | 830 | |||||||||||||
CGT | GTT | ACG | TTC | CGC | CGC | ACC | CAA | CTC | CCC | CGA | CGC | CAG | CGC | CTT | GCC | 2233 |
Ser | Vnl | Thr | Phe | Arg | Ser | Thr | Lys | Leu | Aln | ThT | AUn | His | Arg | Leu | Gly | |
035 | 800 | 84 5 | ||||||||||||||
CTG | AAG | TTA | ACT | GGT | CCT | GAA | GCC | TAT | GCC | ATA | CCT | CGA | GAA | CCA | ACC | 2781 |
Met | Lys | Leu | Aly | Ale | Pro | Gly | Aln | Tyr | Asp | Ile | Asn | Thr | Cly | Pro | Asn | |
050 | 855 | aso | ||||||||||||||
TGG | GCA | CCG | TTC | ATC | ACA | CGT | TTC | CCT | CAC | CAT | CCC | CGA | AAC | TCA | CAC | 2329 |
Trp | AUn | Thr | Phe | Vnl | Lys | Arg | Phe | Pro | His | Asn | Pro | Arg | Asp | Arp | Asp |
065 8-70 875
190 220
AGG TAC TTT TAT ATT AAA CTT TGA TAT CTC CGA ACA ACA GCA GGC AGT 223 7
Arg Lla Pro Tyr Leu Asa Pau Air Tyr Oeu Pro Pro Thr Al c G1g Ar.
880 885 880
CAG TTT CAT CTA GAC CTT GAG TAC CGT CAG GAA TGA GAC GGA T GA AGG 2445
Gln Phe His Lla Ala Leu A1a aGa Sir O1g PGe Lys PIg AGa Oap o 1g
89S 990 905 911
TTC CAA GAC GCT ATG CGC GCA ATG CGT GCC GCT GCA AAT CCC GAC CCA 2473
Lla Glu Asp Ala Val Arg Ala Met Asp AlLa UL a Ala Asn Ala JSsp Pro
915 920 925
TTC TTC TCC TCA GTT CTC CAA CAC CAA AGA CGT CAT CGC GAG AGA TGC 2222 lla Phe Aog reo Ala Lee a li Val Phr lam tat Lal A1c a Ic Ain Gly
930 935 940
ACC CCC ACC GAT ACC GCC AAC TAC CGC CGC AGA CAC CGA ATG C AC CTT Hep
Ul | Vsl | Thr 945 | Asp | Met | All | Sin | pAp 950 | A 1a. | S ie | A as | Οι. | Pap 95S | oin | n Ac | Sas | |
ACG | ATG | AGA | AAG | CTC | GCA | ACA | GAG | AGA | GTC | GAG | GGT | GGA | AGG | TAG | TAG | 2 617 |
nog | Met 960 | Lys | ASA | PPe | All | All 965 | TAS | All | Aro | Gil | All 970 | Gly | s er | lys | lee | |
CAC | CGG | CCC | AAG | TAT | GGC | ACA5 | Gd | GGC | TAC | GGA | GTG | GAG | G er | CGT, | GGC | 2665 |
Cln 975 | log | Als | Lys | Tyr | Giy 980 | Thr | A lćl | Gly | TGat | Gly 985 | sial | Glu | Ala | Arg | Gly 999 | |
CTC | ncn | CCA | ynn | GAG | Gd | CAG | AGG | GAJA | ATCC | GAC | ACH | CGG | ATCC | TCC | AAG | 2713 |
Poo | Tho | Pro | Glu | Glu 995 | Ala | Gln | JAA<3 | Glu | Lys Asp 10Q0 | TGac | Arg | I 1«! | Ser Lys 1005 | |||
AGG | ncc | CAA | Ad | ATC! | GCC | ATC | TAC | TTC | CGG | Ad | atc | GCA | GAG | GCC | GCC? | 27Π |
Lys | Met | Clu | Tle Met 1010 | Gly | Ile | iyr | PPe 3A_a 1015 | ACh | Aro | Gil | Acp TaS 1020 | All | ||||
CTT | nnc | CGC | CAC | CGA | GGC | CCA | AGC | CCC | GGC | ACC. | CTC | (AA. | GAC | GGC | CCA | 280S |
lla | Asn | Cly His 1025 | Jurg | Gly | Pro | Ser Pro 1030 | Gly | Gln | Leu | Lys tat 1035 | Trp | Glu | ||||
GAC | ACA | ncn | GACA | ATA | Cd | GAG | CCC | JAGA | GAG | (GAC | TAC | CCC. | GAC | TAG | GCA | 2857 |
Asn | Thr Aog 1040 | GlU | He | Pro | Glu Pro 1045 | (Cu | Glu | (Asp | Τ/τ Pro 1050 | Acp | Gat | Gal | ||||
CGT | CCC | CAC | AAG | JACC | CGG | TAG | GCG | Td | GAJA | CCCC | dG | ATC | (ACA | CCCC | Gd | 3955 |
His Als 355e | Clu | Lys | Ser | Arg Leu 1060 | Ala | Ser | Glu | Glu Gln 1065 | 11 li | Leu | (Aog | (Ala 1070 | ||||
GCT | ACC | TCC | ATC | TAC | GGG | GGA | CCA | (GCA | dG | GiCA | (GAC | Cd | CCC | dG | GCC | łS 33 |
G.s | Tho | Seo | Ile | ryr Gly Als 1075 | Pro | Gly | Gln Ala 1080 | Glu | Pro | Pro | Gln (GLs 1085 |
190 220
TTC ATA GAC | GAG GTC Glu Val 1090 | GCC Ala | ϋΑ TCP TTG GGA ATC AAC CAT GGG CGT GGT | |||||
Phe | Ile | Asp | 0Ag Paa Tyr Glu 0Ie .Asn His Gly Arg | Gly | ||||
1095 | 1100 | |||||||
CCA | AAC | CAG | GAG CAG | ATG | AGG ACP CTP CTC CTG | CCA GAA ATG GCG | CAG | 3049 |
Pro | Asn | Gln | Glu Gln | Mec | Ssp Mp Lup Leu Ilu | Tir Ma Met Glu | Met | |
1105 | 1110 | 1115 | ||||||
AlG | CAT | CGC | AAT CCC | AGG | CUP CAP CCG C<C AAG | CCC CAG CCA CAA | CCC | |
Lys | His | Arg | Asn Pro | Arg | Arg 0Ca Pro Pro Ly3 | Pro Lys Pro Lys | Pro | |
1150 | 1155 | 113 0 | ||||||
AAT | GCT | CCA | TCA CAG | AGA | CCP CCA GAP Cd» CT5 | AAA CGC ΤΜ CTC | CGG | 3145 |
Asn | Ala | Pro | Ser Gln | Arg | Pro Pro Gly Arg Leu | Gly Arg Trp I1p | Arg | |
113 5 | 1140 1145 | 1150 | ||||||
ACG | GTC | TCC | GAC GAG | GAC | ΠΆ GCG TACGGCTCCT GAGCATATAC AACAACACCC | 3199 | ||
Tho | Val | Ser | Asp Glu | Asp | Lee Gle |
1155
CGCGCAGGTG TGGACACCAA TTCGGCCTTC TACCATCCCA AATTGGATCC GTTCGCGGGT 3559
CCCCT 3564 (2) INFORMACJA o sekwencji o numerze identyfikacyjnym: 34 (2) CHARAKTERYSTYKA SEKWENCJI (A) DŁUGOŚĆ: 1013 aminokwasów (B) RODZAJ: aminokwas (D) TOPOLOGIA: liniowa (ii) RODZAJ MOLEKUŁY: proteina (xi) OPIS SEKWENCJI: numer identyfikacyjny sekwencji: 34
Met 1 | Thr | Als | Leu | Met 5 | Mp | His | Thr | Gln | Gln 10 | Ul | Val | Pro | Pru | He 11 | PAg |
SLO | yLU | Lyu | Met 50 | Pro | Tlrr | Tho | Gly | Pro 55 | Ma | Ssi- | 0Ie | Pro | Asp 30 | Asp | TCr· |
Lee | Glu | Lys 35 | Hiis | Tło | Leu | Arg | Ser 40 | Glu | Tir | Ser | Thr | Tyr 45 | Mrn | Leu | tIo:- |
Val | Gly 50 | Asp | Tho | Gly | Seg | Gly 55 | Lee | Ile | Val | Phe | Phe 60 | Poo | Gly | Phe | Poo |
GIs 65 | SLO | Val | Val | Gly | Ala 70 | His | TS?o | Thr | Leu | Gln 7^ | Ser | Ser | Gly | Asn | Tyr 38 |
Gln Phe Asp Gln Mey Leu Leu Thr Ala Gln Mn Leu Pro Ala Ser iyy
190 220
85 | 90 | 90 | |||||||||||||
Asn | Ayr | <Ges | Mg | Leu | Val· | Ser | Arg | Ser : | Leu | Thr ' | Vai | Mg | Ser | Ser | TSe· |
100 | 150 | 110 | |||||||||||||
Leu | Poo | Gly | Gly | Val | Tyr | Ala | Leu . | Asn | Gly | TM | lie | Asn | Ala | Val | Thr |
115 | 110 | 122 | |||||||||||||
Phe | His | Gly | Ser | Lys | S er | Glu | Lys | lipo | Asp | Gpr | SSL | oyy | Acs | Ale | Cyu |
130 | 135 | 140 | |||||||||||||
Met | Ser | Ala | Thr | Ala | Aaa | sl c | As n | Asp | Lys | lip | GSs | len | Pcs | Aaa | Val |
145 | 150 | 155 | 160 | ||||||||||||
Gly | Glu | Gly | Val | Tłuc | Val | Luu | Ser | Leu | Pro | Thr | Ser | Gyr | Asp | Luu | Ser |
165 | 170 | 175 | |||||||||||||
Cyr | Val | Arg | Leu | Gly | Gap | Pro | 11 e | Pro | Ala | Ais | Gly | Leu | LVa | Pro | Lys |
180 | 15 0 | 190 | |||||||||||||
Leu | Met | Ala | Thr | CCS | Asp | Ser | Ser | Asp | Mg | Pro | Mg | Val | Tyer | CAp | Ile |
195 | 200 | 225 | |||||||||||||
GPr | Ala | Ala | Asp | GGu | Tyg | Gln | Phe | Sso | Ser | Gln | Leu | Ile | Pro | Ser | Gly |
210 | 215 | 220 | |||||||||||||
VvL | Lys | TPr | Thr | Leu | Phe | Ser | Ala | Asn | lie | Asp | Ala | Lyu | Che | CSr | Che |
225 | 220 | 235 | 240 | ||||||||||||
Seo | Val | Gly Gly | Glu | Leu | Val | Phe | Ser | Gln | Val | Thr | Ile | Cle | Csl | Cle | |
245 | 225 | 225 | |||||||||||||
Glu | wv | Asp | Vcl | Thr | aaa | Hu | LHe | Ple | Gly | Tle | Asp | Gly | The | Tpg | Val |
260 | 225 | 220 | |||||||||||||
ALa | vaa | Cys | Ale | Cal | Ala | aic | asp | asp | ULg | Pcu | Thr | Thr | Gly | TM | Asn |
275 | 220 | 228 | |||||||||||||
Asn | Llu | Val | Pra | Che | Asn | Leu | Val | vai | Pro | Thr | Asn | G1 u | Ile | TM | Gln |
290 | 295 | 300 | |||||||||||||
Poo | lis | Gpg | Ser | Met | Lys | Leu | Glu | VaC | Val | Thr | Tyr | Lys | Ile | Gly Gly | |
305 | 310 | 315 | 322 | ||||||||||||
GPo | Ala | Gly | Asp | Pro | Ile | Seo | Grp | Thr | VaC | Ser | Gly | The | Cyu | CAa | Val |
325 | 330 | 335 | |||||||||||||
Thr | Val | His | GHy | Cly | Gie | . lyc | Icp | Gly | lic | Caa | Mg | ' Pro | Vhl | VV.l | ' L<W |
340 | 345 | 350 |
Val Ala Cyr GTu Arg Gid. Ala LAa Cla Ler lcl Val Tlcr Val Lc-La Gly 355 360 365
190 220
VaU | Ser 370 | Tnn | Phe | Glu | Leu | iau 337 | Pro | Tnn | Pro | Glu | Leu 380 | Ala | Lys | TTin | Ilu |
VaU 385 | The | GUI | T/A | CU/ | Trg 390 | Phe | Tnp | Peo | Gly | TUo 302 | Met | Tnn | T/A | Thr | Lys 400 |
Leu | IUe | Leu | Ser | GUu 405 | Trg | Tnp | Arg | Leu | Gly 405 | IIs | L/n | The | VaI | Tep 402 | Peo |
Thr | Arg | GUi | T/A 420 | Tleć· | Asp | Phe | Arg | Glu 425 | T/A | Phe | Me t | Glu | Va 1 430 | Ala | Asp |
Leu | Tnn | Ssa 435 | Pro | Leu | Lys | Ile | TUa 440 | Gly | TUa | Phe | GUy | Phe 445 | Lys | A^jp | I le |
Ile | Arg 450 | TUa | IUe | Teg | Lys | Ile 455 | TUo | VaU | Pro | Val | VoU 4(60 | See | TTa | Leu | PTs |
Peo 465 | Peo | TUa | Ala | Pro | Leu 470 | TUo | Hls | Tlo | Ile | Gly 473 | Cli | CU/ | VaU | Tnp | T/a 480 |
Leu | Leu | Gly | Asp | CUu 485 | TUa | GIn | TUa | Tla | Ssa 490 | Cl/ | The | TUo | AAg | TUo 449 | TUo |
Ser | GU/ | L/n | Ala 500 | Arg | SULa | TUa | Ser | Gly Trg 555 | Ile | Teg | GUn | Leu 550 | The- | Leu | |
TUo | AT u | Asp 515 | Ltp | Gly | cys | GU/ | ClP 552 | Cli | AUv | Usu | Ant | MSt 552 | TSc | nal | Pro |
CUn | Tnn 530 | Pro | Ile | Val | Asp | Gly 533 | 0 le | Lei | TUa | Ssa | Ppa 554 | GUy | Ile | Leu | Arg |
Cl/ 545 | TUa | Hln | Tsn | Lei | Tnp 550 | C/s | Val | Lei | Tep | Glu 535 | GUy | Tla | Thr | Leu | Phs 3O0 |
Peo | VaU | VoU | Ile | The 565 | TTa | Lei | Cli | Asp | GUu 570 | Leu | TTr | Pro | Lys | TUo 575 | Lei |
Tnn | Ser | Lys | MeS 580 | Che | ASu | Cal | 0 le | Glu 555 | Gly | Val | Arg | CUi | Asp 590 | Leu | Gln |
Peo | Pro | See 595 | Gln | TArg | Gly | Ser- | PPe 660 | Ile | Teg | Thr | Leu | Ser 60Si | Gly | KlS | Arg |
VoU | T/A 610 | Gly | Ttl | Ala | Pio | Aop 615 | G0y | Val | Leu | Pro | Leu 652 | oLh | TUi | hAy | Lta |
Tnp T/a The Vol VaI Peo IIs Asp Tnp VaU Tep Tnp Asp Ser Ile Met 625 630 635 C40
190 220
Luu | Sur Gln Asp | Pro 645 | Ilu | Pro Poo Ilu | Ile Tly Asn Siu Tly Asn Luu | ||||||||||
665 | 665 | ||||||||||||||
Ala | Ile | Ala | Tyr | Met | Asp | Val | Phe · | Arg | Pro | Lys ' | arl | Pro | Ile | His | wa |
660 | 666 | 667 | |||||||||||||
Ala | Mut | hhr | Gly | Ala | Leu | Asn | Ma . | Mg | Gly | Glu | Ile | Glu | Ser | Val | Thr |
675 | 660 | 685 | |||||||||||||
Phe | Arg | Ser | Th.r | Lys | Ttu | Ma | uAl | TTh | lli | Mg | Leu | SAg | MeL | Lys | Iiłu |
660 | 665 | 700 | |||||||||||||
Ala | Tly | Pro | Gly | Ala | Tyr | Asp | Ile | Asn | TTr | Gly | Pro | Mn | Tsp | Ala | Thr |
705 | 710 | 7!1 | 770 | ||||||||||||
PTe | Arl | Lys | Mg | Phe | Pro | His | Asn | Pro | Aug | Asp | Top | Asp | Mg | Leu | Pro |
725 | 730 | 735 | |||||||||||||
Tyr | Luu | Asn | Leu | Pro | Tyr· | Luu | Poo | Poo | Thr | Ala | Gly | Asg | Gln | Phe | His |
740 | Ί45 | 750 | |||||||||||||
Leu | Ala | Leu | Ala | Ala | ilr | llu | OTl | h-U | ysu | uiir | Pro | TSg | Leu | Glu | Aap |
755 | 7761 | 776 | |||||||||||||
Ala | Vvl | Arg | Ala | Met | Mp | Ml | Ma | Ma | Mn | Air | Ais | Pro | Leu | Phe | Arg |
770 | 777 | 770 | |||||||||||||
Ser | Ala | Leu | Gln | wa | IhT | Met | hop | Luu | Glu | Glu | Mn | Gly | Ile | Arl | TTr |
705 | 770 | 776 | 800 | ||||||||||||
Asp | Mut | MLa | Ain | Ghr | All. | Leu | Ser | Mp | Pro | Mn | Ma | His | Asg | Met | Lyy |
005 | 800 | 815 | |||||||||||||
Asn | Phe | Leu | Ala | Asn | Ala | Pro | Gln | lla | Gly | Ser | Lys | Ser | Gln | Mg | All |
020 | 025 | 830 | |||||||||||||
Lys | Tyr | Gly | Thh | Ala | Aly | Tyr | Gly | Val | Glu | Aly | Arl | Tlu | lri | TTl | Pso |
935 | 840 | 805 | |||||||||||||
Glu | Glu | Ala | Gln | Arg | Tlu | Lys | Asp | Thr | Mg | Ile | Ser | Lys | Lys | Met | Glu |
050 | 8053 | 800 | |||||||||||||
hhr | Met | Gly | IIl | Gyr | Phe | Ala | Thr | Pro | Glu | Tjsp | Val | Ma | Leu | Asn | Gll |
065 | 870 | 875 | 800 | ||||||||||||
Hes | Arg | Gly | Pro | Ger | Pro | Tly | · Gln | Leu | . Lvs | Tyr | Trp | Tln | . Asg | . hhr | Aig |
095 | 890 | 895 | |||||||||||||
Tlu | . Ilu | Pro | , Iug | . Pro | Asn | . Glu | . Asp | - Tyr | • Pro | i Asp | Tyr | Val | His | i Ala | Glu |
600 605 910
190 220
Lys | Seo | Arg 915 | Leu | Ala | Ser | Glu | Glu 920 | Gln | Ile | Leu JLrg | Ala 925 | Ala | Thr | Ser |
Ile | Tyr 930 | Gly | Ala | Pro | Gly | Gln 935 | Ala | Glu | Pro | Pro Gln 940 | Ala | Phe | Ile | Asp |
Glu 945 | Val | Ala | Arg | Val | Tyrr SSO | Glu | Ile | Asn | His | Gly Arg 955 | Gly | Pro | (Asn | Gln 960 |
Glu | Gln | Met | Lys | Asp 905 | Leu | leju | Leu | Thr | Ala 970 | Met G1 u. | Met | Ly. | Kir 975 | Arg |
Asn | hoo | Arg | JLg 980 | Ala | Pro | Pro | Lys | Pro 9S5 | Lys | Pro Lys | Pro | Asn 990 | Ala | Pro |
Seo | Gln | Aog 995 | Pro | Pro | Gly | Arg | Leu Gly 1005 | Arg | Trp Ile | Arg Thr 1005 | Val | Ser |
Asp Glu Asp Leu Glu 1010
190 220
TranserIpłion
Flg.lB
TranserIptlon
Fig. I C
190 220 kbp
2 3 4 5 6 Μ
21.0
5.0
2.0
1.6
0.33
0.56
F i g. 2
190 220
Segment A
23-82A SEG 10 No. 7 23A/P2B SEQ ID NO. 8 P2A
SEQ ID No. 9
530 540 550 560 570 580
GGAAGCCTGAGTGAGTTGACTGACTACAGCTACAACGGGCTGATGTCAGCCACTGCGAAC
6GAAGCCTGAGTGAGTTGACTGACTACAGCTACAACGGGCTGATGTCAGCCACTGCGAAC
23-82A SEQ ID No. 7
23A/P2B SEG ID No. 8 P2A
SEO ID No. 9
GGAA6CCTGAGTGAACTGACAGATGTTAGCTACAATGGGTT6ATGTCTGCAACAGCCAAC 530 540 550 560 570 580
590 600 610 620 630 640
ATCAACGACAAGATCGGGAACGTTCTAGTTGGAGAAGGGGTGACTGTTCTCAGTCTACCG
ATCAACGACAA6ATCGGGAACGTTCTAGTTGGAGAAG6GGTGACTGTTCTCAGTCTACCG
ATCAACGACAAAATT6G6AAC6TCCTAGTAGG6GAA6GGGTCACCGTCCTCAGCTTACCC 590 600 610 620 630 640
Fig.3A
Segment B
23-82B
SEO ID No. 10
23A/P2B SEQ ID No. II P2B
SEQ ID No. 12
23-82B
SEQ ID No. 10 23A/P2B SEO ID No. II P2B
SEO ID No. 12
130 140 150 160 170 180
TTTTCAATAGTCCACA6GCGCGAACGAAGATCTCAGCAGCGTTCGGCATAAAGCCTACTG
TTTTCAACAGTCCACAGGCGCGAAGCACGATCTCA6CA6CGTTC66CATAAAGCCTACTG
TTTTCAACAGTCCACAG6CGCGAAGCACGATCTCAGCAGCGTTCGGCATAAAGCCTACTG
130 140 150 160 170 180
190 200 210 220 230 240
CTGGACAAGACGTGGAAGAACTCTT6ATCCCCAAAGTCT66GT6CCACCTGAGGATCC6C Cr6GACAA6AC6T66AA6AACTCTT6ATCCCTAAA6nT666T6CCACCTGAGGATCC6C
CTGGACAAGACGTGGAAGAACTCTTGATCCCTAAAGTTTGGGTGCCACCTGAGGATCCGC 190 200 210 220 230 240
Fig.3B
190 220
Fig.4A
20 30 40 50 GO 70
I I I I I I I
GGATACGATCGGTCTGACCCCGGGGGAGTCACCCGGGGACAGGCCATCACTGCCTTGTTCCTGGTTGGAA 71 CTCCTCTTTCTGCTGTACTATCGUGATGGTGAGTAGAGATCAGACAAACGATCGCAGCGATGACAAACC 141 TG ATGGATCACACCCAACAGATTGTTCCGTTCATACGGAGCCTTCTGATGCCAACGACCGGACCGGCGTC 211 CATTCCGGACGACACCCTGGAGAAGCACACACTCAGGTCCGAAACCTCGACTTACAACTTGACTGTAGGG 281 GATACAGGGTCAGGACTAATTGTCTTTTTCCCTGGATTCCCTGGTTCAGTTGTAGGTGCTCACTACACAC 351 TGCAGAGCAGTGGGAACTACCAATTCGACCAGATGCTCCTGACAGCGCAGAACCTGCCTGCCAGCTACAA 421 CTACTGCAGGCTAGTGAGCAGGAGTCTAACCGTACGGTCAAGCACACTCCCTGGTGGCGTTTATGCACTA 491 AACGGAACCATAAACGCAGTGACCTTCCACGGAAGCCTGAGTGAGTTGACTGACTACAGCTACAACGGGC 561 TGATGTCAGCCACTGCGAACATCAACGACAAGATCGGGAACGTTCTAGTTGGAGAAGGGGTGACTGTTCT 631 CA6TCTACCGACTTCATATGACCTTAGTTATGTGAGACTCGGTGACCCCATCCCCGCAGCAGGACTCGAC 701 CCGAAGTTGATGGCCACGTGCGACAGTAGTGACAGACCCAGAGTCTACACCATAACAGCTGCAGATGAAT 771 ACCAATTCTCGTCACAACTCATCCCGAGTGGCGTGAAGACCACACTGTTCTCCGCCAACATCGATGCTCT 841 CACCAGCTTCAGCGTTGGTGGTGAGCTTGTCTTCAGCCAAGTAACGATCCAAAGCATTGAAGTGGACGTC 911 ACCATTCACTTCATTGGGTTTGACGGGACAGACGTAGCAGTCAAGGCAGTTGCAACAGACTTTGGGCTGA 981 CAACTGGGACAAACAACCTTGTGCCATTCAACCTGGTGGTCCCAACAAATGAGATCACCCAGCCCATCAC
1051 TTCCATGAAACTAGAGGTTGTGACCTACAAGATTGGCGGCACCGCTGGTGACCCAATATCATGGACAGTG 1121 AGTGGTACACTAGCTGTGACGGTGCACGGAGGCAACTACCCTGGGGCTCTCCGTCCTGTCACCCTGGTGG 1191 CCTATGAACGAGTGGCTGCAGGATCTGTTGTCACAGTTGCAGGGGTGAGCAACTTCGAGCTAATCCCCAA 1261 CCCTGAGCTTGCAAAGAACCTAGTTACAGAGTATGGCCGCTTTGACCCCGGAGCAATGAACTACACCAAA 1331 CTAATACTGAGTGAGAGAGATCGTCTAGGCATCAAGACAGTCTGGCCCACCAGGGAGTACACCGATTTGA 1401 GGGAGTACTTCATGGAGGTTGCAGATCTCAACTCACCCCTAAAGATTGCAGGAGCATTTGGCTTTAAGGA 1471 CATAATCCGAGCCATTCGGAAGATTGCGGTGCCAGTGGTATCCACACTCTTCCCTCCAGCTGCACCCCTA 1541 GCACATGCAATCGGAGAAGGTGTAGACTACCTCCTGGGCGACGAGGCCCAAGCAGCCTCAGGGACAGCTC 1611 GAGCCGCGTCAGGAAAAGCTAGAGCTGCCTCAGGACGAATAAGGCAGCTAACTCTCGCAGCTGACAAGGG 1681 GTGCGAGGTAGTCGCCAACATGTTCCAGGTGCCCCAGAATCCCATTGTTGATGGCATTCTGGCATCCCCA (751 GGAATCCTGCGTGGCGCACACAACCTCGACTGCGTGCTATGGGAGGGAGCCACTCTTTTCCCTGTTGTCA
1821 TTACGACACTCGAGGATGAGCTGACCCCCAAGGCACTGAACAGCAAAATGTTTGCTGTCATTGAAGGTGT 1891 GCGAGAGGACCTCCAGCCTCCATCCCAACGGGGATCCTTCATTCGAACTCTCTCTGGCCATAGAGTCTAT I9GI GGCTATGCCCCAGACGGAGTACTGCCTCTGGAGACCGGGAGAGACTACACCGTTGTCCCAATTGATGATG 2031 TGTGGGACGATAGCATAATGCTGTCGCAGGACCCCATACCTCCAATCATAGGGAACAGCGGCAACCTAGC 2101 CATAGCATACATGGATGTCTTCAGGCCCAAGGTCCCCATCCACGTGGCTATGACAGGGGCCCTCAATGCC 2171 CGCGGTGAGATCGAGAGTGTTACGTTCCGVAGCACCAAACTCGCCACAGCCCACCGACTTGGCATGAAGT 2241 TAGCTGGTCCTGGAGCCTATGACATTAATACAGGACCTAACTGGGCAACGTTCGTCAAACGTTTCCCTCA 2311 CAATCCCCGAGACTGGGACAGGTTGCCCTACCTCAACCTTCCTTATCTCCCACCAACAGCAGGACGTCAG 2381 TTCCATCTAGCCCTGGCTGCCTCCGAGTTCAAAGAGACCCCAGAACTCGAAGACGCTGTGCGCGCAATGG 2451 ATGCCGCTGCAAATGCCGACCCATTGTTCCGCTCAGCTCTCCAGGTCTTCATGTGGTTGGAAGAAAACGG 2521 GATTGTGACCGACATGGCTAACTTCGCCCTCAGCGACCCAAACGCGCATAGGATGAAAAACTTCCTAGCA 2591 AACGCACCCCAGGCTGGAAGCAAGTCGCAGAGGGCCAAGTATGGCACGGCAGGCTACGGAGTGGAGGCTC 2661 GAGGCCCCACACCAGAAGAGGCACAGAGGGAAAAAGACACACGGATCTCCAAGAAGATGGAAACAATGGG 2731 CATCTACTTCGCGACACCGGAATGGGTGGCTCTCAACGGGCACCGAGGCCCAAGCCCCGGCCAACTCAAG 2801 TACTGGCAAAACACAAGAGAAATACCAGAGCCCAATGAGGACTACCCAGACTATGTGCACGCGGAGAAGA 2871 GCCGGTTGGCGTCAGAAGAACAGATCCTACGGGCAGCCACGTCGATCTACGGGGCTCCAGGACAGGCTGA 2941 ACCACCCCAGGCCTTCATAGACGAGGTCGCCAGGGTCTATGAAATCAACCATGGGCGTGGTCCAAACCAG 3011 GAGCAGATGAAGGACCTGCTCCTGACTGCGATGGAGATGAAGCATCGCAATCCCAGGCGGGCTCCACCAA 3081 AGCCAAAGCCAAAACCCAATGCTCCATCACAGAGACCCCCTGGACGGCTGGGCCGCTGGATCAGGACGGT 3151 CTCCGACGAGGACTTGGAGTGAGGCTCCTGGGAGTCTCCCGACACTACCCGCGCAGGTGTGGACACCAAT 3221 TCGG CCTTCTACCATCCCAAATTGGATCCGTTCGCGGGTCCCCT
Całkowita liczba baz ls: 3264 skład sekwencji DNA: 834 A; 942 C; 853 G; 635 T; nazwa sekwencji: 23-82A (numery ID sekwencji: 31 i 33)
Fig.4B
190 220
ΙΟ 20 30 40 50 GO 70
Fig.5A
I GGATACGATCGGTCTGACCCCGGGGGAGTCACCCGGGGACAGGCCGTCAAGGCCTTGTTCCAGGATGGGA 71 CTCCTCCTTCTACAACGCTATCATTGATGGTTAGTAGAGATCAGACAAACGATCGCAGCGATGACAAACC 141 TGCA AGATCAAACCCA ACAGATTGTTCCGTTCATACGGAGCCTTCTGATGCCA ACAACCGGACCGGCGTC 211 CATTCCGGACGACACCCTGGAGAAGCACACTCTCAGGTCAGAGACCTCGACCTACAATTTGACTGTGGGG 281 GACACAGGGTCAGGGCTAATTGTCTTTTTCCCTGGATTCCCTGGCTCAATTGTGG6TGCTCACTACACAC 351 TGCAGGGCAATGGGAACTACAAGTTCGATCAGATGCTCCTGACTGCCCAGAACCTACCGGCCAGTTACAA 421 CTACTGCAGGCTAGTGAGTCGGAGTCTCACAGTGAG6TCAAGCACACTTCCTGGTGGCGTTTATGCACTA 491 AACGGCACCATAAACGCCGTGACCTTCCAAGGAAGCCTGAGTGAACrGACAGATGTTAGCTACAATGGGT 561 TGATGTCTGCAACAGCCAACATCAACGACAAAATTGGGAACCTCCTAGTAGGGGAAGGGGTCACCGTCCT 631 CAGCTTACCCACATCATATGATCTTGGG7ATGTGAGGCTTGGTGACCCCATTCCCGCAATAGGGCTTGAC 701 CCAAAAATGGTAGCCACATGTGACAGCAGTGACAGGCCCAGAGTCTACACCATAACTGCAGCCGAT6ATT 771 ACCAATTCTCATCACAGTACCAACCAGGTGGGGTAACAATCACACTGTTCTCAGCCAACATTGATGCCAT 841 CACAAGCCTCAGCGTTG5GGGAGAGCTCGTGTTTCAAACAAGCGTCCACGGCCTTGTACTGGGCGCCACC 911 ATCTACCTCATAGGCTTTGATGGGACAACGGTAATCACCAGGGCTGTGGCCGCAAACAATGGGCTGACGA 981 CCGGCACCGACAACCTTATGCCATTCAATCTTGTGATTCCAACAAACGAGATAACCCAGCCAATCACATC 1051 CATCAAACTGGAGATAGTGACCTCCAAAAGTGGTGGTCAGGCAGGGGATCAGATGTCATGGTCGGCAAGA H2I GGGAGCCTAGCAGTGACGATCCATGGTGGCAACTATCCAGGGGCCCTCCGTCCCGTCACGCTAGTGGCCT 1191 ACGAAAGAGTGGCAACAGGATCCGTCG fTACGGTCGCTGGGGTGAGCAACTTCGAGCTGATCCCAAATCC 1261 TGAACTAGCAAAGAACCTGGTTACAGAATACGGCCGATTTGACCCAGGAGCCATGAACTACACAAAATTG 1331 ATACTGAGTGAGAGGGACCGTCTTGGCATCAAGACCGTCTGGCCAACAAGGGAGTACACTGACTTTCGTG 1401 AATACTTCATGGA6GTGGCCGACCTCAACTCTCCCCTGAAGATTGCAGGAGCATTCGGCTTCAAAGACAT 1471 AATCCGGGCCATAAGGAGGATAGCTGTGCCGGTGGTCTCCACATTGTTCCCACCTGCCGCTCCCCTAGCC 1541 CATGCAATTGGGGAAGGTGTAGACTACCTGCTGGGCGATGAGGCACAGGCTGCTTCAGGAACTGCTCGAG 1611 CCGCGTCAGGAAAAGCAAGAGCTGCCTCA66CC6CATAAGGCAGCTGACTCTCGCCGCCGACAAGGGGTA 1681 CGAGGTAGTCGCGAATCTATTCCAGGTGCCCCAG AATCCCGTAGTCGACGGGATTCTTGCTTCACCTGGG 1751 GTACTCCGCGGTGCACACAACCTCGACTGCGTGTTAAGAGAGGGTGCCACGCTATTCCCTGTGGTTATTA
1821 CGACAGTGGAAGACGCCATGACAC CCAAAGCATTGAACAGCAA AATGTTTGCTGTCATTGAAGGCGTGCG 1891 AGAAGACCTCCAACCTCCATCTCAAAGAGGATCCTTCATACGAACTCTCTCTGGACACAGAGTCTATGGA 1961 TATGCTCCAGATGGGGTACTTCCACTGGAGACTGGGAGAGACTACACCGTTGTCCCAATAGATGATGTCT 2031 GGGACGACAGCATTATGCTGTCCAAAGATCCCATACCTCCTATTGTGGGAAACAGTGGAAATCTAGCCAT 2101 AGCTTACATGGATGTGTTTCGACCCAAAGTCCCAATCC ATGTGGCTATGACGGGAGCCCTCAATGCTTGT 2171 6GCGAGATTGAGAAAGTAAGCTTTAGAAGCACCAAGCTCGCCACTGCACACCGACTTGGCCTTAGGTTGG 2241 CTGGTCCCGGAGCATTCGATGTAAACACCGGGCCCAACTGGGCAACGTTCATCAAACGTTTCCCTCACAA 2311 TCCACGCCACTGGGACAGGCTCCCCTACCTCAACCTACCATACCTTCCACCCAATGCAGGACGCCAGTAC 2381 CACCTTGCCAT6GCTGCATCAGAGTTCAAAGAGACCCCCGAACTCGAGAGTGCCGTCAGAGCAATGGAAG 2451 CAGCAGCCAACGTGGACCCACTATTCCAATCT6CACTCAGTGTGTTCATGTGGCTGGAAGAGAATGGGAT 2521 TGTGACTGACATGGCCAACTTCGCACTCAGCGACCCGAACGCCCATCGGATGCGAAATTTTCTTGCAAAC 2591 GCACCACAAGCAGGCAGCAAGTCG CAAAGGGCCAAGTACGGGACAGCAGGCTACGGAGTGGAGGCTCGGG 2661 GCCCCACACCAGAGGAAGCACAGA GGGAAAAAGACACACGGATCTCAAAGAAGATGGAGACCATGGGCAT 2731 CTACTTTGCAACACCAGAATGGGTAGCACTCAATGGGCACCGAGGGCCAAGCCCCGGCCAGCTAAAGTAC 2801 TGGCAGAACACACGAGAAATACCGGACCCAAACGAGGACTATCTAGACTACGTGCATGCAGAGAAGAGCC 2871 GGTTGGCATCAGAAGAACAAATCCTAAGGGCAGCTACGTCGATCTACGGGGCTCCAGGACAGGCAGAGCC 2941 ACCCCAAGCTTTCATAGACGAAGTTGCCAAAGTCTATGAAATCAACCATGGACGTGGCCCAAACCAAGAA 3011 CAGATGAAAGATCTGCTCTTGACTGCGATGGAGATGAAGCATCGCAATCCCAGGCGGGCTCTACCAAAGC 3081 CCAAGCCAAAACCCAATGCTCCAACACAGAGACCCCCTGGTCGGCTGGGCCGCTGGATCAGGACCGTCTC 3151 TGATGAGGACCTTGAGTGAGGCTCCTGGGAGTCTCCCGACACCACCCGCGCAGGTGTGGACACCAATTCG 3221 GCCTTACAACATCCCAAATTGGATCCGTTCGCGGGTCCCCT
Całkowita liczb baz ls: 3261 skład sekwencji DNA: 873 A; 909 C; 847 G; 632 T; O inne; nazwa sekwencji: D78F (numery ID sekwencji: 27 i 29)
Flg.5B
190 220
ΙΟ 20 30 40 50 60 70
Fig.6A
I GGATACGAT6GGTCT6ACCCTCTGGGAGTCAC6AATTAAC6TGGCTACTAG6GGCGATACCCGCCGCTGG 71 CCGCCACGTTAGTGGCTCCTCTTCTTGATGATTCTGCCACCATGAGTGACATTTTCAACAGTCCACAGGC 141 GCGAAGCACGATCTCAGCAGCGTTC6GCATAAAGCCTACTGCTGGACAAGACGTGGAAGAACTCTTGATC 211 CCTAAAGTTTGGGTGCCACCTGAGGATCCGCTTGCCAGCCCTAGTCGACTGGCAAAGTTCCTCAGAGAGA 281 ACGGCTACAAAGTTTTGCAGCCACGGTCTCTGCCCGAGAATGAGGAGTATGAGACCGACCAAATACTCCC 351 AGACTTAGCATGGATGCGACAGATAGAAGGGGCTGTTTTAAAACCCACTCTATCTCTCCCTATTGGAGAT 421 CAGGAGTACTTCCCAAAGTACTACCCAACACATCGCCCTAGCAAGGAGAAGCCCAATGCGTACCCGCCAG 491 ACATCGCACTACTCAAGCAGATGATTTACCTGTTTCTCCAGGTTCCAGAGGCCAACGAGGGCCTAAAGGA 5GI TGAAGTAACCCTCTTGACCCAAAACATAAGGGACAAGGCCTATGGAAGTGGGACCTACATGGGACAAGCA 631 AATCGACTTGTGGCCATGAAGGAGGTCGCCACTGGAAGAAACCCAAACAAGGATCCTCTAAAGCTTGGGT 701 ACACTTTTGAGAGCATCGCGCAGCTACTTGACATCACACTACCGGTAGGCCCACCCGGTGAGGATGACAA 771 GCCCTGGG TGCCACTCACAAGAGTGCCGTCACGGATGTTGGTGCTGACGGGAGACGTAGATGGCGACTTT 841 G AGGTTG A AGATTACCTTCCCAA A ATCAACCTCAAGTCATCAAGTGGACTACCAT ATGTAGGTCGCACCA 911 AAGG AGAGACAATTGGCGAGATGATAGCTATCTCAAACCAGTTTCTCAGAGAGCTATCAACACTGTTGAA 981 GCAAGGTG CAGGGACAAAGGGGTCAAAC A AGAAG A AGCTACTCAGCATGTTAAGTGACTATTGGTACTTA 1051 TCATGCGGGCTTTTGTTTCCAAAGGCTGAAAGGTACGACAAAAGTACATGGCTCACCAAGACCCGGAACA 1121 TATG6TCAGCTCCATCCCCAACACACCTCATGATCTCTATGATCACCTGGCCCGTGATGTCCAACAGCCC 1191 AAATAACGTGrTGAACATTGAAGGGTGTCCATCACTCTACAAANCAACCCGTTCAGAGGAGGGTTGAAC 1261 AGG A TCGTCGAGTGGATATTGGCCCCGGAAGA ACCCAAGGCTCTTGTAT ATGCGG ACAACATATACATTG 1331 TCCACTCAAACACGTGGTACTCAATTGACCTAGAGAAGGGTGAGGCAAACTGCACTCGCCAACACATGCA 1401 AGCCGCAATGTACTACATACTCACCAGAGGGTGGTCAGACAACGGCGACCCAATGTTCAATCAAACATGG 1471 GCCACCTTTGCCATGAACATTGCCCCTGCTCTAGTGGTGGACTCATCGTGCCTGATAATGAACCTGCAAA 1541 TTAAGACCTATGGTCAAGGCAGCGGGAATGCAGCCACGTTCATCAACAACCACCTCTTGAGCACACTAGT IGI I GCTTGACCAGTGGAACCTGATGAGACAGCCCAGACCAGACAGCGAGGAGTTCAAATCAATTGAGGACAAG 1681 CTAGGTATCAACTTTAAGATTGAGAGGTCCATTGATGATATCAGGGGCAAGCTGAGACAGCTTGTCCTCC 1751 TTGCACAACCAGGGTACCTGAGTGGGGGGGTTGAACCAGAACAATCCAGCCCAACTGTTGAGCTTGACCT
1821 ACTAGGGTGGTCAGCTACATACAGCAAAGATCTCGGGATCTATGTGCCGGTGCTTGACAAGGAACGCCTA 1891 TTTTGTTCTGCTGCGTATCCCAAGGGAGTAGAGAACAAGAGTCTCAAGTCCAAAGTCGGGATCGAGCAGG 1961 CATACAAGGTAGTCAGGTATGAGGCGTTGAGGTTGGTAGGTGGTTGGAACTACCCACTCCTGAACAAAGC 2031 CTGCAAGAATAACGCAGGCGCCGCTCGGCGGCATCT6GAGGCCAAGGGGTTCCCACTCGACGAGTTCCTA 2101 GCCGAGTGGTCTGAGCTGTCAGAGTTCGGTGAGGCCTTCGAAGGCTTCAATATCAAGCTGACCGTAACAT 2171 CTGAGAGCCTAGCCGAACTGAACAAGCCAGTACCCCCCAAGCCCCCAAATGTCAACAGACCAGTCAACAC 2241 TGGGGGACTCAAGGCAGTCAGCAACGCCCTCAAGACCGGTCGGTACAGGAACGAAGCCGGACTGAGTGGT 2311 CTCGTCCTTCTAGCCACAGCAAGAAGCCGTCTGCAAGATGCAGTTAAGGCCAAGGCAGAAGCCGAGAAAC 2381 TCCACAAGTCCAAGCCAGACGACCCCGATGCAGACTGGTTCGAAAGATCAGAAACTCTGTCAGACCTTCT 2451 GGAGAAAGCCGACATCGCCAGCAAGGTCGCCCACTCAGCACTCGTGGAAACAAGCGACGCCCTTGAAGCA 2521 GTTCAGTCGACTTCCGTGTACACCCCCAAGTACCCAGAAGTCAAGAACCCACAGACCGCCTCCAACCCCG 2591 TTGTTGGGCTCCACCTGCCCGCCAAGAGAGCCACCGGTGTCCAGGCCGCTCTTCTCGGAGCAGGAACGAG 2661 CAGACCAATGGGGATGGAGGCCCCAACACGGTCCAAGAACGCCGTGAAAATGGCCAAACGGCGGCAACGC 2731 CAAAAGGAGAGCCGCTAACAGCCATGATGGGAACCACTCAAGAAGAGGACACTAATCCCAGACCCCGTAT 2801 CCCCGGCCTTCGCCTGCGGGGGCCCCC
Całkowita liczba baz ls: 2827.
skład sekwencji DNA: 796 A; 770 C; 724 G; 537 T; o inne; nazwa sekwencji: P2B (numer ID sekwencji: 25)
Fig.6B
190 220
Fig ΙΔ
F i g. 1
F i g. 4
Fig. 5
Fig. 6
Fig. IB
Fig. IC
F ig. 4Δ
Fig.4B
Fig. 5A
Fig. 5B
Fig. 6A
Fig.68
Departament Wydawnictw UP RP Nakład 50 egz Cena 6,00 zł
Claims (9)
- Zastrzeżenia patentowe1. Sposób otrzymywania żywego Bimawirusa, w którym Bimawirusem jest wirus zakaźnej choroby kaletkowej (IBDV), znamienny tym, ze obejmuje następujące etapy:- otrzymanie cDNA segmentu A i segmentu B genomu Birnawirusa,- przetworzenie wymienionego cDNA w celu wyprodukowania syntetycznych transkryptów RNA, gdzie wspomniane transkrypty RNA są dodatnio polarnymi transkryptami RNA wspomnianych segmentów A i B,- dokonanie transfekcji komórek żywicielskich wspomnianymi syntetycznymi transkryptami RNA,- inkubację wspomnianych komórek żywicielskich w pożywce kulturowej oraz- wyizolowanie żywego, zakaźnego Birnawirusa ze wspomnianej pożywki kulturowej.
- 2. Sposób według zastrz. 1, znamienny tym, ze wymienionymi komórkami żywiciela są komórki afrykańskiej małpy zielonej Vero.
- 3. Sposób wdług zastrz. 1, znamienny tym, że wymienionymi komórkami żywiciela są komórki drobiowe, korzystnie komórki fibroblastu embrionu kurczaka lub komórki nerkowe embrionu kurczaka.
- 4. Sposób według zastrz. 1, znamienny tym, że wymienione segmenty A iB genomu Birnawirusa są otrzymywane niezależnie z różnych szczepów Birnawirusa.
- 5. Sposób według zastrz. 4, znamienny tym, że wymieniony segment A jest obecny w plazmidzie pUC19FLAD78 lub pUC18FLA23.
- 6. Sposób według zastrz. 4, znamienny tym, że wymieniony segment B jest obecny w plazmidzie pUC18FLBP2.
- 7. Żywy, chimeryczny wirus zakaźnej choroby kaletkowej (IBDV), gdzie wymieniony wirus jest wytworzony sposobem, obejmującym etapy- otrzymywania cDNA wirus zakaźnej choroby kaletkowej (IBDV) segmentów A i B,- kopiowania wymienionego cDNA w celu wytworzenia syntetycznych transkryptów RNA wymienionych segmentów A i B,- transfekcję komórki żywiciela wymienionymi transkryptami syntetycznego RNA,- inkubacji wymienionych komórek żywiciela w pożywce, oraz- wyizolowania żywego, chimerycznego wirus zakaźnej choroby kaletkowej (IBDV) z wymienionej pożywki.
- 8. Plazmid wybrany z grupy obejmującej pUC19FLAD78, pUC18FLA23 i pUC19FLBP2.
- 9. Szczepionka, zawierająca żywy, chimeryczny wirus zakaźnej choroby kaletkowej (IBDV), znamienna tym, ze wspomniany wirus wytworzony jest sposobem, obejmującym etapy- otrzymywania cDNA wirus zakaźnej choroby kaletkowej (IBDV) segmentów A i B,- kopiowania wymienionego cDNA w celu wytworzenia syntetycznych transkryptów RNA wymienionych segmentów A i B,- transfekcję komórki żywiciela wymienionymi transkryptami syntetycznego RNA,- inkubacji wymienionych komórek żywiciela w pożywce, oraz- wyizolowania żywego, chimerycznego wirus zakaźnej choroby kaletkowej (IBDV) z wymienionej pożywki, w której wymieniony żywy chimeryczny Birnawirus jest przed podaniem pozbawiany aktywności lub osłabiany.190 220Wirus Zakaźnej Choroby Kaletkowej (IBDV), członek rodziny Birnaviridae, jest czynnikiem powodującym silną chorobę immunosupresyjną u młodych kurcząt (Kibenge, F.S.B., et al., J Gen Yirol,, 69, 1757-1775 (1988)). Zakaźna choroba kaletkowa (IBD) lub choroba Gumboro charakteryzuje się niszczeniem limfatycznych grudek chłonnych w kaletkach Fabrycjusza.W stadzie kurcząt w wieku 3-6 tygodni, charakteryzującym się całkowitym brakiem odporności, ta kliniczna choroba powoduje poważną immunosupresję i jest odpowiedzialna za straty spowodowane osłabieniem wzrostu, spadkiem skuteczności żywienia oraz śmiercią. Podatne kurczaki poniżej 3 tygodni nie wykazują zewnętrznych objawów choroby, ale posiadają wykrywalne zakażenie charakteryzujące się zmianami makroskopowymi kaletki.Wirus towarzyszący objawom choroby nazywany jest wirusem zakaźnej choroby kaletkowej (infectious bursal disease virus - IBDV). IBDV jest czynnikiem chorobotwórczymo poważnym znaczeniu ekonomicznym dla państwowego i światowego przemysłu drobiarskiego. Powoduje on poważny niedobór odpornościowy u młodych kurcząt poprzez zniszczenie w kaletce Fabrycjusza prekursorów komórek B (limfocytów B, przyp. AJ) produkujących przeciwciała. Immunosupresja powoduje zwiększenie podatności na inne choroby oraz staje na przeszkodzie skuteczności szczepienia przeciwko chorobie Newcastle'a, chorobie Marka oraz wirusom zakaźnego zapalenia oskrzeli.Istnieją dwa znane serotypy IBDV. Wirusy serotypu I są chorobotwórcze dla kurczaków, natomiast wirusy serotypu II zakażają kurczaki i indyki. Znaczenie kliniczne zakażenia indyków jest obecnie nieznane.IBDV należy do grupy wirusów zwanej Birnaviridae, która zawiera także inne dwusegmentowe wirusy RNA, takie jak wirus zakaźnej martwicy trzustki (ryby), tellina virus i oyster virus (mięczaki dwuskorupowe) oraz drosophila X virus (muszka owocowa). Wszystkie te wirusy zawierają dwuniciowe genomy RNA o wysokim ciężarze cząsteczkowym (MW).Kapsyd wirionu IBDV składa się z kilku białek strukturalnych. Opisanych zostało dziewięć białek strukturalnych, ale istnieją dowody, ze niektóre z nich mogą wykazywać związki substrat-produkt (Kibenge, F.S.B., et al., JGen Yirol,, 69, 1757-1775 (1988)). Poniżej przedstawiono oznaczenia oraz ciężar cząsteczkowy białek wirusowych (viral protein-VP).
Białko wirusowe Ciężar cząsteczkowy VP1 90 kDa VP2 41 kDa VP3 32 kDa VP4 28 kDa VP5 17 kDa Dwa segmenty dwuniciowego RNA zostały zidentyfikowane w genomie IBDV. Genom IBDV składa się z dwóch segmentów dwuniciowego (ds)RNA, których długość waha się od 2827 (segment B) do 3261 (segment A) par zasad (Mundt, E. et al., Virology, 209, 10-18 (1995)). Większy segment A koduje poliproteinę, która jest rozszczepiana przez autoproteolizę, co prowadzi do uformowania dojrzałych białek wirusowych VP2, VP3 i VP4 (Hudson, P.J. et al., Nucleic Acids Res, 14, 5001-5012 (1986)). VP2 i VP3 są głównymi białkami strukturalnymi wirionu. VP2 jest głównym immunogenem chroniącym żywiciela IBDV i zawiera odcinki antygenowe odpowiedzialne za indukcję przeciwciał neutralizujących wirus (Azad, et al., Virology, 161,145-152 (1987)).Druga otwarta ramka odczytu (ORF), poprzedzająca i częściowo zachodząca na gen poliproteinowy, koduje białko (VP5) o nieznanej funkcji, które jest obecne w komórkach zainfekowanych wirusem IBDV (Mundt, E, et al., J Gen Yirol, 76, 437-443, (1995)). Mniejszy segment B koduje VP1, wielofunkcyjne białko o ciężarze cząsteczkowym 90 kDa, wykazujące aktywność polimerazy i enzymu syntezy czapeczki (mRNA 5'-CAP, przyp. AJ) (Spies, U., et al., Virus Res, 8, 127-140 (1987), Spies, U., et al., J Gen Yirol, 71, 977-981 (1990)).190 220Wykazano, że białko VP2 jest głównym immunogenem chroniącym żywiciela IBDV oraz, ze zawiera on obszar antygenowy odpowiedzialny za wywołanie przeciwciał neutralizujących wirus. Obszar zawierający część neutralizującą okazał się bardzo zalezny od struktury przestrzennej. Białko VP3 jest uważane za antygen grupowo-specyficzny, ponieważ jest on rozpoznawalny przez przeciwciała monoklonalne skierowane przeciw niemu ze szczepów obydwóch serotypów wirusa-1 i II. Białko VP4 okazuje się być proteazą wirusowo-kodowaną, która jest zaangażowana w przetwarzanie prekursorów poliprotein białek VP2, VP3 i VP4.Mimo iz sekwencje nukleotydowe dla segmentów A i B genomu różnych szczepów IBDV zostały opublikowane, to dopiero niedawno określone zostały kompletne sekwencje niekodujące 5' i 3' obydwu segmentów. Odcinek niekodujący 5' segmentów A i B IBDV zawiera zgodną sekwencję 32 nukleotydów, podczas gdy 3'-końcowe sekwencje niekodujące obydwu segmentów są nie powiązane, ale zachowane pomiędzy szczepami IBDv tego samego serotypu (Mundt, E et al, Yirology, 209, 10-18 (1995)). Odcinki te mogą zawierać sekwencje istotne w upakowaniu oraz w regulacji ekspresji genów IBDV, jak to zostało zademonstrowane dla innych wirusów zawierających dsRNA takich jak reowirusy ssaków i roślin oraz rotawirusy (Anzola, et al., Proc Natl. Acad. Sci USA, 84, 8301-8305 (1987); Zou, S., et al., Virology, 186, 377-388 (1992); Gorziglia, M.I., et al., Proc Natl Acad Sci USA, 89, 5784-5788 (1992)).W ostatnich latach ze sklonowanego cDNA, wytworzono wiele zakaźnych zwierzęcych wirusów RNA przy użyciu transkryptów produkowanych przez polimerazę RNA zalezną od DNA (Boyer, J.C., et al., Virology, 198, 415-426 (Γ994)). Przykładem mogą być: wirus choroby Heinego-Mcdina (reovirus), wirus polio typu (+)RNA; wirus grypy - segmentowany wirus (-)RNA; wirus wścieklizny - niesegmentowany wirus (-)RNA; wszystkie one zostały otrzymane ze sklonowanego cDNA, z ich poszczególnych genomów (van der Werf, S., et al., Proc. Natl Acad Sci USA, 83, 2330-2334 (1986); Enami, M., et al., Proc. Natl Acad Sci USA, 87, 3802-3805 (1990); Schnell, M.J., et al., EMBOJ, 13, 4195-4205 (1994)).W przypadku reowirusa pokazano, ze transfekcja komórek kombinacją ssRNA, dsRNA i produktów translacji in vitro reowirusa, wygenerowała zakaźny reowirus po uzupełnieniu wirusem pomocniczym z innego serotypu (Roner, M.R., et al., Virology, 179, 845-852 (1990)). Mimo tego, po dzień dzisiejszy, nie ukazało się żadne doniesienie o odzyskaniu wirusa choroby zakaźnej o podzielonym na segmenty genomie dsRNA jedynie z syntetycznych łańcuchów RNA.Wynalazek ten dotyczy wirusa zakaźnej choroby kaletkowej (IBDV), który towarzyszy chorobie Gumoro u młodych kurcząt. W szczególności, wynalazek ten dotyczy systemu wytwarzania wirusa zakaźnej choroby kaletkowej (IBDV) przy wykorzystaniu syntetycznych transkryptów, wyprowadzonych ze sklonowanych cząsteczek cDNA. Obecny wynalazek ułatwi badania nad regulowaniem ekspresji genów wirusowych, patogenezą oraz zaprojektowaniem nowej generacji szczepionek czynnych, zawierających atenuowane drobnoustroje oraz szczepionek unieaktywnionych.Aby zastosować system odwrotnej genetyki dla IBDV, skonstruowano odpowiednio trzy niezalezne klony cDNA o pełnej długości, które zawierają odpowiednio segment A szczepu D78 serotypu I lub szczepu 23/82 serotypu II oraz segment B szczepu P2 serotypu I. Syntetyczne RNA segmentów A i B zostały wytworzone poprzez reakcję transkrypcji in vitro na zlinearyzowanych plazmidach przy użyciu polimerazy T7 RNA. Transkrypty tych segmentów, nie poddane lub poddane działaniu DN-azy lub RN-azy, zostały przebadane pod względem generowania wirusów zakaźnych poprzez transfekcję komórek Vero.Wykazano, że syntetyczne transkrypty wyprowadzone ze sklonowanego DNA, odpowiadającego całemu genomowi segmentowanego dsRNA wirusa zwierzęcego, mogą prowadzić do replikacji wirusa. Regeneracja wirusa zakaźnego po transfekcji komórek syntetycznymi cząsteczkami pozytywnego RNA, wyprowadzonymi ze sklonowanych cDNA wirusao genomie dsRNA (IBÓV), jest ostatnim krokiem w odwróconym systemie zakaźnym dla wirusów RNA. W wielu przeprowadzanych badaniach wytworzono zakaźne wirusy zwierzęce RNA ze sklonowanego cDNA (Boyer, J.C., et al., Virology, 198, 415-426 (1994)). Van der Werf et al. był pierwszym, który wygenerował wirus choroby Heinego-Medina (wirus polio) wirus typu (+)RNA, wykorzystując syntetyczny RNA produkowany przez polimerazę T7190 220RNA na sklonowanym, matrycowym cDNA (Van der Werf, S., et al., Proc. Natl Acad Sci USA, 83, 2330-2334 (1986)). Później Enami i współpracownicy otrzymali wirus grypy, segmentowany wirus (-)RNA (Enami, M., et al., Proc. Natl Acad Sci. USA, 87, 3802-3805 (1990)); oraz Schnell i inni wygenerowali wirus wścieklizny, niepodzielony (-)RNA wirus, ze sklonowanych cząsteczek cDNa (Schnell, M.J., et al., EMBO J, 13, 4195-4205 (1994)). Roner i inni stworzyli układ zakaźny dla segmentowanego dsRNA reowirusa poprzez transfekcję komórek kombinacją syntetycznego ssRNA, dsRNA, i produktów translacji in vitro reowirusa, uzupełnionych przez wirus pomocniczy innego serotypu (Roner, M.R., et al., Virology, 179, 845-852 (1990)). Powstały wirus był odróżniany od wirusa pomocniczego poprzez analizę na płytkach. W tym systemie konieczne było stosowanie wirusa pomocniczego. W przeciwieństwie do niego, opisywany obecnie system odwrotnej genetyki dla IBDV nie wymaga wirusa pomocniczego ani innych białek wirusowych. Transfekcja komórek cząsteczkami pozytywnego RNA obu segmentów była wystarczająca do wygenerowania wirusa zakaźnego (IBDV). Przeznaczenie odpowiednio jednego lub czterech dodatkowych nukleotydów, transkrybowanych na końcu 3' segmentu A, nie było określone. Niemniej jednak, nie przeszkadzało to w replikacji dsRNA wirusa. Podobne zjawisko dla wirusów typu (+)RNA zostało zaobserwowane przez różnych badaczy (Boyer, J.C., et al., Virology, 198, 415-426 (1994)).Dla udanego odzysku IBDV konieczna była transfekcja obydwu segmentów pozytywnego RNA do tej samej komórki. Poddane transfekcji RNA z obu segmentów musiafy ulec translacji przez komórkowy mechanizm translacyjny. Poliproteina segmentu A była przypuszczalnie przetwarzana w białka VP2, VP3 i VP4, które tworzą kapsyd wirusa. Powstałe w wyniku translacji białko VP1 segmentu B prawdopodobnie spełniało funkcje polimerazy RNA zależnej od RNA i transkrybowało nici ujemne z syntetycznych nici dodatnich obydwóch segmentów, a produkty reakcji formowały dsRNA. Dobos poinformował ostatnio, ze transkrypcja in vitro wirusa zakaźnej martwicy trzustki (infectious pancreatic necrosis virus IPNV), prototypowego wirusa rodziny Birnaviridae, przeprowadzana przez wirusową polimerazę RNA zależną od RNA, jest rozpoczynana przez białko VP1 i następnie przechodzi poprzez asymetryczny, semikonserwatywny mechanizm podziału nici prowadzący do syntezy tylko dodatnich nici podczas replikacji genomu wirusowego (Dobos, P., Virology, 208, 10-25 (1995)).Obecna metoda ukazuje, ze synteza ujemnych nici przebiega na niciach dodatnich. To, czy powstała stranskrybowana ujemna nić RNA służy jako matryca dla transkrypcji nici dodatnich lub nie, pozostaje przedmiotem dalszych badań.Aby udowodnić, ze zakaźny IBDV, zawarty w supematantach komórek poddanych transfekcji, naprawdę pochodził z syntetycznych transkryptów, wygenerowano sztuczną chimerę zawierającą segment A szczepu serotypu II oraz segment B szczepu serotypu I. Za pomocą analiz sekwencyjnych zweryfikowano tą kombinację genomów. Rezultat wskazuje także, ze opisane przez Mundta i Muller'a, sekwencje końcowe, są prawdopodobnie odpowiedzialne za replikację, sortowanie i upakowanie genomu wirusa (Mundt, E. Et al, Virology, 209, 10-18 (1995)). Obecność sekwencji końcowych specyficznych dla serotypu nie uniemożliwia prawidłowej replikacji segmentu A serotypu II poprzez działanie RNA-zależnej polimerazy RNA VP1 z segmentu B serotypu I.Możliwość tworzenia rekombinowanych wirusów będzie bardzo przydatna do analizy funkcji sekwencji końcowych specyficznych dla serotypów oraz serotypowo ogólnych.Otrzymywanie zakaźnego IBDV pokazuje, ze tylko nici RNA pozytywnego obydwu segmentów są wystarczające do zainicjowania replikacji dsRNA. Rezultaty te są zgodne z ogólnymi cechami replikacji reowirusów i rotawirusów, w których cząsteczki RNA pozytywnego służą jako matryce dla syntezy potomnych nici - negatywnych i wytwarzania dsRNA (Schonberg, M., et al., Proc. Natl Acad Sci. Patton, J.T., Yirus Res., 6, 217-233 (1986); Chen, D., et al., J Yirol, 68, 7030-7039 (1994)).Mimo tego, zaproponowane przez Spies'a i innych oraz Dobos'a semikonserwatywne mechanizmy podziału nici, nie mogą być wykluczone (Spies, U., et al, Yirus Res., 8, 127-140 (1987); Dobos, P., Virology, 208, ID-25 (1995)). Rozwinięcie systemu odwrotnej genetyki dla wirusa IBDV bardzo ułatwi przyszłe badania nad ekspresją genów, patogenezą oraz pomoże190 220 w projektowaniu nowej generacji szczepionek zawierających atenuowane drobnoustroje i unieaktywnianych szczepionek przeciw IBDV.Użyty w obecnym zastosowaniu termin „syntetyczny” odnoszący się do kwasów nukleidowych, wskazuje, że jest to kwas nukleidowy stworzony przez człowieka w przeciwieństwie do kwasu nukleidowego występującego naturalnie. Termin ten nie zawiera żadnych ograniczeń co do sposobu wytwarzania, który może być chemiczny lub biologiczny, w zakresie w jakim metoda wytwarzania zawiera interwencję człowieka.Termin „cDNA” oznacza każdy cDNA zawierający segmenty A i B oraz 5' i 3' niekodujące odcinki segmentów A i B.Termin „zakaźny” stosowany do wirusów oznacza, ze wirus posiada zdolność do reprodukcji. Wirus może być chorobotwórczy lub nie, ale pozostaje „zakaźny”.Obecny wynalazek dostarcza metodę wytwarzania wirusa zakaźnej choroby kaletkowej przy użyciu syntetycznych transkryptów RNA. Metoda ta może być zastosowana do badania regulacji ekspresji genów wirusowych, patogenezy, oraz do projektowania nowej generacji szczepionek żywych i unieczynnionych.Obecny wynalazek dostarcza zrekombinowany wektor wirusa zawierającego przynajmniej jedną kopię cDNA stosownie do obecnego wynalazku.Zrekombinowany wektor może także zawierać inne konieczne sekwencje, takie jak sekwencje kontrolujące ekspresję, markery, zamplifikowane geny, sekwencje sygnalizujące, promotory i tym podobne znane technice. Uzytecznymi dla tych celów wektorami są plazmidy oraz wirusy takie jak baculovirusy, wirusy opryszczkowe (HVT), wirusy ospy, wirus ospy ptaków i tym podobne.W niniejszym opisie występuje także komórka żywiciela stransformowana zrekombinowanym wektorem według wynalazku lub komórka żywiciela, poddana transfekcji z syntetycznym RNA według wynalazku. Komórka żywiciela może być komórką eukariotyczną lub prokariotyczną. Odpowiednimi przykładami są E coli, linie komórek owadów, takie jak Sf-9 i tym podobne, oraz korzystnie komórki fibroblastu embrionu kurczaka (CEF), komórki nerkowe embrionu kurczaka (CEK), komórki afrykańskiej zielonej małpy Vero, i tym podobne.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/708,541 US5871744A (en) | 1996-09-05 | 1996-09-05 | Method for generating birnavirus from synthetic RNA transcripts |
PCT/US1997/012955 WO1998009646A1 (en) | 1996-09-05 | 1997-07-31 | A method for generating birnavirus from synthetic rna transcripts |
Publications (2)
Publication Number | Publication Date |
---|---|
PL332184A1 PL332184A1 (en) | 1999-08-30 |
PL190220B1 true PL190220B1 (pl) | 2005-11-30 |
Family
ID=24846203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL97332184A PL190220B1 (pl) | 1996-09-05 | 1997-07-31 | Sposób otrzymywania żywego Birnawirusa, wirus wytworzony tym sposobem oraz szczepionka zawierająca wymieniony wirus |
Country Status (18)
Country | Link |
---|---|
US (1) | US5871744A (pl) |
EP (2) | EP0959901A4 (pl) |
JP (1) | JP4670025B2 (pl) |
KR (1) | KR100475427B1 (pl) |
CN (1) | CN1168500C (pl) |
AT (1) | ATE460178T1 (pl) |
AU (1) | AU741055B2 (pl) |
BR (1) | BR9712012B1 (pl) |
CA (1) | CA2264488C (pl) |
CZ (1) | CZ299417B6 (pl) |
DE (1) | DE69739805D1 (pl) |
ES (1) | ES2342325T3 (pl) |
HU (1) | HUP9904365A3 (pl) |
IL (2) | IL128804A0 (pl) |
NO (1) | NO991074L (pl) |
NZ (1) | NZ334667A (pl) |
PL (1) | PL190220B1 (pl) |
WO (1) | WO1998009646A1 (pl) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6596280B1 (en) * | 1997-07-31 | 2003-07-22 | University Of Maryland Biotechnology Institute | Method for generating birnavirus from synthetic RNA transcripts |
WO1999050419A2 (en) * | 1998-03-31 | 1999-10-07 | University Of Maryland Biotechnology Institute | A method for generating nonpathogenic, infectious pancreatic necrosis virus (ipnv) from synthetic rna transcripts |
WO2000012677A2 (en) * | 1998-09-01 | 2000-03-09 | The University Of Hong Kong | Generation of recombinant infectious bursal disease viruses by reverse genetics technology and the use of the recombinant viruses as attenuated vaccines |
HUP9802974A1 (hu) * | 1998-12-19 | 2000-09-28 | Mezőgazdasági Biotechnológiai Kutatóközpont | Fertőző bursitis elleni DNS-vakcina |
US6492148B1 (en) * | 1999-03-05 | 2002-12-10 | Akzo Nobel Nv | Genetically engineered cell culture adapted infectious bursal disease virus (IBDV) mutants |
US6468984B1 (en) | 1999-06-08 | 2002-10-22 | Innovo Biotechnologies Ltd. | DNA vaccine for protecting an avian against infectious bursal disease virus |
EP1069187A1 (en) * | 1999-07-14 | 2001-01-17 | Stichting Dienst Landbouwkundig Onderzoek | Mosaic Infectious Bursal Disease Virus vaccines |
US7431930B2 (en) * | 2002-03-01 | 2008-10-07 | Intervet International B.V. | Infectious bursal disease virus (IBDV) mutant expressing virus neutralising epitopes specific for classic-and variant IBDV strains |
ES2217967B1 (es) * | 2003-03-31 | 2006-01-01 | Consejo Sup. Investig. Cientificas | Procedimiento de produccion de particulas virales vacias (vlps) del virus inductor de la bursitis infecciosa (ibdv), composiciones necesarias para su puesta a punto y su uso en la elaboracion de vacunas frente al ibdv. |
ES2307346B1 (es) * | 2004-01-21 | 2009-11-13 | Consejo Sup. Investig. Cientificas | Capsidas vacias (vlps(-vp4)) del virus causante de la enfermedad de la bursitis infecciosa (ibdv), su procedimiento de obtencion y aplicaciones. |
ES2307345B1 (es) * | 2004-01-21 | 2009-11-13 | Consejo Sup. Investig. Cientificas | Capsidas vacias quimericas del virus causante de la enfermedad de la bursitis infecciosa (ibdv), su procedimiento de obtencion y aplicaciones. |
US7244432B2 (en) * | 2004-12-08 | 2007-07-17 | University Of Maryland Biotechnology Institute | Infectious bursal disease virus (IBDV) variant from Georgia |
ES2310062B1 (es) * | 2005-07-15 | 2009-11-13 | Bionostra, S.L. | Particulas pseudovirales vacias quimericas derivadas del virus causante de la enfermedad de la bursitis infecciosa (ibdv), procedimiento de obtencion y aplicaciones. |
KR100757541B1 (ko) * | 2005-11-08 | 2007-09-10 | 엘지전자 주식회사 | 플라즈마 디스플레이 장치 및 그의 화상 처리방법 |
WO2008068661A1 (en) * | 2006-12-01 | 2008-06-12 | Hepc Biotechnológiai Kutató És Fejleszto Kft. | Compositions and methods for the treatment of viral hepatitis |
CN101016547B (zh) * | 2007-01-25 | 2010-07-28 | 浙江大学 | 海洋双rna病毒mabv重组蛋白的制备方法与应用 |
EP2407534A1 (en) | 2010-07-14 | 2012-01-18 | Neo Virnatech, S.L. | Methods and reagents for obtaining transcriptionally active virus-like particles and recombinant virions |
CN109321583B (zh) * | 2018-09-29 | 2023-08-15 | 福建省农业科学院畜牧兽医研究所 | 一种构建番鸭呼肠孤病毒反向遗传系统的方法 |
AU2020329166A1 (en) | 2019-08-09 | 2022-03-03 | Nutcracker Therapeutics, Inc. | Microfluidic apparatus and methods of use thereof |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4530831A (en) * | 1982-11-02 | 1985-07-23 | Akzo N.V. | Infectious Bursal Disease vaccine |
CA1334941C (en) * | 1985-05-30 | 1995-03-28 | Ahmed Azad Azad | Cloning and expression of a host-protective immunogens of ibdv |
AU602875B2 (en) * | 1985-12-18 | 1990-11-01 | British Technology Group Limited | Newcastle disease virus gene clones |
US5192539A (en) * | 1988-07-21 | 1993-03-09 | Akzo N.V. | Infectious bursal disease virus production in continuous cell lines |
US5518724A (en) * | 1988-08-02 | 1996-05-21 | University Of Maryland | Infectious bursal disease virus |
NZ235474A (en) * | 1989-10-18 | 1992-12-23 | Univ Maryland | Virus capable of inducing infectious bursal disease; assay and vaccine |
JPH05501064A (ja) * | 1990-05-04 | 1993-03-04 | ユニバーシティ オブ メリーランド アット カレッジ パーク | Ibdvタンパク質に関連する特異的dna配列並びにベクター、宿主およびワクチン |
EP0597016A4 (en) * | 1991-07-26 | 1996-04-24 | Virogenetics Corp | Infectious bursal disease virus recombinant poxvirus vaccine. |
US5788970A (en) * | 1994-03-29 | 1998-08-04 | The University Of Maryland College Park | Chimeric infectious bursal disease virus CDNA clones, expression products and vaccines based thereon |
-
1996
- 1996-09-05 US US08/708,541 patent/US5871744A/en not_active Expired - Lifetime
-
1997
- 1997-07-31 JP JP51264398A patent/JP4670025B2/ja not_active Expired - Fee Related
- 1997-07-31 NZ NZ334667A patent/NZ334667A/xx not_active IP Right Cessation
- 1997-07-31 BR BRPI9712012-0A patent/BR9712012B1/pt not_active IP Right Cessation
- 1997-07-31 AT AT07012332T patent/ATE460178T1/de not_active IP Right Cessation
- 1997-07-31 EP EP19970936185 patent/EP0959901A4/en not_active Withdrawn
- 1997-07-31 AU AU38918/97A patent/AU741055B2/en not_active Ceased
- 1997-07-31 DE DE69739805T patent/DE69739805D1/de not_active Expired - Lifetime
- 1997-07-31 CN CNB971976880A patent/CN1168500C/zh not_active Expired - Fee Related
- 1997-07-31 CA CA002264488A patent/CA2264488C/en not_active Expired - Fee Related
- 1997-07-31 EP EP07012332A patent/EP1930026B1/en not_active Expired - Lifetime
- 1997-07-31 ES ES07012332T patent/ES2342325T3/es not_active Expired - Lifetime
- 1997-07-31 KR KR10-1999-7001899A patent/KR100475427B1/ko not_active IP Right Cessation
- 1997-07-31 CZ CZ0074299A patent/CZ299417B6/cs not_active IP Right Cessation
- 1997-07-31 PL PL97332184A patent/PL190220B1/pl not_active IP Right Cessation
- 1997-07-31 IL IL12880497A patent/IL128804A0/xx active IP Right Grant
- 1997-07-31 HU HU9904365A patent/HUP9904365A3/hu unknown
- 1997-07-31 WO PCT/US1997/012955 patent/WO1998009646A1/en not_active Application Discontinuation
-
1999
- 1999-03-03 IL IL128804A patent/IL128804A/en not_active IP Right Cessation
- 1999-03-04 NO NO19991074A patent/NO991074L/no not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
CN1168500C (zh) | 2004-09-29 |
IL128804A0 (en) | 2000-01-31 |
NO991074L (no) | 1999-04-29 |
NZ334667A (en) | 2000-09-29 |
IL128804A (en) | 2006-08-01 |
ATE460178T1 (de) | 2010-03-15 |
BR9712012B1 (pt) | 2009-08-11 |
HUP9904365A2 (hu) | 2000-04-28 |
JP4670025B2 (ja) | 2011-04-13 |
KR100475427B1 (ko) | 2005-03-10 |
CA2264488C (en) | 2009-04-07 |
JP2001501082A (ja) | 2001-01-30 |
WO1998009646A1 (en) | 1998-03-12 |
US5871744A (en) | 1999-02-16 |
CA2264488A1 (en) | 1998-03-12 |
EP0959901A4 (en) | 2002-11-04 |
DE69739805D1 (de) | 2010-04-22 |
CN1229358A (zh) | 1999-09-22 |
KR20010029487A (ko) | 2001-04-06 |
PL332184A1 (en) | 1999-08-30 |
NO991074D0 (no) | 1999-03-04 |
BR9712012A (pt) | 2000-01-18 |
EP1930026A1 (en) | 2008-06-11 |
CZ74299A3 (cs) | 1999-08-11 |
EP1930026B1 (en) | 2010-03-10 |
AU741055B2 (en) | 2001-11-22 |
AU3891897A (en) | 1998-03-26 |
HUP9904365A3 (en) | 2001-06-28 |
EP0959901A1 (en) | 1999-12-01 |
CZ299417B6 (cs) | 2008-07-16 |
ES2342325T3 (es) | 2010-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PL190220B1 (pl) | Sposób otrzymywania żywego Birnawirusa, wirus wytworzony tym sposobem oraz szczepionka zawierająca wymieniony wirus | |
JP4675447B2 (ja) | 遺伝的に操作された細胞培養適応感染性嚢胞疾患ウイルス(ibdv)突然変異体 | |
Fodor et al. | Induction of protective immunity in chickens immunised with plasmid DNA encoding infectious bursal disease virus antigens | |
US10821170B2 (en) | Duck Enteritis Virus and the uses thereof | |
US6231868B1 (en) | Method for generating nonpathogenic infections birnavirus from synthetic RNA transcripts | |
EP1069187A1 (en) | Mosaic Infectious Bursal Disease Virus vaccines | |
Wang et al. | Comparison of four infectious bursal disease viruses isolated from different bird species | |
US6596280B1 (en) | Method for generating birnavirus from synthetic RNA transcripts | |
Vakharia | Development of recombinant vaccines against infectious bursal disease | |
CA2351010C (en) | A broad spectrum infectious bursal disease virus vaccine | |
EP1170302B1 (en) | Infectious bursal disease virus vaccines | |
MXPA99002187A (en) | A method for generating birnavirus from synthetic rna transcripts | |
US20040001863A1 (en) | Immortal cell line derived from grouper Epinephelus coioides and its applications therein | |
JP3693075B2 (ja) | 組み換えウイルス、その作製法およびその利用 | |
Marshall | Experimental in ovo transmission of avian reoviruses and characterization of embryo-generated isolates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Decisions on the lapse of the protection rights |
Effective date: 20120731 |