RU2811752C2 - Материалы и методы, используемые для лечения респираторных заболеваний у собак - Google Patents
Материалы и методы, используемые для лечения респираторных заболеваний у собак Download PDFInfo
- Publication number
- RU2811752C2 RU2811752C2 RU2020100038A RU2020100038A RU2811752C2 RU 2811752 C2 RU2811752 C2 RU 2811752C2 RU 2020100038 A RU2020100038 A RU 2020100038A RU 2020100038 A RU2020100038 A RU 2020100038A RU 2811752 C2 RU2811752 C2 RU 2811752C2
- Authority
- RU
- Russia
- Prior art keywords
- virus
- seq
- canine
- present
- dogs
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 87
- 241000282472 Canis lupus familiaris Species 0.000 title description 242
- 208000023504 respiratory system disease Diseases 0.000 title description 20
- 238000011282 treatment Methods 0.000 title description 7
- 239000000463 material Substances 0.000 title description 6
- 241000282465 Canis Species 0.000 claims abstract description 267
- 241000712461 unidentified influenza virus Species 0.000 claims abstract description 194
- 101710154606 Hemagglutinin Proteins 0.000 claims abstract description 96
- 101710093908 Outer capsid protein VP4 Proteins 0.000 claims abstract description 96
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 claims abstract description 96
- 101710176177 Protein A56 Proteins 0.000 claims abstract description 96
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 85
- 241001465754 Metazoa Species 0.000 claims abstract description 79
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 70
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 70
- 239000002157 polynucleotide Substances 0.000 claims abstract description 70
- 239000000185 hemagglutinin Substances 0.000 claims abstract description 67
- 229960005486 vaccine Drugs 0.000 claims abstract description 33
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims abstract description 14
- 239000004473 Threonine Substances 0.000 claims abstract description 14
- 230000028993 immune response Effects 0.000 claims abstract description 13
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 claims abstract description 11
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims abstract description 10
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims abstract description 7
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 claims abstract description 7
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims abstract description 5
- 239000002773 nucleotide Substances 0.000 claims description 102
- 125000003729 nucleotide group Chemical group 0.000 claims description 102
- 230000001939 inductive effect Effects 0.000 claims description 4
- 239000013603 viral vector Substances 0.000 claims description 3
- 241000700605 Viruses Species 0.000 abstract description 217
- 239000003814 drug Substances 0.000 abstract description 16
- 230000000694 effects Effects 0.000 abstract description 6
- 239000000126 substance Substances 0.000 abstract description 2
- 230000006698 induction Effects 0.000 abstract 1
- 108090000623 proteins and genes Proteins 0.000 description 138
- 238000012360 testing method Methods 0.000 description 97
- 210000004027 cell Anatomy 0.000 description 79
- 239000000523 sample Substances 0.000 description 78
- 241000283073 Equus caballus Species 0.000 description 77
- 108090000765 processed proteins & peptides Proteins 0.000 description 70
- 210000001519 tissue Anatomy 0.000 description 70
- 239000013615 primer Substances 0.000 description 68
- 102000004196 processed proteins & peptides Human genes 0.000 description 62
- 235000001014 amino acid Nutrition 0.000 description 61
- 239000000203 mixture Substances 0.000 description 56
- 102000004169 proteins and genes Human genes 0.000 description 56
- 229940024606 amino acid Drugs 0.000 description 54
- 235000018102 proteins Nutrition 0.000 description 54
- 229920001184 polypeptide Polymers 0.000 description 52
- 150000001413 amino acids Chemical class 0.000 description 44
- 241000282326 Felis catus Species 0.000 description 42
- 210000004072 lung Anatomy 0.000 description 42
- 238000011081 inoculation Methods 0.000 description 40
- 230000003612 virological effect Effects 0.000 description 40
- 241000712431 Influenza A virus Species 0.000 description 38
- 210000002966 serum Anatomy 0.000 description 38
- 238000003757 reverse transcription PCR Methods 0.000 description 37
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 36
- 238000003753 real-time PCR Methods 0.000 description 34
- 201000010099 disease Diseases 0.000 description 32
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 32
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 29
- 108091034117 Oligonucleotide Proteins 0.000 description 29
- 150000007523 nucleic acids Chemical group 0.000 description 29
- 230000014509 gene expression Effects 0.000 description 28
- 239000012634 fragment Substances 0.000 description 26
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 25
- 230000002163 immunogen Effects 0.000 description 24
- 230000003321 amplification Effects 0.000 description 23
- 238000003199 nucleic acid amplification method Methods 0.000 description 23
- 102000039446 nucleic acids Human genes 0.000 description 23
- 108020004707 nucleic acids Proteins 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 22
- 208000015181 infectious disease Diseases 0.000 description 22
- 241000282414 Homo sapiens Species 0.000 description 21
- 239000002609 medium Substances 0.000 description 21
- 206010011224 Cough Diseases 0.000 description 20
- 230000035931 haemagglutination Effects 0.000 description 20
- 238000006467 substitution reaction Methods 0.000 description 20
- 239000000427 antigen Substances 0.000 description 19
- 108091007433 antigens Proteins 0.000 description 19
- 102000036639 antigens Human genes 0.000 description 19
- 206010022000 influenza Diseases 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 18
- 241000196324 Embryophyta Species 0.000 description 18
- 238000003752 polymerase chain reaction Methods 0.000 description 18
- 238000001514 detection method Methods 0.000 description 17
- 241000287828 Gallus gallus Species 0.000 description 16
- 230000001154 acute effect Effects 0.000 description 16
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 16
- 239000002987 primer (paints) Substances 0.000 description 16
- 239000013598 vector Substances 0.000 description 15
- 108091035707 Consensus sequence Proteins 0.000 description 14
- POJWUDADGALRAB-UHFFFAOYSA-N allantoin Chemical compound NC(=O)NC1NC(=O)NC1=O POJWUDADGALRAB-UHFFFAOYSA-N 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 14
- 238000010790 dilution Methods 0.000 description 14
- 239000012895 dilution Substances 0.000 description 14
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 14
- 108010050848 glycylleucine Proteins 0.000 description 14
- 208000037797 influenza A Diseases 0.000 description 14
- 238000002955 isolation Methods 0.000 description 14
- 238000012163 sequencing technique Methods 0.000 description 14
- 241000894007 species Species 0.000 description 14
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 13
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 13
- 206010035664 Pneumonia Diseases 0.000 description 13
- 108010067390 Viral Proteins Proteins 0.000 description 13
- 210000003743 erythrocyte Anatomy 0.000 description 13
- 239000006228 supernatant Substances 0.000 description 13
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 12
- 241000880493 Leptailurus serval Species 0.000 description 12
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 12
- 108010047495 alanylglycine Proteins 0.000 description 12
- 239000003242 anti bacterial agent Substances 0.000 description 12
- 229940088710 antibiotic agent Drugs 0.000 description 12
- 239000003795 chemical substances by application Substances 0.000 description 12
- 235000013601 eggs Nutrition 0.000 description 12
- 108010034529 leucyl-lysine Proteins 0.000 description 12
- 108010056582 methionylglutamic acid Proteins 0.000 description 12
- 108010051242 phenylalanylserine Proteins 0.000 description 12
- 230000002441 reversible effect Effects 0.000 description 12
- 108010061238 threonyl-glycine Proteins 0.000 description 12
- 230000009385 viral infection Effects 0.000 description 12
- 238000002965 ELISA Methods 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 229940098773 bovine serum albumin Drugs 0.000 description 11
- 238000005119 centrifugation Methods 0.000 description 11
- 239000003153 chemical reaction reagent Substances 0.000 description 11
- 229940079593 drug Drugs 0.000 description 11
- 210000002919 epithelial cell Anatomy 0.000 description 11
- 238000012809 post-inoculation Methods 0.000 description 11
- 230000000241 respiratory effect Effects 0.000 description 11
- 210000002345 respiratory system Anatomy 0.000 description 11
- 108020004463 18S ribosomal RNA Proteins 0.000 description 10
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 10
- 108010008355 arginyl-glutamine Proteins 0.000 description 10
- 230000001580 bacterial effect Effects 0.000 description 10
- 238000004113 cell culture Methods 0.000 description 10
- MYSWGUAQZAJSOK-UHFFFAOYSA-N ciprofloxacin Chemical compound C12=CC(N3CCNCC3)=C(F)C=C2C(=O)C(C(=O)O)=CN1C1CC1 MYSWGUAQZAJSOK-UHFFFAOYSA-N 0.000 description 10
- 108010037850 glycylvaline Proteins 0.000 description 10
- 230000005764 inhibitory process Effects 0.000 description 10
- 239000012071 phase Substances 0.000 description 10
- 238000011886 postmortem examination Methods 0.000 description 10
- 230000035945 sensitivity Effects 0.000 description 10
- 108010073969 valyllysine Proteins 0.000 description 10
- 241000271566 Aves Species 0.000 description 9
- 108020000999 Viral RNA Proteins 0.000 description 9
- 210000000621 bronchi Anatomy 0.000 description 9
- 108010064235 lysylglycine Proteins 0.000 description 9
- 238000013081 phylogenetic analysis Methods 0.000 description 9
- 241000283086 Equidae Species 0.000 description 8
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 8
- RGCKGOZRHPZPFP-UHFFFAOYSA-N alizarin Chemical compound C1=CC=C2C(=O)C3=C(O)C(O)=CC=C3C(=O)C2=C1 RGCKGOZRHPZPFP-UHFFFAOYSA-N 0.000 description 8
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 8
- 108010068380 arginylarginine Proteins 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 108010093581 aspartyl-proline Proteins 0.000 description 8
- 210000004369 blood Anatomy 0.000 description 8
- 239000008280 blood Substances 0.000 description 8
- 239000000975 dye Substances 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 108010078144 glutaminyl-glycine Proteins 0.000 description 8
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 230000012010 growth Effects 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 102000013415 peroxidase activity proteins Human genes 0.000 description 8
- 108040007629 peroxidase activity proteins Proteins 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 8
- 210000003437 trachea Anatomy 0.000 description 8
- POJWUDADGALRAB-PVQJCKRUSA-N Allantoin Natural products NC(=O)N[C@@H]1NC(=O)NC1=O POJWUDADGALRAB-PVQJCKRUSA-N 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 7
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 7
- 101150111468 H3 gene Proteins 0.000 description 7
- 241000282412 Homo Species 0.000 description 7
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 7
- 229960000458 allantoin Drugs 0.000 description 7
- 108010038633 aspartylglutamate Proteins 0.000 description 7
- 230000034994 death Effects 0.000 description 7
- 231100000517 death Toxicity 0.000 description 7
- 239000012530 fluid Substances 0.000 description 7
- 210000004907 gland Anatomy 0.000 description 7
- 230000003067 hemagglutinative effect Effects 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000010561 standard procedure Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 6
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 6
- 201000004813 Bronchopneumonia Diseases 0.000 description 6
- 241000282421 Canidae Species 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 6
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 6
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 6
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 6
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 6
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 6
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 6
- 241000282341 Mustela putorius furo Species 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- 108010047562 NGR peptide Proteins 0.000 description 6
- 101710102873 Polymerase basic protein 2 Proteins 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- 102100037516 Protein polybromo-1 Human genes 0.000 description 6
- 101710085035 RNA-directed RNA polymerase catalytic subunit Proteins 0.000 description 6
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 6
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 6
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 6
- 239000002671 adjuvant Substances 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 6
- 239000012298 atmosphere Substances 0.000 description 6
- 239000012472 biological sample Substances 0.000 description 6
- 238000004925 denaturation Methods 0.000 description 6
- 230000036425 denaturation Effects 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 6
- 108010077515 glycylproline Proteins 0.000 description 6
- 230000002008 hemorrhagic effect Effects 0.000 description 6
- 238000002991 immunohistochemical analysis Methods 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 108010009298 lysylglutamic acid Proteins 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 108010070643 prolylglutamic acid Proteins 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 206010039083 rhinitis Diseases 0.000 description 6
- 238000013207 serial dilution Methods 0.000 description 6
- 108010048818 seryl-histidine Proteins 0.000 description 6
- 241000272525 Anas platyrhynchos Species 0.000 description 5
- 241000588779 Bordetella bronchiseptica Species 0.000 description 5
- 229930182566 Gentamicin Natural products 0.000 description 5
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 5
- 208000002979 Influenza in Birds Diseases 0.000 description 5
- 108010006232 Neuraminidase Proteins 0.000 description 5
- 206010037660 Pyrexia Diseases 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 5
- 235000009582 asparagine Nutrition 0.000 description 5
- 229960001230 asparagine Drugs 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 230000037396 body weight Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 229960003405 ciprofloxacin Drugs 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 230000005574 cross-species transmission Effects 0.000 description 5
- 239000012228 culture supernatant Substances 0.000 description 5
- 210000000805 cytoplasm Anatomy 0.000 description 5
- 239000003085 diluting agent Substances 0.000 description 5
- 210000002257 embryonic structure Anatomy 0.000 description 5
- 210000000981 epithelium Anatomy 0.000 description 5
- 230000003628 erosive effect Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 229960002518 gentamicin Drugs 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 210000002540 macrophage Anatomy 0.000 description 5
- 230000001575 pathological effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000000405 serological effect Effects 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 4
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 4
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 4
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 4
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 4
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 4
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 4
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 4
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 4
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 4
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 4
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 4
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 4
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 4
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 4
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 4
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 4
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 4
- GURLOFOJBHRPJN-AAEUAGOBSA-N Asn-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GURLOFOJBHRPJN-AAEUAGOBSA-N 0.000 description 4
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 4
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 4
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 4
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 4
- 206010006448 Bronchiolitis Diseases 0.000 description 4
- 241000712083 Canine morbillivirus Species 0.000 description 4
- 241001353878 Canine parainfluenza virus Species 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 4
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 4
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 4
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 4
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 4
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 4
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 4
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 4
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 4
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 4
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 4
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 4
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 4
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 4
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 4
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 4
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 4
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 4
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 4
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 4
- 101150039660 HA gene Proteins 0.000 description 4
- 208000032843 Hemorrhage Diseases 0.000 description 4
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 4
- UNDGQKWQNSTPPW-CYDGBPFRSA-N Ile-Arg-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N UNDGQKWQNSTPPW-CYDGBPFRSA-N 0.000 description 4
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 4
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 4
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 4
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 4
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 4
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 4
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 4
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 4
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 4
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 4
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 4
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 4
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 4
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 4
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 4
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 4
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 4
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 4
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 4
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 4
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 4
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 4
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 4
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 4
- 241000204031 Mycoplasma Species 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- MQUQNUAYKLCRME-INIZCTEOSA-N N-tosyl-L-phenylalanyl chloromethyl ketone Chemical compound C1=CC(C)=CC=C1S(=O)(=O)N[C@H](C(=O)CCl)CC1=CC=CC=C1 MQUQNUAYKLCRME-INIZCTEOSA-N 0.000 description 4
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 4
- 206010028851 Necrosis Diseases 0.000 description 4
- 102000005348 Neuraminidase Human genes 0.000 description 4
- 108010061100 Nucleoproteins Proteins 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 4
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 4
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 4
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 4
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 4
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- 206010057190 Respiratory tract infections Diseases 0.000 description 4
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 4
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 4
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 4
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 4
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 4
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 4
- 241000282887 Suidae Species 0.000 description 4
- 241000282898 Sus scrofa Species 0.000 description 4
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 4
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 4
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 4
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 4
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 4
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 4
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 4
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 4
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 4
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 4
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 4
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 4
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 4
- 206010044302 Tracheitis Diseases 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 4
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 4
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 4
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 4
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 4
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 4
- 208000036142 Viral infection Diseases 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 230000000890 antigenic effect Effects 0.000 description 4
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 4
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 4
- 210000003123 bronchiole Anatomy 0.000 description 4
- 206010006451 bronchitis Diseases 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 230000000120 cytopathologic effect Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 4
- -1 for example Proteins 0.000 description 4
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 4
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 210000001985 kidney epithelial cell Anatomy 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 108010012058 leucyltyrosine Proteins 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 230000004660 morphological change Effects 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 230000017074 necrotic cell death Effects 0.000 description 4
- 210000000440 neutrophil Anatomy 0.000 description 4
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- OLBCVFGFOZPWHH-UHFFFAOYSA-N propofol Chemical compound CC(C)C1=CC=CC(C(C)C)=C1O OLBCVFGFOZPWHH-UHFFFAOYSA-N 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 230000005030 transcription termination Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 239000012588 trypsin Substances 0.000 description 4
- QWCKQJZIFLGMSD-UHFFFAOYSA-N 2-Aminobutanoic acid Natural products CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 description 3
- 108010085238 Actins Proteins 0.000 description 3
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 3
- 241000020089 Atacta Species 0.000 description 3
- 241001092081 Carpenteria Species 0.000 description 3
- 239000003155 DNA primer Substances 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 206010015548 Euthanasia Diseases 0.000 description 3
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 108060003393 Granulin Proteins 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 3
- 241001500351 Influenzavirus A Species 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- 241000282339 Mustela Species 0.000 description 3
- 102000011931 Nucleoproteins Human genes 0.000 description 3
- 241000702437 Parvovirus H3 Species 0.000 description 3
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 3
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- 108090000631 Trypsin Proteins 0.000 description 3
- 102000004142 Trypsin Human genes 0.000 description 3
- 108700005077 Viral Genes Proteins 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- PNEYBMLMFCGWSK-UHFFFAOYSA-N aluminium oxide Inorganic materials [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 206010064097 avian influenza Diseases 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000740 bleeding effect Effects 0.000 description 3
- 210000000424 bronchial epithelial cell Anatomy 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 210000000254 ciliated cell Anatomy 0.000 description 3
- 230000001351 cycling effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000009365 direct transmission Effects 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000005714 functional activity Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000002649 immunization Methods 0.000 description 3
- 230000003053 immunization Effects 0.000 description 3
- 239000002054 inoculum Substances 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000003928 nasal cavity Anatomy 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 239000012188 paraffin wax Substances 0.000 description 3
- 230000008506 pathogenesis Effects 0.000 description 3
- 244000144977 poultry Species 0.000 description 3
- 230000001681 protective effect Effects 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000002269 spontaneous effect Effects 0.000 description 3
- 239000006163 transport media Substances 0.000 description 3
- 244000052613 viral pathogen Species 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- RFLVMTUMFYRZCB-UHFFFAOYSA-N 1-methylguanine Chemical compound O=C1N(C)C(N)=NC2=C1N=CN2 RFLVMTUMFYRZCB-UHFFFAOYSA-N 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N 2,4-diaminobutyric acid Chemical compound NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 2
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 2
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 2
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 2
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 2
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 2
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 2
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 2
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 2
- VEAPAYQQLSEKEM-GUBZILKMSA-N Ala-Met-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VEAPAYQQLSEKEM-GUBZILKMSA-N 0.000 description 2
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 2
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 2
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- AETQNIIFKCMVHP-UVBJJODRSA-N Ala-Trp-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AETQNIIFKCMVHP-UVBJJODRSA-N 0.000 description 2
- SFPRJVVDZNLUTG-OWLDWWDNSA-N Ala-Trp-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFPRJVVDZNLUTG-OWLDWWDNSA-N 0.000 description 2
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 2
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 2
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- RWWPBOUMKFBHAL-FXQIFTODSA-N Arg-Asn-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O RWWPBOUMKFBHAL-FXQIFTODSA-N 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 2
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 2
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 2
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 2
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 2
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- IRRMIGDCPOPZJW-ULQDDVLXSA-N Arg-His-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IRRMIGDCPOPZJW-ULQDDVLXSA-N 0.000 description 2
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 2
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 2
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 2
- PSOPJDUQUVFSLS-GUBZILKMSA-N Arg-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PSOPJDUQUVFSLS-GUBZILKMSA-N 0.000 description 2
- ZEBDYGZVMMKZNB-SRVKXCTJSA-N Arg-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N ZEBDYGZVMMKZNB-SRVKXCTJSA-N 0.000 description 2
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 2
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 2
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 2
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 2
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 2
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 2
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 2
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 2
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 2
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 2
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 2
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 2
- JKRPBTQDPJSQIT-RCWTZXSCSA-N Arg-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O JKRPBTQDPJSQIT-RCWTZXSCSA-N 0.000 description 2
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 2
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 2
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 2
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 2
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 2
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 2
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 2
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 2
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 2
- DXZNJWFECGJCQR-FXQIFTODSA-N Asn-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N DXZNJWFECGJCQR-FXQIFTODSA-N 0.000 description 2
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 2
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 2
- YQNBILXAUIAUCF-CIUDSAMLSA-N Asn-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N YQNBILXAUIAUCF-CIUDSAMLSA-N 0.000 description 2
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 2
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 2
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 2
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 2
- QEQVUHQQYDZUEN-GUBZILKMSA-N Asn-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N QEQVUHQQYDZUEN-GUBZILKMSA-N 0.000 description 2
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 2
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 2
- VOGCFWDZYYTEOY-DCAQKATOSA-N Asn-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N VOGCFWDZYYTEOY-DCAQKATOSA-N 0.000 description 2
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 2
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 2
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 2
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 2
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 2
- UOUHBHOBGDCQPQ-IHPCNDPISA-N Asn-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)N)N UOUHBHOBGDCQPQ-IHPCNDPISA-N 0.000 description 2
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 2
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 2
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 2
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- XHTUGJCAEYOZOR-UBHSHLNASA-N Asn-Ser-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XHTUGJCAEYOZOR-UBHSHLNASA-N 0.000 description 2
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 2
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 2
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 2
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 2
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 2
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 2
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 2
- MLJZMGIXXMTEPO-UBHSHLNASA-N Asn-Trp-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O MLJZMGIXXMTEPO-UBHSHLNASA-N 0.000 description 2
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 2
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 2
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 2
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- WKGJGVGTEZGFSW-FXQIFTODSA-N Asp-Asn-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O WKGJGVGTEZGFSW-FXQIFTODSA-N 0.000 description 2
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 2
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 2
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 2
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 2
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 2
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 2
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 2
- ODNWIBOCFGMRTP-SRVKXCTJSA-N Asp-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CN=CN1 ODNWIBOCFGMRTP-SRVKXCTJSA-N 0.000 description 2
- LNENWJXDHCFVOF-DCAQKATOSA-N Asp-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LNENWJXDHCFVOF-DCAQKATOSA-N 0.000 description 2
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 2
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 2
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 2
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 2
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 2
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 2
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 2
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 2
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 2
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 2
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 2
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 2
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- GYNUXDMCDILYIQ-QRTARXTBSA-N Asp-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N GYNUXDMCDILYIQ-QRTARXTBSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- 241000588807 Bordetella Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 241000824799 Canis lupus dingo Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 2
- BYALSSDCQYHKMY-XGEHTFHBSA-N Cys-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O BYALSSDCQYHKMY-XGEHTFHBSA-N 0.000 description 2
- SBMGKDLRJLYZCU-BIIVOSGPSA-N Cys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N)C(=O)O SBMGKDLRJLYZCU-BIIVOSGPSA-N 0.000 description 2
- DVKQPQKQDHHFTE-ZLUOBGJFSA-N Cys-Cys-Asn Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)N DVKQPQKQDHHFTE-ZLUOBGJFSA-N 0.000 description 2
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 2
- DZIGZIIJIGGANI-FXQIFTODSA-N Cys-Glu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DZIGZIIJIGGANI-FXQIFTODSA-N 0.000 description 2
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 2
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 2
- ANPADMNVVOOYKW-DCAQKATOSA-N Cys-His-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ANPADMNVVOOYKW-DCAQKATOSA-N 0.000 description 2
- VTJLJQGUMBWHBP-GUBZILKMSA-N Cys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N VTJLJQGUMBWHBP-GUBZILKMSA-N 0.000 description 2
- WAJDEKCJRKGRPG-CIUDSAMLSA-N Cys-His-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N WAJDEKCJRKGRPG-CIUDSAMLSA-N 0.000 description 2
- UVZFZTWNHOQWNK-NAKRPEOUSA-N Cys-Ile-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UVZFZTWNHOQWNK-NAKRPEOUSA-N 0.000 description 2
- OTXLNICGSXPGQF-KBIXCLLPSA-N Cys-Ile-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTXLNICGSXPGQF-KBIXCLLPSA-N 0.000 description 2
- KCSDYJSCUWLILX-BJDJZHNGSA-N Cys-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N KCSDYJSCUWLILX-BJDJZHNGSA-N 0.000 description 2
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 2
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 2
- MKMKILWCRQLDFJ-DCAQKATOSA-N Cys-Lys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MKMKILWCRQLDFJ-DCAQKATOSA-N 0.000 description 2
- YXPNKXFOBHRUBL-BJDJZHNGSA-N Cys-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N YXPNKXFOBHRUBL-BJDJZHNGSA-N 0.000 description 2
- WTEACWBAULENKE-SRVKXCTJSA-N Cys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N WTEACWBAULENKE-SRVKXCTJSA-N 0.000 description 2
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 2
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 2
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 2
- CLEFUAZULXANBU-MELADBBJSA-N Cys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N)C(=O)O CLEFUAZULXANBU-MELADBBJSA-N 0.000 description 2
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 2
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 2
- WVWRADGCZPIJJR-IHRRRGAJSA-N Cys-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N WVWRADGCZPIJJR-IHRRRGAJSA-N 0.000 description 2
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 2
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 2
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 2
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 2
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 2
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 2
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 2
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 2
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 2
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 2
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 2
- GXMBDEGTXHQBAO-NKIYYHGXSA-N Gln-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N)O GXMBDEGTXHQBAO-NKIYYHGXSA-N 0.000 description 2
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 2
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 2
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 2
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 2
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 2
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 2
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 2
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 2
- XGKNQFOKIBKFTR-CIUDSAMLSA-N Gln-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCC(N)=O XGKNQFOKIBKFTR-CIUDSAMLSA-N 0.000 description 2
- NMYFPKCIGUJMIK-GUBZILKMSA-N Gln-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NMYFPKCIGUJMIK-GUBZILKMSA-N 0.000 description 2
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 2
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 2
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 2
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 2
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 2
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 2
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 2
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 2
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 2
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 2
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 2
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 2
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 2
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 2
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 2
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 2
- XKPOCESCRTVRPL-KBIXCLLPSA-N Glu-Cys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XKPOCESCRTVRPL-KBIXCLLPSA-N 0.000 description 2
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 2
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 2
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 2
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 2
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 2
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 2
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 2
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 2
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 2
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 2
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 2
- NPMSEUWUMOSEFM-CIUDSAMLSA-N Glu-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N NPMSEUWUMOSEFM-CIUDSAMLSA-N 0.000 description 2
- LGWUJBCIFGVBSJ-CIUDSAMLSA-N Glu-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LGWUJBCIFGVBSJ-CIUDSAMLSA-N 0.000 description 2
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 2
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 2
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 2
- UERORLSAFUHDGU-AVGNSLFASA-N Glu-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UERORLSAFUHDGU-AVGNSLFASA-N 0.000 description 2
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 2
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 2
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 2
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 2
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 2
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- ZGXGVBYEJGVJMV-HJGDQZAQSA-N Glu-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O ZGXGVBYEJGVJMV-HJGDQZAQSA-N 0.000 description 2
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 2
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 2
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 2
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 2
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 2
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 2
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 2
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 2
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 2
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 2
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 2
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 2
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 2
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 2
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 2
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 2
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 2
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 2
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 2
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 206010069767 H1N1 influenza Diseases 0.000 description 2
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 2
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 2
- CJGDTAHEMXLRMB-ULQDDVLXSA-N His-Arg-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CJGDTAHEMXLRMB-ULQDDVLXSA-N 0.000 description 2
- QQJMARNOLHSJCQ-DCAQKATOSA-N His-Cys-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N QQJMARNOLHSJCQ-DCAQKATOSA-N 0.000 description 2
- LDTJBEOANMQRJE-CIUDSAMLSA-N His-Cys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LDTJBEOANMQRJE-CIUDSAMLSA-N 0.000 description 2
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 2
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 2
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 2
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 2
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 2
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 2
- MVZASEMJYJPJSI-IHPCNDPISA-N His-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC3=CN=CN3)N MVZASEMJYJPJSI-IHPCNDPISA-N 0.000 description 2
- KQJBFMJFUXAYPK-AVGNSLFASA-N His-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KQJBFMJFUXAYPK-AVGNSLFASA-N 0.000 description 2
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 2
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 2
- WYKXJGWSJUULSL-AVGNSLFASA-N His-Val-Arg Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O WYKXJGWSJUULSL-AVGNSLFASA-N 0.000 description 2
- 241000701109 Human adenovirus 2 Species 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 2
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 2
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 2
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 2
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 2
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 2
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 2
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 2
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 2
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 2
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 2
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 2
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 2
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 2
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 2
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 2
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 2
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 2
- VNDQNDYEPSXHLU-JUKXBJQTSA-N Ile-His-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N VNDQNDYEPSXHLU-JUKXBJQTSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 2
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 2
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 2
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- RFMDODRWJZHZCR-BJDJZHNGSA-N Ile-Lys-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(O)=O RFMDODRWJZHZCR-BJDJZHNGSA-N 0.000 description 2
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 2
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 2
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 2
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 2
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 2
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 2
- WJBOZUVRPOIQNN-KJYZGMDISA-N Ile-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)C1=CN=CN1 WJBOZUVRPOIQNN-KJYZGMDISA-N 0.000 description 2
- OAQJOXZPGHTJNA-NGTWOADLSA-N Ile-Trp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N OAQJOXZPGHTJNA-NGTWOADLSA-N 0.000 description 2
- JERJIYYCOGBAIJ-OBAATPRFSA-N Ile-Tyr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JERJIYYCOGBAIJ-OBAATPRFSA-N 0.000 description 2
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 2
- IPFKIGNDTUOFAF-CYDGBPFRSA-N Ile-Val-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IPFKIGNDTUOFAF-CYDGBPFRSA-N 0.000 description 2
- ZSESFIFAYQEKRD-CYDGBPFRSA-N Ile-Val-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N ZSESFIFAYQEKRD-CYDGBPFRSA-N 0.000 description 2
- 101900222562 Influenza A virus Nucleoprotein Proteins 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- 241000272168 Laridae Species 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- GPXFZVUVPCFTMG-AVGNSLFASA-N Leu-Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C GPXFZVUVPCFTMG-AVGNSLFASA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 2
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 2
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 2
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 2
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 2
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 2
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 2
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 2
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 2
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 2
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 2
- VHFFQUSNFFIZBT-CIUDSAMLSA-N Lys-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N VHFFQUSNFFIZBT-CIUDSAMLSA-N 0.000 description 2
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 2
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 2
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 2
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 2
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 2
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 2
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 2
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 2
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 2
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 2
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 2
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 2
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 2
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 2
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 2
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 2
- KVNLHIXLLZBAFQ-RWMBFGLXSA-N Lys-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N KVNLHIXLLZBAFQ-RWMBFGLXSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- MSSABBQOBUZFKZ-IHRRRGAJSA-N Lys-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O MSSABBQOBUZFKZ-IHRRRGAJSA-N 0.000 description 2
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 2
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 2
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 2
- BVRNWWHJYNPJDG-XIRDDKMYSA-N Lys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N BVRNWWHJYNPJDG-XIRDDKMYSA-N 0.000 description 2
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 2
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 2
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 2
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 2
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 2
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 2
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 2
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- FWCDNVNUSIIDNP-UHFFFAOYSA-N Met Gln Phe Ser Chemical compound CSCCC(N)C(=O)NC(CCC(N)=O)C(=O)NC(C(=O)NC(CO)C(O)=O)CC1=CC=CC=C1 FWCDNVNUSIIDNP-UHFFFAOYSA-N 0.000 description 2
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 2
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 2
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 2
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 2
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 2
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 2
- UOENBSHXYCHSAU-YUMQZZPRSA-N Met-Gln-Gly Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UOENBSHXYCHSAU-YUMQZZPRSA-N 0.000 description 2
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 2
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 2
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 2
- UZVKFARGHHMQGX-IUCAKERBSA-N Met-Gly-Met Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCSC UZVKFARGHHMQGX-IUCAKERBSA-N 0.000 description 2
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 2
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 2
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 2
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 2
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 2
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 2
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 2
- YLBUMXYVQCHBPR-ULQDDVLXSA-N Met-Leu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YLBUMXYVQCHBPR-ULQDDVLXSA-N 0.000 description 2
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 2
- VWWGEKCAPBMIFE-SRVKXCTJSA-N Met-Met-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VWWGEKCAPBMIFE-SRVKXCTJSA-N 0.000 description 2
- ILKCLLLOGPDNIP-RCWTZXSCSA-N Met-Met-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ILKCLLLOGPDNIP-RCWTZXSCSA-N 0.000 description 2
- RIWWCXKWIUQIAY-SZMVWBNQSA-N Met-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RIWWCXKWIUQIAY-SZMVWBNQSA-N 0.000 description 2
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 2
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 2
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 2
- MPCKIRSXNKACRF-GUBZILKMSA-N Met-Pro-Asn Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O MPCKIRSXNKACRF-GUBZILKMSA-N 0.000 description 2
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 2
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 2
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 2
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 2
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 2
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 2
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 2
- CKAVKDJBSNTJDB-SRVKXCTJSA-N Met-Val-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCSC CKAVKDJBSNTJDB-SRVKXCTJSA-N 0.000 description 2
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 2
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 2
- 238000010629 Molecular evolutionary genetics analysis Methods 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 238000011887 Necropsy Methods 0.000 description 2
- 108010065395 Neuropep-1 Proteins 0.000 description 2
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 2
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 2
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 2
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 2
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 2
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 2
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 2
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 2
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 2
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 2
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 2
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 2
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 2
- PPHFTNABKQRAJV-JYJNAYRXSA-N Phe-His-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PPHFTNABKQRAJV-JYJNAYRXSA-N 0.000 description 2
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- ACJULKNZOCRWEI-ULQDDVLXSA-N Phe-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O ACJULKNZOCRWEI-ULQDDVLXSA-N 0.000 description 2
- YVIVIQWMNCWUFS-UFYCRDLUSA-N Phe-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N YVIVIQWMNCWUFS-UFYCRDLUSA-N 0.000 description 2
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 2
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 2
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 2
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 2
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 2
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 2
- XZGWNSIRZIUHHP-SRVKXCTJSA-N Pro-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 XZGWNSIRZIUHHP-SRVKXCTJSA-N 0.000 description 2
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 2
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 2
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 2
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 2
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 2
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 2
- QVIZLAUEAMQKGS-GUBZILKMSA-N Pro-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 QVIZLAUEAMQKGS-GUBZILKMSA-N 0.000 description 2
- ZBAGOWGNNAXMOY-IHRRRGAJSA-N Pro-Cys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZBAGOWGNNAXMOY-IHRRRGAJSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 2
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 2
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 2
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 2
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 2
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 2
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 2
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 2
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 2
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 2
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 2
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 2
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 2
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 2
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 2
- 206010037368 Pulmonary congestion Diseases 0.000 description 2
- 206010037394 Pulmonary haemorrhage Diseases 0.000 description 2
- 206010037423 Pulmonary oedema Diseases 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 206010039101 Rhinorrhoea Diseases 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 2
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 2
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 2
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 2
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 2
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 2
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 2
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 2
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 2
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 2
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 2
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 2
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 2
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 2
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 2
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 2
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 2
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 2
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 2
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 2
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 2
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 2
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 2
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 2
- BIENEHRYNODTLP-HJGDQZAQSA-N Thr-Glu-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O BIENEHRYNODTLP-HJGDQZAQSA-N 0.000 description 2
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 2
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 2
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 2
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 2
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 2
- UDNVOQMPQBEITB-MEYUZBJRSA-N Thr-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UDNVOQMPQBEITB-MEYUZBJRSA-N 0.000 description 2
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 2
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 2
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 2
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 2
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 2
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 2
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 2
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 2
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 2
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 2
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 2
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 2
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 2
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 2
- VGNKUXWYFFDWDH-BEMMVCDISA-N Thr-Trp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N)O VGNKUXWYFFDWDH-BEMMVCDISA-N 0.000 description 2
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 2
- BGHVVGPELPHRCI-HZTRNQAASA-N Thr-Trp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N)O BGHVVGPELPHRCI-HZTRNQAASA-N 0.000 description 2
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 2
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 2
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- 206010044314 Tracheobronchitis Diseases 0.000 description 2
- NIWAGRRZHCMPOY-GMVOTWDCSA-N Trp-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NIWAGRRZHCMPOY-GMVOTWDCSA-N 0.000 description 2
- DXDMNBJJEXYMLA-UBHSHLNASA-N Trp-Asn-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 DXDMNBJJEXYMLA-UBHSHLNASA-N 0.000 description 2
- PHNBFZBKLWEBJN-BPUTZDHNSA-N Trp-Glu-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PHNBFZBKLWEBJN-BPUTZDHNSA-N 0.000 description 2
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 2
- IJRXQJVGFBSKIV-ZFWWWQNUSA-N Trp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N IJRXQJVGFBSKIV-ZFWWWQNUSA-N 0.000 description 2
- LDMUNXDDIDAPJH-VMBFOHBNSA-N Trp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LDMUNXDDIDAPJH-VMBFOHBNSA-N 0.000 description 2
- RRXPAFGTFQIEMD-IVJVFBROSA-N Trp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RRXPAFGTFQIEMD-IVJVFBROSA-N 0.000 description 2
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 2
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 2
- OFTGYORHQMSPAI-PJODQICGSA-N Trp-Met-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O OFTGYORHQMSPAI-PJODQICGSA-N 0.000 description 2
- SNWIAPVRCNYFNI-SZMVWBNQSA-N Trp-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SNWIAPVRCNYFNI-SZMVWBNQSA-N 0.000 description 2
- ABEVJDLMFPTGPS-SZMVWBNQSA-N Trp-Met-Met Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ABEVJDLMFPTGPS-SZMVWBNQSA-N 0.000 description 2
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 2
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 2
- HWCBFXAWVTXXHZ-NYVOZVTQSA-N Trp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N HWCBFXAWVTXXHZ-NYVOZVTQSA-N 0.000 description 2
- ABRICLFKFRFDKS-IHPCNDPISA-N Trp-Ser-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ABRICLFKFRFDKS-IHPCNDPISA-N 0.000 description 2
- UPUNWAXSLPBMRK-XTWBLICNSA-N Trp-Thr-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UPUNWAXSLPBMRK-XTWBLICNSA-N 0.000 description 2
- SGQSAIFDESQBRA-IHPCNDPISA-N Trp-Tyr-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SGQSAIFDESQBRA-IHPCNDPISA-N 0.000 description 2
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 2
- LNGFWVPNKLWATF-ZVZYQTTQSA-N Trp-Val-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LNGFWVPNKLWATF-ZVZYQTTQSA-N 0.000 description 2
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 2
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 2
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 2
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 2
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 2
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 2
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 2
- FGJWNBBFAUHBEP-IHPCNDPISA-N Tyr-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FGJWNBBFAUHBEP-IHPCNDPISA-N 0.000 description 2
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 2
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 2
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 2
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 2
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 2
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 2
- LQGDFDYGDQEMGA-PXDAIIFMSA-N Tyr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N LQGDFDYGDQEMGA-PXDAIIFMSA-N 0.000 description 2
- AVIQBBOOTZENLH-KKUMJFAQSA-N Tyr-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AVIQBBOOTZENLH-KKUMJFAQSA-N 0.000 description 2
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 2
- VPEFOFYNHBWFNQ-UFYCRDLUSA-N Tyr-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 VPEFOFYNHBWFNQ-UFYCRDLUSA-N 0.000 description 2
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 2
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 2
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 2
- ZYVAAYAOTVJBSS-GMVOTWDCSA-N Tyr-Trp-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZYVAAYAOTVJBSS-GMVOTWDCSA-N 0.000 description 2
- AXKADNRGSUKLKI-WIRXVTQYSA-N Tyr-Trp-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 AXKADNRGSUKLKI-WIRXVTQYSA-N 0.000 description 2
- JRMCISZDVLOTLR-BVSLBCMMSA-N Tyr-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CC=C(C=C3)O)N JRMCISZDVLOTLR-BVSLBCMMSA-N 0.000 description 2
- BUPRFDPUIJNOLS-UFYCRDLUSA-N Tyr-Tyr-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O BUPRFDPUIJNOLS-UFYCRDLUSA-N 0.000 description 2
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 2
- 102220522139 Uncharacterized protein C9orf131_W222L_mutation Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 2
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 2
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 2
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 2
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 2
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 2
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 2
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 2
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 2
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 2
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 2
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 2
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 2
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 2
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 2
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 2
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 2
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 2
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000004520 agglutination Effects 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 230000000840 anti-viral effect Effects 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005352 clarification Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- XVOYSCVBGLVSOL-UHFFFAOYSA-N cysteic acid Chemical compound OC(=O)C(N)CS(O)(=O)=O XVOYSCVBGLVSOL-UHFFFAOYSA-N 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 108010033011 des-Arg- enterostatin Proteins 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000005911 diet Nutrition 0.000 description 2
- 230000037213 diet Effects 0.000 description 2
- 229940072271 diprivan Drugs 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 230000036732 histological change Effects 0.000 description 2
- 238000010562 histological examination Methods 0.000 description 2
- 238000012333 histopathological diagnosis Methods 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000011532 immunohistochemical staining Methods 0.000 description 2
- 238000003364 immunohistochemistry Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 230000002045 lasting effect Effects 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 239000006193 liquid solution Substances 0.000 description 2
- 239000006194 liquid suspension Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 208000010753 nasal discharge Diseases 0.000 description 2
- 238000006386 neutralization reaction Methods 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 210000001331 nose Anatomy 0.000 description 2
- 239000002751 oligonucleotide probe Substances 0.000 description 2
- UOZODPSAJZTQNH-LSWIJEOBSA-N paromomycin Chemical compound N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)N)O[C@@H]1CO UOZODPSAJZTQNH-LSWIJEOBSA-N 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920000728 polyester Polymers 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 229960004134 propofol Drugs 0.000 description 2
- 208000005333 pulmonary edema Diseases 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 102200123046 rs2229263 Human genes 0.000 description 2
- 102200113352 rs28399499 Human genes 0.000 description 2
- 102220145202 rs574215585 Human genes 0.000 description 2
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000009589 serological test Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 201000010740 swine influenza Diseases 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- XOAAWQZATWQOTB-UHFFFAOYSA-N taurine Chemical compound NCCS(O)(=O)=O XOAAWQZATWQOTB-UHFFFAOYSA-N 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000002627 tracheal intubation Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 108010036387 trimethionine Proteins 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- RDEIXVOBVLKYNT-VQBXQJRRSA-N (2r,3r,4r,5r)-2-[(1s,2s,3r,4s,6r)-4,6-diamino-3-[(2r,3r,6s)-3-amino-6-(1-aminoethyl)oxan-2-yl]oxy-2-hydroxycyclohexyl]oxy-5-methyl-4-(methylamino)oxane-3,5-diol;(2r,3r,4r,5r)-2-[(1s,2s,3r,4s,6r)-4,6-diamino-3-[(2r,3r,6s)-3-amino-6-(aminomethyl)oxan-2-yl]o Chemical compound OS(O)(=O)=O.O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H](CC[C@@H](CN)O2)N)[C@@H](N)C[C@H]1N.O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H](CC[C@H](O2)C(C)N)N)[C@@H](N)C[C@H]1N.O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N RDEIXVOBVLKYNT-VQBXQJRRSA-N 0.000 description 1
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 1
- 125000000349 (Z)-3-carboxyprop-2-enoyl group Chemical group O=C([*])/C([H])=C([H])\C(O[H])=O 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- JUEUYDRZJNQZGR-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JUEUYDRZJNQZGR-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- FRFDXQWNDZMREB-ACZMJKKPSA-N Ala-Cys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRFDXQWNDZMREB-ACZMJKKPSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N Alanine Chemical compound CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- 101710187573 Alcohol dehydrogenase 2 Proteins 0.000 description 1
- 101710133776 Alcohol dehydrogenase class-3 Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 241001153886 Ami Species 0.000 description 1
- APKFDSVGJQXUKY-KKGHZKTASA-N Amphotericin-B Natural products O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1C=CC=CC=CC=CC=CC=CC=C[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-KKGHZKTASA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- 208000031504 Asymptomatic Infections Diseases 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 201000001178 Bacterial Pneumonia Diseases 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 101150104494 CAV1 gene Proteins 0.000 description 1
- 101100520142 Caenorhabditis elegans pin-2 gene Proteins 0.000 description 1
- 241000178270 Canarypox virus Species 0.000 description 1
- 241000701114 Canine adenovirus 2 Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 101150047856 Cav2 gene Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 102000036364 Cullin Ring E3 Ligases Human genes 0.000 description 1
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 1
- IDZDFWJNPOOOHE-KKUMJFAQSA-N Cys-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N IDZDFWJNPOOOHE-KKUMJFAQSA-N 0.000 description 1
- QWCKQJZIFLGMSD-GSVOUGTGSA-N D-alpha-aminobutyric acid Chemical compound CC[C@@H](N)C(O)=O QWCKQJZIFLGMSD-GSVOUGTGSA-N 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- ZAQJHHRNXZUBTE-WUJLRWPWSA-N D-xylulose Chemical compound OC[C@@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-WUJLRWPWSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 101000737786 Daucus carota Calcium-dependent protein kinase Proteins 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- ZEFNOZRLAWVAQF-UHFFFAOYSA-N Dinitolmide Chemical compound CC1=C(C(N)=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O ZEFNOZRLAWVAQF-UHFFFAOYSA-N 0.000 description 1
- 102100020743 Dipeptidase 1 Human genes 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 208000000655 Distemper Diseases 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 206010053172 Fatal outcomes Diseases 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 241001200922 Gagata Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 101000737787 Glycine max Calcium-dependent protein kinase SK5 Proteins 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 241000252869 H3N8 subtype Species 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000005548 Hexokinase Human genes 0.000 description 1
- 108700040460 Hexokinases Proteins 0.000 description 1
- UWNUQPZUSRFIIN-JUKXBJQTSA-N His-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N UWNUQPZUSRFIIN-JUKXBJQTSA-N 0.000 description 1
- 241000701149 Human adenovirus 1 Species 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- VLCMCYDZJCWPQT-VKOGCVSHSA-N Ile-Met-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N VLCMCYDZJCWPQT-VKOGCVSHSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 241000384201 Influenza A virus (A/canine/Florida/242/2003(H3N8)) Species 0.000 description 1
- 241000134304 Influenza A virus H3N2 Species 0.000 description 1
- 101710128560 Initiator protein NS1 Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 1
- XIGSAGMEBXLVJJ-YFKPBYRVSA-N L-homocitrulline Chemical compound NC(=O)NCCCC[C@H]([NH3+])C([O-])=O XIGSAGMEBXLVJJ-YFKPBYRVSA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical group CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 208000032376 Lung infection Diseases 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- RDIILCRAWOSDOQ-CIUDSAMLSA-N Lys-Cys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RDIILCRAWOSDOQ-CIUDSAMLSA-N 0.000 description 1
- 241000721576 Melopsittacus undulatus Species 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 101710144127 Non-structural protein 1 Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 208000009620 Orthomyxoviridae Infections Diseases 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- UOZODPSAJZTQNH-UHFFFAOYSA-N Paromomycin II Natural products NC1C(O)C(O)C(CN)OC1OC1C(O)C(OC2C(C(N)CC(N)C2O)OC2C(C(O)C(O)C(CO)O2)N)OC1CO UOZODPSAJZTQNH-UHFFFAOYSA-N 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- 108050000930 Polymerase acidic proteins Proteins 0.000 description 1
- 101710093543 Probable non-specific lipid-transfer protein Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 description 1
- 238000010802 RNA extraction kit Methods 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000011530 RNeasy Mini Kit Methods 0.000 description 1
- 238000010240 RT-PCR analysis Methods 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 108010077895 Sarcosine Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- XSYJDGIDKRNWFX-SRVKXCTJSA-N Ser-Cys-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XSYJDGIDKRNWFX-SRVKXCTJSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000194007 Streptococcus canis Species 0.000 description 1
- 241000194048 Streptococcus equi Species 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241000272534 Struthio camelus Species 0.000 description 1
- 206010042566 Superinfection Diseases 0.000 description 1
- 241000725681 Swine influenza virus Species 0.000 description 1
- 241000700565 Swinepox virus Species 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- KULBQAVOXHQLIY-HSCHXYMDSA-N Trp-Ile-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 KULBQAVOXHQLIY-HSCHXYMDSA-N 0.000 description 1
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 108010093857 Viral Hemagglutinins Proteins 0.000 description 1
- 206010047482 Viral upper respiratory tract infection Diseases 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 241000710886 West Nile virus Species 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 101150069317 alcA gene Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960002684 aminocaproic acid Drugs 0.000 description 1
- APKFDSVGJQXUKY-INPOYWNPSA-N amphotericin B Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-INPOYWNPSA-N 0.000 description 1
- 229960003942 amphotericin b Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000012805 animal sample Substances 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 150000001507 asparagine derivatives Chemical class 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 210000000270 basal cell Anatomy 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 235000010216 calcium carbonate Nutrition 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 208000014058 canine distemper Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 239000013553 cell monolayer Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 239000003610 charcoal Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 208000035850 clinical syndrome Diseases 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010460 detection of virus Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108010060641 flavanone synthetase Proteins 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- ZHNUHDYFZUAESO-UHFFFAOYSA-N formamide Substances NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 239000004333 gold (food color) Substances 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000003118 histopathologic effect Effects 0.000 description 1
- 230000005571 horizontal transmission Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 230000002390 hyperplastic effect Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000013115 immunohistochemical detection Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 208000037798 influenza B Diseases 0.000 description 1
- 108700010900 influenza virus proteins Proteins 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 210000004731 jugular vein Anatomy 0.000 description 1
- 238000003771 laboratory diagnosis Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 150000002614 leucines Chemical class 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000008297 liquid dosage form Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 239000004337 magnesium citrate Substances 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 210000001370 mediastinum Anatomy 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229940127554 medical product Drugs 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- ZLVYMPOQNJTFSG-QMMMGPOBSA-N monoiodotyrosine Chemical compound OC(=O)[C@@H](NI)CC1=CC=C(O)C=C1 ZLVYMPOQNJTFSG-QMMMGPOBSA-N 0.000 description 1
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 1
- 210000003550 mucous cell Anatomy 0.000 description 1
- 210000004400 mucous membrane Anatomy 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 230000002956 necrotizing effect Effects 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 210000002445 nipple Anatomy 0.000 description 1
- QYSGYZVSCZSLHT-UHFFFAOYSA-N octafluoropropane Chemical compound FC(F)(F)C(F)(F)C(F)(F)F QYSGYZVSCZSLHT-UHFFFAOYSA-N 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 210000003300 oropharynx Anatomy 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 229960001914 paromomycin Drugs 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 101150009573 phoA gene Proteins 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000002862 phylogeny inference package Methods 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 210000003281 pleural cavity Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 235000015277 pork Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 239000001397 quillaja saponaria molina bark Substances 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 235000020995 raw meat Nutrition 0.000 description 1
- 238000012755 real-time RT-PCR analysis Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 102220060532 rs786201764 Human genes 0.000 description 1
- 102220082153 rs863223933 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000012898 sample dilution Substances 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 229940043230 sarcosine Drugs 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 239000008299 semisolid dosage form Substances 0.000 description 1
- 150000003354 serine derivatives Chemical class 0.000 description 1
- 238000012344 serological confirmation Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000007909 solid dosage form Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 239000011877 solvent mixture Substances 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 229940031626 subunit vaccine Drugs 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960003080 taurine Drugs 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 238000012956 testing procedure Methods 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 125000004149 thio group Chemical group *S* 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 230000008359 toxicosis Effects 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 208000030218 transient fever Diseases 0.000 description 1
- 101150019416 trpA gene Proteins 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 238000002562 urinalysis Methods 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000007485 viral shedding Effects 0.000 description 1
- 210000000605 viral structure Anatomy 0.000 description 1
- 229960004854 viral vaccine Drugs 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Abstract
Изобретение относится к биотехнологии и ветеринарии и представляет собой вирус гриппа собачьих, содержащий полинуклеотид, кодирующий гемагглютинин (НА), содержащий аминокислотную последовательность SEQ ID NO: 33 или SEQ ID NO: 34 или аминокислотную последовательность, имеющую более 95% идентичности аминокислотной последовательности SEQ ID NO: 34 или SEQ ID NO: 34, где указанный белок HA включает серин в положении 82, лейцин в положении 221, треонин в положении 327 и треонин в положении 482 аминокислотной последовательности, а также вакцину против вируса собачьих, содержащую вирус гриппа. Изобретение позволяет повысить индуцирование иммунного ответа у животного. 5 н. и 4 з.п. ф-лы, 7 ил., 25 табл., 16 пр.
Description
ОПИСАНИЕ
ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИ
Настоящая заявка заявляет приоритет предварительной заявки на патент США No. 60/673 443, зарегистрированной 21 апреля 2005 года, которая включена в настоящее описание полностью в виде ссылки, включая все приведенные в ней чертежи, таблицы, последовательности нуклеиновых кислот, последовательности аминокислот и рисунки.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
"Кашель в условиях конуры", или инфекционный трахеобронхит (ITB), представляет собой острую контагиозную респираторную инфекцию у собак, характеризующуюся, в основном, кашлем (Ford et al, 1998). ITB собак рассматривается как наиболее распространенное в мире инфекционное респираторное заболевание собак, вспышки которого могут достичь масштабов эпидемии, если собаки содержатся в условия высокой плотности животных, какие имеются, например, в конурах. Большая часть таких вспышек заболевания связана с непосредственным контактом собак или определяется аэрозольным распространением респираторных выделений (Ford et al, 1998). Клинические признаки вызываются инфицированием одним инфекционным агентом или сочетанием бактериальных и вирусных агентов, которые населяют эпителий верхнего и нижнего отделов дыхательных путей. Вирус парагриппа собак (CPiV) и бактерии Bordetella bronchiseptica представляют организмы, чаще всего выделяемые из организма больных животных, однако на клиническое течение и исход заболевания могут оказать влияние и некоторые другие вирусы, такие как вирус чумы собак (CDV), аденовирус-1 и -2 собак (CAV-1, CAV-2), вместе с бактериями, такими как Streptococcus sp., Pasteurella multicoda и Escherichia coli (Ford et al, 1998). Несмотря на то, что вспышки заболевания протекают выраженно и быстро, с высоким уровнем заболеваемости, в популяциях с высокой плотностью проживания животных, осложненные респираторные инфекции и летальные исходы встречаются не часто. Хотя могут развиваться опасные для жизни вторичные бактериальные пневмонии, в большинстве случаев ITB являются самокупирующимися и разрешаются без какого-либо лечения (Ford et al, 1998).
В июле 1992 респираторная инфекция, которую, предположительно, отнесли к "кашлю в конуре", достигла эпидемических масштабов на нескольких участках выгула борзых собак в Новой Англии, Флориде, Западной Вирджинии, Висконсине, Канзасе, Колорадо, Оклахоме и Аризоне. Согласно заключению ветеринаров, большая часть пораженных собак имела умеренный кашель, который проходил, но более чем у десятка борзых развилась острая геморрагическая пневмония, которая привела к быстрой смерти животных (Greyhound Daily News, 1999).
С конца 1998 до начала 1999 несколько вспышек заболевания по типу "кашель в условиях конуры", возникшие по всей стране на скачках борзых, содержавшихся в конурах, привели к принудительному закрытию треков и введению карантина на всех соревнованиях борзых в США на несколько недель (Greyhound Daily News, 1999). На одном треке во Флориде (Palm Beach Kennel Club) в один день кашель был зарегистрирован примерно у 40% собак (личное сообщение от д-ра William Duggar). Как и в случае вспышки заболевания в 1992 году, кашель проходил у большинства борзых, но 10 собак во Флориде умерли от синдрома геморрагической пневмонии, нехарактерной для инфекции по типу "кашля в конуре" (Putnam, 1999).
В марте-апреле 2003, другая вспышка "кашля в конуре" возникла на участках выгула борзых на востоке США. Эта вспышка, которая, предположительно, возникла в конурах на четырех треках во Флориде, вызвала отмену скачек и карантин собак почти на три недели. Были поражены около 25% собак на треке в Западном Пальм-Бич, и почти у 50% из 1400 собак на озере Дерби в Санкт-Петербурге развился кашель. И, как и прежде, большая часть собак выздоровела, но несколько собак умерло от респираторной инфекции. Экономический ущерб вспышки респираторной инфекции только на треке в районе озера Дерби составил, по оценкам, 2 миллиона долларов.
В настоящее время отсутствуют документальные отчеты с описанием этиологии или клинической картины эпидемии "кашля в конуре", возникшей в собачьих конурах во время скачек борзых в 1992, 1998-1999 или 2003 гг. Было высказано предположение о связи данной инфекции с CPiV и/или B. bronchiseptica, которые являются наиболее частой причиной кашля в конуре. Не подкрепленные соответствующими обоснованиями сообщения, типа информации, появляющейся на веб-сайтах, связывают фатальные случаи геморрагической пневмонии, развившейся у некоторых кашляющих собак, с инфекцией β-гемолитическим стрептококком Streptococcus equi, подвид zooepidemicus, и относят эти случаи к синдрому так называемого "стрептококкового токсического шока собак".
Передача вируса от одного организма-хозяина к другому является ключевым моментом экологии и эпидемиологии вируса гриппа (Webster, 1998). Возможны два основных механизма межвидовой передачи вируса гриппа (Webster et al., 1992; Lipatov et al., 2004). Один из них относится к непосредственной передаче по существу не измененного вируса от одного вида к другому. Примеры такого механизма включают идентифицированные недавно инфекции человека вирусом птичьего гриппа подтипа H5N1 (Subbarao et al., 1998; Peiris et al., 2004; Guan et al., 2004) и, возможно, также пандемию 1918 года, известную как «испанка» (Reid et al., 2004). Второй механизм имеет отношение к сегментированной природе генома вируса гриппа. Совместная инфекция организма-хозяина вирусами из разных видов может привести к перегруппировке сегментированных вирусных генов и образованию рекомбинанта, который способен инфицировать другой вид. Так, например, новые вирусы, образующиеся при генной перегруппировке между вирусами птичьего гриппа и гриппа человека, привели к пандемии гриппа у людей в 1957 и 1968 гг. (Webster et al., 1992; Lipatov et al., 2004; Kawaoka et al., 1989).
В основном, непосредственная передача не измененных вирусов гриппа от природного организма-хозяина к другому виду представляет собой завершенный процесс, поскольку длительная передача между индивидуумами нового вида не происходит. Множественные взаимодействия по типу вирус-организм-хозяин необходимы для репликации и горизонтальной передачи и обеспечивают непреодолимый барьер для длительного пребывания вирусов гриппа в новом организме-хозяине (Webby et al., 2004). В этой связи, установление новых линий вируса гриппа, специфичных для организма-хозяина, является необычным процессом и происходит только на птицеводческих фермах, в свинарниках, конюшнях и в человеческих сообществах (Webster et al., 1992; Lipatov et al., 2004).
В связи с серьезной инфекции вирусом гриппа, остается потребность в способах диагностики, профилактики и лечения инфекции вирусом гриппа.
КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к выделенному вирусу гриппа, который способен инфицировать представителей группы псовых и вызывать респираторное заболевание у представителей группы псовых. Настоящее изобретение также относится к композициям и способам, подходящим для индукции иммунного ответа против вируса гриппа согласно настоящему изобретению. Настоящее изобретение также относится к композициям и способам, подходящим для идентификации вируса согласно настоящему изобретению, и диагностики наличия у животного инфекции вирусом согласно настоящему изобретению.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Патент или зарегистрированная заявка содержит по меньшей мере один рисунок, выполненный в цвете. Копии данного патента или публикация по патентной заявке с цветными рисунками будут предоставлены Патентным Бюро, при направлении соответствующего запроса и оплате необходимой суммы.
Фиг.1A-1B иллюстрируют филогенетическое родство, имеющееся между генами гемагглютинина. На фиг.1A показано дерево генов HA из репрезентативных изолятов из организма собаки, человека, птицы, свиньи и лошади, включая A/Budgerigar/Hokkaido/1/77 (H4), как варианта за пределами рассматриваемой группы. На фиг.1B показано дерево генов HA из вируса гриппа собаки, в сочетании с современными и более древними генами НА лошади A/Duck/Ukraine/63 (H3), как варианта за пределами рассматриваемой группы. Филогенетические деревья были построены на основе нуклеотидных последовательностей, определенных по методу «ближайших соседей», и показаны результаты анализа по методу «расшнурованной выборки» ≥90%. Стрелка указывает число нуклеотидных изменений на единицу длины горизонтальных ветвей дерева.
На фиг.2A-2B проиллюстрировано выявление иммуногистохимическим методом вирусного антигена H3 в легких. Срезы из ткани легкого зондируют мышиным моноклональным антителом против H3 гемагглютинина и выявляют наличие связывания по результатам иммунопероксидазной реакции (коричневый осадок). На фиг.2A показан бронхиальный эпителий, взятый от борзой со спонтанным заболеванием. Вирусный антиген H3 выявляется в цитоплазме эпителиальных клеток бронхов и в макрофагах в просвете дыхательных путей и в альвеолярном пространстве. На фиг.2B показан бронхиальный эпителий, взятый у собаки через 5 дней после инокуляции A/canine/Florida/43/04 (H3N8). Вирусный антиген H3 выявляется в цитоплазме эпителиальных клеток бронхов. Масштаб: 66 мкм.
На фиг.3 показаны характерные гистологические изменения в бронхах борзых, умерших от геморрагической пневмонии, ассоциированной с инфекцией вирусом гриппа. Ткани окрашивают красителем H&E. На верхней панели показаны: нормальный бронх с реснитчатыми клетками, слизистыми клетками и базальными клетками. На нижней панели показаны: бронх от борзой со спонтанным заболеванием. Отмечается некроз и эрозия реснитчатых клеток бронхиального эпителия. Масштаб: 100 мкм.
На фиг.4A-4B проиллюстрировано филогенетическое родство между генами H3 гемагглютинина. На фиг.4A показано филогенетическое дерево генов НА вируса гриппа собаки, вместе с современными и более древними генами НА лошади. На фиг.4B показано филогенетическое дерево белка НА вируса гриппа собаки, вместе с современными и более древними НА лошади. Филогенетические деревья построены на основе нуклеотидных последовательностей, определенных по методу «ближайших соседей», и показаны результаты анализа по методу «расшнурованной выборки» ≥80%. Стрелка указывает число нуклеотидных изменений на единицу длины горизонтальных ветвей дерева.
На фиг.5 показан белок H3 из вируса гриппа в эпителиальных клетках бронхов и бронхиальных желез в легких собак, которые умерли от пневмонии, ассоциированной с инфекцией вирусом гриппа. На верхней панели показаны: эрозия реснитчатых клеток бронхиального эпителия в бронхах. Ткани окрашивают красителем H&E. На нижней панели показаны: белок H3 из вируса гриппа в цитоплазме эпителиальных клеток бронхов (слева) и бронхиальной железы (справа). Ткани окрашивают с использованием моноклонального антитела против H3 вируса гриппа, при выявлении результатов иммунопероксидазной реакцией (коричневый осадок) и при проведении контрастного окрашивания гематоксилином.
На фиг.6A-6D приведены графики, описывающие амплификацию H3 и Matrix генов (фиг.6A и фиг.6B), полученных при амплификации 10-кратных серийных разведений транскрибированных in vitro стандартных препаратов РНК. Стандартные кривые для H3 и Matrix генов (фиг.6C и фиг.6D) получают при построении графика зависимости log исходных концентраций РНК от порогового значения цикла (Ct), полученного для каждого разведения.
На фиг.7 проиллюстрирована чувствительность Directigen Flu A, при анализе 10-кратных серийных разведений стандартных вирусных препаратов, включая A/Wyoming/3/2003 и A/canine/FL/242/2003. Фиолетовый треугольник указывает на положительный результат.
КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
SEQ ID NO: 1 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Florida/43/04), кодирующую белок PB2, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 2 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 1.
SEQ ID NO: 3 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Florida/43/04), кодирующую белок PB1, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 4 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 3.
SEQ ID NO: 5 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Florida/43/04), кодирующую белок PA, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 6 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 5.
SEQ ID NO: 7 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Florida/43/04), кодирующую белок NS, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 8 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 7.
SEQ ID NO: 9 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Florida/43/04), кодирующую белок NP, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 10 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 9.
SEQ ID NO: 11 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Florida/43/04), кодирующую белок NA, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 12 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 11.
SEQ ID NO: 13 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Florida/43/04), кодирующую белок МА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 14 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 13.
SEQ ID NO: 15 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Florida/43/04), кодирующую белок НА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 16 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 15.
SEQ ID NO: 17 представляет собой нуклеотидную последовательность из вируса гриппа собаки (FL/242/03), кодирующую белок РВ2, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 18 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 17.
SEQ ID NO: 19 представляет собой нуклеотидную последовательность из вируса гриппа собаки (FL/242/03), кодирующую белок РВ1, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 20 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 19.
SEQ ID NO: 21 представляет собой нуклеотидную последовательность из вируса гриппа собаки (FL/242/03), кодирующую белок РА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 22 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 21.
SEQ ID NO: 23 представляет собой нуклеотидную последовательность из вируса гриппа собаки (FL/242/03), кодирующую белок NS, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 24 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 23.
SEQ ID NO: 25 представляет собой нуклеотидную последовательность из вируса гриппа собаки (FL/242/03), кодирующую белок NP, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 26 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 25.
SEQ ID NO: 27 представляет собой нуклеотидную последовательность из вируса гриппа собаки (FL/242/03), кодирующую белок NA, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 28 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 27.
SEQ ID NO: 29 представляет собой нуклеотидную последовательность из вируса гриппа собаки (FL/242/03), кодирующую белок МА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 30 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 29.
SEQ ID NO: 31 представляет собой нуклеотидную последовательность из вируса гриппа собаки (FL/242/03), кодирующую белок МА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 32 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 31.
SEQ ID NO: 33 представляет собой зрелую форму белка HA, показанного в виде SEQ ID NO: 16, в котором удалена N-концевая сигнальная последовательность из 16 аминокислот.
SEQ ID NO: 34 представляет собой зрелую форму белка HA, показанного в виде SEQ ID NO: 32, в котором удалена N-концевая сигнальная последовательность из 16 аминокислот.
SEQ ID NO: 35 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 36 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 37 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 38 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 39 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 41 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 42 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 43 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 44 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 45 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 46 представляет собой олигонуклеотид, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 47 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Miami/2005), кодирующую белок PB2, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 48 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 47.
SEQ ID NO: 49 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Miami/2005), кодирующую белок PB1, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 50 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 49.
SEQ ID NO: 51 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Miami/2005), кодирующую белок PA, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 52 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 51.
SEQ ID NO: 53 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Miami/2005), кодирующую белок NS, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 54 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 53.
SEQ ID NO: 55 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Miami/2005), кодирующую белок NP, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 56 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 55.
SEQ ID NO: 57 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Miami/2005), кодирующую белок NA, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 58 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 57.
SEQ ID NO: 59 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Miami/2005), кодирующую белок МА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 60 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 59.
SEQ ID NO: 61 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Miami/2005), кодирующую белок НА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 62 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 61.
SEQ ID NO: 63 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Jacksonville/2005), кодирующую белок РВ2, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 64 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 63.
SEQ ID NO: 65 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Jacksonville/2005), кодирующую белок РВ1, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 66 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 65.
SEQ ID NO: 67 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Jacksonville/2005), кодирующую белок РА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 68 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 67.
SEQ ID NO: 69 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Jacksonville/2005), кодирующую белок NS, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 70 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 69.
SEQ ID NO: 71 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Jacksonville/2005), кодирующую белок NP, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 72 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 71.
SEQ ID NO: 73 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Jacksonville/2005), кодирующую белок NA, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 74 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 73.
SEQ ID NO: 75 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Jacksonville/2005), кодирующую белок МА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 76 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 75.
SEQ ID NO: 77 представляет собой нуклеотидную последовательность из вируса гриппа собаки (Jacksonville/2005), кодирующую белок НА, который может использоваться в соответствии с настоящим изобретением.
SEQ ID NO: 78 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 77.
SEQ ID NO: 79 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 80 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 81 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 82 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 83 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 84 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 85 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 86 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 87 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
SEQ ID NO: 88 представляет собой олигонуклеотид, который может использоваться согласно настоящему изобретению.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к выделенному вирусу гриппа, который способен инфицировать псовых и вызывать респираторное заболевание. В одном варианте вирус гриппа согласно настоящему изобретению включает полинуклеотид, который кодирует белок, имеющий аминокислотную последовательность, показанную в виде любой из последовательностей SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, или их функциональный и/или иммуногенный фрагмент или вариант. В конкретных вариантах осуществления настоящего изобретения, указанный полинуклеотид включает нуклеотидную последовательность, показанную в виде любой из последовательностей SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77, или их фрагмент или вариант. В конкретном варианте осуществления настоящего изобретения, вирус гриппа согласно настоящему изобретению относится к подтипу H3. Вирус может быть выделен от инфицированных собак и из культуральных клеток или яиц, в соответствии с приведенными в настоящем описании методами. В репрезентативном варианте осуществления настоящего изобретения, вирус гриппа представляет собой вирус гриппа A.
Настоящее изобретение также относится к полинуклеотидам, которые включают полностью или часть одного или нескольких генов или геномного сегмента из вируса гриппа согласно настоящему изобретению. В одном варианте, полинуклеотид согласно настоящему изобретению включает ген гемагглютинина вируса (HA), ген нейраминидазы (NA), ген нуклеопротеина (NP), ген матричного белка (MA или M), ген белка щелочной полимеразы (PB), ген белка кислой полимеразы (PA), ген неструктурного белка (NS) или функциональный фрагмент или вариант любого из указанных генов. В конкретном варианте осуществления настоящего изобретения, полинуклеотид согласно настоящему изобретению включает ген гемагглютинина (HA) или его функциональный фрагмент или вариант. В другом варианте осуществления настоящего изобретения, ген HA кодирует белок гемагглютинин, включающий одну или несколько следующих характеристик: серин в положении 83; лейцин в положении 222; треонин в положении 328 и/или треонин в положении 483, в сравнении с аминокислотной последовательностью консенсусной последовательности лошади H3. В одном варианте осуществления настоящего изобретения, ген HA кодирует полипептид, имеющий аминокислотную последовательность, показанную в виде SEQ ID No: 16, 32, 62 или 78, или их функциональный и/или иммуногенный фрагмент или вариант. В конкретном варианте осуществления настоящего изобретения, ген HA включает нуклеотидную последовательность, показанную в виде SEQ ID No: 15, 31, 61 или 77.
В одном варианте осуществления настоящего изобретения, полинуклеотид согласно настоящему изобретению кодирует полипептид, имеющий аминокислотную последовательность, показанную в виде SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, или их функциональный и/или иммуногенный фрагмент или вариант. В конкретном варианте осуществления настоящего изобретения, полинуклеотид, кодирующий аминокислотную последовательность, показанную в виде SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, включает нуклеотидную последовательность, показанную в виде SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77, соответственно, или последовательность, кодирующую функциональный и/или иммуногенный фрагмент или вариант любой из SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78. Таким образом, настоящее изобретение относится к полинуклеотидным последовательностям, включающим нуклеотидную последовательность, показанную в виде любой из SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77, или фрагмент или вариант, включая вырожденный вариант, любой из SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77. В другом конкретном варианте осуществления настоящего изобретения, полинуклеотид согласно настоящему изобретению может включать: нуклеотиды 1-2271 из SEQ ID NO: 3; нуклеотиды 1-2148 из SEQ ID NO: 5; нуклеотиды 1-657 из SEQ ID NO: 7; нуклеотиды 1-1494 из SEQ ID NO: 9; нуклеотиды 1-1410 из SEQ ID NO: 11; нуклеотиды 1-756 из SEQ ID NO: 13; нуклеотиды 1-1695 из SEQ ID NO: 15; нуклеотиды 1-2271 из SEQ ID NO: 19; нуклеотиды 1-2148 из SEQ ID NO: 21; нуклеотиды 1-657 из SEQ ID NO: 23; нуклеотиды 1-1494 из SEQ ID NO: 25; нуклеотиды 1-756 из SEQ ID NO: 29; нуклеотиды 1-1695 из SEQ ID NO: 31; нуклеотиды 1-2277 из SEQ ID NO: 47; нуклеотиды 1-2271 из SEQ ID NO: 49; нуклеотиды 1-2148 из SEQ ID NO: 51; нуклеотиды 1-690 из SEQ ID NO: 53; нуклеотиды 1-1494 из SEQ ID NO: 55; нуклеотиды 1-1410 из SEQ ID NO: 57; нуклеотиды 1-756 из SEQ ID NO: 59; нуклеотиды 1-1695 из SEQ ID NO: 61; нуклеотиды 1-2277 из SEQ ID NO: 63; нуклеотиды 1-2271 из SEQ ID NO: 65; нуклеотиды 1-2148 из SEQ ID NO: 67; нуклеотиды 1-690 из SEQ ID NO: 69; нуклеотиды 1-1494 из SEQ ID NO: 71; нуклеотиды 1-1410 из SEQ ID NO: 73; нуклеотиды 1-756 из SEQ ID NO: 75; и нуклеотиды 1-1695 из SEQ ID NO: 77. Нуклеотидные и аминокислотные последовательности вирусных полинуклеотидных и полипептидных последовательностей, входящие в область настоящего изобретения, депонированы в GenBank с номерами доступа No. DQ124147 - DQ124161 и DQ124190, полное раскрытие которых приведено в настоящем описании в качестве ссылки.
Настоящее изобретение также относится к полипептидам, кодируемым полинуклеотидами вируса гриппа согласно настоящему изобретению. Настоящее изобретение также относится к функциональным и/или иммуногенным фрагментам и вариантам рассматриваемых полипептидов. Рассматриваемые полипептиды включают белок HA, белок NA, белок NS, нуклеопротеин, белок щелочной полимеразы, белок кислой полимеразы и матричный белок вируса гриппа согласно настоящему изобретению. В репрезентативном варианте, полипептид согласно настоящему изобретению имеет аминокислотную последовательность, показанную в виде любой из SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, или их функциональный и/или иммуногенный фрагмент или вариант.
Настоящее изобретение также относится к полинуклеотидным экспрессирующим конструкциям, включающим полинуклеотидную последовательность согласно настоящему изобретению. В одном варианте осуществления настоящего изобретения, рассматриваемая в нем экспрессирующая конструкция включает полинуклеотидную последовательность, кодирующую полипептид, включающий аминокислотную последовательность, показанную в виде любой из SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, или их функциональный и/или иммуногенный фрагмент или вариант. В конкретном варианте осуществления настоящего изобретения, полинуклеотид, кодирующий аминокислотную последовательность, показанную в виде SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, включает нуклеотидную последовательность, показанную в виде SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77, соответственно, или последовательность, кодирующую функциональный и/или иммуногенный фрагмент или вариант любой из SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78. Таким образом, настоящее изобретение относится к экспрессирующим конструкциям, включающим полинуклеотидную последовательность, содержащую нуклеотидную последовательность, показанную в виде любой из SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77, или фрагмент или вариант, включая вырожденный вариант, любой из SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77. В предпочтительном варианте осуществления настоящего изобретения рассматриваемая в нем экспрессирующая конструкция обеспечивает суперэкспрессию оперативно связанного полинуклеотида согласно настоящему изобретению.
Экспрессирующая конструкции согласно настоящему изобретению в основном включают регуляторные элементы, функционирующие в целевой клетке-хозяине, в которой должна экспрессироваться указанная экспрессирующая конструкция. При этом, любой специалист со средним уровнем знаний в данной области может выбрать регуляторные элементы для целей использования, например, в человеческих клетках-хозяевах, клетках-хозяевах других млекопитающих, клетках-хозяевах насекомых, дрожжевых клетках-хозяевах, бактериальных клетках-хозяевах и растительных клетках-хозяевах. В одном варианте осуществления настоящего изобретения, рассматриваемые в нем регуляторные элементы включают такие регуляторные элементы, которые функционируют в клетках собаки. Указанные регуляторные элементы включают промоторы, последовательности терминации транскрипции, последовательности терминации трансляции, энхансеры и сигналы полиаденилирования. В контексте настоящего описания, термин "экспрессирующая конструкция" относится к сочетанию последовательностей нуклеиновых кислот, которая обеспечивает транскрипцию оперативно связанной последовательности нуклеиновой кислоты. В контексте настоящего описания, термин "оперативно связанный" относится к такому взаимному расположению описанных компонентов, при котором указанные компоненты находятся в определенной взаимосвязи, позволяющей им функционировать заданным образом. В основном, оперативно связанные компоненты расположены непосредственно вблизи друг от друга.
Экспрессирующая конструкция согласно настоящему изобретению может включать промоторную последовательность, оперативно связанную с полинуклеотидной последовательностью, кодирующей полипептид согласно настоящему изобретению. Промоторы могут быть введены в состав полинуклеотида с использованием стандартных методик, известных в данной области. В экспрессирующей конструкции согласно настоящему изобретению могут использоваться множественные копии промоторов или множественные промоторы. В предпочтительном варианте осуществления настоящего изобретения, промотор может быть расположен примерно на том же примерно расстоянии от сайта старта транскрипции в экспрессирующей конструкции, как это имеет место применительно к сайту старта транскрипции в его природном генетической окружении. Допускаются некоторые вариации в этом расстоянии, которые не снижают в заметной мере промоторную активность. В экспрессирующую конструкцию в типичном случае включается сайт старта транскрипции. Предпочтительно, промотор, ассоциированный с экспрессирующей конструкцией согласно настоящему изобретению, обеспечивает суперэкспрессию оперативно связанного полинуклеотида согласно настоящему изобретению.
Промоторы, используемые в экспрессирующих конструкциях в эукариотических клетках, согласно настоящему изобретению, могут быть вирусного или клеточного происхождения. Вирусные промоторы включают, без ограничения, генные промоторы цитомегаловируса (CMV), ранние или поздние промоторы SV40 или генные промоторы вируса саркомы Рауса (RSV). Промоторы клеточного происхождения включают, без ограничения, промотор гена десмина и промотор гена актина. Промоторы, подходящие для использования в сочетании с конструкцией, экспрессируемой в дрожжевых клетках, включают, без ограничения, промотор 3-фосфоглицерилкиназы, промотор глицеральдегид-3-фосфатдегидрогеназы, промотор металлотионеина, промотор алкогольдегидрогеназы-2 и промотор гексокиназы.
Если экспрессирующая конструкция находится в растительной клетке или встраивается в нее, то могут также использоваться промоторы вирусов растений, такие как, например, вирус табачной мозаики (CaMV) 35S (включая усиленный промотор CaMV 35S (см., например, патент США No. 5 106 739 и An, 1997)) или промотор CaMV 19S. Другие промоторы, которые также могут использоваться в конструкциях, экспрессируемых в растениях, включают, например, промотор prolifera, Ap3 промотор, промоторы белков теплового шока, T-ДНК 1'- или 2'- промотор из A. tumefaciens, промотор полигалактуроназы, промотор халконсинтазы A (CHS-A) из петуньи, промотор PR-1a из табака, убихитиновый промотор, промотор актина, промотор гена alcA, промотор pin2 (Xu et al., 1993), промотор WipI из кукурузы, промотор гена trpA из кукурузы (патент США No. 5 625 136), промотор гена CDPK из кукурузы и промотор RUBISCO SSU (патент США No. 5 034 322). В конструкциях согласно настоящему изобретению могут использоваться корне-специфические промоторы, такие как промоторные последовательности, описанные в патенте No. 6 455 760, или в патенте США No. 6 696 623, или в публикациях заявок на патент США No. 20040078841; 20040067506; 20040019934; 20030177536; 20030084486 или 20040123349. Конститутивные промоторы (такие как промотор CaMV, убихина, актина или NOS), промоторы, регулируемые в процессе развития, и индуцибельные промоторы (такие как промоторы, которые могут быть индуцированы теплом, светом, гормонами или химическими веществами) также рассматриваются как подходящие для использования с полинуклеотидными экспрессирующими конструкциями согласно настоящему изобретению. Могут также использоваться тканеспецифичные промоторы, например, специфичные для плодов промоторы, такие как промотор E8 из томатов (номер хранения депонированного материала: AF515784; Good et al. (1994)). Могут также использоваться специфичные для семян промоторы, такие как промотор из гена β-фазеолина (например, в фасоли обыкновенной) или гена глицина (например, в сое) и другие промоторы.
Для экспрессии в прокариотических системах экспрессирующая конструкция согласно настоящему изобретению может включать промоторы, такие как, например, промотор щелочной фосфатазы, промотор триптофана (trp), промотор ламбда PL, промотор β-лактамазы, промотор лактозы, промотор phoA, промотор T3, промотор T7 или промотор tac (de Boer et al., 1983).
Экспрессирующие конструкции согласно настоящему изобретению могут необязательно содержать последовательность терминации транскрипции, последовательность терминации трансляции, последовательность, кодирующую сигнальный пептид, и/или энхансерные элементы. Участки терминации транскрипции в типичном случае могут быть получены из 3'-нетранслируемой области эукариотической или вирусной генной последовательности. Последовательности терминации транскрипции могут быть локализованы по направлению считывания кодирующей последовательности, обеспечивая эффективную терминацию. Последовательность сигнального пептида представляет собой короткую аминокислотную последовательность, присутствующую обычно на амино-конце белка, отвечающего за перемещение оперативно связанного зрелого полипептида как в пределах клетки, по самым разным направлениям, варьирующим от специфических клеточных отсеков до сайта действия белка, так и во внеклеточную среду. Применительно к полипептидам согласно настоящему изобретению, рассматриваются целевые генные продукты, действующие в направлении заданной мишени внутри клетки и/или во внеклеточной среде, ассоциированные с использованием оперативно связанной сигнальной пептидной последовательности. Классические энхансеры представляют собой цис-энхансеры, которые повышают уровень транскрипции гена и которые также могут включаться в экспрессирующую конструкцию. Такие классические энхансерные элементы известны в данной области и включают, без ограничения, энхансерный элемент CaMV 35S, энхансерный элемент раннего промотора цитомегаловируса (CMV) и энхансерный элемент SV40. Интрон-опосредованные энхансерные элементы, которые повышают генную экспрессию, известны в данной области. Указанные элементы должны присутствовать в транскрибируемой области и ориентированы определенным образом.
Последовательности ДНК, которые направляют полиаденилирование мРНК, транскрибированной на основе экспрессирующей конструкции, и которые также могут вводиться в экспрессирующую конструкцию, включают, без ограничения, сигнальную последовательность октопинсинтазы или нопалинсинтазы.
Экспрессирующие конструкции могут также включать один или несколько доминантных селектируемых маркерных генов, включающих, например, гены, кодирующие антибиотикорезистентность и/или гербицидную резистентность выбранных трансформированных клеток. Гены антибиотикорезистентности могут обеспечивать резистентность к одному или нескольким антибиотикам, таким как гигромицин, канамицин, блеомицин, G418, стрептомицин, паромомицин, неомицин и спектиномицин. Резистентность к канамицину может быть достигнута за счет неомицинфосфотрансферазы (NPT II). Гены резистентности к гербицидам могут обеспечивать резистентность к ацетилтрансферазе фосфинотрицина или глифозата. Другие маркеры, используемые для скрининга клеточных трансформантов, включают, без ограничения, гены, кодирующие β-глюкуронидазу (GUS), β-галактозидазу, люциферазу, нопалинсинтазу, хлорамфениколацетилтрансферазу (CAT), зеленый флуоресцентный белок (GFP) или усиленный GFP (Yang et al., 1996).
Настоящее изобретение также относится к полинуклеотидным векторам, включающим полинуклеотидную последовательность согласно настоящему изобретению, которая кодирует полипептид согласно настоящему изобретению. Уникальные сайты для ферментов рестрикции могут быть включены на 5' и 3' концах экспрессирующей конструкции или полинуклеотида согласно настоящему изобретению, с тем чтобы можно быть ввести инсерцию в полинуклеотидный вектор. В контексте настоящего описания термин "вектор" относится к любому генетическому элементу, включающему, например, плазмиды, космиды, хромосомы, фаг, вирус и т.п., которые способны к репликации в сочетании с соответствующими контрольными элементами и которые могут переносить полинуклеотидные последовательности между клетками. Векторы содержат нуклеотидную последовательность, которая позволяет вектору реплицироваться в выбранной клетке-хозяине. Доступно множество векторов для экспрессии и/или клонирования, которые включают, без ограничения, вектор pBR322, векторы серии pUC, векторы серии M13, векторы серии pGEM и вектор pBLUESCRIPT (Stratagene, La Jolla, CA и Promega, Madison, WI).
Настоящее изобретение также относится к олигонуклеотидным зондам и праймерам, таким как праймеры для полимеразно-цепной реакции (ПЦР), которые могут гибридизоваться с кодирующей или некодирующей последовательностью полинуклеотида согласно настоящему изобретению. Олигонуклеотидные зонды согласно настоящему изобретению могут использоваться в рамках методик выявления последовательностей нуклеотидных кислот вируса гриппа. Олигонуклеотидные праймеры согласно настоящему изобретению могут использоваться в методиках ПЦР, а также в других методиках, включающих амплификацию нуклеиновой кислоты. В предпочтительном варианте, зонд или праймер согласно настоящему изобретению может гибридизоваться с полинуклеотидом согласно настоящему изобретению в жестких условиях. Праймеры и зонды согласно настоящему изобретению могут необязательно включать выявляемую метку или репортерную молекулу, такие как флуоресцентные молекулы, ферменты, радиоактивный фрагмент и т.п. Зонды и праймеры согласно настоящему изобретению могут иметь любую длину, приемлемую для метода или теста, в котором они используются. В типичном случае, зонды и праймеры согласно настоящему изобретению включают в длину от 10 до 500 или более нуклеотидов. В область настоящего изобретения включаются зонды и праймеры, которые включают в длину 10-20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, 91-100 или 101 или более нуклеотидов. В одном варианте осуществления настоящего изобретения, рассматриваемые в нем зонды и праймеры включают в длину 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов. Зонды и праймеры согласно настоящему изобретению могут характеризоваться полной (100%) идентичностью по нуклеотидной последовательности к полинуклеотидной последовательности, или указанная идентичность по последовательности может быть ниже, чем 100%. Например, идентичность по последовательности между зондом или праймером и рассматриваемой последовательностью может составлять 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70% или характеризоваться любым процентным показателем идентичности по последовательности, при условии, что зонд или праймер могут гибридизоваться в жестких условиях с нуклеотидной последовательностью полинуклеотида согласно настоящему изобретению. Репрезентативные зонды и праймеры согласно настоящему изобретению включают такие зонды и праймеры, которые имеют любую из последовательностей, показанную в виде SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 44, SEQ ID NO: 45 и SEQ ID NO: 46, или функциональный фрагмент или вариант любой из SEQ ID NO: 35-46.
В контексте настоящего описания термины "нуклеиновая кислота", "полинуклеотид" и "олигонуклеотид" относятся к дезоксирибонуклеотиду, рибонуклеотиду или смеси дезоксирибонуклеотидного и рибонуклеотидного полимера в одноцепочечной или двухцепочечной форме и, в отсутствие иных ограничений, включают известные аналоги природных нуклеотидов, которые могут функционировать аналогично природным нуклеотидам. Полинуклеотидные последовательности включают последовательность цепи ДНК, которая может транскрибироваться в РНК, и цепи РНК, которая может транслироваться в белок. В область настоящего изобретения также включается комплементарная последовательность любой рассматриваемой в нем нуклеиновой кислоты, полинуклеотида или олигонуклеотида. Полинуклеотидные последовательности также включают полноразмерные последовательности, равно как и более короткие последовательности, полученные из полноразмерных последовательностей. Настоящее изобретение также включает те полинуклеотиды, которые комплементарны на уровне последовательности рассматриваемым в нем полинуклеотидам. Полинуклеотиды и полипептиды согласно настоящему изобретению могут быть представлены в очищенной форме или в виде выделенного продукта.
В связи с вырожденностью генетического кода, полипептид согласно настоящему изобретению может кодироваться множеством разных полинуклеотидных последовательностей. В работе Левина (1985) приводится таблица, описывающая возможные триплетные кодоны (где U также означает T) и аминокислоты, кодируемые каждым из этих кодонов. Кроме того, специалисты в данной области могут получить альтернативные полинуклеотидные последовательности, кодирующие одни и те же, или по существу одни и те же, полипептиды согласно настоящему изобретению. Указанные вырожденные вариантные и альтернативные полинуклеотидные последовательности охватываются рамками настоящего изобретения. В контексте настоящего описания, использование применительно к последовательностям фразы "по существу одни и те же" относится к таким последовательностям, которые кодируют аминокислотные замещения, делеции, добавления или инсерции и которые физически не меняют функциональную и/или иммуногенную активность полипептида, кодируемого полинуклеотидами согласно настоящему изобретению.
Настоящее изобретение также относится к вариантам полинуклеотидов согласно настоящему изобретению, которые кодируют полипептиды согласно настоящему изобретению. Вариантные последовательности включают такие последовательности, в которых один или несколько нуклеотидов были замещены, делетированы и/или встроены. Нуклеотиды, которые могут замещать природные нуклеотиды в ДНК, содержат фрагмент основания, который включает, без ограничения, инозин, 5-фторурацил, 5-бромурацил, гипоксантин, 1-метилгуанин, 5-метилцитозин и тритилированные основания. Сахарный фрагмент нуклеотида в такой последовательности может быть также модифицирован и включает, без ограничения, арабинозу, ксилулозу и гексозу. Кроме того, адениновые, цитозиновые, гуаниновые, тиминовые и урациловые основания нуклеотидов могут быть модифицированы ацетильной, метильной и/или тиогруппами. Последовательности, содержащие нуклеотидные замещения, делеции и/или инсерции, могут быть получены и проанализированы с использованием стандартных методик, известных в данной области.
Настоящее изобретение также охватывает своими рамками замещение аминокислот, отличных от конкретно указанных примеров или от присутствующих в полипептиде согласно настоящему изобретению, в его природной форме. Так, например, неприродные аминокислоты могут замещать аминокислоты в полипептиде, при условии, что такой полипептид с замещенными аминокислотами сохраняет по существу ту же самую функциональную активность, что и полипептид, в котором аминокислоты не были замещены. Примеры неприродных аминокислот включают, без ограничения, орнитин, цитруллин, гидроксипролин, гомосерин, фенилглицин, таурин, йодтирозин, 2,4-диаминомасляную кислоту, α-аминомасляную кислоту, 4-аминомасляную кислоту, 2-аминомасляную кислоту, γ-аминомасляную кислоту, ε-аминогексаноевую кислоту, 6-аминогексаноевую кислоту, 2-аминоизомасляную кислоту, 3-аминопропионовую кислоту, норлейцин, норвалин, саркозин, гомоцитруллин, цистеиновую кислоту, τ-бутилглицин, τ-бутилаланин, фенилглицин, циклогексилаланин, β-аланин, фтораминокислоты, сконструированные аминокислоты, такие как β-метиламинокислоты, C-метиламинокислоты, N-метиламинокислоты и, в целом, аналоги аминокислот. Неприродные аминокислоты также включают аминокислоты, содержащие дериватизированные боковые группы. Кроме того, любая из аминокислот в белке может быть в D (правовращающей) форме или в L (левовращающей) форме. В область настоящего изобретения также включаются аллельные варианты белковой последовательности полипептида согласно настоящему изобретению.
Аминокислоты могут быть классифицированы, в основном, на несколько классов: неполярные, незаряженные полярные, основные и кислотные аминокислоты. Настоящее изобретение охватывает своими рамками консервативные замещения, в ходе которых полипептид согласно настоящему изобретению содержит аминокислоту одного определенного класса, замещенную другой аминокислотой того же класса, если полипептид, содержащий такое замещение, все еще сохраняет по существу ту же самую функциональную активность, что и полипептид, который не содержит замещения. Полинуклеотиды, кодирующие полипептид, содержащий в своей последовательности одно или несколько аминокислотных замещений, также входят в область настоящего изобретения. В приведенной ниже таблице 11 дан перечень примеров аминокислот, принадлежащих к каждому из указанных классов. Однобуквенные сокращения названий аминокислот определены в таблице 12.
Фрагменты и варианты полипептидов вируса гриппа согласно настоящему изобретению могут быть получены с использованием стандартных методик, известных в данной области, и далее проанализированы на наличие в них функции или иммуногенности с использованием стандартных методик, известных в данной области. Так, например, при анализе фрагментов и/или вариантов полипептида нейраминидазы согласно настоящему изобретению может быть определена его ферментативная активность. Таким образом, любой специалист со средним уровнем знаний в данной области может без труда получить и протестировать фрагменты и варианты полипептида согласно настоящему изобретению, и определить, сохраняет ли указанный фрагмент или вариант активность, в сравнении с полноразмерным полипептидом или полипептидом, который не является вариантом.
Полинуклеотиды и полипептиды, включенные в область настоящего изобретения, могут быть определены в терминах большей идентичности и/или близких диапазонов, в сравнении с конкретно приведенными в настоящем описании последовательностями согласно настоящему изобретению. Идентичность по последовательности в типичном случае выше, чем 60%, предпочтительно, выше, чем 75%, более предпочтительно, выше, чем 80%, и еще более предпочтительно, выше, чем 90%, и может быть даже выше, чем 95%. Идентичность и/или сходство такой последовательности может составлять 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99%, в сравнении с последовательностью, конкретно приведенной в настоящем описании. Если особо не указано иное, приводимый в описании процент идентичности и/или сходства на уровне последовательности двух последовательностей может быть определен с использованием алгоритма Карлина и Альтшуля (Karlin and Altschul (1990)), в модификации Карлина и Альтшуля (Karlin and Altschul (1993)). Указанный алгоритм включен в программы NBLAST и XBLAST, разработанные Альтшулем с соавт. (Altschul et al. (1990)). Поиски в режиме BLAST могут быть осуществлены на основе программы NBLAST, включающей следующие параметры: очки = 100, длина слов = 12, для получения последовательностей с желательным значением процента идентичности по последовательности. Для выравнивания последовательностей по наличию двухцепочечных разрывов, с целью сравнения, может использоваться программа Gapped BLAST, описанная в работе Альтшуля с соавт. (Altschul et al. (1997)). При использовании программ BLAST и Gapped BLAST, могут использоваться заданные параметры соответствующих программ (NBLAST и XBLAST). См. веб-сайт NCBI/NIH.
Настоящее изобретение также относится к таким полинуклеотидным молекулам, которые имеют последовательности, обладающие достаточной степенью гомологии с полинуклеотидными последовательностями, приведенными в качестве примеров в настоящем изобретении, что позволяет им гибридизоваться с каждой из таких последовательностей в условиях стандартной жесткости и в рамках стандартных методик (Maniatis et al., 1982). В контексте настоящего описания, термин "жесткие" условия применительно к гибридизации относится к условиям, в случае которых гибридизация проводится в течение ночи при температуре, которая на 20-25°C ниже температуры плавления (Tm) гибридной ДНК в смеси, включающей 6x SSPE, 5x растворе Денхардта, 0,1% SDS, 0,1 мг/мл денатурированной ДНК. Температура плавления, Tm, описывается приведенной ниже формулой (Beltz et al., 1983):
Tm=81,5°C+16,6 Log[Na+]+0,41(%G+C)-0,61(% формамид)-600/длина дуплекса пар оснований.
Промывку проводят в типичном случае следующим образом:
(1) Два раза при комнатной температуре в течение 15 минут в 1x SSPE, 0,1% ДСН (промывка в условиях низкой жесткости).
(2) Один раз при Tm-20°C в течение 15 минут в 0,2x SSPE, 0,1% ДСН (промывка в условиях умеренной жесткости).
Настоящее изобретение также относится к вирусным белкам и пептидам, кодируемым генами вируса гриппа согласно настоящему изобретению. В одном варианте осуществления настоящего изобретения, указанный вирусный белок представляет собой зрелый белок HA. В конкретном варианте осуществления настоящего изобретения, зрелый белок HA включает одну или несколько следующих особенностей: содержит серин в положении 82; лейцин в положении 221; треонин в положении 327; и/или треонин в положении 482. В репрезентативном варианте осуществления настоящего изобретения, зрелый белок HA содержит аминокислотную последовательность, показанную в виде SEQ ID NO: 33 или SEQ ID NO: 34, или функциональный и/или иммуногенный фрагмент или вариант SEQ ID NO: 33 или SEQ ID NO: 34. В другом варианте осуществления настоящего изобретения, указанный вирусный белок представляет собой белок NA, белок NS, белок PB, белок PA или белок MA. Вирусные белки и пептиды согласно настоящему изобретению могут использоваться для получения антител, которые специфически связываются с указанным белком или пептидом. Вирусные белки и пептиды согласно настоящему изобретению могут также использоваться в качестве иммуногенов и в составе вакцинных композиций.
Настоящее изобретение также относится к композициям и способам, используемым для индукции иммунного ответа против вируса гриппа, обладающего способностью инфицировать организм чувствительного животного-хозяина и вызвать респираторное заболевание. Настоящее изобретение может также использоваться для индукции иммунного ответа против вируса гриппа любого подтипа у чувствительного животного-хозяина. Вирус гриппа может представлять собой, например, вирус HA, подтипа H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 или H16, а также вирус NA, подтипа N1, N2, N3, N4, N5, N6, N7, N8 или N9. В одном варианте осуществления настоящего изобретения, соответствующим подтипом вируса HA является H3 или H5. В другом варианте осуществления настоящего изобретения, соответствующим подтипом вируса NA является N7 или N8. В конкретном варианте осуществления настоящего изобретения, иммунный ответ индуцируется против вируса гриппа подтипа H3N8. В одном варианте осуществления настоящего изобретения, соответствующим животным-хозяином является представитель псовых. Псовые в контексте настоящего изобретения включают диких, содержащихся в зоопарке и домашних собак, таких как волки, койоты и лисы. Псовые в контексте настоящего изобретения также включают собак, в частности, домашних собак, таких как, например, чистокровные и/или помесные собаки, декоративные собаки, служебные собаки, пастушьи собаки, охотничьи собаки, сторожевые собаки, полицейские собаки, гончие собаки и/или лабораторные собаки. В конкретном варианте осуществления настоящего изобретения, животное-хозяин представляет собой домашнюю собаку, такую как борзая. В одном варианте осуществления настоящего изобретения, животному вводят эффективное количество иммуногенной композиции согласно настоящему изобретению, достаточное для индукции иммунного ответа против вируса гриппа согласно настоящему изобретению. Указанный иммунный ответ может представлять собой гуморальный и/или клеточный иммунный ответ. В конкретном варианте осуществления настоящего изобретения, указанный иммунный ответ представляет собой защитную иммунную реакцию, способную предотвратить или минимизировать проявление вирусной инфекции в иммунизированном организме животного-хозяина в течение некоторого периода времени после иммунизации. Таким образом, настоящее изобретение также относится к вакцинным композициям и методам, которые обеспечивают генерирование у вакцинированного животного защитной иммунной реакции против вируса согласно настоящему изобретению.
Как приведено в настоящем описании, вакцинные или иммуногенные композиции согласно настоящему изобретению могут включать бесклеточный полный вирус, включающий аттенуированный или инактивированный вирус, или части такого вируса, в том числе субвирионные частицы (включая субъединичную вакцину, в составе которых вирион подвергают обработке с целью удаления некоторой части или всех вирусных липидов), вирусные белки (включая индивидуальные белки и макромолекулярные комплексы множества белков), полипептиды и пептиды, а также инфицированные вирусом клеточные линии или любое сочетание указанных форм. Вакцинные или иммуногенные композиции, содержащие инфицированные вирусом клеточные линии, могут включать множество клеточных линий, каждая из которых инфицирована другим штаммом вируса.
Вакцинные или иммуногенные композиции согласно настоящему изобретению относятся также к рекомбинантным конструкциям, созданным с использованием вирусного вектора, которые могут включать, например, гены, кодирующие белок HA, белок NA, нуклеопротеин, основной белок полимеразы, кислый белок полимеразы и/или матричный белок вируса гриппа согласно настоящему изобретению. Для использования в рамках настоящего изобретения может рассматриваться любой подходящий вирусный белок, который может быть использован для получения рекомбинантной вектор/вирусной конструкции. Так, например, в композициях и способах настоящего изобретения могут использоваться вирусные векторы, полученные из аденовируса, вируса птичьей оспы, герпесвируса, вируса осповакцины, вируса оспы канареек, вируса оспы насекомых, вируса свиной оспы, вируса лихорадки Западного Нила и других известных в данной области векторов. Рекомбинантные полинуклеотидные векторы, которые кодируют и экспрессируют соответствующие компоненты, могут быть сконструированы с использованием методик, известных в данной области. Кроме того, приведенные в настоящем описании различные вакцинные композиции могут использоваться как по отдельности, так и в сочетании друг с другом. Так, например, при первичных иммунизациях животных могут использоваться рекомбинантные конструкции, построенные на основе векторов, содержащих компоненты одного или многих штаммов, с последующим проведением вторичного бустинга вакцинными композициями, содержащими инактивированный вирус или клеточные линии, инфицированные инактивированным вирусом. Другие протоколы иммунизации с использованием вакцинных композиций согласно настоящему изобретению известны специалистам в данной области и охватываются объемом настоящего изобретения.
Настоящее изобретение также относится к перегруппированному вирусу, включающему по меньшей мере один ген или генный сегмент из вируса гриппа согласно настоящему изобретению, тогда как оставшаяся часть вирусных генов или сегментов генома происходит из другого вируса гриппа согласно настоящему изобретению или из вируса гриппа, отличного от вируса согласно настоящему изобретению. Перегруппированный вирус может быть получен путем генетической реаранжировки нуклеиновой кислоты из донорного вируса гриппа согласно настоящему изобретению с нуклеиновой кислотой реципиентного вируса гриппа, с последующим отбором перегруппированного вируса, который включает нуклеиновую кислоту из вируса-донора. Способы продуцирования и выделения перегруппированного вируса известны в данной области (Fields et al., 1996). В одном варианте осуществления настоящего изобретения, перегруппированный вирус согласно настоящему изобретению включает гены или сегменты генома из вируса гриппа человека, птицы, свиньи или лошади. Перегруппированный вирус согласно настоящему изобретению может включать любо сочетание нуклеиновых кислот из донорного и реципиентного вируса гриппа, при условии, что перегруппированный вирус включает по меньшей мере один ген или генный сегмент из донорного вируса согласно настоящему изобретению. В одном варианте осуществления настоящего изобретения, реципиентный вирус гриппа может представлять собой вирус гриппа лошади.
Природные, рекомбинантные или синтетические полипептиды вирусных белков и их пептидные фрагменты также могут использоваться в качестве вакцинных композиций, в соответствии со способами, предлагаемыми в настоящем изобретении. В одном варианте осуществления настоящего изобретения, вирусные полипептиды, получаемые из множества штаммов, могут быть объединены в составе вакцинной композиции и далее использоваться для вакцинации животного-хозяина. Так, например, в составе одной вакцины могут быть объединены полипептиды, основанные на HA белках, взятых по меньшей мере из двух штаммов вируса гриппа согласно настоящему изобретению. Указанные полипептиды могут быть гомологичны по отношению к одному штамму или могут включать «гибридные», или «химерные» полипептиды, аминокислотная последовательность которых получена из присоединенных или связанных полипептидов, взятых по меньшей мере из двух разных штаммов. Процедуры получения вирусных полипептидов известны в данной области. Так, например, вирусные полипептиды и пептиды могут быть синтезированы с использованием методик твердофазного синтеза (Merrifield, 1963). Вирусные полипептиды и пептиды могут быть также получены с использованием методик рекомбинантных ДНК, в рамках которых полинуклеотидную молекулу, кодирующую вирусный белок или пептид, подвергают экспрессии в клетке-хозяине, такой как бактериальная клетка, дрожжевая клетка или клеточные линии млекопитающих, после чего экспрессированный белок подвергают очистке с использованием стандартных методик, широко применяемых в данной области.
Вакцинные композиции согласно настоящему изобретению включают композиции на основе оголенных нуклеиновых кислот. В одном варианте осуществления настоящего изобретения, нуклеиновая кислота может включать нуклеотидную последовательность, кодирующую белок HA и/или NA из вируса гриппа согласно настоящему изобретению. Способы вакцинации нуклеиновыми кислотами известны в данной области и описаны, например, в патентах США No. 6 063 385 и 6 472 375. Указанная нуклеиновая кислота может иметь форму плазмиды или кассеты генной экспрессии. В одном варианте осуществления настоящего изобретения, рассматриваемая в нем нуклеиновая кислота инкапсулирована в состав липосомы, вводимой в организм животного.
Вакцинные композиции и иммуногены, такие как полипептиды и нуклеиновые кислоты, которые могут использоваться в соответствии с настоящим изобретением, могут поставляться вместе с фармацевтически приемлемым носителем или разбавителем. Соединения и композиции, используемые согласно настоящему изобретению, могут быть изготовлены с использованием известных методов получения фармацевтически полезных композиций. Процессы изготовления композиций подробно описаны во многих источниках, которые хорошо известны специалистам в данной области и доступны для использования. См., например, руководство Ремингтона (Remington’s Pharmaceutical Science by E.W. Martin, Easton Pennsylvania, Mack Publishing Company, 19th ed., 1995), в котором описываются композиции, которые могут использоваться в контексте настоящего изобретения. В основном, композиции согласно настоящему изобретению изготавливают путем объединения эффективного количества иммуногена с приемлемым носителем, с тем чтобы достичь эффективности при введении такой композиции. Композиции, используемые в соответствии с настоящим изобретением, могут быть представлены в виде разнообразных форм. Указанные формы включают, например, твердые, полутвердые и жидкие дозированные формы, такие как таблетки, пилюли, порошки, жидкие растворы или суспензии, суппозитории, растворимые, вводимые инъекцией и инфузией формы, а также распыляемые формы. Предпочтительная форма определяется предполагаемым способом введения и характером терапевтического применения. Предпочтительно, композиции также включают традиционные фармацевтически приемлемые носители и разбавители, известные специалистам в данной области. Примеры носителей или разбавителей, которые могут использоваться вместе с пептидомиметиками, включают, без ограничения, воду солевой раствор, масла, включая минеральное масло, этанол, диметилсульфоксид, желатин, циклодекстраны, стеарат магния, декстрозу, целлюлозу, сахара, карбонат кальция, глицерин, глинозем, крахмал и эквивалентные указанным, носители и разбавители, или их смеси. Композиции на основе иммуногена согласно настоящему изобретению могут также включать суспензию агентов, защитных веществ, замасливателей, буферов, консервантов и стабилизаторов. Для целей введения таких дозировок в направлении проведения желательного терапевтического воздействия, фармацевтические композиции согласно настоящему изобретению могут с успехом включать примерно от 0,1 вес.% до 45 вес.%, и в особенности, от 1 до 15 вес.% одного или нескольких иммуногенов от веса всей композиции, включая носитель или разбавитель.
Вакцинные и иммуногенные композиции согласно настоящему изобретению могут быть изготовлены в соответствии с процедурами, хорошо известными в данной области. Например, в типичном случае вакцину и иммуногены изготавливают в виде инъецируемых форм, например, в виде жидких растворов или суспензий. Вакцину или иммуногены вводят с использованием такого способа, который будет совместим с данной дозированной формой, и в таком количестве, которая будет терапевтически эффективной и иммуногенной для реципиента. Оптимальные дозировки и характер введения, подходящие для конкретной композиции вакцины или иммуногенов, могут быть без труда определены специалистом в данной области.
Пептиды и/или полипептиды согласно настоящему изобретению также могут быть представлены в виде конструкции из множества антигенных пептидов (MAP). Получение конструкций MAP описано в работе Tam (1988). Конструкции MAP включают наличие ядерной матрицы из лизиновых остатков, на основе которой синтезируют множество копий иммуногена (Posnett et al., 1988). Может быть получено множество конструкций MAP, которые содержат одинаковые или разные иммуногены, и введено в составе вакцинной композиции согласно способам настоящего изобретения. В одном варианте осуществления настоящего изобретения, конструкция MAP представлена в объединенной форме вместе с одним или несколькими адъювантами и/или вводится вместе с одним или несколькими адъювантами. Полипептиды из вируса гриппа согласно настоящему изобретению также могут быть получены и далее введены в виде макромолекулярных белковых структур, включающих один или несколько полипептидов. См. публикацию заявки на патент США US2005/0009008, в которой описываются способы получения вирусоподобных частиц в качестве вакцины против вируса гриппа.
В соответствии со способами настоящего изобретения, описываемые в нем вакцинные и иммуногенные композиции вводят в чувствительный организм-хозяин, в типичном случае псовых, и в более типичном случае, домашним собакам, в эффективном количестве и по способу, позволяющему индуцировать защитный иммунитет против последующих провокации или инфекции данного организма-хозяина вирусом. В одном варианте осуществления настоящего изобретения, указанный организм животного-хозяина включает представителя псовых. Псовые включают диких, содержащихся в зоопарке и домашних собак, таких как волки, койоты и лисы. Псовые также включают собак, в частности, домашних собак, таких как, например, чистокровные и/или помесные собаки, декоративные собаки, служебные собаки, пастушьи собаки, охотничьи собаки, сторожевые собаки, полицейские собаки, гончие собаки и/или лабораторные собаки. В конкретном варианте осуществления настоящего изобретения, животное-хозяин представляет собой домашнюю собаку, такую как борзая. Вакцины или иммуногены в типичном случае вводят парентерально, путем инъекции, например, подкожно, внутрибрюшинно или внутримышечно. Другие подходящие способы введения включают пероральное или назальное введение. Обычно, вакцины и иммуногены вводят животному по меньшей мере два раза, с интервалом между введениями в одну или несколько недель. Однако, в изобретении рассматриваются также другие режимы начального и бустерного введения вакцины или иммуногенов, выбор которых может определяться решением соответствующего специалиста, с учетом конкретного организма-хозяина, подлежащего лечению.
Вирус и инфицированные вирусом клетки в составе вакцинной композиции могут быть инактивированы или ослаблены с использованием известных в данной области способов. Например, целый вирус и инфицированные вирусом клетки могут быть инактивированы или ослаблены за счет воздействия на них параформальдегида, формалина, фенола, УФ облучения, повышенной температуры и т.п. Количество бесклеточного целого вируса в дозе вакцины обычно варьирует в диапазоне от примерно 0,1 мг до примерно 5 мг, и чаще, составляет от примерно 0,2 мг до примерно 2 мг. Дозировки вакцинных композиций, включающих клеточные линии, инфицированные вирусом, обычно содержат от примерно 106 до примерно 108 клеток на дозу, и чаще, от примерно 5 × 106 до примерно 7,5 × 107 клеток на дозу. Количество белкового или пептидного иммуногена, содержащегося в дозе для одного животного, может варьировать примерно от 0,1 мкг до 10000 мкг или примерно от 1 мкг до 5000 мкг, или примерно от 10 мкг до 1000 мкг, или примерно от 25 мкг до 750 мкг, или примерно от 50 мкг до 500 мкг, или от 100 мкг до 250 мкг, в зависимости от размера, возраста и других характеристик животного, получающего дозу.
Иммуногенная или вакцинная композиция согласно настоящему изобретению, такая как композиция на основе вируса или клеток, инфицированных вирусом, или вирусных белков или пептидов, может быть объединена с адъювантом, что обычно делают перед введением. Адъюванты, которые могут рассматриваться как подходящие для использования в вакцинных композициях, включают треонилмурамильный дипептид (MDP) (Byars et al., 1987), сапонин, агент на основе Corinebacterium parvum, полный и неполный адъюванты Фрейнда, глинозем или смесь любых из указанных агентов. В настоящем изобретении рассматривается также множество других адъювантов, подходящих для использования в сочетании с методами и вакцинами согласно настоящему изобретению, хорошо известные в данной области, такие как глинозем.
Настоящее изобретение также относится к антителам, которые способны специфические связываться с белком или пептидом согласно настоящему изобретению. Антитела согласно настоящему изобретению включают композиции на основе моноклональных и поликлональных антител. Предпочтительно, антитела согласно настоящему изобретению представляют собой моноклональные антитела. В настоящем изобретении рассматриваются как полные антитела, так и их антиген-связывающие фрагменты. В этой связи, например, подходящие антиген-связывающие фрагменты включают Fab2, Fab и Fv антительные фрагменты. Антитела согласно настоящему изобретению могут быть мечены детектируемым фрагментом, таким как флуоресцентная молекула (например, флуоресцеин или фермент).
Настоящее изобретения также относится к способам и композициям, используемым для детекции и идентификации вируса гриппа согласно настоящему изобретению и для диагностики наличия у животного инфекции вирусом гриппа согласно настоящему изобретению. Способы согласно настоящему изобретению включают детекцию наличия гриппа собак в биологическом образце, взятом у животного. Детекция гриппа собак в образце используется для диагностики собачьего гриппа у животного. В свою очередь, эта информация может позволить сделать прогноз развития заболевания у животного, на основе оценки характерных уровней прогрессирования собачьего гриппа с течением времени и стать подспорьем в выборе терапевтических агентов и методов лечения животного, а также использоваться при мониторинге проводимой терапии. Данный способ также позволяет установить отсутствие собачьего гриппа у исследуемого животного.
Возможность выявления собачьего гриппа у животного позволит проводить оценку вспышек заболеваемости собачьим гриппом в разных географических областях. Такого рода информация также поможет в достижении ранней детекции, так что в этом случае инфицированные животные могут быть вовремя изолированы, что будет способствовать ограничению распространения заболевания, а также позволит провести более ранние соответствующие терапевтические процедуры. Кроме того, такая информация, в случае ее доступности, может стать основой для организации и отправки медицинского персонала, готового лечить большое число больных животных, включая подготовку продукции и устройств медицинского назначения, и, при необходимости, вакцин.
В одном варианте осуществления настоящего изобретения, рассматриваемый в нем способ включает отбор биологического образца из организма исследуемого животного, такого как собака. Биологический образец может представлять собой любой биологический материал, включающий клетки, ткань, волосы, цельную кровь, сыворотку, плазму, аспират из соска, лаваж легких, цереброспинальную жидкость, слюну, пот и слезы.
Исследуемый образец животного может быть взят от животного, в отношении которого подозревается наличие инфекции вирусом собачьего гриппа, независимо от того, проявляются ли у животного симптомы этого заболевания. Могут быть также получены или собраны контрольные образцы от тех животных, в отношении которых известно, что они не имеют собачьего гриппа. Могут быть также использованы дополнительные контроли, например, с целью снижения риска ложных и отрицательных результатов, а также для подтверждения того, что используемые в тесте реагенты активны по выявлению вируса собачьего гриппа типа А.
В дополнение к выявлению наличия или отсутствия собачьего гриппа в биологическом образце, методы детекции, используемые в настоящем изобретении, могут выявлять мутации в вирусе собачьего гриппа, такие как изменения в последовательности нуклеиновой кислоты, которые могут быть следствием воздействия условий окружающей среды, лечения лекарственными препаратами, генетических манипуляций или мутаций, поражения, изменений в режиме питания, возраста или любых других одной или нескольких характеристик животного. Мутации могут также приводить к тому, что вирус собачьего гриппа A становится резистентным к тому лекарственному веществу, которое раньше было эффективным, или которые будут позволять вирусу инфицировать и размножаться в другом виде животного или в организме человека. Например, было показано, что вирус птичьего гриппа A становится способным инфицировать других животных и людей.
В одном варианте детекции вируса гриппа в организме животного согласно настоящему изобретению, диагностика облегчается за счет отбора образцов высокого качества, их быстрой транспортировки к месту анализа, а также за счет создания соответствующих условий хранения, до лабораторного исследования. Вирус выявляется лучше всего в образцах, содержащих инфицированные клетки и их секреты. В одном варианте осуществления настоящего изобретения, образцы для непосредственного выявления вирусных антигенов и/или нуклеиновых кислот и/или вирусных изолятов в клеточных культурах, отбирают в течение первых 3 дней после появления первых клинических симптомов. Приемлемо множество разных типов образцов для целей диагностики вирусных инфекций верхних дыхательных путей, включающих, без ограничения, назальный мазок, носоглоточный мазок, носоглоточный аспират, назальную промывку и мазок из горла. Кроме отбора мазков, могут быть отобраны образцы ткани или сыворотки, а также могут проводиться инвазивные процедуры.
В одном варианте осуществления настоящего изобретения, респираторные образцы отбирают и переносят в 1-5 мл среды для переноса вируса. Коммерчески доступно большое число сред, которые подходят для восстановления множества вирусов. К среде для переноса добавляют клинические образцы. Назальные или носоглоточные мазки также могут транспортироваться в среде для переноса вирусов. Один из примеров среды для переноса включает среду, содержащую 10 г телячьего инфузионного бульона и 2 г бычьего альбумина, фракция V, доведенную стерильной дистиллированной водой до объема 400 мл. К среде могут быть добавлены антибиотики, такие как 0,8 мл раствора сульфата гентамицина (50 мг/мл) и 3,2 мл амфотерицина B (250 мкг/мл). Среду предпочтительно стерилизуют фильтрованием. Назальные промывные жидкости, такие как полученные в стерильном солевом растворе (0,85% NaCl), также могут использоваться для целей отбора респираторных образцов с целью оценки наличия в них вирусов.
В одном варианте осуществления настоящего изобретения, сыворотки собирают в количестве, соответствующем 1-5 мл цельной крови от животного в острой фазе заболевания, вскоре после появления клинических симптомов и предпочтительно не позже, чем через 7 дней. Может быть также отобран образец сыворотки в фазе выздоровления, например, по прошествии приблизительно 14 дней после появления симптомов заболевания. Образцы сыворотки могут использоваться для выявления антител против респираторных вирусов в тесте на нейтрализацию.
В некоторых случаях, образцы могут быть отобраны от индивидуальных животных в течение некоторого периода времени (например, с периодичностью один раз в день, один раз в неделю, один раз в месяц, один раз в два года или ежегодно). Различные образцы, полученные от индивидуального животного в течение определенного периода времени, могут использоваться для подтверждения результатов более ранних детектирующих тестов и/или для идентификации реакции или резистентности в ответ на конкретное лечение, например, в ответ на выбранный терапевтический препарат.
Способы согласно настоящему изобретению могут использоваться для детекции наличия одного или нескольких патологических агентов в исследуемом образце от животного и для определения уровня каждого такого патологического агента. При этом может использоваться любой способ детекции патологического агента, включающий, без ограничения, антительные тесты, в том числе тесты на основе иммуноферментного твердофазного анализа (ELISA), тесты, основанные на непрямой флуоресценции антитела (IFA), тесты с использованием реакции гемагглютинации и тесты, основанные на ингибировании реакции гемагглютинации (HI), а также вестерн-блот анализ. Могут также использоваться известные методы культивирования клеток. Положительные по нужному признаку культуры могут быть далее идентифицированы с использованием феномена флуоресценции клеточных культур или на основе HI анализа среды для клеточной культуры (супернатанта).
Кроме того, могут использоваться методы детекции нуклеиновой кислоты (ДНК или РНК) или белка. Такие методы включают, без ограничения, полимеразно-цепную реакцию (ПЦР) и тесты на основе ПЦР с обратной транскриптазой (ОТ), а также тесты в масштабе реального времени и количественные тесты по нуклеазной защите. Имеются коммерчески доступные наборы, подходящие для проведения указанных видов тестирования. Так, например, компания QIAGEN (Valencia, CA) продает набор для проведения одностадийного тестирования в рамках реакции ОТ-ПЦР, а также набор для экстрагирования вирусной РНК.
В одном варианте осуществления настоящего изобретения, данный метод включает использование антитела, специфичного для вируса или вирусного белка согласно настоящему изобретению. В конкретном варианте осуществления настоящего изобретения, используют антитело, специфичное для белка HA из вируса согласно настоящему изобретению. В другом варианте осуществления настоящего изобретения, используют антитело, специфичное для белка NP из вируса согласно настоящему изобретению. При этом из организма животного отбирают подходящий образец, например, из назальной или носоглоточной области, и выделяют из него вирус или вирусный белок. Далее вирусные компоненты подвергают скринингу для оценки их способности связываться с антителом, специфичным для белка, таким как HA или NP, из вируса согласно настоящему изобретению. В другом варианте осуществления настоящего изобретения, из организма животного отбирают сыворотку (или другой антитело-содержащий образец) и далее сыворотку подвергают скринингу для выявления наличия антитела, которое связывается с белком из вируса согласно настоящему изобретению. Так, например, может быть проведен тест ELISA, в рамках которого ячейки планшета содержат белок HA и/или NP, или их пептид, связанные с ячейкой. Затем ячейки в планшете подвергают контакту с сывороткой или антителом из исследуемого организма. Наличие антитела в организме животного, которое специфически связывается с белком HA и/или NP, является показателем того, что исследуемое животное инфицировано вирусом гриппа согласно настоящему изобретению.
В одном варианте осуществления настоящего изобретения, наличие патологического агента выявляется посредством определения наличия или отсутствия в биологическом образце антител против данного агента. Этот процесс может потребовать некоторого времени (например, месяцы) после инфицирования животного и перед выявлением антител при анализе крови. Однако, после своего появления, антитела обычно персистируют в течение многих лет, даже если заболевание было успешно излечено. Обнаруженные антитела против вируса собачьего гриппа A необязательно следует рассматривать как указание на то, что инфекция была недавно, поскольку они могут относиться к инфекции, имевшей место в прошлом.
Анализ на наличие антител может быть также выполнен в одной или нескольких жидкостях в качестве образца. Тесты для выявления антител включают тесты на основе иммуноферментного твердофазного анализа (ELISA), тесты, основанные на непрямой флуоресценции антител (IFA), а также вестерн-блот анализ. Предпочтительно, анализ на наличие антител проводят с использованием для этого множества тестов, например, ELISA или IFA, с последующим проведением вестерн-блоттинга. Тесты на наличие антител могут быть выполнены в рамках двустадийного процесса, с проведением вначале ELISA или IFA анализов и затем вестерн-блоттинга. ELISA считается более достоверным и точным методом, чем IFA, однако, IFA может использоваться в тех случаях, кода выполнение анализа ELISA по каким-либо причинам недоступно. Вестерн-блот анализ (представляющий собой более специфичный тест) может проводиться на всех животных, в особенности на тех из них, у которых по результатам ELISA или IFA анализов были получены позитивные или погранично-позитивные (неоднозначные) результаты.
Другие основанные на антителах тесты, которые могут использоваться для выявления вируса гриппа, включают тесты на ингибирование реакции гемагглютинации. Активность в реакции гемагглютинации может быть выявлена в биологическом образце, отобранном из организма животного, с использованием эритроцитов кур или индейки, как описано в литературе (Burleson et al., 1992; и Kendal et al., 1982). В одном варианте осуществления настоящего изобретения, вирус гриппа или белок HA или пептид согласно настоящему изобретению подвергают контакту с исследуемым образцом, содержащим сыворотку или антитело. Добавляют эритроциты (RBC), взятые от животного, такого как птица. Если имеется антитело против HA, то RBC не агглютинируют. Если антитело к HA не присутствует, то RBC будут агглютинировать в присутствии HA. В данной области известны вариации и модификации стандартного теста на ингибирование реакции агглютинации, которые охватываются областью настоящего изобретения.
Инфекция у животного может быть также установлена путем выделения вируса из образца, такого как назальный или носоглоточный мазок. Выделение вируса может быть осуществлено с использованием стандартных методов, включающих культивирование клеток и инокуляцию яйца.
В другом варианте осуществления настоящего изобретения, может быть использован тест на основе нуклеиновой кислоты для детекции вируса согласно настоящему изобретению. В одном варианте осуществления настоящего изобретения, получают образец нуклеиновой кислоты из организма животного, и нуклеиновую кислоту подвергают реакции ПЦР с использованием праймеров, способных генерировать продукт амплификации, если нуклеиновая кислота содержит последовательность, специфичную для вируса гриппа согласно настоящему изобретению. В конкретном варианте осуществления настоящего изобретения, в тесте для оценки наличия целевого вируса используют ОТ-ПЦР. В репрезентативном варианте осуществления настоящего изобретения, используют ОТ-ПЦР в масштабе реального времени для оценки наличия вируса гриппа согласно настоящему изобретению. Методы, основанные на проведении ПЦР, ОТ-ПЦР и ПЦР в масштабе реального времени, известны в данной области и описаны в патентах США No. 4 683 202; 4 683 195; 4 800 159; 4 965 188; 5 994 056; 6 814 934; и в работах Saiki et al. (1985); Sambrook et al. (1989); Lee et al. (1993); и Livak et al. (1995). В одном варианте осуществления настоящего изобретения, в тесте на основе ПЦР используют олигонуклеотиды, специфичные для матричного гена (MA) и/или гена HA из вируса гриппа. Продукт амплификации может быть подвергнут секвенированию для определения, содержит ли данный продукт последовательность из вируса гриппа согласно настоящему изобретению. Другие основанные на нуклеиновых кислотах тесты могут использоваться для детекции и диагностики вирусной инфекции, вызванной вирусом согласно настоящему изобретению, и такие тесты охватываются областью настоящего изобретения. В одном варианте осуществления настоящего изобретения, образец, содержащий нуклеиновую кислоту, подвергают реакции амплификации по методу ПЦР с использованием прямых и обратных праймеров, где указанные праймеры специфичны для полинуклеотида или генной последовательности вируса. Если нуклеиновая кислота в данном образце представлена РНК, то проводят реакцию ОТ-ПЦР. Для проведения ПЦР в масштабе реального времени с праймерами используют выявляемый зонд.
Наборы праймеров, специфичных для гена гемагглютинина (HA) из многих циркулирующих вирусов гриппа, известны и постоянно разрабатываются. Геном вируса гриппа представлен одноцепочечной РНК, и должна быть получена копия ДНК (кДНК) с использованием полимеразы обратной транскриптазы (ОТ). Реакция амплификации геномной РНК, например, с использованием ОТ-ПЦР, требует наличия пары олигонуклеотидных праймеров, обычно разрабатываемых на основе известной последовательности HA из вируса гриппа, подтипа A, и нейраминидазы (NM)-1. Соответствующие праймеры могут быть отобраны таким образом, что они будут специфически амплифицировать РНК только одного подтипа вируса. ДНК, генерируемые при использовании праймеров, специфичных для определенного подтипа, могут быть далее проанализированы в рамках молекулярно-генетических методик, таких как секвенирование. Данный тест проводят, предпочтительно, с включением в него позитивного контроля, или идентичность продуктов подтверждают путем их секвенирования и сравнения с известными последовательностями. Отсутствие целевых продуктов ПЦР (т.е. "отрицательный" результат) необязательно исключает наличие вируса. Результаты могут быть получены позже, через несколько часов, когда станут доступны данные анализа клинических мазков или инфицированных клеточных культур. Тесты на основе ПЦР и ОТ-ПЦР для вируса гриппа А описаны в работах Fouchier et al., 2000 и Maertzdorf et al., 2004.
Настоящее изобретении также относится к методам скрининга соединений или лекарственных агентов, которые обладают антивирусной активностью против вируса согласно настоящему изобретению. В одном варианте осуществления настоящего изобретения, клетки, инфицированные вирусом согласно настоящему изобретению, подвергают контакту с исследуемым соединением или лекарственным агентом. Затем определяют количество вируса или вирусную активность после такого контакта. Те соединения или лекарственные агенты, которые демонстрируют противовирусную активность, могут быть отобраны для дальнейшей оценки.
Настоящее изобретение также относится к выделенным клеткам, инфицированным вирусом гриппа согласно настоящему изобретению. В одном варианте осуществления настоящего изобретения, указанная клетка представляет собой клетку собаки, например, эпителиальные клетки почки собаки.
Настоящее изобретение также относится к клеткам, трансформированным полинуклеотидом согласно настоящему изобретению, кодирующим полипептид согласно настоящему изобретению. Предпочтительно, полинуклеотидная последовательность входит в экспрессирующую конструкцию согласно настоящему изобретению. Более предпочтительно, экспрессирующая конструкция обеспечивает суперэкспрессию в клетке оперативно связанного полинуклеотида согласно настоящему изобретению. В одном варианте осуществления настоящего изобретения, клетку трансформируют полинуклеотидной последовательностью, включающей последовательность, кодирующую аминокислотную последовательность, показанную в виде любой из последовательностей SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, или ее функциональный фрагмент или вариант. В конкретном варианте осуществления настоящего изобретения, клетку трансформируют полинуклеотидом, кодирующим аминокислотную последовательность, показанную в виде SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, который включает нуклеотидную последовательность, показанную в виде SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77, соответственно, или последовательность, кодирующую функциональный фрагмент или вариант любой из SEQ ID No: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78. Таким образом, настоящее изобретение относится к клеткам, трансформированным полинуклеотидной последовательностью, включающей нуклеотидную последовательность, показанную в виде любой из SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77, или фрагмент или вариант, включая дегенеративный вариант, любой из SEQ ID No: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77.
Трансформированная клетка может представлять собой эукариотическую клетку, например, растительную клетку, включая протопласты, или трансформированная клетка может быть прокариотической клеткой, например, бактериальной клеткой, такой как E. coli или B. subtilis. Клетки животных включают человеческие клетки, клетки других млекопитающих, частично клетки собаки, клетки птиц и клетки насекомых. Растительные клетки включают, без ограничения, клетки двудольных, однодольных и хвойных растений.
Настоящее изобретение также относится к растениям, включая трансгенные растения, которые экспрессируют и продуцируют вирусный белок или полипептид согласно настоящему изобретению. Растения, растительные ткани и растительные клетки, трансформированные или выращенные таким образом, что они будут содержать полинуклеотид согласно настоящему изобретению, охватываются областью настоящего изобретения. Предпочтительно, полинуклеотид согласно настоящему изобретению подвергается суперэкспрессии в растении, растительной ткани или растительной клетке. Растения могут использоваться для получения противовирусных вакцинных композиций согласно настоящему изобретению и далее такие вакцины могут вводиться в организм при употреблении в пищу этих растений (см., например, патенты США No. 5 484 719 и 6 136 320).
Настоящее изобретение также относится к наборам для выявления вируса или для диагностики инфекции вирусом согласно настоящему изобретению. В одном варианте осуществления настоящего изобретения, набор включает антитело согласно настоящему изобретению, которое специфически связывается с вирусом гриппа согласно настоящему изобретению или с его антигенной частью. В другом варианте осуществления настоящего изобретения, набор включает один или несколько полипептидов или пептидов согласно настоящему изобретению. В конкретном варианте осуществления настоящего изобретения, указанные полипептиды имеют аминокислотную последовательность, показанную в виде любой из SEQ ID No. 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 33, 34, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 или 78, или их функциональный и/или иммуногенный фрагмент или вариант. В еще одном варианте осуществления настоящего изобретения, набор включает один или несколько полинуклеотидов или олигонуклеотидов согласно настоящему изобретению. В конкретном варианте осуществления настоящего изобретения, указанные полинуклеотиды имеют нуклеотидную последовательность, показанную в виде любой из SEQ ID No. 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 или 77, или их фрагмент или вариант. Набор может необязательно включать одно или несколько контрольных антител, контрольный полипептид или пептид и/или контрольный полинуклеотид или олигонуклеотид. Антитело, полипептиды, пептиды, полинуклеотиды и/или олигонуклеотиды в наборе могут быть введены в подходящий контейнер или соответствующую упаковку.
Настоящая заявка также относится к использованию помесных собак в качестве модели для оценки инфекции и патогенеза заболевания, вызванного вирусом гриппа. В одном варианте осуществления настоящего изобретения, помесной собаке инокулируют вирус гриппа, такой как вирус собачьего гриппа согласно настоящему изобретению. Необязательно, указанной собаке после инокуляции также вводят терапевтические агенты. Дополнительно, данной собаке, перед инокуляцией вирусом, может быть также введена композиция, которая вызывает иммунный ответ против вируса гриппа. Образцы ткани, крови, сыворотки и других биологических материалов могут быть отобраны до и/или после инокуляции, после чего устанавливают наличие вируса и исследуют протекающий в ткани патогенез с использованием известных методик, включающих, без ограничения, ПЦР, ОТ-ПЦР, секвенирование нуклеиновой кислоты и иммуногистохимический анализ.
Любой элемент любого из раскрытых в настоящем описании вариантов осуществления настоящего изобретения может быть объединен с любым другим элементом или вариантом, приведенных в данной заявке, и такие сочетания специфически охватываются областью настоящего изобретения.
Все патенты, патентные заявки, предварительные заявки и публикации, относящиеся к данному описанию или процитированные в указанных материалах, включены в настоящее описании полностью, включая все чертежи и таблицы, в той мере, в какой они соответствуют тематике настоящего изобретения и помогают прояснить его описание.
МАТЕРИАЛЫ И МЕТОДЫ, ОТНОСЯЩИЕСЯ К ПРИМЕРАМ 1-6
Отбор образцов крови и назальных мазков у борзых собак
Образцы крови в острый период заболевания и на стадии выздоровления отбирают путем венопункции яремной вены у борзых с клиническими признаками заболевания или у нормальных борзых, находящихся в конурах в период скачек, где выявлены вспышки респираторного заболевания. Образцы, рассматриваемые как образцы со стадии выздоровления, отбирают через 4-12 недель после отбора образца в острой стадии. Получают сыворотку и хранят ее при температуре -80°C. Собирают назальные мазки и помещают их в среду для транспортировки Amies, содержащую древесный уголь (Becton Dickinson Biosciences), с тем, чтобы эти образцы использовать далее для выделения бактерий.
Посмертное обследование борзых
Полное посмертное обследование было проведено в отделе анатомии и патологии Колледжа ветеринарной медицины при Университете во Флориде (Anatomic Pathology Service at the University of Florida College of Veterinary Medicine (UF CVM)) на 5 из 8 собак, которые умерли в январе 2004 г. при вспышке заболевания на соревнованиях во Флориде. Посмертный осмотр другой собаки был проведен в частной ветеринарной клинике в ходе анализа по программе UF CVM для постановки гистопатологического диагноза. Ткани фиксировали в 10% нейтральном забуференном растворе формалина, погруженном в парафин, и срезы толщиной по 5 мкм окрашивали либо гематоксилином, либо эозином, для постановки гистопатологического диагноза, или подвергали обработке с целью подготовки к проведению иммуногистохимического анализа по процедуре, описанной ниже. Нефиксированные ткани подвергают культивированию для оценки бактериального роста и далее также хранят при температуре -80°C.
Серологические тесты для оценки вирусных патогенов, вызывающих респираторное заболевание у собак
Образцы сыворотки крови, полученные в острый период заболевания и на стадии выздоровления, попарно, подвергают анализу в лаборатории диагностики заболеваний животных (Animal Health Diagnostic Laboratory (AHDL)) в Колледже ветеринарной медицины при Корнельском Университете (Cornell University College of Veterinary Medicine) в рамках проведения тестов на способность сыворотки к нейтрализации вируса собачьей чумы, аденовируса типа 2 и вируса парагриппа. Титры антител выражают в виде последнего разведения сыворотки, которое еще ингибирует вирусную инфекцию в клеточных культурах. Сероконверсия, определяемая как ≥ 4-кратное повышение титра антител между образцами, отобранными в остром периоде заболевания и на стадии выздоровления, указывает на наличие вирусной инфекции. Однако, применительно к указанных вирусным патогенам сероконверсия не была выявлена.
Микробные тесты, используемые для анализа бактериальных патогенов, вызывающих респираторное заболевание
Образцы назальных мазков и тканей для посмертного анализа, попарно, направляют в Центр Диагностической Клинической Микробиологии/Паразитологии/Серологии (Diagnostic Clinical Microbiology/Parasitology/Serology Service) в UF CVM для выделения из них бактерий и последующей идентификации. Полученные образцы культивируют на неселективных средах, а также на средах, специфичных для видов Bordetella (Regan-Lowe; Remel) и видов Mycoplasma (Remel). Все культуры выдерживают в течение 21 дня для того, чтобы сделать вывод об отсутствии роста. Назальные мазки, отобранные от некоторых борзых, также направляют в Отдел Диагностической Медицины/Патобиологии Колледжа ветеринарной медицины при Канзасском Государственном Университете (Department of Diagnostic Medicine/Pathobiology at the Kansas State University College of Veterinary Medicine) для культивирования с целью оценки роста бактерий. Из 70 исследованных собак с клиническими признаками заболевания, Bordetella bronchiseptica была выделена из полости носа у 1 собаки, тогда как виды Mycoplasma spp. были выделены из полости носа у 33 собак. Pasteurella multocida обычно выделяется из носовой полости собак с гнойными выделениями из носа. У двух собак, умерших во время вспышки заболевания в январе 2004 г., отмечался очень слабый рост Escherichia coli в посмертных образцах легких, у одной собаки отмечался очень слабый рост E. coli и Streptococcus canis, и у другой собаки отмечался также очень слабый рост Pseudomonas aeruginosa и дрожжевых форм. Ни Bordetella bronchiseptica, ни Mycoplasma не были выделены из трахей или легких умерших собак.
Выделение вируса из посмертных образцов тканей
Замороженные ткани оттаивают и гомогенизируют в 10 объемах минимальной основной среды (MEM) с добавкой 0,5% бычьего сывороточного альбумина (БСА) и антибиотиков. Твердые клеточные остатки удаляют центрифугированием, и супернатанты инокулируют в культивируемые клетки или в куриные яйца с 10-дневными эмбрионами. Тканевые гомогенаты от умерших борзых инокулируют в различные клеточные культуры, которые поддерживают репликацию большого числа вирусных патогенов. Используемые клеточные культуры включают клетки Vero (эпителиальные клетки из почки Африканской зеленой мартышки, ATCC No. CCL-81), A-72 (фибробласты из опухолевой ткани собаки, CRL-1542), HRT-18 (эпителиальные клетки из прямой кишки человека, CRL-11663), MDCK (эпителиальные клетки из почки собаки, CCL-34), первичные эпителиальные клетки из почки собаки (AHDL, Cornell University), первичные эпителиальные клетки из легкого собаки (AHDL) и первичные тестикулярные клетки быка (AHDL). Клетки MDCK и HRT культивируют в среде MEM с добавкой 2,5 мкг/мл TPCK, обработанного трипсином (Sigma); оставшиеся клеточные линии культивируют в среде MEM с добавкой 10% фетальной сыворотки теленка и антибиотиков. Клетки растят в колбах объемом 25 см2 при температуре 37°C в увлажненной атмосфере с содержанием 5% CO2. В контрольную культуру инокулируют среду MEM с добавками. Рост культур оценивают ежедневно с точки зрения появления морфологических изменений и собирают на 5 день после инокуляции. Собранные жидкости и клетки осветляют путем центрифугирования и инокулируют в свежие клетки по той же процедуре, которая была описана выше применительно к начальной инокуляции; в тест вводят два слепых пассажа. Гемагглютинирующую активность в осветленных супернатантах определяют с использованием эритроцитов курицы или индейки, как описано в литературе (Burleson et al., 1992; Kendal et al., 1982). Для выделения вируса из куриных эмбрионов, 0,1 мл тканевого гомогената инокулируют в аллантоиновый мешок с последующей инкубацией в течение 48 часов при температуре 35°C. После двух слепых пассажей, определяют гемагглютинирующую активность в аллантоиновых жидкостях, по описанной в литературе процедуре (Burleson et al., 1992; Kendal et al., 1982).
ОТ-ПЦР, нуклеотидное секвенирование и филогенетический анализ
Суммарную РНК экстрагируют из супернатанта культуры ткани или из аллантоиновой жидкости с использованием набора RNeasy (Qiagen, Valencia, CA), в соответствии с инструкциями производителя. Суммарную РНК (10 нг) подвергают обратной транскрипции до кДНК с использованием набора для одностадийной реакции ОТ-ПЦР (Qiagen, Valencia, CA), в соответствии с инструкциями производителя. Амплификацию по методу ПЦР кодирующей области 8 генов из вируса гриппа проводят по ранее описанной методике (Klimov et al., 1992a) с использованием универсальных наборов ген-специфических праймеров. Полученные ампликоны ДНК используют в качестве матриц для автоматизированного секвенирования на автоматическом секвенаторе ДНК Applied Biosystems 3100 по процедуре секвенирования, в сочетании с окрашиванием красителем в конце цикла (ABI). Нуклеотидные последовательности анализируют с использованием пакета прикладных программ GCG Package© версия 10.0 (Accelyrs) (Womble, 2000). Используют также пакет программ Phylogeny Inference Package© версия 3.5 для оценки филогенетических взаимосвязей и расчета показателей, полученных по методу «расшнурованной выборки» на основе данных нуклеотидных последовательностей (Felsenstein, 1989). Построенные филогенетические деревья сравнивают с деревьями, полученными при анализе по методу анализа ближайших соседей с использованием Tamura-Nei-гамма модели, встроенной в программу MEGA© (Kumar et al., 2004), и подтверждают полученные результаты с использованием программы PAUP© 4.0 Beta (Sinauer Associates).
Эксперименты, включающие инокуляцию собакам
Используют четырех 6-месячных, конкретно подтвержденных как не содержащие патогенов собак бигль [2 самца и 2 самки (Liberty Research)]. Физический осмотр и анализ крови на базовом уровне, включая результаты полного/дифференциального подсчета клеток крови, анализа панели для оценки химических показателей сыворотки, и анализ мочи показывают, что животные были здоровы. Животных поместили вместе в устройство BSL, одобренное Ассоциацией по контролю за содержанием животных, подвергающихся лабораторным экспериментам (Association for Assessment and Accreditation of Laboratory Animal Care). Базовый уровень ректальных температур регистрируют два раза в день в течение 7 дней. Собак подвергают анестезии путем внутривенного введения пропофола (Diprivan®, Zeneca Pharmaceuticals, 0,4 мг/кг веса тела) для интубации эндотрахеальными трубками. Каждой собаке инокулируют суммарную дозу 106,6 средних цитопатогенных доз для культуры тканей (TCID50) вируса A/Canine/Florida/43/2004 (Canine/FL/04) (H3N8), при этом половину дозы вводят в дистальную трахею через эндотрахеальную трубку, а другую половину вводят глубоко в носовой проход с помощью катетера. Физический осмотр и регистрацию ректальной температуры проводят два раза в день в течение 14 дней после инокуляции (p.i.). Образцы крови (по 4 мл) отбирают венопункцией яремной вены в дни 0, 3, 5, 7, 10 и 14 после инокуляции. Назальные и орофарингеальные образцы отбирают с помощью полиэфирных тампонов (Fisher Scientific) от каждой собаки в дни 0-5, 7, 10 и 14 после инокуляции. Тампоны помещают в среды для транспортировки вируса (Remel) и хранят при температуре -80°C. Две собаки (1 самец и 1 самка) были подвергнуты эвтаназии путем внутривенной инокуляции раствора Beuthanasia-D® solution (1 мл/5 кг веса тела; Schering-Plough Animal Health Corp) в 5 день после инокуляции, а оставшихся 2 собак подвергли эвтаназии на 14 день, для посмертного исследования образцов. Ткани для гистологического анализа были подвергнуты обработке по описанной выше процедуре. Ткани для культивирования вирусов хранят при температуре -80°C. Данное исследование было разрешено Комитетом по контролю за обращением с лабораторными животными при Университете Флориды (University of Florida Institutional Animal Care and Use Committee).
Рассеивание вируса от животных, инокулированных в ходе эксперимента
Серийные разведения гомогенов легких и экстрактов тампонов, полученных путем осветления при проведении центрифугирования сред для транспортировки тампонов, проводят в среде MEM с добавкой 0,5% БСА и антибиотиков. Проводят тест на бляшкообразование, как описано в литературе (Burleson et al., 1992), с использованием монослойных клеток MDCK в 6-ячеечных планшетах для культуры тканей. На инокулированные монослои клеток наслаивают среду MEM с добавками, включающими 0,8% агарозы и 1,5 мкг/мл TPCK-трипсина. Клетки культивируют в течение 72 часов при температуре 37°C в увлажненной атмосфере, содержащей 5% CO2, перед фиксацией и окрашиванием кристаллическим фиолетовым. Концентрацию вируса выражают в виде бляшкообразующих единиц (БОЕ) на грамм ткани или на тампон.
Иммуногистохимия
Депрафинизированные и регидратированные срезы из ткани легкого толщиной по 5 мкм, отобранные от борзых и собак бигль, вносят на предметные стекла Bond-Rite™ (Richard-Allan Scientific, Kalamazoo, MI) и затем обрабатывают протеиназой K (DakoCytomation, Carpenteria, CA), с последующей обработкой реагентом, блокирующим пероксидазу (Dako® EnVision™ Peroxidase Kit, Dako Corp.). Срезы инкубируют со взятыми в разведении 1:500 моноклональных антител против вируса чумы собак (VMRD, Inc.), аденовируса собак, типа 2 (VMRD, Inc.), вируса парагриппа собак (VMRD, Inc.) или вируса гриппа A H3 (Chemicon International, Inc.) в течение 2 часов при комнатной температуре. Контроли включают проведение инкубации тех же самых срезов с мышиным IgG (1 мг/мл, Serotec, Inc.) и инкубацию моноклональных антител со срезами из нормальных легких собак. После обработки первичными антителами, срезы инкубируют с вторичными антителами реагентами-субстратами иммунопероксидазы и пероксидазы (Dako® EnVision™ Peroxidase Kit, Dako Corp.), в соответствии с инструкциями производителя. Срезы подвергают контрастному окрашиванию гематоксилином, Обрабатывают Clarifier #2 и Bluing реагентом (Richard-Allan Scientific, Kalamazoo, MI), дегидратируют и закрывают покровными стеклами Permount (ProSciTech).
Тест на ингибирование гемагглютинации (HI)
Образцы сыворотки инкубируют с рецептор-разрушающим ферментом (RDE, Denka) (1 часть сыворотки: 3 части RDE) в течение 16 часов при температуре 37°C до проведения тепловой инактивации в течение 60 минут при температуре 56°C. Вирус гриппа A/Canine/FL/04 (H3N8) растят в клетках MDCK в течение 36-48 часов при температуре 37°C. Супернатанты вирусной культуры собирают, осветляют центрифугированием и хранят при температуре -80°C. Проводят HI тест по описанной ранее методике (Kendal et al., 1982). В общих чертах, тест состоит в том, что 4 гемагглютинирующих единицы вируса в 25 мкл добавляют к равному объему серийно разведенной сыворотки в ячейках микротитрационного планшета и инкубируют при комнатной температуре в течение 30 минут. Добавляют равный объем 0,5% (объем/объем) эритроцитов индейки и оценивают титры гемагглютинации через 30 минут. Конечная точка HI титра определяется как последнее разведение сыворотки, которое полностью ингибирует гемагглютинацию. Сероконверсию определяют как ≥ 4-кратное возрастание HI титра между парой образцов, взятых в острой фазе заболевания и в период выздоровления. Серопозитивность одного образца определяют как титр HI антитела ≥1:32.
Тест на микронейтрализацию (MN)
Реакции нейтрализующих антител сыворотки в ответ на вирус A/Canine/FL/04 (H3N8) выявляют в MN тесте по описанной ранее методике (Rowe et al., 1999), с тем исключением, что сыворотки от собак обрабатывают RDE, как было указано выше, перед описанием тестирования. Конечный титр определяют как наивысшее разведение сыворотки, которое приводит к 50% нейтрализации 100 TCID50 вируса. Сероконверсию определяют как ≥ 4-кратное возрастание HI титра между парой образцов, взятых в острой фазе заболевания и в период выздоровления. Серопозитивность одного образца определяют как титр MN ≥1:80.
Ниже приведены примеры, которые иллюстрируют процедуры, используемые в практике осуществления настоящего изобретения. Однако, указанные примеры не следует рассматривать в ограничительном контексте. Все процентные показатели даны применительно к весу, и все пропорции в смеси растворителей даны по объему, если особо не указано иное.
ПРИМЕР 1
В январе 2004 произошла вспышка респираторного заболевания у 22 борзых на скачках, размещенных 2 зданиях с конурами для собак на треке во Флориде и на местной ферме, которая поставляла собак в указанные конуры. Было приблизительно 60 животных в каждом из зданий для собак и 300 собак - на ферме. Вспышка произошла в течение 6-дневного периода, после которого не было идентифицировано новых случаев. У четырнадцати из 22 собак отмечалась лихорадка с температурой от 39,5 до 41,5°C, слабый, рвотный кашель в течение периода времени от 10 до 14 дней, с постепенным выздоровлением. Среди оставшихся 8 собак, 6 явно здоровых неожиданно умерли от кровотечения изо рта и носа. Две других собаки были подвергнуты эвтаназии в течение 24 часов, в связи с тем, что кровотечение изо рта и носа быстро усиливалось. Обе этих собаки имели лихорадку с температурой до 41°C. Четыре из 8 летальных случаев произошли в зданиях с конурами собак, и 4 произошли на ферме. Пятьдесят процентов летальных исходов произошло на 3 день вспышки заболевания. Указанные 22 собаки были в возрасте от 17 месяцев до 4 лет, и 73% были в возрасте от 17 до 33 месяцев.
Были отмечены два клинических синдрома: слабое заболевание, характеризующееся вначале лихорадкой и затем кашлем в течение 10-14 дней (у 14 собак) с последующим выздоровлением, или подострое течение со смертельным исходом, ассоциированным с кровотечением в дыхательных путях (8 собак, при среднем уровне смертности 36%). Посмертные исследования проводились в 6 из 8 летальных случаев. У всех собак отмечалась обширная геморрагия в легких, средостении и плевральной полости. Гистологическое исследование дыхательных путей показало, что, кроме легочной геморрагии, у всех собак отмечался трахеит, бронхит, бронхиолит и гнойная бронхопневмония (фиг.3). Эпителиальная выстилка и просвет дыхательных путей в этих тканях инфильтрованы нейтрофилами и макрофагами. Гомогенаты легких, полученные из указанных собак, инокулируют в большое число клеточных линий обезьян, человека, быка и собаки для культивирования вируса. Гомогенат легкого от одной собаки вызывал цитопатические эффекты в эпителиальных клетках почки собаки Madin-Darby (MDCK), культивируемых в присутствии трипсина, а клеточный супернатант вызывал агглютинацию куриных эритроцитов. Предварительные данные о том, что это был вирус гриппа типа A, были получены при проведении метода ELISA, в его коммерческом варианте, для детекции нуклеопротеина вирусов гриппа A и B, а также по результатам анализа по методу ПЦР с использованием праймеров, специфичных для матричного гена вирусов гриппа А. Кроме того, гемагглютинирующая активность ингибировалась эталонной антисывороткой против лошадиного вируса гриппа А, подтипа H3, но не антисывороткой, специфичной для человеческого вируса гриппа А, подтипов H1-H11 и H13 (Таблица 3). Для характеристики молекулярных свойств вируса, авторы определили нуклеотидные последовательности 8 сегментов РНК в вирусном геноме. Сравнение последовательностей с известными генами вируса гриппа и результаты филогенетического анализа указывают на то, что 8 генов изолята от собаки были наиболее близки к современным изолятам вирусов гриппа лошади A (H3N8), с которым они имели идентичность по последовательности ≥96-97% (фиг.1A, Таблица 4). И наоборот, репрезентативные гены из изолятов вируса гриппа А из птиц, свиньи и человека характеризовались ≤94% идентичностью с изолятом из собаки (Таблица 4). Эти данные позволили идентифицировать изолят из собаки A/Canine/Florida/43/04 (Canine/FL/04) как вирус гриппа A H3N8, очень близкий к современной линии вирусов гриппа лошади. Поскольку все гены изолята из собаки происходят из вируса гриппа лошади, авторы сделали вывод о том, что полный геном вируса гриппа лошади был перенесен к собаке.
ПРИМЕР 2
Для исследовании роли вируса Canine/FL/04 в проявлении клинических и патологических признаков у борзых, авторы провели иммуногистохимическое окрашивание (IHC) тканей легкого с использованием моноклонального антитела против вируса гриппа A H3. Вирусный антиген H3 неизменно выявляется в цитоплазме эпителиальных клеток бронхов и бронхиол, эпителиальных клетках бронхиальной железы, а также в макрофагах в просвете дыхательных путей и в альвеолярном пространстве (фиг.2A). Эти данные подтверждают диагноз инфекции легкого, вызванной вирусом H3 подтипа, у множества собак.
ПРИМЕР 3
Для установления участия вируса, подобного вирусу Canine/FL/04, в этиологии вспышки респираторного заболевания, авторы проанализировали, попарно, сыворотку, взятую в остром периоде заболевания и в фазе выздоровления у 11 больных собак и у 16 животных, бывших в контакте, но не демонстрирующих симптомов заболевания, с использованием тестов на ингибирование гемагглютинации (HI) и на микронейтрализацию (MN). Сероконверсия, определяемая как ≥ 4-кратное повышение титра антител против Canine/FL/04, и которая имела место в период от острой фазы заболевания до стадии выздоровления, отмечалась 8 из 11 (73%) больных собак, по данным обоих тестов (Таблица 1). Сероконверсия была выявлена у 6 из 16 (38%) животных без симптомов заболевания, которые были в контакте с больными, по данным HI теста, тогда как по данным MN теста (Таблица 1), сероконверсия имеет место у 8 из 16 (50%) исследованных животных. Данные по оценке сероконверсии указывают на наличие инфекции собак вирусом, подобным вирусу Canine/FL/04, которая совпала по времени с началом респираторного заболевания у большинства животных.
Через 3 месяца после вспышки заболевания отобрали отдельные образцы сыворотки еще у 46 собак, которые не имели симптомов заболевания, но которые были размещены вместе с больными собаками. Из них, по данным обоих тестов, 43 животных (93%) были серопозитивными. Из общей популяции 73 исследованных собак, как было выявлено по данным обоих тестов, 93% животных были серопозитивными, включая 82% (9/11) больных собак и 95% (59/62) здоровых животных, бывших в контакте с больными. Высокий уровень серопозитивности у собак, у которых ранее не было зарегистрировано респираторное заболевание, указывает на то, что по большей части инфекция вирусом собачьего гриппа является субклинической по своему течению, что предполагает эффективное распространение указанного вируса в популяции собак. Однако, пока неизвестно, вносят ли субклинические инфекции какой-либо вклад в распространение вируса.
ПРИМЕР 4
С тем, чтобы наилучшим образом определить способность вируса Canine/FL/04 инфицировать собак, четырем 6-месячным выращенным по специальной программе щенкам бигль инокулировали 106,6 средних цитопатогенных доз для культуры (TCID50) путем интратрахеального и интраназального введения. У всех собак в течение первых 2 дней после инокуляции (p.i.) появляется лихорадка (с ректальной температурой ≥39°C), однако, ни у одной из них не отмечаются респираторные симптомы, такие как кашель или выделения из носа, в течение 14-дневного периода наблюдения. Тест на выделение вируса проводят путем количественной оценки содержания вируса в назальных и орофарингеальных мазках. Только у 2 животных из 4 были выявлены заметные количества вируса. У одного животного вирус выделялся в 1 и 2 дни после инокуляции (1,0-2,5 log10 БОЕ на мазок), тогда как у другой собаки вирус выделялся в течение 4 последовательных дней после инокуляции (1,4-4,5 log10 БОЕ на мазок). Посмертное исследование 2 собак на 5 день после инокуляции выявило некротизирующий и гиперплазирующий трахеит, бронхит, бронхиолит, аналогично тем изменениям, которые наблюдались при спонтанном развитии заболевания у борзых собак, но при этом не отмечалось легочной геморрагии или бронхопневмонии. Вирусный антиген H3 выявлялся в цитоплазме эпителиальных клеток бронхов, бронхиол и бронхиальных желез, по данным иммуногистохимического анализа (фиг.2B). У одной собаки инфицирующий вирус восстанавливался из ткани легкого. Посмертное исследование 2 оставшихся собак на 14 день после инокуляции выявило минимальные гистологические изменения в тканях дыхательных путей, тогда как по данным иммуногистохимического анализа не было выявлено антигена H3, а также из гомогенатов легкого не выделялся вирус. Сероконверсия у этих 2 собак была детектирована по данным MN тестирования, проведенного на 7 после инокуляции, а к 14 дню отмечалось дальнейшее повышение титра антител в 2-3 раза. Полученные результаты указывают на чувствительность собак к инфекции вирусом Canine/FL/04, как следует из результатов продемонстрированной у животных фебрильной реакции, наличия вирусного антигена и инфицирующего вируса в паренхиме легкого, гистопатологических показателей, характерных для гриппа, и сероконверсии. Тот факт, что у собак бигль, которым провели инокуляцию в ходе эксперимента, не развилось тяжелое заболевание с последующим летальным исходом, не стал неожиданностью, поскольку большая часть естественно инфицированных борзых характеризовалась бессимптомным течением заболевания.
ПРИМЕР 5
Для выяснения того, циркулировал ли вирус гриппа, подобный вирусу Canine/FL/04, в популяции борзых во Флориде до вспышки заболевания в январе 2004 г., были исследованы архивные образцы сывороток крови от 65 борзых, с целью установления наличия антител к вирусу Canine/FL/04, с использованием HI и MN тестов. В образцах из 33 собак, отобранных в период 1996-1999 гг. не было продемонстрировано выявляемых количеств антител. Из образцов 32 собак, отобранных в период 2000-2003 гг., 9 образцов были определены как серопозитивные, по данным обоих тестов, при этом 1 из них в 2000 г., 2 - в 2002 г. и 6 образцов - в 2003 г. (Таблица 5). Серопозитивные собаки, размещенные на треках во Флориде, были вовлечены в развитие вспышек респираторного заболевания неясной этиологии, имевшего место в период 1999-2003 гг., что дает основания полагать, что вирус, подобный вирусу Canine/FL/04, мог быть тем агентом, который вызывал эти вспышки. Для дальнейшего исследования этого предположения, авторы исследовали архивные образцы тканей тех борзых, которые умерли от геморрагической бронхопневмонии в марте 2003 г. Для этого проводили экспериментальную инокуляцию в клетки MDCK и куриные эмбрионы гомогенатов легкого, полученных от одной собаки с гриппом, вызванным вирусом H3N8, обозначенным как A/Canine/Florida/242/2003 (Canine/FL/03). Анализ последовательности полного генома вируса Canine/FL/03 показал наличие >99% идентичности к последовательности вируса Canine/FL/04 (Таблица 4), указывая на то, что вирусы, подобные вирусу Canine/FL/04, инфицировали борзых еще до 2004 г.
ПРИМЕР 6
В период с июня по август 2004 г., вспышки респираторного заболевания регистрировались у тысяч борзых на 14 треках во Флориде, Техасе, Алабаме, Арканзасе, Западной Вирджинии и Канзасе.
По официальным данным, на ряде из этих треков по меньшей мере до 80% собак в популяциях имели клиническую форму заболевания. Большая часть собак характеризовалась наличием клинических признаков лихорадки (температура ≥ 39°C) и кашля, аналогично тем признакам, которые были зарегистрированы во время вспышки заболевания в 2004 г., однако у многих собак имелись также гнойно-слизистые выделения из носа. Было зарегистрировано большое число летальных исходов, однако точный уровень смертности не установлен.
Авторы отобрали и проанализировали, попарно, образцы сыворотки крови, отобранные у 94 собак в остром периоде заболевания и на фазе выздоровления, размещенных на 4 треках во Флориде: 56% указанных собак демонстрировали ≥4-кратное повышение титра антител против вируса Canine/FL/04, и 100% были серопозитивными (Таблица 6). В сыворотке, взятой на фазе выздоровления у 29 собак в Западной Вирджинии и Канзасе, также выявлялись антитела против вируса Canine/FL/04. Авторы выделили вирус гриппа A (H3N8) из легких борзых, которые умерли от геморрагической бронхопневмонии на треке в Техасе. Анализ полноразмерной последовательности данного изолята, обозначенного как A/Canine/Texas/1/2004 (Canine/TX/04), выявил наличие ≥99% идентичности к Canine/FL/04 (Таблица 4). Выделение трех близкородственных вирусов гриппа от трех умерших собак, где указанные летальные случаи имели место в течение 13-месячного периода времени и были локализованы в различных географических областях, в сочетании со значимыми серологическими данными о распространении инфекции среди участвовавших в скачках борзых, дали основание говорить о длительной циркуляции вируса, подобного вирусу Canine/FL/04, в популяции собак.
Филогенетический анализ, проведенный на генах HA из вирусов Canine/FL/03, Canine/FL/04 и Canine/TX/04, показал, что они составляют монофилетическую группу, которая соответствует жестким критериям оценки по методу «расшнурованной выборки» и явно отличается от современных генов H3 из вирусов лошади, выделенных в 2002 и 2003 гг. (фиг.1B). Результаты филогенетического анализа и сравнения нуклеотидных последовательностей других 7 сегментов генома, проведенного попарно, подтверждают факт сегрегации генов собаки в качестве четко выделенной сублинии, которая ближе всего стоит к линии лошадиного вируса (данные не проиллюстрированы, а также Таблица 4). Выделение генов собачьего гриппа в виде монофилетической группы, отделенной от лошадиного вируса, также подтверждается наличием 4 характерных изменений в аминокислотном составе HA (Таблица 2). В сочетании с серологическими результатами, полученными в период с 2003 по 2004 гг., эти данные согласуются с предположением о феномене однократной передачи вируса от лошадей к собакам, с последующим горизонтальным распространением вируса в популяции борзых. Однако, повторное встраивание уникальной линии вируса гриппа из неидентифицированного вида, в качестве резервуара инфекции, формально не может быть исключено, хотя это маловероятно.
Вирусный антиген HA представляет собой ключевую детерминанту, определяющую видоспецифичность вируса (Suzuki et al., 2000). Для идентификации остатков в составе HA, которые могут быть ассоциированы с адаптацией к организму собаки, как к организму-хозяину, авторы провели сравнение расчетной аминокислотной последовательности HA собачьих вирусов с соответствующей последовательностью, характерной для современных лошадиных вирусов. Наличие четырех изменений на уровне аминокислот определяют различие между зрелыми консенсусными аминокислотными последовательностями НА лошади и собаки: N83S, W222L, I328T и N483T (см. Таблица 2). Вирусы собаки содержат делецию аминокислоты, в сравнении с консенсусными последовательностями лошадиных вирусов. В этой связи, аминокислота в положении 7 в последовательности лошадиного HA соответствует аминокислоте в положении 6 в последовательности HA из вирусов собаки, аминокислота в положении 29 в последовательности лошадиного HA соответствует аминокислоте в положении 28 в последовательности HA из вирусов собаки, аминокислота в положении 83 в последовательности лошадиного HA соответствует аминокислоте в положении 82 в последовательности HA из вирусов собаки и т.п. Таким образом, четыре замещенных аминокислоты локализованы в положениях 82, 221, 327 и 482 в аминокислотной последовательности, показанной в виде SEQ ID NO: 33 и SEQ ID NO: 34. Замещение серина на аспарагин в положении 83 в консенсусной последовательности представляет собой изменение неизвестной функциональной значимости, поскольку различные полярные остатки обнаружены в молекулах H3 из других видов. Строго консервативный изолейцин, локализованный в положении 328 в консенсусной последовательности, рядом с сайтом расщепления H3 HA, был замещен треонином. Жизненно важная роль расщепления HA протеазами организма-хозяина в ходе патогенеза дополнительно указывает на то, что это изменение заслуживает дальнейшего исследования. Замещение лейцина на триптофан в положении 222 в консенсусной последовательности является весьма примечательным феноменом, поскольку представляет собой неконсервативное изменение, в непосредственной близости от связывающего кармана сиаловой кислоты, что может привести к модуляции рецепторной функции (Weis et al., 1988). Интересно отметить, что лейцин в положении 222 не является уникальной характеристикой собачьего H3 HA, поскольку, в типичном случае, он обнаруживается в H4, H8, H9 и H12 подтипах HA (Nobusawa et al., 1991; Kovacova et al., 2002). Замещение лейцина может быть более совместимо с сохранением специфичности вируса в отношении млекопитающих, в качестве организмов-хозяев, поскольку имеются сообщения об инфекции свиней подтипом H4 (Karasin et al., 2000), а также и людей, и свиней подтипом H9 (Peiris et al., 1999) вирусов. Замещение аспарагина треонином в положении 483 в консенсусной последовательности приводит к потере сайта гликозилирования в субъединице HA2, которая сохраняется, в качестве консервативного элемента, во всех подтипах HA (Wagner et al., 2002). Несмотря на то, что еще предстоит определить значимость указанных аминокислотных замен в составе HA, с точки зрения адаптации лошадиного вируса к организму собак, аналогичные изменения в составе аминокислот ранее были выявлены применительно к межвидовой передаче (Vines et al., 1998; Matrosovich et al., 2000). Различия на уровне аминокислот между другими белками вируса гриппа согласно настоящему изобретению и соответствующей консенсусной последовательностью в лошадином вирусе проиллюстрированы в Таблицах 19-25.
Соображения относительно источника вируса лошадиного гриппа по сей день остаются спекулятивными. Строения с конурами для собак на треках в районе скачек борзых не расположены рядом с лошадьми или с лошадиными рейстреками, и этот факт свидетельствует о том, что контакт между борзыми собаками и распространяющими инфекцию лошадьми является несостоятельным объяснением множества вспышек заболевания, имевших место в разных штатах в 2004 г. Потенциальным источником воздействия лошадиного вируса является поедание борзыми собаками лошадиной пищи, рацион которых включает добавку сырого мяса, поставляемого мясокомбинатами, на которых разделываются туши, включая туши лошадей, которые могли быть носителями вируса гриппа. Прецеденты такого способа инфекции описаны применительно к межвидовой передаче вируса птичьего гриппа H5N1 к свиньям и кошачьим в зоопарке, которых кормили тушками инфицированных кур (Webster, 1998; Keawcharoen et al., 2004; Kuiken et al., 2004). Хотя этот путь внедрения вируса лошадиного гриппа в организм собак выглядит достаточно правдоподобным, он не может объяснить имевшиеся в недавнее время многочисленные вспышки гриппа у тысяч собак в разных штатах. Результаты авторов, полученные в ходе экспериментальной инокуляции, продемонстрировали наличие вируса в носовых проходах и мезофаринксе у собак, хотя и с умеренными значениями титра. Тем не менее, полученные результаты указывают на то, что выделение вируса в среду возможно, и что передача вируса от собаки к собаке в составе крупных аэрозольных капель, через предметы или путем непосредственного контакта через слизистые, могли сыграть определенную роль в эпизоотиологии заболевания.
Межвидовая передача полноразмерного вируса гриппа млекопитающих к неродственным видам млекопитающих представляет собой весьма редкое событие. Предшествующие исследования предоставили ограниченные доказательства, серологического или вирусологического характера, но не одновременно обоих видов, временного инфицирования собак вирусами человеческого гриппа A (H3N2) (Nikitin et al., 1972, Kilbourne, et al., 1975; Chang et al., 1976; Houser et al., 1980). Однако, до сих пор отсутствуют доказательства возможностей длительной циркуляции вируса в организме псовых, в качестве хозяев. Несмотря на то, что возможность непосредственной передачи вирусов свиного гриппа от свиней к людям хорошо установлена и описана (Dacso et al., 1984; Kimura et al., 1998; Patriarca et al., 1984; Top et al., 1977), отсутствуют достоверные данные, свидетельствующие о возможности их адаптации в организме человека в качестве хозяина. В настоящем описании, авторы предоставляют вирусологические, серологические и молекулярные доказательства межвидовой передачи полноразмерного вируса лошадиного гриппа A (H3N8) к другому виду млекопитающих, а именно: к собаке. Данные по уникальным замещениям в HA вируса собаки, в сочетании с серологическим подтверждением инфекции у собак во многих штатах США, указывают на возможную адаптацию вируса к организму собаки в качестве хозяина. Поскольку собаки являются основным спутником человека, полученные результаты имеют значимость и для охраны здоровья людей, поскольку собаки могут выполнять роль нового источника в передаче новых вирусов гриппа A к людям.
Таблица 1 Образование антител против вируса A/Canine/Florida/43/04 (H3N8) |
||||
Больные собаки (11)a | Контакты здоровых собак (16)b | |||
Иммунный ответ | HIc | SNd | HI | SN |
Сероконверсия (%)e | 73 | 73 | 38 | 50 |
Серопозитивный (%)f | 82 | 82 | 100 | 100 |
Среднее геометрическое значение титраg | 329 | 424 | 268 | 431 |
a Число собак с клиническими признаками заболевания. b Число собак без симптомов заболевания, размещенных в контакте с собаками, имеющими клинические признаки заболевания. c Тест на ингибирование гемагглютинации (HI), проводимый с использованием вируса A/Canine/Florida/43/04. d Тест на микронейтрализацию (MN), проводимый с использованием вируса A/Canine/Florida/43/04. e Процент собак, демонстрирующих по меньшей мере 4-кратное повышение титра антител, при попарном исследовании сывороток, отобранных в остром периоде заболевания и в фазе выздоровления. f Процент собак, демонстрирующих положительный титр антител (HI титр ≥32: MN титр ≥80) в сыворотке, взятой в фазе выздоровления. g Среднее геометрическое значение титра в сыворотке, взятой в фазе выздоровления. |
Таблица 2 Аминокислотные различия между Н3 гемагглютининами собаки и лошади |
||||
H3 консенсус лошади | Can/FL/03 | Can/FL/04 | Can/TX/04 | Потенциальная функциональная значимость |
G7* | D | - † | - | D также обнаружен в H3 HA утки и человека |
I29 | - | M | M | I, консервативный в H3 HA из всех видов |
N83 | S | S | S | Присутствуют различные полярные аминокислоты в данном положении в H3 HA других видов |
S92 | - | N | - | N присутствует в некоторых H3 HA утки |
L118 | - | - | V | L, консервативный во всех H3 HA |
W222 | L | L | L | W, консервативный в большинстве H3 HA из всех видов; локализован рядом с сайтом связывания рецептора |
A272 | V | A | V | V присутствует в некоторых поздних изолятах лошади |
I328 | T | T | T | T строго консервативен во всех птичьих, свиных или человеческих H3 HA |
N483 | T | T | T | N встречается во всех H3 и в других подтипах HA. Замещение приводит к потере сайта гликозилирования. |
K541 | - | R | - | Консервативная замена основной аминокислоты |
* Остаток аминокислоты (однобуквенный код) и положение в зрелом H3 HA. Аминокислотный код обозначает: A=аланин, D=аспарагиновая кислота, G=глицин, I=изолейцин, K=лизин, L=лейцин, M=метионин, N=аспарагин, R=аргинин, S=серин, T=треонин, V=валин, W=триптофан. † Означает отсутствие изменения относительно консенсуса лошадиных H3 HA. |
Таблица 3 Ингибирование гемагглютинации вирусного изолята эталонными антисыворотками против разных подтипов НА |
||
Эталонные антисыворотки | Специфичность HA | Титр HIa |
Puerto Rico/8/34 | H1 | 5 |
Swine/Iowa15/30 | H1 | 5 |
Singapore/01/57 | H2 | 5 |
Shanghai/11/87 | H3b | 5 |
Equine/Miami/1/63 | H3 | 160 |
Duck/Czechoslovakia/56 | H4 | 5 |
Tern/South Africa/61 | H5 | 5 |
Turkey/Massachussetts/65 | H6 | 5 |
Fowl Plague/Dutch/27 | H7 | 5 |
Fowl Plague/Rostock/34 | H7 | 5 |
Equine/Prague/1/56 | H7 | 5 |
Turkey/Ontario/6118/68 | H8 | 5 |
Quail/Hong Kong/G1/97 | H9b | 5 |
Chicken/Hong Kong/G9/97 | H9b | 5 |
Chicken/Germany/49 | H10 | 5 |
Duck/England/56 | H11 | 5 |
Gull/Maryland/704/77 | H13 | 5 |
Нормальная овечья сыворотка | - | 5 |
Нормальная сыворотка от африканского хорька | - | 5 |
a Титр антисыворотки, ингибирующий гемагглютинацию вирусного изолята из собаки # 43. b Поликлональные антисыворотки получают из африканского хорька, а все другие антисыворотки получают из овцы или коз. |
Таблица 4 Гомология на уровне последовательности генов из A/Canine/Florida/43/04 (H3N8) и генов из штаммов лошадиного, птичьего, свиного и человеческого вируса гриппа A |
||||
Ген | Лошадиный | Птичий | Свиной | Человеческий |
PB2 DQ124147 |
96,9 (98,7)a Eq/Kentucky/2/8 M73526 |
88,6 (96,8) Mall/Alberta/98/85 AY633315 |
87,9 (96,8) Sw/Ontario/ 01911-1/99 AF285892 |
86,2 (96,4) PR/8/34 (HK/213/03) AF389115 (AY576381) |
PB1 DQ124148 |
97,1 (98,8) Eq/Tennessee/5/86 M25929 |
83,9 (97,1) Ck/BritishColumbia/04 (Gull/Md/704/77) AY61675 (M25933) |
83,9 (97,1) Sw/Korea/S109/04 (Sw/Saskatch/ 18789/02) AY790287 (AY619955) |
83,9 (97,1) WSN/33 (Sing/1/57) J02178 (M25924) |
PA DQ124149 |
96,3 (97,5) M26082 Eq/Tennesee/5/86 |
87,0 (94,3) Ck/Chile/4591/02 (Ostrich/SA/08103/95) AY303660(AF508662) |
84,3 (94,6) Sw/Hong Kong/ 126/02 M26081 |
83,8 (93,4) Taiwan/2/70 (Viet Nam/ 1203/04) AY210199 (AY818132) |
HA (H3) DQ124190 |
97,4 (97,1) Eq/FL/1/93 L39916 |
80,7 (89,0) Dk/Norway/1/03 AJ841293 |
80,0 (87,7) Sw/Ontario/42729a/01 AY619977 |
81,8 (87,9) HK/1/68 AF348176 |
NP DQ124150 |
96,6 (97,9) Eq/Tennesee/5/86 M30758 |
87,9 (95,1) Ck/Chile/176822/02 AY303658 |
85,4 (93,5) Sw/Ontario/42729a/01 (Sw/Fujian/1/2003) AY619974 (AY747611) |
84,7 (93,0) HK/1073/99 (Hong Kong /538/97) AF255742 (AF255751) |
NA (N8) DQ124151 |
96,8 (97,0) Eq/Tennesee/5/86 L06583 |
84,0 (85,2) Dk/NJ/2000 L06583 |
не применимо b | не применимо b |
M DQ124152 |
97,9 (95,7) Eq/Tennesee/5/86 (Eq/Kentucky/92) M63529 (AF001683) |
94,1 (94,0) Tky/Mn/833/80 AF001683 |
93,7 (93,5) Sw/Saskatchewan/ 18789/02 M63527 |
91,2 (95,4) WSN/33 (Hong Kong/ 1073/99) J02177 (AJ278646) |
NS DQ124153 |
97,5 (95,7) Eq/Tn/5/86 (Eq/Kentucky/92) M80973 (AF001671) |
92,0 (90,4) Mal/NY/6750/78 M80945 |
91,1 (89,1) Sw/China/8/78 (Sw/Korea/s452/04) M80968 (AY790309) |
91,4 (90,0) Brevig Mission/1/18 AF333238 |
a Процент идентичности нуклеотидной и аминокислотной последовательностей (в скобках) генов A/Canine/Florida/43/04 (H3N8) и генов самых близких по гомологии изолятов вируса гриппа из разных видов, с соответствующими номерами доступа в базе данных Genbank (указанными за обозначением изолята). b Не применимо: нет ни одного сообщения о наличии нейраминидазы N8 в человеческих или свиных вирусах. |
Таблица 5 Титры антител против A/canine/Florida/43/04 (H3N8) в сыворотках борзых собак, отобранных в период с 1996 по 2003 гг. |
||||||
Года | ||||||
1996 | 1997 | 1998 | 2000 | 2002 | 2003 | |
Число исследованных собак | 8 | 6 | 19 | 4 | 6 | 22 |
Число серопозитивных собак | 0 | 0 | 0 | 1 | 2 | 6 |
Титры антителb | 512 | 232, 524 | 280-2242 | |||
a Год отбора образца сыворотки на скачках борзых во Флориде. b Титры антител в тесте на микронейтрализацию у серопозитивных собак, включая диапазон, выявленный для шести серопозитивных собак в 2003 г. |
Таблица 6 Антительная реакция против A/canine/Florida/43/04 (H3N8) у борзых собак, выявленная на 4 треках, в рамках соревнованиях во Флориде в июне 2004 г. |
||||
Реакция | Трек A | Трек B | Трек C | Трек D |
Число исследованных собакa | 37 | 10 | 22 | 25 |
Сероконверсия (%)b | 46 | 90 | 100 | 64 |
Серопозитивные (%)c | 100 | 100 | 100 | 100 |
Среднее геометрическое значение титраd | 401 | 512 | 290 | 446 |
a Число собак с клиническим проявлением заболевания, по данным HI тестирования с использованием A/canine/Florida/43/04 (H3N8). b Процент собак с ≥4-кратным повышением титра антител в сыворотках, выявленным в период между острой фазой заболевания и стадией выздоровления. c Процент собак с позитивным титром антител (титр HI >16) в сыворотках, отобранных в фазе выздоровления. d Среднее геометрическое значение титра в сыворотках, отобранных в фазе выздоровления. |
МАТЕРИАЛЫ И МЕТОДЫ, ОТНОСЯЩИЕСЯ К ПРИМЕРАМ 7-11
Ткани, отобранные у собак
Посмертные исследования животных проводят в отделе анатомии и патологии Колледжа ветеринарной медицины при Университете во Флориде (Anatomic Pathology Service at the University of Florida College of Veterinary Medicine (UF CVM)) на 6 помесных собаках, которые умерли в апреле/мае 2005 г. при вспышке заболевания в приюте на северо-востоке Флориды, и на йоркширском терьере, который умер в мае 2005 г. при вспышке заболевания в ветеринарной клинике на юго-востоке Флориды. Ткани фиксировали в 10% нейтральном забуференном растворе формалина, погруженном в парафин, и срезы толщиной по 5 мкм окрашивали гематоксилином и эозином для постановки гистопатологического диагноза. Нефиксированные ткани хранили при температуре -80°C до проведения вирусологических анализов.
Экстракция РНК из образцов тканей собак
Замороженные ткани легкого, взятые от каждой из 7 собак, оттаивают и гомогенизируют в минимальной основной среде (MEM), содержащей, в качестве добавок, 0,5% бычий сывороточный альбумин (БСА) и антибиотики (гентамицин и ципрофлоксацин), с использованием одноразового измельчителя тканей (Kendall, Lifeline Medical Inc., Danbury, CT). Суммарную РНК экстрагируют с использованием коммерческого набора RNeasy (RNeasy® Mini Kit, QIAGEN Inc., Valencia, CA), в соответствии с инструкциями производителя, и проводят элюцию буфером, взятым в конечном объеме 60 мкл. Суммарную РНК также экстрагируют из тканей легких, собранных от собак, не имевших респираторного заболевания.
ОТ-ПЦР в масштабе реального времени
Одностадийную количественную ОТ-ПЦР в масштабе реального времени проводят на суммарной РНК, экстрагированной из образцов тканей собак, с использованием набора зондов для проведения ОТ-ПЦР (QuantiTect® Probe RT-PCR Kit), содержащего ROX в качестве пассивного эталонного красителя (QIAGEN Inc., Valencia, CA). В общих чертах, процедура состоит в том, что для каждого образца используют 2 набора праймерных зондов для детекции последовательностей вируса A (Таблица 7). Один набор праймерных зондов является селективным для последовательностей гена гемагглютинина собаки (H3). Другой набор праймерных зондов направлен на высоко консервативный участок матричного гена (M) вируса гриппа типа A. При проведении каждой из реакций по процедуре ОТ-ПЦР в масштабе реального времени, добавляют 5 мкл экстрагированной суммарной РНК к реакционной смеси, содержащей 12,5 мкл 2Х основной смеси зондов для ОТ-ПЦР (2X QuantiTech® Probe RT-PCR Master Mix), 0,25 мкл смеси ОТ (QuantiTech® RT Mix), обратные и прямые праймеры (в конечной концентрации каждого из них 0,4 мкМ), зонд (в конечной концентрации 0,1 мкМ) и не содержащую РНК-азы воду, в конечном объеме 25 мкл. Используют также рибосомальную РНК, в качестве контрольных реагентов (TaqMan® Ribosomal RNA Control Reagents (Applied Biosystems, Foster City, CA)), в соответствии с инструкциями производителя, для детекции 18S рРНК в качестве эндогенного внутреннего контроля на присутствие РНК, экстрагированной из образцов тканей собак.
Количественную одностадийную ОТ-ПЦР в масштабе реального времени проводят при введении реакционных смесей в систему Mx3000P® QPCR (Stratagene, La Jolla, CA). Условия циклической обработки включают стадию обратной транскрипции, проводимую при температуре 50°C в течение 30 минут, стадию начальной денатурации, проводимую при температуре 95°C в течение 15 минут, для активации ДНК-полимеразы HotStarTaq®, и стадию амплификации, проводимую в течение 40 циклов. Каждый цикл амплификации включает денатурацию при температуре 94°C в течение 15 секунд, с последующим проведением стадии отжига/наращивания при температуре 60°C в течение 1 минуты. Сигналы FAM (длина волны эмиссии при 518 нм) и VIC (длина волны эмиссии при 554 нм) флуоресценции регистрируют в конце каждого цикла. Пороговый показатель цикла (Ct) определяют при установке пороговой флуоресценции (dR) на 1000 в каждом отдельном эксперименте. Для регистрации и анализа данных используют пакет прикладных программ Mx3000P® версия 2.0 (Stratagene, La Jolla, CA). Образцы рассматриваются как позитивные в отношении вируса гриппа A, если пороговый показатель цикла (Ct) для H3 или M гена на 3 единицы меньше, чем значение Ct для тканей легких у собак, не имеющих респираторного заболевания. Позитивный контроль включает проведение амплификации РНК, экстрагированной из вируса A/canine/FL/242/03 (H3N8).
Выделение вируса из клеток MDCK
Замороженные ткани легких от каждой из 7 собак оттаивают и гомогенизируют в 10 объемах среды Игла в модификации Дульбекко (DMEM) с добавкой 0,5% БСА и антибиотиков (гентамицин и ципрофлоксацин). Твердые остатки клеток удаляют центрифугированием, и супернатанты используют для инокуляции в клетки почки собаки Madin-Darby (MDCK), культивируемые в среде DMEM с добавкой 1 мкг/мл TPCK при обработке трипсином (Sigma-Aldrich Corp., St. Louis, MO) и антибиотиков (гентамицин и ципрофлоксацин). Клетки растят в колбах объемом 25 см2 при температуре 37°C в увлажненной атмосфере, содержащей 5% CO2. Культуры ежедневно осматривают для выявления наличия морфологических изменений и собирают через 5 дней после инокуляции. Собранные культуры осветляют центрифугированием, и супернатанты используют для инокуляции в свежие клетки MDCK, как было описано применительно к начальной инокуляции; проводят еще два дополнительных пассажа для образцов, которые не демонстрируют наличия вируса гриппа, по данным оценки гемагглютинации или по результатам реакции ОТ-ПЦР. Гемагглютинирующую активность в осветленных супернатантах определяют с использованием 0,5% эритроцитов индейки, в соответствии с описанной ранее методикой (Burleson, F. et al., 1992; Kendal, P. et al., 1982). ОТ-ПЦР проводят по описанной ниже процедуре.
Выделение вируса из эмбрионов в куриных яйцах
Получают гомогенаты из замороженных тканей, как было описано применительно к инокуляции в клетки MDCK. Гомогенаты (0,2 мл) используют для инокуляции в аллантоиновый мешок 10-дневных эмбрионов в куриных яйцах. После 48 часов инкубации при температуре 35°C, яйца охлаждают при температуре 4°C в течение ночи, перед отбором аллантоиновой жидкости. Гемагглютинирующую активность в осветленных супернатантах определяют с использованием 0,5% эритроцитов индейки, в соответствии с описанной ранее методикой (Burleson, F. et al., 1992; Kendal, P. et al., 1982). ОТ-ПЦР проводят по описанной ниже процедуре. Проводят еще два дополнительных пассажа в яйцах с эмбрионами для тех образцов, которые не продемонстрировали наличия вируса после первоначальной инокуляции.
ОТ-ПЦР, секвенирование нуклеотидов и филогенетический анализ
Суммарную РНК экстрагируют из супернатанта культуры клеток MDCK или из аллантоиновой жидкости с использованием мининабора для выделения вирусной РНК QIAamp® Viral RNA Mini Kit (QIAGEN Inc., Valencia, CA), в соответствии с инструкциями производителя. Вирусную РНК подвергают обратной транскрипции до кДНК с использованием набора для проведения одностадийной реакции ОТ-ПЦР QIAGEN® OneStep RT-PCR Kit (QIAGEN, Valencia, CA), в соответствии с инструкциями производителя. Амплификацию по методу ПЦР кодирующей области 8 генов из вируса гриппа проводят по описанной ранее методике (Klimov et al., 1992a) с использованием универсальных наборов ген-специфических праймеров (праймерные последовательности доступны по запросу). Полученные ампликоны ДНК используют в качестве матриц для автоматизированного секвенирования на автоматическом секвенаторе ДНК ABI PRISM® 3100 по процедуре циклического секвенирования, включающего использование красителя в конце цикла (Applied Biosystems, Foster City, CA). Нуклеотидные последовательности анализируют с использованием пакета прикладных программ Lasergene 6 Package® (DNASTAR, Inc., Madison, WI). Используют также пакет программ PHYLIP версия 3.5© для оценки филогенетических взаимосвязей и расчета показателей, полученных при анализе по методу «расшнурованной выборки», на основе данных по нуклеотидным последовательностям (Felsenstein, 1989). Построенные филогенетические деревья сравнивают с деревьями, полученными при анализе по методу анализа ближайших соседей с использованием Tamura-Nei-гамма модели, встроенной в программу MEGA© (Kumar et al., 2004), и подтверждают полученные результаты с использованием программы PAUP© 4.0 Beta (Sinauer Associates, Inc., Sunderland, MA).
Тест на ингибирование гемагглютинации (HI)
Образцы сыворотки инкубируют с рецептор-разрушающим ферментом (RDE, DENKA SEIKEN Co., Ltd., Tokyo, Japan) (1 часть сыворотки: 3 части RDE) в течение 16 часов при температуре 37°C до проведения тепловой инактивации в течение 60 минут при температуре 56°C. Вирус гриппа A/Canine/Jacksonville/05 (H3N8) растят в клетках MDCK в течение 72 часов при температуре 37°C в атмосфере 5% CO2. Супернатанты вирусной культуры собирают, осветляют центрифугированием и хранят при температуре -80°C. Все другие вирусы, используемые в HI тесте, растят в куриных яйцах с 10-дневными эмбрионами, из которых отбирают аллантоиновую жидкость и хранят при температуре -80°C. Проводят HI тест по описанной ранее методике (Kendal et al., 1982). В общих чертах, тест состоит в том, что 4 гемагглютинирующих единицы вируса в 25 мкл добавляют к равному объему серийно разведенной сыворотки в ячейках 96-ячеечного пластикового микротитрационного планшета и инкубируют при комнатной температуре в течение 30 минут. Добавляют равный объем 0,5% (объем/объем) эритроцитов индейки, и визуально оценивают титры гемагглютинации через 30 минут. Конечная точка HI титра определяется как последнее разведение сыворотки, которое полностью ингибирует гемагглютинацию.
ПРИМЕР 7 - КЛИНИЧЕСКИЕ СЛУЧАИ
В апреле и мае 2005 г., произошла описанная ранее (Crawford, P.C. et al., 2005) вспышка респираторного заболевания у собак, размещенных в приюте на северо-востоке Флориды. Вспышка охватила 58 собак в возрасте от 3 месяцев до 9 лет и вовлекла как чистопородных собак, так и помесных собак. Самыми распространенными общими для всех клиническими признаками заболевания были гнойные выделения из носа и кашель, продолжавшиеся от 7 до 21 дня. Из 43 собак, демонстрировавших клинические проявления заболевания в течение ≥7 дней, 41 имела титры HI антител против вируса canine/FL/04 (H3N8) в диапазоне от 32 до >1024. По меньшей мере, у 10 собак заболевание прогрессировало до пневмонии, из числа которых 6 животных были подвергнуты эвтаназии. Указанные 6 помесных собак включали 3 самца и 3 самки в возрасте от 4 месяцев до 3 лет. Длительность проявления клинических признаков варьировала от 2 до 10 дней, как времени эвтаназии. При посмертном осмотре было обнаружено, что эти собаки имели застой и отек легких. Гистологическое исследование дыхательных путей показало наличие ринита, трахеита, бронхита, бронхиолита и гнойной бронхопневмонии. Отмечались явления некроза и эрозии эпителиальных клеток в трахее, бронхах, бронхиолах и бронхиальных железах. Ткани дыхательных путей, как было показано, инфильтрованы нейтрофилами и макрофагами.
В мае 2005 г. вспышка респираторного заболевания охватила 40 домашних собак, находившихся в ветеринарной клинике на юго-востоке Флориды. Самыми распространенными общими для всех клиническими признаками заболевания были гнойные выделения из носа и кашель, продолжавшиеся от 10 до 30 дней. Из 40 указанных собак, 17 были серопозитивными по вирусу canine/FL/04 (H3N8), где титры HI антител варьировали от 32 до >1024. Сероконверсия была выявлена у 10 собак, для которых было возможно провести спаренный тест на сыворотках, отобранных в остром периоде заболевания и на фазе выздоровления. У трех собак заболевание прогрессировало до пневмонии. Одна из этих собак, 9-летний самец йоркширского терьера, умерла через 3 дня после появления клинических признаков заболевания. У этой собаки были выявлены трахеобронхит, отек легких и застойные явления в легких, а также тяжелая бронхопневмония. Аналогично 6 собакам, заболевшим в приюте, в ее дыхательных путях были выявлены некроз и эрозия эпителиальных клеток, а также нейтрофильная инфильтрация в тканях.
ПРИМЕР 8 - ОТ-ПЦР В МАСШТАБЕ РЕАЛЬНОГО ВРЕМЕНИ И ВЫДЕЛЕНИЕ ВИРУСА
Ткани легкого от 7 собак анализируют в рамках количественных тестов ОТ-ПЦР в масштабе реального времени, которые позволяют выявить ген M вируса гриппа типа A и ген H3 вируса собачьего гриппа А подтипа H3N8. Образцы легкого из всех 7 собак дали положительный результат и на ген М вируса гриппа типа А, и на ген H3 вируса собачьего гриппа (Таблица 8). После 3 пассажей в клетках MDCK, вирус гриппа А подтипа H3N8 был выделен от собак из приюта, которые умерли через 3 дня после появления пневмонии. Указанному вирусу было дано название A/canine/Jacksonville/05 (H3N8) (canine/Jax/05). После 2 пассажей в куриных яйцах с эмбрионами, вирус гриппа A подтипа H3N8 был выделен из легких домашних собак, которые также умерли через 3 дня после появления пневмонии. Указанному вирусу было дано название A/canine/Miami//05 (H3N8) (canine/Miami/05).
ПРИМЕР 9 - ГЕНЕТИЧЕСКИЙ АНАЛИЗ ИЗОЛЯТОВ СОБАЧЬЕГО ВИРУСА ГРИППА А ПОДТИПА H3N8
Анализ на уровне последовательности собачьих вирусов canine/Jax/05 и canine/Miami/05 показал, что их гены гемагглютинина (HA) на 98% идентичны таковым в изолятах собачьих вирусов canine/FL/04, canine/TX/04 и canine/Iowa/05, выделенных из легких борзых, которые умерли от пневмонии во время вспышек заболевания на треках в 2004 и 2005 гг. (Crawford, P.C. et al., 2005; Yoon K-Y. et al., 2005). Кроме того, HA гены собачьих вирусов canine/Jax/05 и canine/Miami/05 были на 98% идентичны таковым в современных вариантах лошадиных вирусов, выделенных после 2000 г. Сравнительный филогенетический анализ HA генов показал, что собачьи вирусы canine/Jax/05 и canine/Miami/05 образуют кластерную группу с изолятами собачьих вирусов canine/FL/04, canine/TX/04 и canine/Iowa/05 из борзых собак и с изолятами современных форм лошадиных вирусов, так что они формируют отдельную группу, отличную от более ранних лошадиных вирусов, выделенных в начале 1990-х гг. (фиг.4). Кроме того, изоляты собачьих вирусов canine/Jax/05, canine/Miami/05 и canine/Iowa/05 ближе стоят к canine/Tx/04, чем к canine/FL/04 или canine/FL/03. Изоляты 2005 г. формируют подгруппу, которая, по всей видимости, является ответвлением более ранних собачьих вирусов 2003 и 2004 гг., при этом различия наблюдаются примерно в 10 сайтах, отобранных по принципу экономии информации. Наличие этих различий поддерживают гипотезу, согласно которой вирус собачьего гриппа был перенесен горизонтально от собаки к собаке, а не встраивался неоднократно с некоторой периодичностью из внешнего источника. Накопление мутаций в период с 2003 по 2005 гг. иллюстрирует протекающий процесс адаптации, которому вирус должен был подвергнуться, с тем, чтобы он мог быть перенесен в новый организм-хозяин, как это, по предположениям, случилось с вирусами собачьего гриппа.
ПРИМЕР 10 - АМИНОКИСЛОТНЫЙ АНАЛИЗ ИЗОЛЯТОВ ВИРУСА СОБАЧЬЕГО ГРИППА A ПОДТИПА H3N8
В 6 изолятах вируса собачьего гриппа было показано наличие консервативных замещений аминокислот, которые отличают их от современных вирусов лошадиного гриппа (Таблица 9). Указанные консервативные замещения включают I15M, N83S, W222L, I328T и N483T. Сравнительный филогенетический анализ зрелого белка HA показал, что вирусы собаки canine/Jax/05, canine/Miami/05 и canine/Iowa/05 формируют одну подгруппу вместе с изолятом вируса собаки canine/TX/04 (фиг.4). Идентифицировано 3 аминокислотных замены (L118V, K261N и G479E), которые отличают данную подгруппу от других вирусов собак (Таблица 9). Идентифицировано также 2 аминокислотных замены (F79L и G218E), которые отличают изоляты 2005 г. от их корневого варианта canine/TX/04. Кроме того, изоляты 2005, взятые от собак, отличных от борзых, а именно: canine/Jax/05 и canine/Miami/05, отличаются от изолята, выделенного из борзых, canine/Iowa/05, наличие изменения по одной аминокислоте, R492K. И наконец, собачий вирус canine/Jax/05 отличается от другого вируса, выделенного из собак, canine/Miami/05, всего по одной аминокислоте, S107P. Во всех других вирусах H3N8 лошади и собаки, аминокислота S консервативна в положении 107, за исключением A/Equine/Jilin/1/89, который в этом положении содержит T (Guo Y. et al., 1992).
ПРИМЕР 11 - АНТИГЕННЫЙ АНАЛИЗ ИЗОЛЯТОВ ВИРУСА СОБАЧЬЕГО ГРИППА A ПОДТИПА H3N8
Проводят тесты на ингибирование гемагглютинации (HI) с использованием панели антигенов из более ранних и современных вирусов лошадиного гриппа и вирусов собачьего гриппа, а также на фоне сыворотки, отобранной в 2005 г. из лошадей и собак, которые были инфицированы вирусом гриппа (Таблица 10). В процедуру анализа была также включена сыворотка, взятая у африканских хорьков, иммунизированных против canine/FL/04. Титры HI антител, выявленные в сыворотке лошадей, были в 8-16 раз выше, в случае их тестирования с использованием современных лошадиных вирусов, чем с другими, более ранними изолятами, но снижались по меньшей мере в 4 раза, в случае их тестирования с использованием вирусов собаки. Сыворотка из собак не давала реакции с более ранними лошадиными вирусами, тогда как титр антител повышался в 4 раза, при проведении тестирования с использованием изолятов современных лошадиных вирусов и изолятов вирусов собаки. Указанная картина наблюдалась также для сыворотки, взятой из африканских хорьков, иммунизированных против вируса собачьего гриппа. Такого рода серологическая реакция указывает на антигенное сходство между вирусами гриппа собак и современными лошадиными вирусами, что также согласуется с результатами филогенетического анализа. Титры антител, выявленные в сыворотках лошади, собаки и африканского хорька, против изолята canine/Miami/05, были аналогичны таковым, найденным для изолятов вирусов собаки в 2003 и 2004 гг. Однако, в данном случае титры были в 2-4 раза ниже применительно к изоляту canine/Jax/05. Эти результаты позволяют полагать, что canine/Jax/05 отличается по антигенному составу от других изолятов собачьего вируса, что, хотя бы частично, может определяться аминокислотной заменой в положении 107 в зрелом HA.
Таблица 7 Праймеры и зонды, используемые при количественном анализе по методу ОТ-ПЦР в масштабе реального времени матричного гена из вируса гриппа A и H3 гена из вируса собачьего гриппа A (H3N8) |
|||
Праймер | Мишень | Последовательность | Вариант применения |
Ca-H3-F387 | H3 (нт 387-406) | 5’-tatgcatcgctccgatccat-3’ (SEQ ID NO: 79) | Прямой праймер для H3 |
Ca-H3-R487 | H3 (нт 487-467) | 5’-gctccacttcttccgttttga-3’ (SEQ ID NO: 80) | Обратный праймер для H3 |
Ca-H3-P430 | H3 (нт 430-459) | FAM-aattcacagcagagggattcacatggacag-BHQ1 (SEQ ID NO: 81) | Зонд TaqMan® |
FluA-M-F151 | M (нт 151-174) | 5’-catggartggctaaagacaagacc-3’ a (SEQ ID NO: 82) | Прямой праймер для M |
FluA-M-R276 | M (нт 276-253) | 5’-agggcattttggacaaakcgtcta-3’ (SEQ ID NO: 83) | Обратный праймер для M |
FluA-M-P218 | M (ет 218-235) | FAM-acgcTcaccgTgcccAgt-BHQ1 b (SEQ ID NO: 84) | Зонд TaqMan® |
а Подчеркнутая буква r обозначает нуклеотид a или g, и подчеркнутая буква k обозначает нуклеотид g или t. b Буквы верхнего регистра обозначают остатки зафиксированной нуклеиновой кислоты. |
Таблица 8 Количественный анализ по методу ОТ-ПЦР в масштабе реального времени и выделение вируса, проведенные на тканях легкого, взятых из собак, умерших от пневмонии во время вспышек респираторного заболевания в приюте и в ветеринарной клинике во Флориде |
|||||
Обозначение собаки | Местонахождение | Длительность проявления клинических признаков заболевания | ОТ-ПЦР в масштабе реального времени | Выделение вируса | |
M (Ct) | HA (Ct) | ||||
A/canine/FL/242/03 | позитивный контроль | 28,15 | 27,36 | ||
1079 | Приют (NE FL) | 2 дня | 29,81 | 28,84 | нет |
1078 | Приют (NE FL) | 3 дня | 30,37 | 29,71 | MDCK, 3-ий пассаж |
318 | Приют (NE FL) | 9 дней | 33,89 | 32,97 | нет |
320 | Приют (NE FL) | 10 дней | 39,44 | 37,09 | нет |
319 | Приют (NE FL) | 6 дней | 33,87 | 32,23 | нет |
1080 | Приют (NE FL) | 6 дней | 38,87 | 38,23 | нет |
374 | Ветеринарная клиника (SE FL) | 3 дня | 24,05 | 22,65 | Яйцо, 2-ой пассаж |
Таблица 9 Сравнение по аминокислотному составу зрелого HA из вирусов собачьего гриппа и современных вирусов лошадиного гриппа |
||||||||||||||||||
Аминокислота | ||||||||||||||||||
7 | 15 | 54 | 78 | 79 | 83 | 92 | 107 | 118 | 159 | 218 | 222 | 261 | 328 | 479 | 483 | 492 | 541 | |
A/equine/KY/5/02 | G | I | N | V | F | N | S | S | L | N | G | W | K | I | G | N | R | K |
A/equine/MA/213/03 | - | - | - | A | - | - | - | - | - | S | - | - | - | - | - | - | - | - |
A/equine/OH/1/03 | D | - | K | A | - | - | - | - | - | S | - | - | - | - | - | - | - | - |
A/canine/FL/242/03 | - | M | K | A | - | S | - | - | - | S | - | L | - | T | - | T | - | - |
A/canine/FL/43/04 | - | M | K | A | - | S | N | - | - | S | - | L | - | T | - | T | - | R |
A/canine/TX/1/04 | - | M | K | A | - | S | - | - | V | S | - | L | N | T | E | T | - | - |
A/canine/Iowa/05 | - | M | K | A | L | S | - | - | V | S | E | L | N | T | E | T | - | - |
A/canine/Miami/05 | - | M | K | A | L | S | - | - | V | S | E | L | N | T | E | T | K | - |
A/canine/Jacksonville/05 | - | M | K | A | L | S | - | P | V | S | E | L | N | T | E | T | K | - |
Таблица 10 Титры антител в сыворотке лошади, собаки и африканского хорька, выявленные против более ранних и современных вирусов лошадиного гриппа и против вирусов собачьего гриппа |
|||
Титры антител в сывороткеa | |||
Антигены | Лошади | Собаки | Африканского хорькаb |
equine/Miami/63 | 40 | <10 | 16 |
equine/Ky/86 | 40 | 40 | 32 |
equine/KY/92 | 40 | <10 | 32 |
equine/NY/99 | 320 | 40 | 128 |
equine/Ky/05/02 | 320 | 160 | 256 |
equine/MA/213/03 | 640 | 160 | 512 |
equine/OH/01/03 | 640 | 160 | 512 |
canine/FL/03 | 160 | 160 | 512 |
canine/FL/04 | 160 | 80 | 512 |
canine/Tx/04 | 160 | 160 | 512 |
canine/Miami/05 | 160 | 80 | 256 |
canine/Jax/05 | 40 | 40 | 128 |
а Титры антител определяют в тесте на ингибирование гемагглютинации, проводимом с использованием серийных разведений сыворотки лошади, собаки или африканского хорька и вирусов, перечисленных в столбце таблицы, относящемся к антигенам. b Сыворотка из африканских хорьков, иммунизированных вирусом canine/FL/04. |
МАТЕРИАЛЫ И РЕПРЕЗЕНТАТИВНЫЕ МЕТОДЫ, ОТНОСЯЩИЕСЯ К ПРИМЕРАМ 12-15
Инокулят вируса собачьего гриппа
Вирусный инокулят получают путем инокуляции в эпителиальные клетки почки собаки Madin-Darby (MDCK) основной формы вируса A/canine/FL/43/04 (H3N8), представляющей собой 3 пассаж ранее описанного исходного изолята (Crawford et al., 2005). Инокулированные MDCK клетки в минимальной основной среде в модификации Дульбеккоо (DMEM), содержащей в качестве добавок 1 мкг/мл TPCK в трипсиновой обработке (Sigma-Aldrich Corp., St. Louis, MO) и антибиотики (гентамицин и ципрофлоксацин), растят в колбах на 250 см2 при температуре 37°C в увлажненной атмосфере, содержащей 5% CO2. Культуру осматривают ежедневно на выявление возможных морфологических изменений и собирают через 5 дней после инокуляции. Собранную культуру осветляют центрифугированием, и полученные супернатанты хранят при температуре -80°C до проведения инокуляции собак. Отбирают аликвоту супернатанта для определения титра вируса по методу Рида и Мюнша (Reed and Muench). Указанный титр составляет 107 средней цитопатогенной дозы для культуры (TCID50) вируса A/canine/Florida/43/04 (canine/FL/04) на мл.
Экспериментальная инокуляция
Используют восемь 4-месячных помесных собак из колонии (Marshall BioResources, North Rose, NY) (4 самца и 4 самки) для проведения исследования по экспериментальной инокуляции, разрешенного Комитетом по надзору за использованием животных в эксперименте и уходу за ними при Университете во Флориде (University of Florida Institutional Animal Care and Use Committee). В эксперимент были включены собаки с весом тела от 13 до 17 кг. Указанные собаки были признаны здоровыми, по результатам физического осмотра, данных анализа крови на базовом уровне и температурных показателей, зарегистрированных в течение 2 недель до инокуляции. Ни одна из собак до этого не подвергалась воздействию вируса собачьего гриппа, как следует из результатов серологических анализов, проведенных на спаренных образцах сывороток, отобранных в момент поступления животных в данное учреждение и через 2 недели. Собак повергают анестезии путем внутривенной инъекции пропофола (Diprivan®, Zeneca Pharmaceuticals, 0,4 мг/кг веса тела, для достижения желательного эффекта) с последующей интубацией эндотрахеальными трубками. Каждой из шести собак (3 самца и 3 самки) инокулируют 107 TCID50 вируса canine/FL/04 в 5 мл стерильного солевого раствора, вводимого в дистальную часть трахеи с помощью каучукового катетера небольшого диаметра, встроенного в эндотрахеальную трубку. Двум собакам (1 самец и 1 самка) проводят ложную инокуляцию равного объема стерильного раствора. Ложно инокулированных контрольных собак помещают в комнатах, отдельно от собак, которым был инокулирован вирус, и за ними ухаживают разные люди из числа персонала. Физический осмотр и регистрацию ректальной температуры проводят два раза в день в течение 6 дней после инокуляции (p.i.).
Отбор фарингеальных и ректальных мазков
Для отслеживания выделения вируса во внешнюю среду, от каждой собаки дважды в день отбирают орофарингеальные образцы в дни от 0 до 6 после инокуляции, с использованием полиэфирных тампонов (Fisher Scientific International Inc., Pittsburgh, PA). Тампоны помещают в 1 мл стерильного фосфатно-буферного раствора (PBS), содержащего 0,5% бычьего сывороточного альбумина (БСА). Ректальные образцы берут у каждой собаки ежедневно в дни от 0 до 6. Экстракты тампонов получают путем осветления центрифугированием сред, использованных для транспортировки. Аликвоту экстракта тампона анализируют, сразу же отбирают для анализа на наличие нуклеопротеина вируса гриппа A с использованием коммерческого набора для иммуноанализа Directigen™ (BD, Franklin Lakes, NJ), в соответствии с инструкциями производителя. Оставшийся экстракт хранят при температуре -80°C до проведения вирусологических исследований.
Посмертный осмотр
В 1 день после инокуляции, одну ложно инокулированную собаку и одну собаку с инокулированным вирусом подвергают эвтаназии путем внутривенной инокуляции раствора Beuthanasia-D® (1 мл/5 кг веса тела; Schering-Plough Animal Health Corp). Аналогично, по одной собаке с инокулированным вирусом подвергают эвтаназии каждый день в период от 2 до 5 дня после эвтаназии. В 6 день после эвтаназии, подвергают эвтаназии оставшихся ложно инокулированных собак и собак с инокулированным вирусом. Полный посмертный осмотр проводит один из исследователей (WLC). Ткани фиксируют в 10% нейтральном забуференном формалине, погруженном в парафин, и срезы по 5 мкм либо окрашивают гематоксилином и эозином, либо подвергают обработке для иммуногистохимического анализа по описанной ниже процедуре. Нефиксированные ткани легкого отправляют в Диагностический Центр клинической микробиологии/паразитологии/серологии Колледжа Ветеринарной Медицины при Университете Флориды (Diagnostic Clinical Microbiology/Parasitology/ Serology Service at the University of Florida College of Veterinary Medicine) для выделения и идентификации бактерий. Образцы культивируют на неселективных средах, а также на средах, селективных для видов Bordetella (Regan-Lowe; Remel, Lenexa, KS) и видов Mycoplasma (Remel). Все культуры выдерживают в течение 21 для того, чтобы сделать вывод об отсутствии роста. Нефиксированные ткани также хранят при температуре -80°C до проведения вирусологических исследований.
Иммуногистохимия
Депарафинизированные и регидратированные срезы тканей трахеи и легкого толщиной по 5 мкм помещают на предметные стекла Bond-Rite™ (Richard-Allan Scientific, Kalamazoo, MI), после чего обрабатывают протеиназой K (DAKOCytomation Inc., Carpenteria, CA) и затем реагентом, блокирующим пероксидазу (DAKO® EnVision™ Peroxidase Kit, DAKO Corp., Carpenteria, CA). Срезы инкубируют с моноклональным антителом против вируса гриппа А Н3, в разведении 1:500 (Chemicon International, Inc., Ternecula, CA), в течение 2 часов при комнатной температуре. В качестве контрольных вариантов проводят инкубацию тех же срезов с мышиным IgG (1 мг/мл, Serotec, Inc. Raleigh, NC), а также инкубацию моноклонального антитела со срезами из ткани нормального легкого собаки. После обработки первичным антителом, срезы инкубируют со вторичными реагентами субстратов иммунопероксидазы и пероксидазы (Dako® EnVision™ Peroxidase Kit, Dako Corp.), в соответствии с инструкциями производителя. Далее срезы подвергают контрастному окрашиванию гематоксилином, обрабатывают очищающим реагентом #2 и подсинивающим реагентом (Richard-Allan Scientific, Kalamazoo, MI), дегидратируют и закрывают покровными стеклами Permount (ProSciTech, Queensland, Australia).
Экстракция РНК из тампонов и тканей
Ткани трахеи и легкого от каждой из исследуемых собак оттаивают и гомогенизируют в минимальной основной среде (MEM), содержащей, в качестве добавок, 0,5% бычий сывороточный альбумин (БСА) и антибиотики (гентамицин и ципрофлоксацин) с использованием одноразового измельчителя тканей (Kendall, Lifeline Medical Inc., Danbury, CT). Суммарную РНК экстрагируют из гомогенатов тканей, а также из экстрактов, полученных из орофарингеальных и ректальных тампонов, с использованием коммерческого набора (RNeasy® Mini Kit, QIAGEN Inc., Valencia, CA), в соответствии с инструкциями производителя, и элюируют в конечном объеме 60 мкл буфера.
ОТ-ПЦР в масштабе реального времени
На суммарной РНК проводят количественную одностадийную ОТ-ПЦР в масштабе реального времени с использованием набора зондов для ПЦР (QuantiTect® Probe RT-PCR Kit), содержащего ROX, в качестве эталонного пассивного красителя (QIAGEN Inc., Valencia, CA), и набор праймерных зондов, направленных на высоко консервативный участок матричного гена (M) вируса гриппа типа A (Payungporn S. et al., 2006a; Payungporn S. et al., 2006b). Для проведения каждой из реакций ОТ-ПЦР в масштабе реального времени, добавляют по 5 мкл экстрагированной суммарной РНК к реакционной смеси, содержащей 12,5 мкл основной смеси зондов для ОТ-ПЦР (2X QuantiTech® Probe RT-PCR Master Mix), 0,25 мкл смеси QuantiTech® RT Mix, прямых и обратных праймеров (в конечной концентрации каждого из них 0,4 мкМ), зонд (в конечной концентрации 0,1 мкМ) и воду, не содержащую РНКазу, до общего конечного объема 25 мкл. Используют контрольные реагенты TaqMan® GAPDH (Applied Biosystems, Foster City, CA), в соответствии с инструкциями производителя, для детекции GAPDH, в качестве эндогенного внутреннего контроля для оценки РНК, экстрагированной из тампона и образцов ткани, и в качестве контрольного варианта для нормализации результатов.
Количественную одностадийную ОТ-ПЦР в масштабе реального времени проводят на реакционных смесях, введенных в систему Mx3000P® QPCR System (Stratagene, La Jolla, CA). Условия циклической обработки включают стадию обратной транскрипции при температуре 50°C в течение 30 минут, стадию начальной денатурации при температуре 95°C в течение 15 минут, для целей активации ДНК-полимеразы HotStarTaq®, и стадию амплификации, осуществляемую в ходе 40 циклов. Каждый цикл амплификации включает стадию денатурации при температуре 94°C в течение 15 секунд, с последующим проведением стадии отжига/наращивания при температуре 60°C в течение 1 минуты. В конце каждого цикла регистрируют флуоресцентные сигналы FAM (длина волны эмиссии при 518 нм) и VIC (длина волны эмиссии при 554 нм). Пороговый показатель цикла (Ct) определяют при установке пороговой флуоресценции (dR) на 1000 в каждом отдельном эксперименте. Для регистрации и анализа данных используют пакет прикладных программ Mx3000P® версия 2.0 (Stratagene, La Jolla, CA). Позитивный контроль включает проведение амплификации РНК, экстрагированной из вируса A/canine/FL/242/03 (H3N8). Полученные результаты нормализуют путем деления значения Ct для М на соответствующее значение Ct для GAPDH, полученное для каждого образца.
Повторное выделение вируса из тканей
Замороженные ткани, взятые от собак с инокулированным вирусом, оттаивают и гомогенизируют в 10 объемах среды DMEM, содержащей, в качестве добавок, 0,5% БСА и антибиотики. Твердые остатки удаляют центрифугированием, а полученные супернатанты используют для инокуляции в клетки MDCK, культивируемые в среде DMEM, содержащей, в качестве добавок, 1 мкг/мл TPCK после трипсиновой обработки (Sigma-Aldrich Corp., St. Louis, MO) и антибиотики, описанные выше. Клетки растят в колбах на 25 см2 при температуре 37°C в увлажненной атмосфере, содержащей 5% CO2. Культуры осматривают ежедневно для выявления возможных морфологических изменений и собирают на 5 день после инокуляции. Собранные культуры осветляют центрифугированием, и полученные супернатанты используют для инокуляции в клетки MDCK, как было описано выше применительно к исходной инокуляции; проводят два дополнительных пассажа для образцов, которые не продемонстрировали наличия вируса гриппа, по данным теста на гемагглютинацию или по данным анализа в рамках ОТ-ПЦР. Гемагглютинирующую активность в осветленных супернатантах определяют с использованием 0,5% эритроцитов индейки, по описанной ранее методике (Crawford et al., 2005). ОТ-ПЦР проводят в соответствии с описанной ниже процедурой.
ОТ-ПЦР, нуклеотидное секвенирование и филогенетический анализ
Вирусную РНК экстрагируют из супернатанта культуры клеток MDCK с использованием мининабора для выделения вирусной РНК QIAamp® Viral RNA Mini Kit (QIAGEN Inc., Valencia, CA), в соответствии с инструкциями производителя. Вирусную РНК подвергают обратной транскрипции до кДНК с использованием набора для проведения одностадийной реакции ОТ-ПЦР QIAGEN® OneStep RT-PCR Kit (QIAGEN, Valencia, CA), в соответствии с инструкциями производителя. Амплификацию по методу ПЦР кодирующей области 8 генов из вируса гриппа проводят по описанной ранее методике (Crawford et al., 2005), с использованием универсальных наборов ген-специфических праймеров (праймерные последовательности доступны по запросу). Полученные ампликоны ДНК используют в качестве матриц для автоматизированного секвенирования на автоматическом секвенаторе ДНК ABI PRISM® 3100 по процедуре циклического секвенирования, включающего использование красителя в конце цикла (Applied Biosystems, Foster City, CA). Нуклеотидные последовательности анализируют с использованием пакета прикладных программ Lasergene 6 Package® (DNASTAR, Inc., Madison, WI). Нуклеотидные последовательности вирусов, выделенных из инфицированных собак, сравнивают с последовательностями вируса в используемом инокуляте, с целью определения возможных изменений, произошедших в ходе репликации в дыхательных путях.
ПРИМЕР 12 - КЛИНИЧЕСКАЯ КАРТИНА ЗАБОЛЕВАНИЯ
У всех 6 собак с инокулированным вирусом развилась временная лихорадка (с ректальной температурой ≥39°C) в течение первых 2 дней после инокуляции, однако, в ходе 6-дневного периода наблюдения не было отмечено респираторных симптомов, таких как кашель или выделения из носа. При этом ложно инокулированные собаки оставались клинически здоровыми.
ПРИМЕР 13 - ВЫДЕЛЕНИЕ ВИРУСА В ОКРУЖАЮЩУЮ СРЕДУ
Нуклеопротеин вируса гриппа A был выявлен в орофарингеальном мазке, взятом от одной собаки с инокулированным вирусом через 24 часа после инокуляции. Тогда как по данным количественной ОТ-ПЦР в масштабе реального времени, орофарингеальные мазки, взятые от одной собаки через 72, 84 и 120 часов после инокуляции, и у другой собаки через 108, 120 и 132 часа после инокуляции, дали положительные результаты на наличие вируса (Таблица 11). Абсолютное число копий гена M на мкл экстракта из тампона возрастает со временем, в период от 3 до 6 дней после инокуляции. Тогда как в ректальных мазках вирус выделен не был.
ПРИМЕР 14 - ПОСМЕРТНЫЙ ОСМОТР
В отличие от предшествующих исследований с экспериментальным инфицированием собак бигль, не содержавших патогена (Crawford et al., 2005), у помесных собак с инокулированным вирусом развилась пневмония, как следовало по данным общего осмотра животных и по результатам гистологического анализа легких, проведенного в период от 1 до 6 дня после инокуляции. Кроме пневмонии, указанные собаки имели ринит, трахеит, бронхит и бронхиолит, аналогично тому, что было ранее зарегистрировано для собак, инфицированных естественным образом (Crawford et al., 2005). Отмечаются некроз и эрозия эпителиальной выстилки дыхательных путей и бронхиальных желез, с сопутствующей инфильтрацией нейтрофилов и макрофагов в подслизистые ткани (фиг.5, верхние панели). При проведении иммуногистохимического анализа был выявлен вирусный антиген H3 в эпителиальных клетках бронхов, бронхиол и бронхиальных желез (фиг.5, нижние панели). Не обнаружено бактериальной суперинфекции. Ткани дыхательных путей, взятые от 2 ложно инокулированных собак были нормальными.
ПРИМЕР 15 - РЕПЛИКАЦИЯ ВИРУСА В ТРАХЕЯХ И ЛЕГКИХ
По данным количественной ОТ-ПЦР в масштабе реального времени, трахеи и легкие были положительными на наличие вируса у всех собак в период от 1 до 6 дня после инокуляции (Таблица 12). Абсолютное число копий гена М вируса гриппа на мкл гомогената трахей возрастает в период от 1 до 5 дня после инокуляции, и затем снижается к 6 дню. Абсолютное число копий гена М вируса гриппа на мкл гомогената легких снижается в период от 1 до 6 дня после инокуляции. В основном, трахеи содержат ≥ одного log10 больше вируса, чем легкие, на 6 день после инокуляции.
Таблица 11 Детекция выделения вируса в орофаринксе помесных собак с инокулированным вирусом собачьего гриппа, по данным количественной ОТ-ПЦР в масштабе реального времени |
|||
Идентификация собаки | Время после инокуляции (часы)a | M/GAPDH, соотношениеb | Матричный ген (копии / мкл)c |
860 | 72 | 1,20 | 1,57E+02 |
84 | 1,30 | 8,25E+02 | |
120 | 1,23 | 1,47E+03 | |
894 | 108 | 1,17 | 1,17E+02 |
120 | 1,41 | 1,37E+02 | |
132 | 1,27 | 3,74E+02 | |
a Время, прошедшее после инокуляции помесным собакам вируса A/canine/FL/43/04 (H3N8) перед отбором у них орофарингеальных мазков. b Коэффициенты, используемые для нормализации результатов, получаемых при делении показателя Ct для M на Ct для GAPDH для каждого экстракта из тампона. c Абсолютное число копий матричного гена на мкл экстракта тампона. |
Таблица 12 Выявление репликации вируса в трахеях и легких помесных собак с инокулированным вирусом собачьего гриппа, по данным количественной ОТ-ПЦР в масштабе реального времени |
|||||
Идентификация собаки | Время после инокуляции (часы)a | M/GAPDH, соотношениеb | Матричный ген (копии / мкл)c | ||
Легкое | Трахея | Легкое | Трахея | ||
797 | 24 | 1,20 | 1,43 | 8,22E+05 | 3,11E+04 |
801 | 48 | 1,33 | 0,99 | 1,15E+05 | 6,52E+06 |
789 | 72 | 1,44 | 1,12 | 2,39E+04 | 1,56E+05 |
819 | 96 | 1,40 | 1,27 | 3,19E+04 | 1,43E+05 |
860 | 120 | 1,59 | 1,04 | 3,48E+03 | 1,17E+06 |
894 | 144 | 1,70 | 1,15 | 4,78E+02 | 1,50E+03 |
а Время, прошедшее после инокуляции собакам вируса A/canine/FL/43/04 (H3N8) перед отбором тканей. b Коэффициенты, используемые для нормализации результатов, получаемых при делении показателя Ct для M на Ct для GAPDH для каждого гомогената ткани. c Абсолютное число копий матричного гена на мкл гомогената ткани. |
МАТЕРИАЛЫ И РЕПРЕЗЕНТАТИВНЫЕ МЕТОДЫ ДЛЯ ПРИМЕРА 16
Штаммы вирусов
Штаммы вируса гриппа собаки, а также штаммы соответствующих вирусов из птиц, лошади и человека (перечисленные в Таблице 15), размножают в эмбрионах куриных яиц или в клетках MDCK, и определяют их инфективность путем титрования серийных разведений, с определением конечной точки, в куриных эмбрионах или в рамках теста на бляшкообразование. Быстрым методом количественной оценки вируса является тест на гемагглютинацию, проводимый с использованием эритроцитов индейки.
Образцы, используемые для диагностики
В ходе вспышки 2005 г. отбирают в общей совокупности 60 тканей легкого у собак, в отношении которых имелись основания, подозревать развитие вирусного респираторного заболевания, которые исследуют на наличие у них вируса собачьего гриппа.
Экстракция РНК из образцов тканей собак
Блоки ткани легкого весом от 20 до 30 мг гомогенизируют с использованием одноразового измельчителя тканей (Kendal). Суммарную РНК экстрагируют с использованием коммерческого набора (RNeasy Mini Kit, Qiagen, Valencia, CA), и далее проводят элюцию в конечном объеме 60 мкл, в соответствии с рекомендациями производителя.
Разработанные для анализа праймеры и зонды
Проводят множественные сопоставления последовательностей для H3 и M генов из множества подтипов и различных видов с использованием программы CLUSTAL X (версия 1.8). Выбирают матричные (M) праймеры и зонды из консервативных участков известных последовательностей, соответствующих различных подтипам вируса гриппа A, тогда как ген-специфичные праймеры для гемагглютинина H3 и набор зондов выбирают таким образом, чтобы можно было отслеживать специфическое спаривание генов из вирусов лошадиного и собачьего гриппа A и ошибочное спаривание гомологичных птичьих и человеческих генов (Таблица 13). Был использован соответствующий пакет прикладных программ, используемый для разработки праймеров (OLIGOS версия 9.1), а также информация веб-сайта, построенного на результатах анализа с использованием инструментов, доступных в рамках программы EXIQON (http://lnatools.com), для расчета показателя Tm и прогностических оценок вторичной структуры и возможности самогибридизации. Был использован консервативный участок гена 18S рРНК, в качестве внутреннего эндогенного контроля для оценки наличия РНК, экстрагированной из образца ткани собаки. Были использованы реагенты TaqMan® для проведения теста на наличие эукариотической 18S рРНК (VIC/TAMRA) (Applied Biosystems) для детекции в реальном времени 18S рРНК в образцах ткани.
Условия проведения ОТ-ПЦР в масштабе реального времени
Проводят одностадийную ОТ-ПЦР в масштабе реального времени с использованием набора для ОТ-ПЦР Quantitect Probe RT-PCR, содержащего ROX, в качестве пассивного эталонного красителя (Qiagen, Valencia, CA). Для каждой из ОТ-ПЦР, проводимой в масштабе реального времени, используют 5 мкл образца РНК, в качестве матрицы, в составе реальной смеси, содержащей 10 мкл основной смеси зондов для ОТ-ПЦР (2X QuantiTech Probe RT-PCR Master Mix), 0,2 мкл смеси QuantiTech RT Mix, праймеры (в конечной концентрации 0,4 мкМ, для H3 гена, или в конечной концентрации 0,6 мкМ, для M гена), зонд (в конечной концентрации 0,1 мкМ, для H3 гена, или в конечной концентрации 0,2 мкМ, для M гена) и воду, не содержащую РНКазу, до общего конечного объема 20 мкл. Одностадийную ОТ-ПЦР в масштабе реального времени проводят в системе Mx3005P Real-Time QPCR System (Stratagene). Условия циклической обработки включают стадию обратной транскрипции при температуре 50°C в течение 30 минут. После проведения стадии начальной денатурации при температуре 95°C в течение 15 минут, с целью активации ДНК-полимеразы HotStarTaq, проводят амплификацию в ходе 40 циклов, включающих денатурацию (94°C в течение 15 секунд) и отжиг/наращивание (60°C в течение 30 секунд). Флуоресцентные сигналы FAM (длина волны эмиссии при 516 нм, для детекции H3 и M) и VIC (длина волны эмиссии при 555 нм, для детекции 18S рРНК) получают один раз в конце стадии расширения. Сбор и анализ данных, полученных в ходе ПЦР теста в масштабе реального времени, проводят с использованием программного обеспечения Mx3005P, версия 2.02 (Stratagene).
Специфичность H3 праймеров/набора зондов для вируса собачьего гриппа (H3N8) и универсальность M праймеров/набора зондов для вируса собачьего гриппа типа A
Для оценки специфичности каждого из праймеров/набора зондов используют РНК, экстрагированную из нескольких известных подтипов вирусов гриппа A, в качестве матрицы в тесте на основе ОТ-ПЦР в масштабе реального времени (Таблица 15).
Стандартная РНК, используемая для проведения ОТ-ПЦР в масштабе реального времени
Используют гены вируса собачьего гриппа A (A/canine/Florida/242/2003(H3N8)) с целью создания ПЦР ампликонов для H3 (нт 1-487) и M (нт 1-276) с использованием праймеров, соединенных с T7 промотором (Таблица 13). Затем очищенные ПЦР ампликоны H3 и M генов используют в качестве матриц для проведения транскрипции in vitro с использованием системы транскрипции Riboprobe in vitro Transcription System-T7 (Promega), в соответствии с рекомендациями производителя. Концентрации транскрибированных РНК рассчитывают при измерении поглощения при длине волны 260 нм. Далее делают 10-кратные серийные разведения РНК, в диапазоне от 108 до 10 копий/мкл, для проведения тестов на чувствительность. Кроме того, строят стандартную кривую зависимости log исходных концентраций матричных РНК (копии/мкл) от порогового значения цикла (Ct), полученного для каждого разведения, с тем чтобы определить общие характеристики ОТ-ПЦР в масштабе реального времени.
Сравнительные тесты на чувствительность между ОТ-ПЦР в масштабе реального времени и набором для анализа Directigen Flu A
Используют основные вирусные препараты двух вирусных штаммов, включающих A/Wyoming/3/2003 (H3N2) с показателем 106,67 EID50/мл (HA=64) и A/canine/Florida/242/2003(H3N8) с показателем 107,17 EID50/мл (HA=16), в методе определения порогового показателя. Используют логарифмические разведения образцов в фосфатно-буферном растворе (PBS) (125 мкл), включенные в набор для быстрой детекции антигена вируса гриппа A, Directigen Flu A (Becton, Dickinson and Company), в соответствии с инструкциями производителя. Устройство для каждого из анализов в рамках теста с использованием набора Directigen Flu A содержит в центре мембраны пятно нанесенного антигена из вируса гриппа H1N1, которое приобретает вид точки фиолетового цвета, указывая на пригодность системы тестирования, основанной на моноклональном антителе против нуклеопротеина (NP). Образование фиолетового треугольника вокруг точки указывает на наличие в исследуемом образце NP вируса гриппа. Интенсивность фиолетового сигнала, регистрируемая от треугольника, ранжируется в следующем порядке: + (очертание треугольника), ++ (слегка окрашенный треугольник), +++ (темно-фиолетовый треугольник) и ++++ (очень темно-фиолетовый треугольник). Вирусную РНК экстрагируют аликвотами по 125 мкл каждого из разведений вируса с использованием мининабора для вирусной РНК QIAamp Viral RNA Mini Kit (Qiagen, Valencia, CA) и далее проводят элюцию в конечном объеме 50 мкл. Экстрагированные вирусные РНК в объеме 5 мкл анализируют в рамках ОТ-ПЦР в масштабе реального времени, для проведения сравнительной оценки относительно метода тестирования, включающего использование набора Directigen Flu A.
ПРИМЕР 16
Тест в рамках ОТ-ПЦР в масштабе реального времени на наличие вируса собачьего гриппа основан на информации, доставляемой тремя молекулярными зондами, которые направляют 18S рРНК из клетки-хозяина, а также M и H3 гены из генома вируса гриппа A (Таблица 14). Амплификация гена-хозяина является показателем качества и целостности образца. Ожидалось, что клинические образцы, равно как и образцы некропсии или лабораторные образцы, содержащие вирус собачьего гриппа (H3N8), продемонстрируют сигнал амплификации с тремя зондами. Образцы, демонстрирующие сигнал амплификации с зондами для M и 18S рРНК, но дающие отрицательную реакцию для H3, могут рассматриваться как индикаторные на наличие вируса гриппа, подтипа H3, взятого от человека, свиньи или птицы, или подтипов, отличных от H3. Такие случаи могут быть далее прояснены в рамках ОТ-ПЦР с использованием универсальных праймеров HA, способных создавать ампликон кДНК, который может быть далее проанализирован секвенированием. Отобранные и обработанные соответствующим образом образцы, которые не содержат вируса гриппа A, демонстрируют только сигнал амплификации для 18S рРНК. Ситуации, в которых только зонд для 18S рРНК и H3 зонды генерируют сигнал амплификации, являются индикаторами ошибочности в проведении методики, если не доказано обратное; или в этом случае следует подтвердить ложно-негативный результат для M зондов или ложно-позитивный результат для H3. И, наконец, образцы, которые не демонстрируют сигналы амплификации с тремя зондами, являются показателями дефектов в процессе отбора образца, его деградации, некорректности в процессе экстракции РНК или наличия ингибиторов полимераз, используемых в ПЦР.
Для оценки специфичности H3 праймеров/набора зондов для вируса собачьего гриппа A (H3N8) и универсальности M праймеров/набора зондов для вируса гриппа типа A, несколько подтипов вирусов гриппа А тестируют по методу ОТ-ПЦР в масштабе реального времени. Полученные результаты показывают, что H3 праймеры/набор зондов дают позитивный сигнал амплификации только с вирусом собачьего гриппа (H3N8). Для других подтипов или для человеческих Н3 штаммов не наблюдалось значимых ложно-позитивных или неспецифических сигналов амплификации. M праймеры/набор зондов генерируют позитивный сигнал амплификации со всеми исследованными штаммами (Таблица 15). Полученные результаты показывают, что H3 праймеры/зонды способны специфически выявлять вирус собачьего гриппа A (H3N8), тогда как M праймеры/зонды выявляют множество подтипов вирусов гриппа типа A.
Результаты тестов в рамках ОТ-ПЦР в масштабе реального времени оценивают по точке конечного разведения транскрибированных in vitro рРНК для M и H3. Как ожидалось, пороговое значение цикла (Ct) возрастает прямо пропорционально разведению стандартов РНК. Флуоресцентные сигналы могут быть выявлены при разведениях стандартов РНК для M и H3 до 103 и 102 копий/мкл, соответственно (фиг.6A и 6B). Стандартные кривые для M и H3 генов получают при построении графика зависимости log исходных концентраций РНК от порогового значения цикла (Ct), полученного для каждого разведения (фиг.6C и 6D). Угол наклона стандартной кривой используется в качестве показателя, позволяющего определить эффективность реакции ПЦР, которая теоретически является экспоненциальной; при этом показатель 100% эффективности амплификации будет означать удвоение концентрации ампликона в каждом цикле. Стандартные кривые с углом наклона в диапазоне примерно от -3,1 до -3,6 в типичном случае приемлемы для большинства вариантов применения, требующих точного количественного определения (в плане тщательности выявления) (где эффективность реакции достигает 90-110%). Показатель Rsq представляет собой коэффициент, используемый с целью преставления и анализа всех данных в графической форме. Если все данные укладываются точно на одну линию, то показатель Rsq будет равен 1,00. По мере удаления данных от указанной линии, показатель Rsq будет снижаться. Для большинства вариантов тестирования приемлем показатель Rsq ≥ 0,985. Стандартная кривая для M имеет угол наклона -3,576 (эффективность = 90,4%) и, в этом случае, показатель Rsq = 1,00, тогда как стандартная кривая для H3 имеет угол наклона -3,423 (эффективность = 95,9%), и для нее показатель Rsq = 0,999. Приведенные значения представляют собой удовлетворительную эффективность амплификации и, в целом, характера тестирования по методу ОТ-ПЦР в масштабе реального времени. Авторы связывают сниженную эффективность и чувствительность M праймеров/набора зондов, относительно варианта H3 праймеров/набора зондов, с N-кратной вырожденностью праймерных последовательностей для M, необходимых для охвата генных последовательностей М, в связи с более расширенным в этом случае диапазоном, определяемым вариабельностью множества подтипов вирусов, организмов-хозяев и клеточных линий.
Чувствительность процедуры тестирования по методу ОТ-ПЦР в масштабе реального времени сравнивают с данным показателем для коммерческого набора, применяемой с целью быстрой детекции антигена (Directigen Flu A). Анализируют логарифмические разведения вирусов A/Wyoming/3/2003 (H3N2) и A/canine/Florida/242/2003(H3N8) с использованием набора Directigen Flu A и по процедуре ОТ-ПЦР в масштабе реального времени. Результаты оценки с использованием набора Directigen Flu A показывают, что чувствительность против обоих вирусных штаммов характеризуется величиной, равной примерно 100-кратному разведению основных препаратов вирусов, использованных в данных экспериментах (фиг.7). Сигналы (фиолетовое окрашивание), создаваемые образцами с вирусом собаки (A/canine/Florida/242/2003: 106,x БОЕ/мл), были намного слабее, чем соответствующие сигналы, выявленные для человеческого вируса (A/Wyoming/3/2003: 107,x БОЕ/мл), что согласуется с более низкой концентрацией вируса в этих образцах. Альтернативно, более низкий сигнал в случае вируса собачьего гриппа может определяться молекулярной специфичностью моноклональных антител против NP; т.е. может иметь отношение к недостаточной консервации аминокислот в NP эпитопа вирусов собачьего гриппа.
Чувствительность тестирования по методу ОТ-ПЦР в масштабе реального времени применительно к гену M приводит к получению показателей Ct, превышающих порог для реакции с вирусными эквивалентами в 10 и 30 БОЕ применительно к A/canine/Florida/242/2003 и A/Wyoming/3/2003, соответственно (Таблица 16). Различия между показателями чувствительности 2 вирусных штаммов определяются разницей в исходных титрах этих вирусов. Сравнительное исследование вирусов собачьего и человеческого гриппа применительно к возможности детекции в них гена H3 не проводилось, поскольку H3 праймеры/зонды в использованном авторами тесте по методу ОТ-ПЦР в масштабе реального времени приводили к амплификации исключительного вируса собачьего гриппа типа А. При этом тест по процедуре ОТ-ПЦР был в 105 более чувствительным, чем набор для быстрой детекции антигена.
Для оценки возможностей теста по методу ОТ-ПЦР при исследовании образцов некропсии, взятых от собак с острым респираторным заболеванием, провели анализ по методу ОТ-ПЦР в масштабе реального времени шестидесяти образцов тканей легкого, отобранных в 2005 г., с целью выявления вируса собачьего гриппа A. В случае 12 из 60 исследованных образцов (20%) проведенный анализ дал позитивный результаты для генов M и H3, тогда как оставшиеся 48 образцов дали отрицательный результат и для гена M, и для гена H3. Были предприняты попытки выделения вируса с использованием метода инокуляции в куриные яйца и клетки MDCK, с тем чтобы оценить специфичность теста в масштабе реального времени; в случае 2 из 12 образцов, которые были позитивными, по данным ОТ-ПЦР, для вируса собачьего гриппа, было продемонстрировано наличие вируса собачьего гриппа (данные не показаны, рукопись находится в печати). Несмотря на то, что все ткани были взяты от собак, у которых было ранее зарегистрировано респираторное заболевание, в большинстве образцов не был выявлен вирус собачьего гриппа, ни по процедуре ОТ-ПЦР в масштабе реального времени, ни при проведении стандартного выделения, что может указывать на высокую вероятность наличия других респираторных патогенов, таких как Bordetella bronchiseptica, возбудитель чумы собак или вирус парагриппа. В этой связи, одностадийный тест по методу ОТ-ПЦР в масштабе реального времени обеспечивает быструю, чувствительную и недорогую процедуру для выявления вируса собачьего гриппа A (H3N8). А быстрая лабораторная диагностика инфекций, вызванных вирусом собачьего гриппа A (H3N8), на ранних стадиях заболевания может дать релевантную информацию, важную для оценки клинического состояния животного и соответствующих для данного случая эффективных стратегий.
Таблица 13 Праймеры и пробы, использование для детекции по методу ОТ-ПЦР и при транскрипции in vitro |
||||
Название олигонуклеотида | Тип | Мишень | Последовательность * | Вариант применения |
Ca-H3-F387 | Прямой праймер | H3 (нт 387-406) | 5’-tatgcatcgctccgatccat-3’ (SEQ ID NO: 79) | ПЦР в масштабе реального времени |
Ca-H3-R487 | Обратный праймер | H3 (нт 487-467) | 5’-gctccacttcttccgttttga-3’ (SEQ ID NO: 80) | |
Ca-H3-P430 | Зонд TaqMan | H3 (нт 430-459) | FAM-aattcacagcagagggattcacatggacag-BHQ1 (SEQ ID NO: 81) | |
FluA-M-F151 | Прямой праймер | M (нт 151-174) | 5’-catggartggctaaagacaagacc-3’ (SEQ ID NO: 82) | ПЦР в масштабе реального времени |
FluA-M-R276 | Обратный праймер | M (нт 276-253) | 5’-agggcattttggacaaakcgtcta-3’ (SEQ ID NO: 83) | |
FluA-M-P218 | LNA Зонд TaqMan |
M (нт 218-235) | FAM-acgcTcaccgTgcccAgt-BHQ1 (SEQ ID NO: 84) | |
H3-F1 | Прямой праймер | H3 (нт 1-14) | 5’-tattcgtctcagggagcaaaagcagggg-3’ (SEQ ID NO: 85) | Транскрипция in vitro |
T7/H3-R490 | Обратный праймер | T7 / H3 (нт 487-467) | 5’-tgtaatacgactcactatagggctccacttcttccgttttga-3’ (SEQ ID NO: 86) | |
M-F1 | Прямой праймер | M (нт 1-15) | 5’-gatcgctcttcagggagcaaaagcaggtag-3’ (SEQ ID NO: 87) | Транскрипция in vitro |
T7/M-R276 | Обратный праймер | M (нт 276-253) | 5’-tgtaatacgactcactatagggcattttggacaaagcgtc-3’ (SEQ ID NO: 88) | |
Примечание: буквы верхнего регистра = остатки LNA (закрытая нуклеиновая кислота), r = a или g, k= g или t, буквы нижнего регистра = промоторная последовательность T7. |
Таблица 14 Интерпретация теста по методу ОТ-ПЦР в масштабе реального времени |
|||
Интерпретация результата | Результаты | ||
M | H3 | 18S рРНК | |
Позитивный на вирус собачьего гриппа A (H3N8) | + | + | + |
Позитивный на вирус гриппа A (неизвестный подтип) | + | - | + |
Отрицательный на вирус гриппа A | - | - | + |
Ошибка в экстракции РНК или присутствие ингибитора ПЦР | - | - | - |
Таблица 15 Специфичность теста с H3 праймерами/набором зондов (из собаки) и универсальность теста с M праймерами/набором зондов (из собаки) применительно к нескольким подтипам вирусов гриппа А |
||||
Подтипы | Название штамма | Организм-хозяин | Детекция по ОТ-ПЦР в реальном времени | |
ген H3 (Ct) | ген M (Ct) | |||
H1 | A/Ohio/1983 | Человек | нет данных по Ct | 15,40 |
A/WSN/1933 | Человек | нет данных по Ct | 20,09 | |
H3 | A/Wyoming/3/2003 | Человек | нет данных по Ct | 28,85 |
A/Victoria/3/1975 | Человек | нет данных по Ct | 16,62 | |
A/canine/FL/242/2003 | Собака | нет данных по Ct | 29,25 | |
H4 | Turkey/MN/1066/1980 | Птица | нет данных по Ct | 17,49 |
Клинический образец* | Птица | нет данных по Ct | 20,87 | |
H5 | AChicken/Thailand/CUK2/2004 | Птица | нет данных по Ct | 20,13 |
A/Pheasant/NJ/1335/1998 | Птица | нет данных по Ct | 16,64 | |
H6 | Клинический образец* | Птица | нет данных по Ct | 19,52 |
H10 | Клинический образец* | Птица | нет данных по Ct | 25,64 |
Клинический образец* | Птица | нет данных по Ct | 19,59 | |
H11 | Клинический образец* | Птица | нет данных по Ct | 15,72 |
Клинический образец* | Птица | нет данных по Ct | 24,55 | |
* Примечание: некоторые подтипы клинических образцов были подвергнуты нуклеотидному секвенированию для подтверждения их характеристик. |
Таблица 16 Сравнение теста по методу ОТ-ПЦР в масштабе реального времени и теста, основанного на использовании набора Directigen Flu A, по их чувствительности на выявление вируса гриппа A |
||||
Разведения вируса | Directigen Flu A | ОТ-ПЦР в реальном времени для M (Ct) | ||
A/canine/242/03 | A/Wyoming/3/03 | A/canine/242/03 | A/Wyoming/3/2003 | |
10-1 | + + | + + + + | 22,42 | 19,48 |
10-2 | + | + + + | 25,85 | 22,66 |
10-3 | - | - | 29,27 | 25,76 |
10-4 | Не проводили | Не проводили | 32,66 | 28,66 |
10-5 | Не проводили | Не проводили | 35,48 | 33,14 |
10-6 | Не проводили | Не проводили | 37,51 | 35,06 |
10-7 | Не проводили | Не проводили | 39,09 | 36,44 |
10-8 | Не проводили | Не проводили | Нет данных по Ct | 38,93 |
Таблица 17 | |
Класс аминокислот | Примеры аминокислот |
Неполярные | Ala, Val, Leu, Ile, Pro, Met, Phe, Trp |
Незаряженные полярные | Gly, Ser, Thr, Cys, Tyr, Asn, Gln |
Кислотные | Asp, Glu |
Основные | Lys, Arg, His |
Таблица 18 | |||
Буквенный символ | Аминокислота | Буквенный символ | Аминокислота |
A | Аланин | M | Метионин |
B | Аспарагин или аспарагиновая кислота | N | Аспарагин |
C | Цистеин | P | Пролин |
D | Аспарагиновая кислота | Q | Глютамин |
E | Глютаминовая кислота | R | Аргинин |
F | Фенилаланин | S | Серин |
G | Глицин | T | Треонин |
H | Гистидин | V | Валин |
I | Изолейцин | W | Триптофан |
K | Лизин | Y | Тирозин |
L | Лейцин | Z | Глютамин или глютаминовая кислота |
Таблица 19 Различия на уровне аминокислот между белками PB2 из H3N8 вирусов гриппа лошади и собаки |
|||
Положение | Консенсусная последовательность лошади* | Canine/FL/03 | Canine/FL/04 |
5 | K | K | E |
12 | S | L | L |
37 | G | G | E |
175 | R | R | I |
374 | L | I | I |
375 | R | R | K |
447 | Q | Q | H |
Таблица 20 Различия на уровне аминокислот между белками PB1 из H3N8 вирусов гриппа лошади и собаки |
|||
Положение | Консенсусная последовательность лошади* | Canine/FL/03 | Canine/FL/04 |
114 | V | I | I |
154 | D | G | G |
221 | A | T | T |
317 | M | I | I |
459 | I | I | V |
682 | I | I | V |
Таблица 21 Различия на уровне аминокислот между белками PA из H3N8 вирусов гриппа лошади и собаки |
|||
Положение | Консенсусная последовательность лошади* | Canine/FL/03 | Canine/FL/04 |
27 | D | N | N |
62 | I | V | V |
213 | R | K | K |
337 | A | T | T |
343 | A | E | E |
345 | L | I | I |
353 | K | R | R |
400 | T | T | A |
450 | V | I | I |
460 | M | M | I |
673 | R | R | K |
675 | N | D | D |
*Данные получены на основе доступных генов из вирусов, выделенных в период от 1963 до 1998 гг. |
Таблица 22 Различия на уровне аминокислот между белками NP из H3N8 вирусов гриппа лошади и собаки |
|||
Положение | Консенсусная последовательность лошади* | Canine/FL/03 | Canine/FL/04 |
16 | G | D | D |
157 | A | T | T |
214 | R | R | K |
285 | V | V | I |
286 | A | T | T |
359 | A | T | T |
375 | D | D | N |
384 | R | K | K |
452 | R | K | K |
Таблица 23 Различия на уровне аминокислот между белками NA из H3N8 вирусов гриппа лошади и собаки |
|||
Положение | Консенсусная последовательность лошади* | Canine/FL/03 | Canine/FL/04 |
9 | A/T | T | A |
12 | S | F | F |
20 | L | I | I |
40 | G | R | R |
42 | G | D | D |
46 | N | K | K |
52 | E | E | K |
61 | R | K | K |
69 | N | S | S |
72 | E | K | K |
201 | V | I | I |
261 | I | V | V |
301 | I | I | V |
396 | N | D | D |
397 | L | P | P |
Таблица 24 Различия на уровне аминокислот между белками М1 из H3N8 вирусов гриппа лошади и собаки |
|||
Положение | Консенсусная последовательность лошади* | Canine/FL/03 | Canine/FL/04 |
M1 161 | S | S | A |
M1 208 | K/Q | R | R |
* Данные получены на основе доступных генов из вирусов, выделенных в период от 1963 до 1998 гг. |
Таблица 25 Различия на уровне аминокислот между белками NS1 из H3N8 вирусов гриппа лошади и собаки |
|||
Положение | Консенсусная последовательность лошади* | Canine/FL/03 | Canine/FL/04 |
44 | K | R | R |
59 | R | H | H |
71 | E | K | K |
86 | A | T | T |
88 | R | R | L |
140 | R | G | G |
216 | P | S | S |
* Данные получены на основе доступных генов из вирусов, выделенных в период от 1963 до 1998 гг. |
Следует понимать, что примеры и варианты осуществления настоящего изобретения, приведенные в данном тексте, даны лишь с целью иллюстрации, и возможны различные модификации или изменения, которые могут быть внесены специалистами в данной области, в свете приведенного описания, и которые охватываются принципами и областью настоящей заявки.
СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ
Патент США No. 5,106,739
Патент США No. 5,034,322
Патент США No. 6,455,760
Патент США No. 6,696,623
Патент США No. 4,683,202
Патент США No. 4,683,195
Патент США No. 4,800,159
Патент США No. 4,965,188
Патент США No. 5,994,056
Патент США No. 6,814,934
Опубликованная заявка США No. 20040078841
Опубликованная заявка США No. 20040067506
Опубликованная заявка США No. 20040019934
Опубликованная заявка США No. 20030177536
Опубликованная заявка США No. 20030084486
Опубликованная заявка США No. 20040123349
Greyhound Daily News, 1/28/99. National Greyhound Association (NGA), Abilene, Kansas. http://www.NGAgreyhounds.com.
Personal communication, Dr. William Duggar, veterinarian at Palm Beach Kennel Club, West Palm Beach, Florida.
Altschul, S. F. et al. (1990) "Basic Local Alignment Search Tool" J. Mol. Biol. 215:402-410.
Altschul, S. F. et al. (1997) "Gapped BLAST and PSI-BLAST: A New Generation of Protein Database Search Programs" Nucl. Acids Res. 25:3389-3402.
An, G. (1987) "Binary Ti vectors for plant transformation and promoter analysis" Methods Enzymol. 153:292-305.
Beltz, G. A., Jacobs, K. A., Eickbush, T. H., Cherbas, P. T., Kafatos, F. C. (1983) "Isolation of multigene families and determination of homologies by filter hybridization methods" Methods of Enzymology, R. Wu, L. Grossman and K. Moldave [eds.] Academic Press, New York 100:266-285.
Burleson, F. et al. (1992) Virology: A Laboratory Manual (Academic Press).
Byars, N.E., A.C. Allison (1987) "Adjuvant formulation for use in vaccines to elicit both cell-mediated and humoral immunity" Vaccine 5:223-228.
Crawford, P.C. et al. (2005) "Transmission of equine influenza virus to dogs" Science 310:482-485.
Chang, C.P. et al. (1976) "Influenza virus isolations from dogs during a human epidemic in Taiwan" Int J Zoonoses 3:61-64.
Dacso, C.C. et al. (1984) "Sporadic occurrence of zoonotic swine influenza virus infections" J Clin Microbiol 20:833-835.
de Boer, H. A., Comstock, L. J., Vasser, M. (1983) "The tac promoter: a functional hybrid derived from the trp and lac promoters" Proc. Natl. Acad. Sci. USA 80(1):21-25.
Felsenstein, J. (1989) Cladistics 5:164.
Fields et al. (1946) Fields Virology, 3rd ed., Lippincott-Raven publishers.
Ford, R.B., Vaden, S.L. (1998) "Canine infectious tracheobronchitis" In Infectious Diseases of the Dog and Cat, 2nd edition, C.E. Greene, editor, W.B. Saunders Co., Philadelphia, PA, pp. 33-38.
Fouchier et al., (2000) Journal of Clinical Microbiology 38 (11):4096-4101.
Good, X. et al. (1994) "Reduced ethylene synthesis by transgenic tomatoes expressing S-adenosylmethionine hydrolase" Plant Molec. Biol. 26:781-790.
Guan, Y. et al. (2004) "H5N1 influenza: a protean pandemic threat" Proc Natl Acad Sci U S A 101:8156-8161.
Guo, Y. et al. (1992) "Characterization of a new avian-like influenza A virus from horses in China" Virology 188:245-255.
Houser, R.E. et al. (1980) "Evidence of prior infection with influenza A/Texas/77 (H3N2) virus in dogs with clinical parainfluenza" Can J Comp Med 44:396-402.
Karasin, A.I. et al. (2000) "Isolation and characterization of H4N6 avian influenza viruses from pigs with pneumonia in Canada" J Virol 74:9322-9327.
Karlin S. and Altschul, S. F. (1990) "Methods for Assessing the Statistical Significance of Molecular Sequence Features by Using General Scoring Schemes" Proc. Natl. Acad. Sci. USA 87:2264-2268.
Karlin S. and Altschul, S. F. (1993) "Applications and Statistics for Multiple High-Scoring Segments in Molecular Sequences" Proc. Natl. Acad. Sci. USA 90:5873-5877.
Kawaoka, Y. et al., (1989) "Avian-to-human transmission of the PB1 gene of influenza A viruses in the 1957 and 1968 pandemics" J Virol 63:4603-4608.
Keawcharoen, J. et al. (2004) "Avian influenza H5N1 in tigers and leopards" Emerg Infect Dis 10:2189-2191.
Kendal, A. P. et al. (1982) In Concepts and Procedures for Laboratory-based Influenza Surveillance . A. P. Kendal, M. S. Pereira, J. J. Skehel, Eds. (U.S. Department of Health and Human Services, Centers for Disease Control and Prevention and Pan-American Health Organization, Atlanta, GA, United States) pp. B17-B35.
Kilbourne, E.D. et al. (1975) "Demonstration of antibodies to both hemagglutinin and neuraminidase antigens of H3N2 influenza A virus in domestic dogs" Intervirology 6:315-318.
Kimura, K. et al. (1998) "Fatal case of swine influenza virus in an immunocompetent host" Mayo Clin Proc 73:243-245.
Klimov, A. I. et al. (1992a) "Sequence changes in the live attenuated, cold-adapted variants of influenza A/Leningrad/134/57 (H2N2) virus" Virology 186:795-797.
Klimov A. et al. (1992b) "Subtype H7 influenza viruses: comparative antigenic and molecular analysis of the HA-, M-, and NS-genes" Arch Virol. 122:143-161.
Kovacova, A. et al. (2002) "Sequence similarities and evolutionary relationships of influenza virus A hemagglutinins" Virus Genes 24:57-63.
Kuiken, T. et al. (2004) "Avian H5N1 influenza in cats" Science 306:241.
Kumar, S. et al. (2004) "MEGA3: Integrated software for Molecular Evolutionary Genetics Analysis and sequence alignment" Brief Bioinform 5:150-163.
Lee, L.G. et al. (1993) "Allelic discrimination by nick-translation PCR with fluorogenic probes" Nucleic Acids Res. 21(16):3761-3766.
Lewin, B. (1985) Genes II, John Wiley & Sons, Inc., p. 96.
Lipatov, A.S. et al. (2004) "Influenza: emergence and control" J Virol 78:8951-8959.
Livak, K. J. et al. (1995) "Oligonucleotides with fluorescent dyes at opposite ends provide a quenched probe system useful for detecting PCR product and nucleic acid hybridization" PCR Methods Appl. 4(6):357-362.
Maniatis, T., E.F. Fritsch, J. Sambrook (1982) "Nuclease Bal31" Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY.
Matrosovich, M. et al. (2000) "Early alterations of the receptor-binding properties of H1, H2, and H3 avian influenza virus hemagglutinins after their introduction into mammals" J Virol 74:8502-8512.
Maertzdorf et al., (2004) Clin Microbiol. 42(3):981-986.
Merrifield, R.B. (1963) "Solid Phase Peptide Synthesis. I. The Synthesis of a Tetrapeptide" J. Amer. Chem. Soc. 85:2149-2154.
Nikitin, A. et al. (1972) "Epidemiological studies of A-Hong Kong-68 virus infection in dogs" Bull World Health Organ 47:471-479.
Nobusawa, E. et al. (1991) "Comparison of complete amino acid sequences and receptor-binding properties among 13 serotypes of hemagglutinins of influenza A viruses" Virology 182:475-485.
Patriarca, P.A. et al. (1984) "Lack of significant person-to person spread of swine influenza-like virus following fatal infection in an immunocompromised child" Am J Epidemiol 119:152-158.
Payungporn S. et al. (2006a) "Detection of canine influenza A virus (H3N8) RNA by real-time RT-PCR" (in preparation for Journal of Clinical Microbiology).
Payungporn S, et al. (2006b) "Isolation and characterization of influenza A subtype H3N8 viruses from dogs with respiratory disease in a shelter and veterinary clinic in Florida" (in preparation for Emerging Infectious Diseases).
Peiris, M. et al. (1999) "Human infection with influenza H9N2" Lancet 354:916-917.
Peiris, J.S. et al. (2004) "Re-emergence of fatal human influenza A subtype H5N1 disease" Lancet 363:617-619.
Posnett, D. N. et al. (1988) "A Novel Method for Producing Anti-peptide Antibodies" J. Biol. Chem. 263(4):1719-1725.
Putnam, Bob (February 10, 1999) "Two illnesses seen in death of dogs" St. Petersburg Times.
Reid, A.H. et al. (2004) "Evidence of an absence: the genetic origins of the 1918 pandemic influenza virus" Nat Rev Microbiol 2:909-914.
Rowe, T. et al. (1999) "Detection of antibody to avian influenza A (H5N1) virus in human serum by using a combination of serologic assays" J Clin Microbiol 37: 937-943.
Saiki, R. (1985) "Enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle cell anemia" Science 230:1350-1354.
Sambrook, J. et al. (1989) "Plasmid Vectors" In: Molecular Cloning: A Laboratory Manual, 2d Edition, pp. 1.82-1.104. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York.
Subbarao, K. et al. (1998) "Characterization of an avian influenza A (H5N1) virus isolated from a child with a fatal respiratory illness" Science 279:393-396.
Suzuki, Y. et al. (2000) "Sialic acid species as a determinant of the host range of influenza A viruses" J Virol 74:11825-11831.
Tam, J. P. (1988) "Synthetic Peptide Vaccine Design: Synthesis and Properties of a High-Density Multiple Antigenic Peptide System" PNAS USA 85(15):5409-5413.
Top, Jr., F.H. et al. (1977) "Swine influenza A at Fort Dix, New Jersey (January-February 1976). IV. Summary and speculation" J Infect Dis 136 Suppl:S376-S380.
Vines, A. et al. (1998) "The role of influenza A virus hemagglutinin residues 226 and 228 in receptor specificity and host range restriction" J Virol 72:7626-7631.
Wagner, R. et al. (2002) "N-Glycans attached to the stem domain of haemagglutinin efficiently regulate influenza A virus replication" J Gen Virol 83:601-609.
Webby, R. et al. (2004) "Molecular constraints to interspecies transmission of viral pathogens" Nat Med 10:S77-S81.
Webster, R.G. (1998) "Influenza: an emerging disease" Emerg Infect Dis. 4:436-441.
Webster, R.G. et al. (1992) "Evolution and ecology of influenza A viruses" Microbiol Rev. 56 :152-179.
Weis, W. et al. (1988) "Structure of the influenza virus haemagglutinin complexed with its receptor, sialic acid" Nature 333:426-431.
Womble, D.D. (2000) "GCG: The Wisconsin Package of sequence analysis programs" Methods Mol Biol 132:3-22.
Xu, D., McElroy, D., Thornburg, R. W., Wu, R. et al. (1993) "Systemic induction of a potato pin2 promoter by wounding, methyl jasmonate, and abscisic acid in transgenic rice plants" Plant Molecular Biology 22:573-588.
Yang, T. T. et al. (1996) "Optimized Codon Usage and Chromophore Mutations Provide Enhanced Sensitivity with the Green Fluorescent Protein" Nucleic Acid Research 24(22):4592-4593.
Yoon K-Y. et al. (2005) "Influenza virus infection in racing greyhounds" Emerg Infect Dis. 11:1974-1975.
--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Crawford, Patti Cynthia
Gibbs, E. Paul J.
Dubovi, Edward J.
Donis, Ruben Omar
Katz, Jacqueline M.
Klimov, Alexander I.
<120> Материалы и методы, используемые для лечения респираторных
заболеваний у собак
<130> UF-445XC1
<150> US 60/673,443
<151> 2005-04-21
<160> 88
<170> PatentIn version 3.3
<210> 1
<211> 2277
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2277)
<400> 1
atg gag aga ata gaa gaa ctg aga gat ctg atg tta caa tcc cgc acc
48
Met Glu Arg Ile Glu Glu Leu Arg Asp Leu Met Leu Gln Ser Arg Thr
1 5 10 15
cgc gag ata cta aca aaa act act gtg gac cac atg gcc ata atc aag
96
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
aaa tac aca tca gaa aga caa gag aag aac cct gca ctt agg atg aaa
144
Lys Tyr Thr Ser Glu Arg Gln Glu Lys Asn Pro Ala Leu Arg Met Lys
35 40 45
tgg atg atg gca atg aaa tac cca att aca gca gat aag agg ata atg
192
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Met
50 55 60
gag atg att cct gag aga aat gaa cag ggt caa acc ctt tgg agc aaa
240
Glu Met Ile Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
acg aac gat gct ggc tca gac cgc gta atg gta tca cct ctg gca gtg
288
Thr Asn Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
aca tgg tgg aat agg aat gga cca aca acg agc aca att cat tat cca
336
Thr Trp Trp Asn Arg Asn Gly Pro Thr Thr Ser Thr Ile His Tyr Pro
100 105 110
aaa gtc tac aaa act tat ttt gaa aag gtt gaa aga ttg aaa cac gga
384
Lys Val Tyr Lys Thr Tyr Phe Glu Lys Val Glu Arg Leu Lys His Gly
115 120 125
act ttt ggc ccc gtt cat ttt agg aat caa gtc aag ata aga cga aga
432
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
gtt gat gta aac cct ggt cac gcg gac ctc agt gcc aaa gaa gca caa
480
Val Asp Val Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
gat gtg atc atg gaa gtt gtt ttc cca aat gaa gtg gga gcc ata att
528
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Ile Ile
165 170 175
cta aca tcg gaa tca caa cta aca ata acc aaa gag aaa aag gaa gaa
576
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
ctt cag gac tgc aaa att gct ccc ttg atg gta gca tac atg cta gaa
624
Leu Gln Asp Cys Lys Ile Ala Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
aga gag ttg gtc cga aaa aca agg ttc ctc cca gta gca ggc gga aca
672
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Ala Gly Gly Thr
210 215 220
agc agt gta tac att gaa gtg ttg cat ctg act cag gga aca tgc tgg
720
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
gag caa atg tac acc cca gga gga gaa gtt aga aac gat gat att gat
768
Glu Gln Met Tyr Thr Pro Gly Gly Glu Val Arg Asn Asp Asp Ile Asp
245 250 255
caa agt tta att att gca gcc cgg aac ata gtg aga aga gcg aca gta
816
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Thr Val
260 265 270
tca gca gat cca cta gca tcc cta ctg gaa atg tgc cac agt aca cag
864
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
att ggt gga ata agg atg gta gac atc ctt aag cag aat cca aca gag
912
Ile Gly Gly Ile Arg Met Val Asp Ile Leu Lys Gln Asn Pro Thr Glu
290 295 300
gaa caa gct gtg gat ata tgc aaa gca gca atg gga ttg aga att agc
960
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
tca tca ttc agc ttt ggt gga ttc acc ttc aaa aga aca agt gga tca
1008
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
tca gtc aag aga gaa gaa gaa atg ctt acg ggc aac ctt caa aca ttg
1056
Ser Val Lys Arg Glu Glu Glu Met Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
aaa ata aga gtg cat gag ggc tat gaa gaa ttc aca atg gtc gga aga
1104
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Arg
355 360 365
aga gca aca gcc att atc aaa aag gca acc aga aga ttg att caa ttg
1152
Arg Ala Thr Ala Ile Ile Lys Lys Ala Thr Arg Arg Leu Ile Gln Leu
370 375 380
ata gta agt ggg aga gat gaa caa tca att gct gaa gca ata att gta
1200
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
gcc atg gtg ttt tcg caa gaa gat tgc atg ata aaa gca gtt cga ggc
1248
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
gat ttg aac ttt gtt aat aga gca aat cag cgt ttg aac ccc atg cat
1296
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
caa ctc ttg agg cat ttc caa aaa gat gca aaa gtg ctt ttc cac aat
1344
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe His Asn
435 440 445
tgg gga att gaa ccc atc gac aat gta atg ggg atg att gga ata ttg
1392
Trp Gly Ile Glu Pro Ile Asp Asn Val Met Gly Met Ile Gly Ile Leu
450 455 460
cct gac atg acc cca agc acc gag atg tca ttg aga gga gtg aga gtc
1440
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Leu Arg Gly Val Arg Val
465 470 475 480
agc aaa atg gga gtg gat gag tac tcc agc act gag aga gtg gtg gtg
1488
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
agc att gac cgt ttt tta aga gtt cgg gat caa agg gga aac ata cta
1536
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Ile Leu
500 505 510
ctg tcc cct gaa gaa gtc agt gaa aca caa gga acg gaa aag ctg aca
1584
Leu Ser Pro Glu Glu Val Ser Glu Thr Gln Gly Thr Glu Lys Leu Thr
515 520 525
ata att tat tcg tca tca atg atg tgg gag att aat ggt ccc gaa tca
1632
Ile Ile Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
gtg ttg gtc aat act tat caa tgg atc atc agg aac tgg gaa att gta
1680
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Ile Val
545 550 555 560
aaa att cag tgg tca cag gac ccc aca atg tta tac aat aag ata gaa
1728
Lys Ile Gln Trp Ser Gln Asp Pro Thr Met Leu Tyr Asn Lys Ile Glu
565 570 575
ttt gag cca ttc caa tcc ctg gtc cct agg gcc acc aga agc caa tac
1776
Phe Glu Pro Phe Gln Ser Leu Val Pro Arg Ala Thr Arg Ser Gln Tyr
580 585 590
agc ggt ttc gta aga acc ctg ttt cag caa atg cga gat gta ctt gga
1824
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
aca ttt gat act gct caa ata ata aaa ctc ctc cct ttt gcc gct gct
1872
Thr Phe Asp Thr Ala Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
cct ccg gaa cag agt agg atg cag ttc tct tct ttg act gtt aat gta
1920
Pro Pro Glu Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
aga ggt tcg gga atg agg ata ctt gta aga ggc aat tcc cca gtg ttc
1968
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
aac tac aat aaa gcc act aaa agg ctc aca gtc ctc gga aag gat gca
2016
Asn Tyr Asn Lys Ala Thr Lys Arg Leu Thr Val Leu Gly Lys Asp Ala
660 665 670
ggt gcg ctt act gag gac cca gat gaa ggt acg gct gga gta gaa tct
2064
Gly Ala Leu Thr Glu Asp Pro Asp Glu Gly Thr Ala Gly Val Glu Ser
675 680 685
gct gtt cta aga ggg ttt ctc att tta ggt aaa gag aac aag aga tat
2112
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asn Lys Arg Tyr
690 695 700
ggc cca gca cta agc atc aat gaa cta agc aaa ctt gca aaa ggg gag
2160
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Lys Leu Ala Lys Gly Glu
705 710 715 720
aaa gcc aat gta cta att ggg caa ggg gac gta gtg ttg gta atg aaa
2208
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Val Val Leu Val Met Lys
725 730 735
cgg aaa cgt gac tct agc ata ctt act gac agc cag aca gcg acc aaa
2256
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
agg att cgg atg gcc atc aat
2277
Arg Ile Arg Met Ala Ile Asn
755
<210> 2
<211> 759
<212> PRT
<213> Вирус гриппа
<400> 2
Met Glu Arg Ile Glu Glu Leu Arg Asp Leu Met Leu Gln Ser Arg Thr
1 5 10 15
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
Lys Tyr Thr Ser Glu Arg Gln Glu Lys Asn Pro Ala Leu Arg Met Lys
35 40 45
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Met
50 55 60
Glu Met Ile Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
Thr Asn Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
Thr Trp Trp Asn Arg Asn Gly Pro Thr Thr Ser Thr Ile His Tyr Pro
100 105 110
Lys Val Tyr Lys Thr Tyr Phe Glu Lys Val Glu Arg Leu Lys His Gly
115 120 125
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
Val Asp Val Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Ile Ile
165 170 175
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
Leu Gln Asp Cys Lys Ile Ala Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Ala Gly Gly Thr
210 215 220
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
Glu Gln Met Tyr Thr Pro Gly Gly Glu Val Arg Asn Asp Asp Ile Asp
245 250 255
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Thr Val
260 265 270
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
Ile Gly Gly Ile Arg Met Val Asp Ile Leu Lys Gln Asn Pro Thr Glu
290 295 300
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
Ser Val Lys Arg Glu Glu Glu Met Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Arg
355 360 365
Arg Ala Thr Ala Ile Ile Lys Lys Ala Thr Arg Arg Leu Ile Gln Leu
370 375 380
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe His Asn
435 440 445
Trp Gly Ile Glu Pro Ile Asp Asn Val Met Gly Met Ile Gly Ile Leu
450 455 460
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Leu Arg Gly Val Arg Val
465 470 475 480
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Ile Leu
500 505 510
Leu Ser Pro Glu Glu Val Ser Glu Thr Gln Gly Thr Glu Lys Leu Thr
515 520 525
Ile Ile Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Ile Val
545 550 555 560
Lys Ile Gln Trp Ser Gln Asp Pro Thr Met Leu Tyr Asn Lys Ile Glu
565 570 575
Phe Glu Pro Phe Gln Ser Leu Val Pro Arg Ala Thr Arg Ser Gln Tyr
580 585 590
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
Thr Phe Asp Thr Ala Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
Pro Pro Glu Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
Asn Tyr Asn Lys Ala Thr Lys Arg Leu Thr Val Leu Gly Lys Asp Ala
660 665 670
Gly Ala Leu Thr Glu Asp Pro Asp Glu Gly Thr Ala Gly Val Glu Ser
675 680 685
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asn Lys Arg Tyr
690 695 700
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Lys Leu Ala Lys Gly Glu
705 710 715 720
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Val Val Leu Val Met Lys
725 730 735
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
Arg Ile Arg Met Ala Ile Asn
755
<210> 3
<211> 2274
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2274)
<400> 3
atg gat gtc aat ccg act cta ctc ttc tta aag gtg cca gcg cag aat
48
Met Asp Val Asn Pro Thr Leu Leu Phe Leu Lys Val Pro Ala Gln Asn
1 5 10 15
gct ata agc aca aca ttc cct tat act gga gat cct ccc tac agt cat
96
Ala Ile Ser Thr Thr Phe Pro Tyr Thr Gly Asp Pro Pro Tyr Ser His
20 25 30
gga aca ggg aca gga tac acc atg gat act gtc aac aga aca cac caa
144
Gly Thr Gly Thr Gly Tyr Thr Met Asp Thr Val Asn Arg Thr His Gln
35 40 45
tat tca gaa aaa ggg aaa tgg aca aca aac act gag att gga gca cca
192
Tyr Ser Glu Lys Gly Lys Trp Thr Thr Asn Thr Glu Ile Gly Ala Pro
50 55 60
caa ctt aat cca atc gat gga cca ctt cct gaa gac aat gaa cca agc
240
Gln Leu Asn Pro Ile Asp Gly Pro Leu Pro Glu Asp Asn Glu Pro Ser
65 70 75 80
ggg tac gcc caa aca gat tgt gta ttg gaa gca atg gct ttc ctt gaa
288
Gly Tyr Ala Gln Thr Asp Cys Val Leu Glu Ala Met Ala Phe Leu Glu
85 90 95
gaa tcc cat cca gga atc ttt gaa aat tcg tgt ctt gaa acg atg gag
336
Glu Ser His Pro Gly Ile Phe Glu Asn Ser Cys Leu Glu Thr Met Glu
100 105 110
gtg att cag cag aca aga gtg gac aaa cta aca caa ggc cga caa act
384
Val Ile Gln Gln Thr Arg Val Asp Lys Leu Thr Gln Gly Arg Gln Thr
115 120 125
tat gat tgg acc ttg aat agg aat caa cct gcc gca aca gca ctt gct
432
Tyr Asp Trp Thr Leu Asn Arg Asn Gln Pro Ala Ala Thr Ala Leu Ala
130 135 140
aat acg att gaa gta ttc aga tca aat ggt ctg act tcc aat gaa tcg
480
Asn Thr Ile Glu Val Phe Arg Ser Asn Gly Leu Thr Ser Asn Glu Ser
145 150 155 160
ggg aga ttg atg gac ttc ctc aaa gat gtc atg gag tcc atg aac aag
528
Gly Arg Leu Met Asp Phe Leu Lys Asp Val Met Glu Ser Met Asn Lys
165 170 175
gaa gaa atg gaa ata aca aca cac ttc caa cgg aag aga aga gta aga
576
Glu Glu Met Glu Ile Thr Thr His Phe Gln Arg Lys Arg Arg Val Arg
180 185 190
gac aac atg aca aag aga atg gta aca cag aga acc ata ggg aag aaa
624
Asp Asn Met Thr Lys Arg Met Val Thr Gln Arg Thr Ile Gly Lys Lys
195 200 205
aaa caa cga tta aac aga aag agc tat cta atc aga aca tta acc cta
672
Lys Gln Arg Leu Asn Arg Lys Ser Tyr Leu Ile Arg Thr Leu Thr Leu
210 215 220
aac aca atg acc aag gac gct gag aga ggg aaa ttg aaa cga cga gca
720
Asn Thr Met Thr Lys Asp Ala Glu Arg Gly Lys Leu Lys Arg Arg Ala
225 230 235 240
atc gct acc cca ggg atg cag ata aga ggg ttt gta tat ttt gtt gaa
768
Ile Ala Thr Pro Gly Met Gln Ile Arg Gly Phe Val Tyr Phe Val Glu
245 250 255
aca cta gct cga aga ata tgt gaa aag ctt gaa caa tca gga ttg cca
816
Thr Leu Ala Arg Arg Ile Cys Glu Lys Leu Glu Gln Ser Gly Leu Pro
260 265 270
gtt ggc ggt aat gag aaa aag gcc aaa ctg gct aat gtc gtc aga aaa
864
Val Gly Gly Asn Glu Lys Lys Ala Lys Leu Ala Asn Val Val Arg Lys
275 280 285
atg atg act aat tcc caa gac act gaa ctc tcc ttc acc atc act ggg
912
Met Met Thr Asn Ser Gln Asp Thr Glu Leu Ser Phe Thr Ile Thr Gly
290 295 300
gac aat acc aaa tgg aat gaa aat cag aac cca cgc ata ttc ctg gca
960
Asp Asn Thr Lys Trp Asn Glu Asn Gln Asn Pro Arg Ile Phe Leu Ala
305 310 315 320
atg atc aca tac ata act aga aac cag cca gaa tgg ttc aga aat gtt
1008
Met Ile Thr Tyr Ile Thr Arg Asn Gln Pro Glu Trp Phe Arg Asn Val
325 330 335
cta agc att gca ccg att atg ttc tca aat aaa atg gca aga ctg ggg
1056
Leu Ser Ile Ala Pro Ile Met Phe Ser Asn Lys Met Ala Arg Leu Gly
340 345 350
aaa gga tat atg ttt gaa agc aaa agt atg aaa ttg aga act caa ata
1104
Lys Gly Tyr Met Phe Glu Ser Lys Ser Met Lys Leu Arg Thr Gln Ile
355 360 365
cca gca gaa atg cta gca agc att gac cta aaa tat ttc aat gat tca
1152
Pro Ala Glu Met Leu Ala Ser Ile Asp Leu Lys Tyr Phe Asn Asp Ser
370 375 380
aca aaa aag aaa att gag aag ata cga cca ctt ctg gtt gac ggg act
1200
Thr Lys Lys Lys Ile Glu Lys Ile Arg Pro Leu Leu Val Asp Gly Thr
385 390 395 400
gct tca ctg agt cct ggc atg atg atg gga atg ttc aac atg ttg agc
1248
Ala Ser Leu Ser Pro Gly Met Met Met Gly Met Phe Asn Met Leu Ser
405 410 415
act gtg ctg ggt gta tcc ata tta aac ctg ggc cag agg aaa tac aca
1296
Thr Val Leu Gly Val Ser Ile Leu Asn Leu Gly Gln Arg Lys Tyr Thr
420 425 430
aag acc aca tac tgg tgg gat ggt ctg caa tca tcc gat gac ttt gct
1344
Lys Thr Thr Tyr Trp Trp Asp Gly Leu Gln Ser Ser Asp Asp Phe Ala
435 440 445
ttg ata gtg aat gcg cct aat cat gaa gga gta caa gct gga gta gac
1392
Leu Ile Val Asn Ala Pro Asn His Glu Gly Val Gln Ala Gly Val Asp
450 455 460
aga ttc tat aga act tgc aaa ctg gtc ggg atc aac atg agc aaa aag
1440
Arg Phe Tyr Arg Thr Cys Lys Leu Val Gly Ile Asn Met Ser Lys Lys
465 470 475 480
aag tcc tac ata aat aga act gga aca ttc gaa ttc aca agc ttt ttc
1488
Lys Ser Tyr Ile Asn Arg Thr Gly Thr Phe Glu Phe Thr Ser Phe Phe
485 490 495
tac cgg tat ggt ttt gta gcc aat ttc agc atg gaa cta ccc agt ttt
1536
Tyr Arg Tyr Gly Phe Val Ala Asn Phe Ser Met Glu Leu Pro Ser Phe
500 505 510
ggg gtt tcc gga ata aat gaa tct gca gac atg agc att gga gtg aca
1584
Gly Val Ser Gly Ile Asn Glu Ser Ala Asp Met Ser Ile Gly Val Thr
515 520 525
gtc atc aaa aac aac atg ata aat aat gat ctc ggt cct gcc acg gca
1632
Val Ile Lys Asn Asn Met Ile Asn Asn Asp Leu Gly Pro Ala Thr Ala
530 535 540
caa atg gca ctc caa ctc ttc att aag gat tat cgg tac aca tac cgg
1680
Gln Met Ala Leu Gln Leu Phe Ile Lys Asp Tyr Arg Tyr Thr Tyr Arg
545 550 555 560
tgc cat aga ggt gat acc cag ata caa acc aga aga tct ttt gag ttg
1728
Cys His Arg Gly Asp Thr Gln Ile Gln Thr Arg Arg Ser Phe Glu Leu
565 570 575
aag aaa ctg tgg gaa cag act cga tca aag act ggt cta ctg gta tca
1776
Lys Lys Leu Trp Glu Gln Thr Arg Ser Lys Thr Gly Leu Leu Val Ser
580 585 590
gat ggg ggt cca aac cta tat aac atc aga aac cta cac atc ccg gaa
1824
Asp Gly Gly Pro Asn Leu Tyr Asn Ile Arg Asn Leu His Ile Pro Glu
595 600 605
gtc tgt tta aaa tgg gag cta atg gat gaa gat tat aag ggg agg cta
1872
Val Cys Leu Lys Trp Glu Leu Met Asp Glu Asp Tyr Lys Gly Arg Leu
610 615 620
tgc aat cca ttg aat cct ttc gtt agt cac aaa gaa att gaa tca gtc
1920
Cys Asn Pro Leu Asn Pro Phe Val Ser His Lys Glu Ile Glu Ser Val
625 630 635 640
aac agt gca gta gta atg cct gcg cat ggc cct gcc aaa agc atg gag
1968
Asn Ser Ala Val Val Met Pro Ala His Gly Pro Ala Lys Ser Met Glu
645 650 655
tat gat gct gtt gca aca aca cat tct tgg atc ccc aag agg aac cgg
2016
Tyr Asp Ala Val Ala Thr Thr His Ser Trp Ile Pro Lys Arg Asn Arg
660 665 670
tcc ata ttg aac aca agc caa agg gga gta ctc gaa gat gag cag atg
2064
Ser Ile Leu Asn Thr Ser Gln Arg Gly Val Leu Glu Asp Glu Gln Met
675 680 685
tat cag aaa tgc tgc aac ctg ttt gaa aaa ttc ttc ccc agc agc tca
2112
Tyr Gln Lys Cys Cys Asn Leu Phe Glu Lys Phe Phe Pro Ser Ser Ser
690 695 700
tac aga aga cca gtc gga att tct agt atg gtt gag gcc atg gtg tcc
2160
Tyr Arg Arg Pro Val Gly Ile Ser Ser Met Val Glu Ala Met Val Ser
705 710 715 720
agg gcc cgc att gat gca cga att gac ttc gaa tct gga cgg ata aag
2208
Arg Ala Arg Ile Asp Ala Arg Ile Asp Phe Glu Ser Gly Arg Ile Lys
725 730 735
aag gat gag ttc gct gag atc atg aag atc tgt tcc acc att gaa gag
2256
Lys Asp Glu Phe Ala Glu Ile Met Lys Ile Cys Ser Thr Ile Glu Glu
740 745 750
ctc aga cgg caa aaa tag
2274
Leu Arg Arg Gln Lys
755
<210> 4
<211> 757
<212> PRT
<213> Вирус гриппа
<400> 4
Met Asp Val Asn Pro Thr Leu Leu Phe Leu Lys Val Pro Ala Gln Asn
1 5 10 15
Ala Ile Ser Thr Thr Phe Pro Tyr Thr Gly Asp Pro Pro Tyr Ser His
20 25 30
Gly Thr Gly Thr Gly Tyr Thr Met Asp Thr Val Asn Arg Thr His Gln
35 40 45
Tyr Ser Glu Lys Gly Lys Trp Thr Thr Asn Thr Glu Ile Gly Ala Pro
50 55 60
Gln Leu Asn Pro Ile Asp Gly Pro Leu Pro Glu Asp Asn Glu Pro Ser
65 70 75 80
Gly Tyr Ala Gln Thr Asp Cys Val Leu Glu Ala Met Ala Phe Leu Glu
85 90 95
Glu Ser His Pro Gly Ile Phe Glu Asn Ser Cys Leu Glu Thr Met Glu
100 105 110
Val Ile Gln Gln Thr Arg Val Asp Lys Leu Thr Gln Gly Arg Gln Thr
115 120 125
Tyr Asp Trp Thr Leu Asn Arg Asn Gln Pro Ala Ala Thr Ala Leu Ala
130 135 140
Asn Thr Ile Glu Val Phe Arg Ser Asn Gly Leu Thr Ser Asn Glu Ser
145 150 155 160
Gly Arg Leu Met Asp Phe Leu Lys Asp Val Met Glu Ser Met Asn Lys
165 170 175
Glu Glu Met Glu Ile Thr Thr His Phe Gln Arg Lys Arg Arg Val Arg
180 185 190
Asp Asn Met Thr Lys Arg Met Val Thr Gln Arg Thr Ile Gly Lys Lys
195 200 205
Lys Gln Arg Leu Asn Arg Lys Ser Tyr Leu Ile Arg Thr Leu Thr Leu
210 215 220
Asn Thr Met Thr Lys Asp Ala Glu Arg Gly Lys Leu Lys Arg Arg Ala
225 230 235 240
Ile Ala Thr Pro Gly Met Gln Ile Arg Gly Phe Val Tyr Phe Val Glu
245 250 255
Thr Leu Ala Arg Arg Ile Cys Glu Lys Leu Glu Gln Ser Gly Leu Pro
260 265 270
Val Gly Gly Asn Glu Lys Lys Ala Lys Leu Ala Asn Val Val Arg Lys
275 280 285
Met Met Thr Asn Ser Gln Asp Thr Glu Leu Ser Phe Thr Ile Thr Gly
290 295 300
Asp Asn Thr Lys Trp Asn Glu Asn Gln Asn Pro Arg Ile Phe Leu Ala
305 310 315 320
Met Ile Thr Tyr Ile Thr Arg Asn Gln Pro Glu Trp Phe Arg Asn Val
325 330 335
Leu Ser Ile Ala Pro Ile Met Phe Ser Asn Lys Met Ala Arg Leu Gly
340 345 350
Lys Gly Tyr Met Phe Glu Ser Lys Ser Met Lys Leu Arg Thr Gln Ile
355 360 365
Pro Ala Glu Met Leu Ala Ser Ile Asp Leu Lys Tyr Phe Asn Asp Ser
370 375 380
Thr Lys Lys Lys Ile Glu Lys Ile Arg Pro Leu Leu Val Asp Gly Thr
385 390 395 400
Ala Ser Leu Ser Pro Gly Met Met Met Gly Met Phe Asn Met Leu Ser
405 410 415
Thr Val Leu Gly Val Ser Ile Leu Asn Leu Gly Gln Arg Lys Tyr Thr
420 425 430
Lys Thr Thr Tyr Trp Trp Asp Gly Leu Gln Ser Ser Asp Asp Phe Ala
435 440 445
Leu Ile Val Asn Ala Pro Asn His Glu Gly Val Gln Ala Gly Val Asp
450 455 460
Arg Phe Tyr Arg Thr Cys Lys Leu Val Gly Ile Asn Met Ser Lys Lys
465 470 475 480
Lys Ser Tyr Ile Asn Arg Thr Gly Thr Phe Glu Phe Thr Ser Phe Phe
485 490 495
Tyr Arg Tyr Gly Phe Val Ala Asn Phe Ser Met Glu Leu Pro Ser Phe
500 505 510
Gly Val Ser Gly Ile Asn Glu Ser Ala Asp Met Ser Ile Gly Val Thr
515 520 525
Val Ile Lys Asn Asn Met Ile Asn Asn Asp Leu Gly Pro Ala Thr Ala
530 535 540
Gln Met Ala Leu Gln Leu Phe Ile Lys Asp Tyr Arg Tyr Thr Tyr Arg
545 550 555 560
Cys His Arg Gly Asp Thr Gln Ile Gln Thr Arg Arg Ser Phe Glu Leu
565 570 575
Lys Lys Leu Trp Glu Gln Thr Arg Ser Lys Thr Gly Leu Leu Val Ser
580 585 590
Asp Gly Gly Pro Asn Leu Tyr Asn Ile Arg Asn Leu His Ile Pro Glu
595 600 605
Val Cys Leu Lys Trp Glu Leu Met Asp Glu Asp Tyr Lys Gly Arg Leu
610 615 620
Cys Asn Pro Leu Asn Pro Phe Val Ser His Lys Glu Ile Glu Ser Val
625 630 635 640
Asn Ser Ala Val Val Met Pro Ala His Gly Pro Ala Lys Ser Met Glu
645 650 655
Tyr Asp Ala Val Ala Thr Thr His Ser Trp Ile Pro Lys Arg Asn Arg
660 665 670
Ser Ile Leu Asn Thr Ser Gln Arg Gly Val Leu Glu Asp Glu Gln Met
675 680 685
Tyr Gln Lys Cys Cys Asn Leu Phe Glu Lys Phe Phe Pro Ser Ser Ser
690 695 700
Tyr Arg Arg Pro Val Gly Ile Ser Ser Met Val Glu Ala Met Val Ser
705 710 715 720
Arg Ala Arg Ile Asp Ala Arg Ile Asp Phe Glu Ser Gly Arg Ile Lys
725 730 735
Lys Asp Glu Phe Ala Glu Ile Met Lys Ile Cys Ser Thr Ile Glu Glu
740 745 750
Leu Arg Arg Gln Lys
755
<210> 5
<211> 2151
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2151)
<400> 5
atg gaa gac ttt gtg cga cag tgc ttc aat cca atg atc gtc gag ctt
48
Met Glu Asp Phe Val Arg Gln Cys Phe Asn Pro Met Ile Val Glu Leu
1 5 10 15
gcg gaa aag gca atg aaa gaa tat gga gag aac ccg aaa atc gaa aca
96
Ala Glu Lys Ala Met Lys Glu Tyr Gly Glu Asn Pro Lys Ile Glu Thr
20 25 30
aac aaa ttt gca gca ata tgc act cac ttg gaa gtc tgc ttc atg tac
144
Asn Lys Phe Ala Ala Ile Cys Thr His Leu Glu Val Cys Phe Met Tyr
35 40 45
tcg gat ttt cac ttt att aat gaa ctg ggt gag tca gtg gtc ata gag
192
Ser Asp Phe His Phe Ile Asn Glu Leu Gly Glu Ser Val Val Ile Glu
50 55 60
tct ggt gac cca aat gct ctt ttg aaa cac aga ttt gaa atc att gag
240
Ser Gly Asp Pro Asn Ala Leu Leu Lys His Arg Phe Glu Ile Ile Glu
65 70 75 80
ggg aga gat cga aca atg gca tgg aca gta gta aac agc atc tgc aac
288
Gly Arg Asp Arg Thr Met Ala Trp Thr Val Val Asn Ser Ile Cys Asn
85 90 95
acc aca aga gct gaa aaa cct aaa ttt ctt cca gat tta tac gac tat
336
Thr Thr Arg Ala Glu Lys Pro Lys Phe Leu Pro Asp Leu Tyr Asp Tyr
100 105 110
aag gag aac aga ttt gtt gaa att ggt gtg aca agg aga gaa gtt cac
384
Lys Glu Asn Arg Phe Val Glu Ile Gly Val Thr Arg Arg Glu Val His
115 120 125
ata tac tac ctg gag aag gcc aac aaa ata aag tct gag aaa aca cat
432
Ile Tyr Tyr Leu Glu Lys Ala Asn Lys Ile Lys Ser Glu Lys Thr His
130 135 140
atc cac att ttc tca ttt aca gga gag gaa atg gct aca aaa gcg gac
480
Ile His Ile Phe Ser Phe Thr Gly Glu Glu Met Ala Thr Lys Ala Asp
145 150 155 160
tat act ctt gat gaa gag agt aga gcc agg atc aag acc aga cta ttc
528
Tyr Thr Leu Asp Glu Glu Ser Arg Ala Arg Ile Lys Thr Arg Leu Phe
165 170 175
acc ata aga caa gaa atg gcc agt aga ggc ctc tgg gat tcc ttt cgt
576
Thr Ile Arg Gln Glu Met Ala Ser Arg Gly Leu Trp Asp Ser Phe Arg
180 185 190
cag tcc gag aga ggc gaa gag aca att gaa gaa aga ttt gaa ata aca
624
Gln Ser Glu Arg Gly Glu Glu Thr Ile Glu Glu Arg Phe Glu Ile Thr
195 200 205
ggg acg atg cgc aag ctt gcc aat tac agt ctc cca ccg aac ttc tcc
672
Gly Thr Met Arg Lys Leu Ala Asn Tyr Ser Leu Pro Pro Asn Phe Ser
210 215 220
agc ctt gaa aat ttt aga gtc tat gtg gat gga ttc gaa ccg aac ggc
720
Ser Leu Glu Asn Phe Arg Val Tyr Val Asp Gly Phe Glu Pro Asn Gly
225 230 235 240
tgc att gag agt aag ctt tct caa atg tcc aaa gaa gta aat gcc aga
768
Cys Ile Glu Ser Lys Leu Ser Gln Met Ser Lys Glu Val Asn Ala Arg
245 250 255
atc gaa cca ttt tca aag aca aca ccc cga cca ctc aaa atg cca ggt
816
Ile Glu Pro Phe Ser Lys Thr Thr Pro Arg Pro Leu Lys Met Pro Gly
260 265 270
ggt cca ccc tgc cat cag cga tct aaa ttc ttg cta atg gat gct ctg
864
Gly Pro Pro Cys His Gln Arg Ser Lys Phe Leu Leu Met Asp Ala Leu
275 280 285
aaa ctg agc att gag gac cca agt cac gag gga gag gga ata cca cta
912
Lys Leu Ser Ile Glu Asp Pro Ser His Glu Gly Glu Gly Ile Pro Leu
290 295 300
tat gat gca atc aaa tgc atg aaa act ttc ttt gga tgg aaa gag ccc
960
Tyr Asp Ala Ile Lys Cys Met Lys Thr Phe Phe Gly Trp Lys Glu Pro
305 310 315 320
agt att gtt aaa cca cat gaa aag ggt ata aac ccg aac tat ctc caa
1008
Ser Ile Val Lys Pro His Glu Lys Gly Ile Asn Pro Asn Tyr Leu Gln
325 330 335
act tgg aag caa gta tta gaa gaa ata caa gac ctt gag aac gaa gaa
1056
Thr Trp Lys Gln Val Leu Glu Glu Ile Gln Asp Leu Glu Asn Glu Glu
340 345 350
agg acc ccc aag acc aag aat atg aaa aaa aca agc caa ttg aaa tgg
1104
Arg Thr Pro Lys Thr Lys Asn Met Lys Lys Thr Ser Gln Leu Lys Trp
355 360 365
gca cta ggt gaa aat atg gca cca gag aaa gtg gat ttt gag gat tgt
1152
Ala Leu Gly Glu Asn Met Ala Pro Glu Lys Val Asp Phe Glu Asp Cys
370 375 380
aaa gac atc aat gat tta aaa caa tat gac agt gat gag cca gaa gca
1200
Lys Asp Ile Asn Asp Leu Lys Gln Tyr Asp Ser Asp Glu Pro Glu Ala
385 390 395 400
agg tct ctt gca agt tgg att caa agt gag ttc aac aaa gct tgt gag
1248
Arg Ser Leu Ala Ser Trp Ile Gln Ser Glu Phe Asn Lys Ala Cys Glu
405 410 415
ctg aca gat tca agc tgg ata gag ctc gat gaa att ggg gag gat gtc
1296
Leu Thr Asp Ser Ser Trp Ile Glu Leu Asp Glu Ile Gly Glu Asp Val
420 425 430
gcc cca ata gaa tac att gcg agc atg agg aga aat tat ttt act gct
1344
Ala Pro Ile Glu Tyr Ile Ala Ser Met Arg Arg Asn Tyr Phe Thr Ala
435 440 445
gag att tcc cat tgt aga gca aca gaa tat ata ata aaa gga gtg tac
1392
Glu Ile Ser His Cys Arg Ala Thr Glu Tyr Ile Ile Lys Gly Val Tyr
450 455 460
atc aac act gct cta ctc aat gca tcc tgt gct gcg atg gat gaa ttt
1440
Ile Asn Thr Ala Leu Leu Asn Ala Ser Cys Ala Ala Met Asp Glu Phe
465 470 475 480
caa tta att ccg atg ata agt aaa tgc agg acc aaa gaa ggg aga agg
1488
Gln Leu Ile Pro Met Ile Ser Lys Cys Arg Thr Lys Glu Gly Arg Arg
485 490 495
aaa aca aat tta tat gga ttc ata ata aag gga agg tcc cat tta aga
1536
Lys Thr Asn Leu Tyr Gly Phe Ile Ile Lys Gly Arg Ser His Leu Arg
500 505 510
aat gat act gac gtg gtg aac ttt gta agt atg gaa ttt tct ctc act
1584
Asn Asp Thr Asp Val Val Asn Phe Val Ser Met Glu Phe Ser Leu Thr
515 520 525
gat cca aga ttt gag cca cac aaa tgg gaa aaa tac tgc gtt cta gaa
1632
Asp Pro Arg Phe Glu Pro His Lys Trp Glu Lys Tyr Cys Val Leu Glu
530 535 540
att gga gac atg ctt cta aga act gct gta ggt caa gtg tca aga ccc
1680
Ile Gly Asp Met Leu Leu Arg Thr Ala Val Gly Gln Val Ser Arg Pro
545 550 555 560
atg ttt ttg tat gta agg aca aat gga acc tct aaa att aaa atg aaa
1728
Met Phe Leu Tyr Val Arg Thr Asn Gly Thr Ser Lys Ile Lys Met Lys
565 570 575
tgg gga atg gaa atg agg cgc tgc ctc ctt cag tct ctg caa cag att
1776
Trp Gly Met Glu Met Arg Arg Cys Leu Leu Gln Ser Leu Gln Gln Ile
580 585 590
gaa agc atg atc gaa gct gag tcc tca gtc aaa gaa aag gac atg acc
1824
Glu Ser Met Ile Glu Ala Glu Ser Ser Val Lys Glu Lys Asp Met Thr
595 600 605
aaa gaa ttt ttt gag aac aaa tca gag aca tgg cct ata gga gag tcc
1872
Lys Glu Phe Phe Glu Asn Lys Ser Glu Thr Trp Pro Ile Gly Glu Ser
610 615 620
ccc aaa gga gtg gaa gag ggc tca atc ggg aag gtt tgc agg acc tta
1920
Pro Lys Gly Val Glu Glu Gly Ser Ile Gly Lys Val Cys Arg Thr Leu
625 630 635 640
tta gca aaa tct gtg ttt aac agt tta tat gca tct cca caa ctg gaa
1968
Leu Ala Lys Ser Val Phe Asn Ser Leu Tyr Ala Ser Pro Gln Leu Glu
645 650 655
ggg ttt tca gct gaa tct agg aaa tta ctt ctc att gtt cag gct ctt
2016
Gly Phe Ser Ala Glu Ser Arg Lys Leu Leu Leu Ile Val Gln Ala Leu
660 665 670
aag gat gac ctg gaa cct gga acc ttt gat att ggg ggg tta tat gaa
2064
Lys Asp Asp Leu Glu Pro Gly Thr Phe Asp Ile Gly Gly Leu Tyr Glu
675 680 685
tca att gag gag tgc ctg att aat gat ccc tgg gtt ttg ctt aat gca
2112
Ser Ile Glu Glu Cys Leu Ile Asn Asp Pro Trp Val Leu Leu Asn Ala
690 695 700
tct tgg ttc aac tcc ttc ctt aca cat gca ctg aag tag
2151
Ser Trp Phe Asn Ser Phe Leu Thr His Ala Leu Lys
705 710 715
<210> 6
<211> 716
<212> PRT
<213> Вирус гриппа
<400> 6
Met Glu Asp Phe Val Arg Gln Cys Phe Asn Pro Met Ile Val Glu Leu
1 5 10 15
Ala Glu Lys Ala Met Lys Glu Tyr Gly Glu Asn Pro Lys Ile Glu Thr
20 25 30
Asn Lys Phe Ala Ala Ile Cys Thr His Leu Glu Val Cys Phe Met Tyr
35 40 45
Ser Asp Phe His Phe Ile Asn Glu Leu Gly Glu Ser Val Val Ile Glu
50 55 60
Ser Gly Asp Pro Asn Ala Leu Leu Lys His Arg Phe Glu Ile Ile Glu
65 70 75 80
Gly Arg Asp Arg Thr Met Ala Trp Thr Val Val Asn Ser Ile Cys Asn
85 90 95
Thr Thr Arg Ala Glu Lys Pro Lys Phe Leu Pro Asp Leu Tyr Asp Tyr
100 105 110
Lys Glu Asn Arg Phe Val Glu Ile Gly Val Thr Arg Arg Glu Val His
115 120 125
Ile Tyr Tyr Leu Glu Lys Ala Asn Lys Ile Lys Ser Glu Lys Thr His
130 135 140
Ile His Ile Phe Ser Phe Thr Gly Glu Glu Met Ala Thr Lys Ala Asp
145 150 155 160
Tyr Thr Leu Asp Glu Glu Ser Arg Ala Arg Ile Lys Thr Arg Leu Phe
165 170 175
Thr Ile Arg Gln Glu Met Ala Ser Arg Gly Leu Trp Asp Ser Phe Arg
180 185 190
Gln Ser Glu Arg Gly Glu Glu Thr Ile Glu Glu Arg Phe Glu Ile Thr
195 200 205
Gly Thr Met Arg Lys Leu Ala Asn Tyr Ser Leu Pro Pro Asn Phe Ser
210 215 220
Ser Leu Glu Asn Phe Arg Val Tyr Val Asp Gly Phe Glu Pro Asn Gly
225 230 235 240
Cys Ile Glu Ser Lys Leu Ser Gln Met Ser Lys Glu Val Asn Ala Arg
245 250 255
Ile Glu Pro Phe Ser Lys Thr Thr Pro Arg Pro Leu Lys Met Pro Gly
260 265 270
Gly Pro Pro Cys His Gln Arg Ser Lys Phe Leu Leu Met Asp Ala Leu
275 280 285
Lys Leu Ser Ile Glu Asp Pro Ser His Glu Gly Glu Gly Ile Pro Leu
290 295 300
Tyr Asp Ala Ile Lys Cys Met Lys Thr Phe Phe Gly Trp Lys Glu Pro
305 310 315 320
Ser Ile Val Lys Pro His Glu Lys Gly Ile Asn Pro Asn Tyr Leu Gln
325 330 335
Thr Trp Lys Gln Val Leu Glu Glu Ile Gln Asp Leu Glu Asn Glu Glu
340 345 350
Arg Thr Pro Lys Thr Lys Asn Met Lys Lys Thr Ser Gln Leu Lys Trp
355 360 365
Ala Leu Gly Glu Asn Met Ala Pro Glu Lys Val Asp Phe Glu Asp Cys
370 375 380
Lys Asp Ile Asn Asp Leu Lys Gln Tyr Asp Ser Asp Glu Pro Glu Ala
385 390 395 400
Arg Ser Leu Ala Ser Trp Ile Gln Ser Glu Phe Asn Lys Ala Cys Glu
405 410 415
Leu Thr Asp Ser Ser Trp Ile Glu Leu Asp Glu Ile Gly Glu Asp Val
420 425 430
Ala Pro Ile Glu Tyr Ile Ala Ser Met Arg Arg Asn Tyr Phe Thr Ala
435 440 445
Glu Ile Ser His Cys Arg Ala Thr Glu Tyr Ile Ile Lys Gly Val Tyr
450 455 460
Ile Asn Thr Ala Leu Leu Asn Ala Ser Cys Ala Ala Met Asp Glu Phe
465 470 475 480
Gln Leu Ile Pro Met Ile Ser Lys Cys Arg Thr Lys Glu Gly Arg Arg
485 490 495
Lys Thr Asn Leu Tyr Gly Phe Ile Ile Lys Gly Arg Ser His Leu Arg
500 505 510
Asn Asp Thr Asp Val Val Asn Phe Val Ser Met Glu Phe Ser Leu Thr
515 520 525
Asp Pro Arg Phe Glu Pro His Lys Trp Glu Lys Tyr Cys Val Leu Glu
530 535 540
Ile Gly Asp Met Leu Leu Arg Thr Ala Val Gly Gln Val Ser Arg Pro
545 550 555 560
Met Phe Leu Tyr Val Arg Thr Asn Gly Thr Ser Lys Ile Lys Met Lys
565 570 575
Trp Gly Met Glu Met Arg Arg Cys Leu Leu Gln Ser Leu Gln Gln Ile
580 585 590
Glu Ser Met Ile Glu Ala Glu Ser Ser Val Lys Glu Lys Asp Met Thr
595 600 605
Lys Glu Phe Phe Glu Asn Lys Ser Glu Thr Trp Pro Ile Gly Glu Ser
610 615 620
Pro Lys Gly Val Glu Glu Gly Ser Ile Gly Lys Val Cys Arg Thr Leu
625 630 635 640
Leu Ala Lys Ser Val Phe Asn Ser Leu Tyr Ala Ser Pro Gln Leu Glu
645 650 655
Gly Phe Ser Ala Glu Ser Arg Lys Leu Leu Leu Ile Val Gln Ala Leu
660 665 670
Lys Asp Asp Leu Glu Pro Gly Thr Phe Asp Ile Gly Gly Leu Tyr Glu
675 680 685
Ser Ile Glu Glu Cys Leu Ile Asn Asp Pro Trp Val Leu Leu Asn Ala
690 695 700
Ser Trp Phe Asn Ser Phe Leu Thr His Ala Leu Lys
705 710 715
<210> 7
<211> 838
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(657)
<400> 7
atg gat tcc aac act gtg tca agc ttt cag gta gac tgt ttt ctt tgg
48
Met Asp Ser Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
cat gtc cgc aaa cga ttc gca gac caa gaa ctg ggt gat gcc cca ttc
96
His Val Arg Lys Arg Phe Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
ctt gac cgg ctt cgc cga gac cag aag tcc cta agg gga aga ggt agc
144
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
act ctt ggt ctg gac atc gaa aca gcc act cat gca gga aag cag ata
192
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr His Ala Gly Lys Gln Ile
50 55 60
gtg gag cag att ctg gaa aag gaa tca gat gag gca ctt aaa atg acc
240
Val Glu Gln Ile Leu Glu Lys Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
att gcc tct gtt cct act tca ctc tac tta act gac atg act ctt gat
288
Ile Ala Ser Val Pro Thr Ser Leu Tyr Leu Thr Asp Met Thr Leu Asp
85 90 95
gag atg tca aga gac tgg ttc atg ctc atg ccc aag caa aaa gta aca
336
Glu Met Ser Arg Asp Trp Phe Met Leu Met Pro Lys Gln Lys Val Thr
100 105 110
ggc tcc cta tgt ata aga atg gac cag gca atc atg gat aag aac atc
384
Gly Ser Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
ata ctt aaa gca aac ttt agt gtg att ttc gaa ggg ctg gaa aca cta
432
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Glu Gly Leu Glu Thr Leu
130 135 140
ata cta ctt aga gcc ttc acc gaa gaa gga gca gtc gtt ggc gaa att
480
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Val Val Gly Glu Ile
145 150 155 160
tca cca tta cct tct ctt cca gga cat act aat gag gat gtc aaa aat
528
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Asn Glu Asp Val Lys Asn
165 170 175
gca att ggg gtc ctc atc gga gga ctt aaa tgg aat gat aat acg gtt
576
Ala Ile Gly Val Leu Ile Gly Gly Leu Lys Trp Asn Asp Asn Thr Val
180 185 190
aga atc tct gaa act cta cag aga ttc gct tgg aga agc agt cat gag
624
Arg Ile Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser His Glu
195 200 205
aat ggg aga cct tca ttc cct tca aag cag aaa tgaaaaatgg agagaacaat
677
Asn Gly Arg Pro Ser Phe Pro Ser Lys Gln Lys
210 215
taagccagaa atttgaagaa ataagatggt tgattgaaga agtgcgacat agattgaaaa
737
atacagaaaa tagttttgaa caaataacat ttatgcaagc cttacaacta ttgcttgaag
797
tagaacaaga gataagaact ttctcgtttc agcttattta a
838
<210> 8
<211> 219
<212> PRT
<213> Вирус гриппа
<400> 8
Met Asp Ser Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
His Val Arg Lys Arg Phe Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr His Ala Gly Lys Gln Ile
50 55 60
Val Glu Gln Ile Leu Glu Lys Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
Ile Ala Ser Val Pro Thr Ser Leu Tyr Leu Thr Asp Met Thr Leu Asp
85 90 95
Glu Met Ser Arg Asp Trp Phe Met Leu Met Pro Lys Gln Lys Val Thr
100 105 110
Gly Ser Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Glu Gly Leu Glu Thr Leu
130 135 140
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Val Val Gly Glu Ile
145 150 155 160
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Asn Glu Asp Val Lys Asn
165 170 175
Ala Ile Gly Val Leu Ile Gly Gly Leu Lys Trp Asn Asp Asn Thr Val
180 185 190
Arg Ile Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser His Glu
195 200 205
Asn Gly Arg Pro Ser Phe Pro Ser Lys Gln Lys
210 215
<210> 9
<211> 1497
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1497)
<400> 9
atg gcg tct caa ggc acc aaa cga tcc tat gaa cag atg gaa act gat
48
Met Ala Ser Gln Gly Thr Lys Arg Ser Tyr Glu Gln Met Glu Thr Asp
1 5 10 15
ggg gaa cgc cag aat gca act gaa atc aga gca tct gtc gga agg atg
96
Gly Glu Arg Gln Asn Ala Thr Glu Ile Arg Ala Ser Val Gly Arg Met
20 25 30
gtg gga gga atc ggc cga ttt tat gtt cag atg tgt act gag ctt aaa
144
Val Gly Gly Ile Gly Arg Phe Tyr Val Gln Met Cys Thr Glu Leu Lys
35 40 45
cta aac gac cat gaa ggg cgg ctg att cag aac agc ata aca ata gaa
192
Leu Asn Asp His Glu Gly Arg Leu Ile Gln Asn Ser Ile Thr Ile Glu
50 55 60
agg atg gta ctt tcg gca ttc gac gaa aga aga aac aag tat ctc gag
240
Arg Met Val Leu Ser Ala Phe Asp Glu Arg Arg Asn Lys Tyr Leu Glu
65 70 75 80
gag cat ccc agt gct ggg aaa gac cct aag aaa acg gga ggc ccg ata
288
Glu His Pro Ser Ala Gly Lys Asp Pro Lys Lys Thr Gly Gly Pro Ile
85 90 95
tac aga agg aaa gat ggg aaa tgg atg agg gaa ctc atc ctc cat gat
336
Tyr Arg Arg Lys Asp Gly Lys Trp Met Arg Glu Leu Ile Leu His Asp
100 105 110
aaa gaa gaa atc atg aga atc tgg cgt cag gcc aac aat ggt gaa gac
384
Lys Glu Glu Ile Met Arg Ile Trp Arg Gln Ala Asn Asn Gly Glu Asp
115 120 125
gct act gct ggt ctt act cat atg atg atc tgg cac tcc aat ctc aat
432
Ala Thr Ala Gly Leu Thr His Met Met Ile Trp His Ser Asn Leu Asn
130 135 140
gac acc aca tac caa aga aca agg gct ctt gtt cgg act ggg atg gat
480
Asp Thr Thr Tyr Gln Arg Thr Arg Ala Leu Val Arg Thr Gly Met Asp
145 150 155 160
ccc aga atg tgc tct ctg atg caa ggc tca acc ctc cca cgg aga tct
528
Pro Arg Met Cys Ser Leu Met Gln Gly Ser Thr Leu Pro Arg Arg Ser
165 170 175
gga gcc gct ggt gct gca gta aaa ggt gtt gga aca atg gta atg gaa
576
Gly Ala Ala Gly Ala Ala Val Lys Gly Val Gly Thr Met Val Met Glu
180 185 190
ctc atc aga atg atc aaa cgc gga ata aat gat cgg aat ttc tgg aga
624
Leu Ile Arg Met Ile Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg
195 200 205
ggt gaa aat ggt cga aaa acc aga att gct tat gaa aga atg tgc aat
672
Gly Glu Asn Gly Arg Lys Thr Arg Ile Ala Tyr Glu Arg Met Cys Asn
210 215 220
atc ctc aaa ggg aaa ttt cag aca gca gca caa cgg gct atg atg gac
720
Ile Leu Lys Gly Lys Phe Gln Thr Ala Ala Gln Arg Ala Met Met Asp
225 230 235 240
cag gtg agg gaa ggc cgc aat cct gga aac gct gag att gag gat ctc
768
Gln Val Arg Glu Gly Arg Asn Pro Gly Asn Ala Glu Ile Glu Asp Leu
245 250 255
att ttc ttg gca cga tca gca ctt att ttg aga gga tca gta gcc cat
816
Ile Phe Leu Ala Arg Ser Ala Leu Ile Leu Arg Gly Ser Val Ala His
260 265 270
aaa tca tgc cta cct gcc tgt gtt tat ggc ctt gca ata acc agt ggg
864
Lys Ser Cys Leu Pro Ala Cys Val Tyr Gly Leu Ala Ile Thr Ser Gly
275 280 285
tat gac ttt gag aag gaa gga tac tct ctg gtt gga att gat cct ttc
912
Tyr Asp Phe Glu Lys Glu Gly Tyr Ser Leu Val Gly Ile Asp Pro Phe
290 295 300
aaa cta ctc cag aac agt caa att ttc agt cta atc aga cca aaa gaa
960
Lys Leu Leu Gln Asn Ser Gln Ile Phe Ser Leu Ile Arg Pro Lys Glu
305 310 315 320
aac cca gca cac aag agc cag ttg gtg tgg atg gca tgc cat tct gca
1008
Asn Pro Ala His Lys Ser Gln Leu Val Trp Met Ala Cys His Ser Ala
325 330 335
gca ttt gag gac ctg aga gtt tta aat ttc att aga gga acc aaa gta
1056
Ala Phe Glu Asp Leu Arg Val Leu Asn Phe Ile Arg Gly Thr Lys Val
340 345 350
atc cca aga gga cag tta aca acc aga gga gtt caa att gct tca aat
1104
Ile Pro Arg Gly Gln Leu Thr Thr Arg Gly Val Gln Ile Ala Ser Asn
355 360 365
gaa aac atg gag aca ata aat tct agc aca ctt gaa ctg aga agc aaa
1152
Glu Asn Met Glu Thr Ile Asn Ser Ser Thr Leu Glu Leu Arg Ser Lys
370 375 380
tat tgg gca ata agg acc aga agc gga gga aac acc agt caa cag aga
1200
Tyr Trp Ala Ile Arg Thr Arg Ser Gly Gly Asn Thr Ser Gln Gln Arg
385 390 395 400
gca tct gca gga cag ata agt gtg caa cct act ttc tca gta cag aga
1248
Ala Ser Ala Gly Gln Ile Ser Val Gln Pro Thr Phe Ser Val Gln Arg
405 410 415
aat cta ccc ttt gag aga gcg acc att atg gct gca ttc act ggt aac
1296
Asn Leu Pro Phe Glu Arg Ala Thr Ile Met Ala Ala Phe Thr Gly Asn
420 425 430
act gaa ggg agg act tcc gac atg aga acg gaa atc ata agg atg atg
1344
Thr Glu Gly Arg Thr Ser Asp Met Arg Thr Glu Ile Ile Arg Met Met
435 440 445
gaa aat gcc aaa tca gaa gat gtg tct ttc cag ggg cgg gga gtc ttc
1392
Glu Asn Ala Lys Ser Glu Asp Val Ser Phe Gln Gly Arg Gly Val Phe
450 455 460
gag ctc tcg gac gaa aag gca acg aac ccg atc gtg cct tcc ttt gac
1440
Glu Leu Ser Asp Glu Lys Ala Thr Asn Pro Ile Val Pro Ser Phe Asp
465 470 475 480
atg agc aat gaa ggg tct tat ttc ttc gga gac aat gct gag gag ttt
1488
Met Ser Asn Glu Gly Ser Tyr Phe Phe Gly Asp Asn Ala Glu Glu Phe
485 490 495
gac agt taa
1497
Asp Ser
<210> 10
<211> 498
<212> PRT
<213> Вирус гриппа
<400> 10
Met Ala Ser Gln Gly Thr Lys Arg Ser Tyr Glu Gln Met Glu Thr Asp
1 5 10 15
Gly Glu Arg Gln Asn Ala Thr Glu Ile Arg Ala Ser Val Gly Arg Met
20 25 30
Val Gly Gly Ile Gly Arg Phe Tyr Val Gln Met Cys Thr Glu Leu Lys
35 40 45
Leu Asn Asp His Glu Gly Arg Leu Ile Gln Asn Ser Ile Thr Ile Glu
50 55 60
Arg Met Val Leu Ser Ala Phe Asp Glu Arg Arg Asn Lys Tyr Leu Glu
65 70 75 80
Glu His Pro Ser Ala Gly Lys Asp Pro Lys Lys Thr Gly Gly Pro Ile
85 90 95
Tyr Arg Arg Lys Asp Gly Lys Trp Met Arg Glu Leu Ile Leu His Asp
100 105 110
Lys Glu Glu Ile Met Arg Ile Trp Arg Gln Ala Asn Asn Gly Glu Asp
115 120 125
Ala Thr Ala Gly Leu Thr His Met Met Ile Trp His Ser Asn Leu Asn
130 135 140
Asp Thr Thr Tyr Gln Arg Thr Arg Ala Leu Val Arg Thr Gly Met Asp
145 150 155 160
Pro Arg Met Cys Ser Leu Met Gln Gly Ser Thr Leu Pro Arg Arg Ser
165 170 175
Gly Ala Ala Gly Ala Ala Val Lys Gly Val Gly Thr Met Val Met Glu
180 185 190
Leu Ile Arg Met Ile Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg
195 200 205
Gly Glu Asn Gly Arg Lys Thr Arg Ile Ala Tyr Glu Arg Met Cys Asn
210 215 220
Ile Leu Lys Gly Lys Phe Gln Thr Ala Ala Gln Arg Ala Met Met Asp
225 230 235 240
Gln Val Arg Glu Gly Arg Asn Pro Gly Asn Ala Glu Ile Glu Asp Leu
245 250 255
Ile Phe Leu Ala Arg Ser Ala Leu Ile Leu Arg Gly Ser Val Ala His
260 265 270
Lys Ser Cys Leu Pro Ala Cys Val Tyr Gly Leu Ala Ile Thr Ser Gly
275 280 285
Tyr Asp Phe Glu Lys Glu Gly Tyr Ser Leu Val Gly Ile Asp Pro Phe
290 295 300
Lys Leu Leu Gln Asn Ser Gln Ile Phe Ser Leu Ile Arg Pro Lys Glu
305 310 315 320
Asn Pro Ala His Lys Ser Gln Leu Val Trp Met Ala Cys His Ser Ala
325 330 335
Ala Phe Glu Asp Leu Arg Val Leu Asn Phe Ile Arg Gly Thr Lys Val
340 345 350
Ile Pro Arg Gly Gln Leu Thr Thr Arg Gly Val Gln Ile Ala Ser Asn
355 360 365
Glu Asn Met Glu Thr Ile Asn Ser Ser Thr Leu Glu Leu Arg Ser Lys
370 375 380
Tyr Trp Ala Ile Arg Thr Arg Ser Gly Gly Asn Thr Ser Gln Gln Arg
385 390 395 400
Ala Ser Ala Gly Gln Ile Ser Val Gln Pro Thr Phe Ser Val Gln Arg
405 410 415
Asn Leu Pro Phe Glu Arg Ala Thr Ile Met Ala Ala Phe Thr Gly Asn
420 425 430
Thr Glu Gly Arg Thr Ser Asp Met Arg Thr Glu Ile Ile Arg Met Met
435 440 445
Glu Asn Ala Lys Ser Glu Asp Val Ser Phe Gln Gly Arg Gly Val Phe
450 455 460
Glu Leu Ser Asp Glu Lys Ala Thr Asn Pro Ile Val Pro Ser Phe Asp
465 470 475 480
Met Ser Asn Glu Gly Ser Tyr Phe Phe Gly Asp Asn Ala Glu Glu Phe
485 490 495
Asp Ser
<210> 11
<211> 1413
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1413)
<400> 11
atg aat cca aat caa aag ata ata gca att gga ttt gca tca ttg ggg
48
Met Asn Pro Asn Gln Lys Ile Ile Ala Ile Gly Phe Ala Ser Leu Gly
1 5 10 15
ata tta atc att aat gtc att ctc cat gta gtc agc att ata gta aca
96
Ile Leu Ile Ile Asn Val Ile Leu His Val Val Ser Ile Ile Val Thr
20 25 30
gta ctg gtc ctc aat aac aat aga aca gat ctg aac tgc aaa ggg acg
144
Val Leu Val Leu Asn Asn Asn Arg Thr Asp Leu Asn Cys Lys Gly Thr
35 40 45
atc ata aga aag tac aat gaa aca gta aga gta gaa aaa att act caa
192
Ile Ile Arg Lys Tyr Asn Glu Thr Val Arg Val Glu Lys Ile Thr Gln
50 55 60
tgg tat aat acc agt aca att aag tac ata gag aga cct tca aat gaa
240
Trp Tyr Asn Thr Ser Thr Ile Lys Tyr Ile Glu Arg Pro Ser Asn Glu
65 70 75 80
tac tac atg aac aac act gaa cca ctt tgt gag gcc caa ggc ttt gca
288
Tyr Tyr Met Asn Asn Thr Glu Pro Leu Cys Glu Ala Gln Gly Phe Ala
85 90 95
cca ttt tcc aaa gat aat gga ata cga att ggg tcg aga ggc cat gtt
336
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Val
100 105 110
ttt gtg ata aga gaa cct ttt gta tca tgt tcg ccc tca gaa tgt aga
384
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ser Glu Cys Arg
115 120 125
acc ttt ttc ctc aca cag ggc tca tta ctc aat gac aaa cat tct aac
432
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
130 135 140
ggc aca gta aag gac cga agt ccg tat agg act ttg atg agt gtc aaa
480
Gly Thr Val Lys Asp Arg Ser Pro Tyr Arg Thr Leu Met Ser Val Lys
145 150 155 160
ata ggg caa tca cct aat gta tat caa gct aga ttt gaa tcg gta gca
528
Ile Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ser Val Ala
165 170 175
tgg tca gca aca gca tgc cat gat gga aaa aaa tgg atg aca gtt gga
576
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
180 185 190
gtc aca ggg ccc gac aat caa gca att gca gta gtg aac tat gga ggt
624
Val Thr Gly Pro Asp Asn Gln Ala Ile Ala Val Val Asn Tyr Gly Gly
195 200 205
gtt ccg gtt gat att att aat tca tgg gca ggg gat att tta aga acc
672
Val Pro Val Asp Ile Ile Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
210 215 220
caa gaa tca tca tgc acc tgc att aaa gga gac tgt tat tgg gta atg
720
Gln Glu Ser Ser Cys Thr Cys Ile Lys Gly Asp Cys Tyr Trp Val Met
225 230 235 240
act gat gga ccg gca aat agg caa gct aaa tat agg ata ttc aaa gca
768
Thr Asp Gly Pro Ala Asn Arg Gln Ala Lys Tyr Arg Ile Phe Lys Ala
245 250 255
aaa gat gga aga gta att gga cag act gat ata agt ttc aat ggg gga
816
Lys Asp Gly Arg Val Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
260 265 270
cac ata gag gag tgt tct tgt tac ccc aat gaa ggg aag gtg gaa tgc
864
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Glu Gly Lys Val Glu Cys
275 280 285
ata tgc agg gac aat tgg act gga aca aat aga cca gtt ctg gta ata
912
Ile Cys Arg Asp Asn Trp Thr Gly Thr Asn Arg Pro Val Leu Val Ile
290 295 300
tct tct gat cta tcg tac aca gtt gga tat ttg tgt gct ggc att ccc
960
Ser Ser Asp Leu Ser Tyr Thr Val Gly Tyr Leu Cys Ala Gly Ile Pro
305 310 315 320
act gac act cct agg gga gag gat agt caa ttc aca ggc tca tgt aca
1008
Thr Asp Thr Pro Arg Gly Glu Asp Ser Gln Phe Thr Gly Ser Cys Thr
325 330 335
agt cct ttg gga aat aaa gga tac ggt gta aaa ggt ttc ggg ttt cga
1056
Ser Pro Leu Gly Asn Lys Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
340 345 350
caa gga act gac gta tgg gcc gga agg aca att agt agg act tca aga
1104
Gln Gly Thr Asp Val Trp Ala Gly Arg Thr Ile Ser Arg Thr Ser Arg
355 360 365
tca gga ttc gaa ata ata aaa atc agg aat ggt tgg aca cag aac agt
1152
Ser Gly Phe Glu Ile Ile Lys Ile Arg Asn Gly Trp Thr Gln Asn Ser
370 375 380
aaa gac caa atc agg agg caa gtg att atc gat gac cca aat tgg tca
1200
Lys Asp Gln Ile Arg Arg Gln Val Ile Ile Asp Asp Pro Asn Trp Ser
385 390 395 400
gga tat agc ggt tct ttc aca ttg ccg gtt gaa cta aca aaa aag gga
1248
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Thr Lys Lys Gly
405 410 415
tgt ttg gtc ccc tgt ttc tgg gtt gaa atg att aga ggt aaa cct gaa
1296
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
420 425 430
gaa aca aca ata tgg acc tct agt agc tcc att gtg atg tgt gga gta
1344
Glu Thr Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
435 440 445
gat cat aaa att gcc agt tgg tca tgg cac gat gga gct att ctt ccc
1392
Asp His Lys Ile Ala Ser Trp Ser Trp His Asp Gly Ala Ile Leu Pro
450 455 460
ttt gac atc gat aag atg taa
1413
Phe Asp Ile Asp Lys Met
465 470
<210> 12
<211> 470
<212> PRT
<213> Вирус гриппа
<400> 12
Met Asn Pro Asn Gln Lys Ile Ile Ala Ile Gly Phe Ala Ser Leu Gly
1 5 10 15
Ile Leu Ile Ile Asn Val Ile Leu His Val Val Ser Ile Ile Val Thr
20 25 30
Val Leu Val Leu Asn Asn Asn Arg Thr Asp Leu Asn Cys Lys Gly Thr
35 40 45
Ile Ile Arg Lys Tyr Asn Glu Thr Val Arg Val Glu Lys Ile Thr Gln
50 55 60
Trp Tyr Asn Thr Ser Thr Ile Lys Tyr Ile Glu Arg Pro Ser Asn Glu
65 70 75 80
Tyr Tyr Met Asn Asn Thr Glu Pro Leu Cys Glu Ala Gln Gly Phe Ala
85 90 95
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Val
100 105 110
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ser Glu Cys Arg
115 120 125
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
130 135 140
Gly Thr Val Lys Asp Arg Ser Pro Tyr Arg Thr Leu Met Ser Val Lys
145 150 155 160
Ile Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ser Val Ala
165 170 175
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
180 185 190
Val Thr Gly Pro Asp Asn Gln Ala Ile Ala Val Val Asn Tyr Gly Gly
195 200 205
Val Pro Val Asp Ile Ile Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
210 215 220
Gln Glu Ser Ser Cys Thr Cys Ile Lys Gly Asp Cys Tyr Trp Val Met
225 230 235 240
Thr Asp Gly Pro Ala Asn Arg Gln Ala Lys Tyr Arg Ile Phe Lys Ala
245 250 255
Lys Asp Gly Arg Val Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
260 265 270
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Glu Gly Lys Val Glu Cys
275 280 285
Ile Cys Arg Asp Asn Trp Thr Gly Thr Asn Arg Pro Val Leu Val Ile
290 295 300
Ser Ser Asp Leu Ser Tyr Thr Val Gly Tyr Leu Cys Ala Gly Ile Pro
305 310 315 320
Thr Asp Thr Pro Arg Gly Glu Asp Ser Gln Phe Thr Gly Ser Cys Thr
325 330 335
Ser Pro Leu Gly Asn Lys Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
340 345 350
Gln Gly Thr Asp Val Trp Ala Gly Arg Thr Ile Ser Arg Thr Ser Arg
355 360 365
Ser Gly Phe Glu Ile Ile Lys Ile Arg Asn Gly Trp Thr Gln Asn Ser
370 375 380
Lys Asp Gln Ile Arg Arg Gln Val Ile Ile Asp Asp Pro Asn Trp Ser
385 390 395 400
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Thr Lys Lys Gly
405 410 415
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
420 425 430
Glu Thr Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
435 440 445
Asp His Lys Ile Ala Ser Trp Ser Trp His Asp Gly Ala Ile Leu Pro
450 455 460
Phe Asp Ile Asp Lys Met
465 470
<210> 13
<211> 982
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(756)
<400> 13
atg agt ctt cta acc gag gtc gaa acg tac gtt ctc tct atc gta cca
48
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Val Pro
1 5 10 15
tca ggc ccc ctc aaa gcc gag atc gcg cag aga ctt gaa gat gtc ttt
96
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
gca gga aag aac acc gat ctt gag gca ctc atg gaa tgg cta aag aca
144
Ala Gly Lys Asn Thr Asp Leu Glu Ala Leu Met Glu Trp Leu Lys Thr
35 40 45
aga cca atc ctg tca cct ctg act aaa ggg att tta gga ttt gta ttc
192
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
acg ctc acc gtg ccc agt gag cga gga ctg cag cgt aga cgc ttt gtc
240
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
caa aat gcc ctt agt gga aac gga gat cca aac aac atg gac aga gca
288
Gln Asn Ala Leu Ser Gly Asn Gly Asp Pro Asn Asn Met Asp Arg Ala
85 90 95
gta aaa ctg tac agg aag ctt aaa aga gaa ata aca ttc cat ggg gca
336
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
aaa gag gta gca ctc agc tat tcc act ggt gca cta gcc agc tgc atg
384
Lys Glu Val Ala Leu Ser Tyr Ser Thr Gly Ala Leu Ala Ser Cys Met
115 120 125
gga ctc ata tac aac aga atg gga act gtt aca acc gaa gtg gca ttt
432
Gly Leu Ile Tyr Asn Arg Met Gly Thr Val Thr Thr Glu Val Ala Phe
130 135 140
ggc ctg gta tgc gcc aca tgt gaa cag att gct gat tcc cag cat cga
480
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
gct cac agg cag atg gtg aca aca acc aac cca ttg atc aga cat gaa
528
Ala His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
aac aga atg gta tta gcc agt acc acg gct aaa gcc atg gaa cag atg
576
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
gca gga tcg agt gag cag gca gca gag gcc atg gag gtt gct agt agg
624
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Arg
195 200 205
gct agg cag atg gta cag gca atg aga acc att ggg acc cac cct agc
672
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
tcc agt gcc ggt ttg aaa gat gat ctc ctt gaa aat tta cag gcc tac
720
Ser Ser Ala Gly Leu Lys Asp Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
cag aaa cgg atg gga gtg caa atg cag cga ttc aag tgatcctctc
766
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
gttattgcag caagtatcat tgggatcttg cacttgatat tgtggattct tgatcgtctt
826
ttcttcaaat tcatttatcg tcgccttaaa tacgggttga aaagagggcc ttctacggaa
886
ggagtacctg agtctatgag ggaagaatat cggcaggaac agcagaatgc tgtggatgtt
946
gacgatggtc attttgtcaa catagagctg gagtaa
982
<210> 14
<211> 252
<212> PRT
<213> Вирус гриппа
<400> 14
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Val Pro
1 5 10 15
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
Ala Gly Lys Asn Thr Asp Leu Glu Ala Leu Met Glu Trp Leu Lys Thr
35 40 45
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
Gln Asn Ala Leu Ser Gly Asn Gly Asp Pro Asn Asn Met Asp Arg Ala
85 90 95
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
Lys Glu Val Ala Leu Ser Tyr Ser Thr Gly Ala Leu Ala Ser Cys Met
115 120 125
Gly Leu Ile Tyr Asn Arg Met Gly Thr Val Thr Thr Glu Val Ala Phe
130 135 140
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
Ala His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Arg
195 200 205
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
Ser Ser Ala Gly Leu Lys Asp Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
<210> 15
<211> 1698
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1698)
<400> 15
atg aag aca acc att att ttg ata cta cta acc cat tgg gcc tac agt
48
Met Lys Thr Thr Ile Ile Leu Ile Leu Leu Thr His Trp Ala Tyr Ser
1 5 10 15
caa aac cca atc agt ggc aac aac aca gcc aca ctg tgt ctg gga cac
96
Gln Asn Pro Ile Ser Gly Asn Asn Thr Ala Thr Leu Cys Leu Gly His
20 25 30
cat gca gta gca aat gga aca ttg gta aaa aca atg agt gat gat caa
144
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Met Ser Asp Asp Gln
35 40 45
att gag gtg aca aat gct aca gaa tta gtt cag agc att tca atg ggg
192
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
50 55 60
aaa ata tgc aac aaa tca tat aga att cta gat gga aga aat tgc aca
240
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
65 70 75 80
tta ata gat gca atg cta gga gac ccc cac tgt gac gcc ttt cag tat
288
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
85 90 95
gag agt tgg gac ctc ttc ata gaa aga agc aac gct ttc agc aat tgc
336
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Asn Ala Phe Ser Asn Cys
100 105 110
tac cca tat gac atc cct gac tat gca tcg ctc cga tcc att gta gca
384
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Ser Leu Arg Ser Ile Val Ala
115 120 125
tcc tca gga aca ttg gaa ttc aca gca gag gga ttc aca tgg aca ggt
432
Ser Ser Gly Thr Leu Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
130 135 140
gtc act caa aac gga aga agt gga gcc tgc aaa agg gga tca gcc gat
480
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
145 150 155 160
agt ttc ttt agc cga ctg aat tgg cta aca aaa tct gga agc tct tac
528
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
165 170 175
ccc aca ttg aat gtg aca atg cct aac aat aaa aat ttc gac aag cta
576
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
180 185 190
tac atc tgg ggg att cat cac ccg agc tca aat caa gag cag aca aaa
624
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
195 200 205
ttg tac atc caa gaa tca gga cga gta aca gtc tca aca aaa aga agt
672
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
210 215 220
caa caa aca ata atc cct aac atc gga tct aga ccg ttg gtc aga ggt
720
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
225 230 235 240
caa tca ggc agg ata agc ata tac tgg acc att gta aaa cct gga gat
768
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
245 250 255
atc cta atg ata aac agt aat ggc aac tta gtt gca ccg cgg gga tat
816
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
260 265 270
ttt aaa ttg aaa aca ggg aaa agc tct gta atg aga tca gat gca ccc
864
Phe Lys Leu Lys Thr Gly Lys Ser Ser Val Met Arg Ser Asp Ala Pro
275 280 285
ata gac att tgt gtg tct gaa tgt att aca cca aat gga agc atc tcc
912
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
290 295 300
aac gac aag cca ttc caa aat gtg aac aaa gtt aca tat gga aaa tgc
960
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
305 310 315 320
cct aag tat atc agg caa aac act tta aag ctg gcc act ggg atg agg
1008
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
325 330 335
aat gta cca gaa aag caa acc aga gga atc ttt gga gca ata gcg gga
1056
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
340 345 350
ttc atc gaa aac ggc tgg gaa gga atg gtt gat ggg tgg tat ggg ttc
1104
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
355 360 365
cga tat caa aac tct gaa gga aca ggg caa gct gca gat cta aag agc
1152
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
370 375 380
act caa gca gcc atc gac cag att aat gga aag tta aac aga gtg att
1200
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
385 390 395 400
gaa aga acc aat gag aaa ttc cat caa ata gag aag gaa ttc tca gaa
1248
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
405 410 415
gta gaa gga aga att cag gac ctg gag aaa tat gta gaa gac acc aaa
1296
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
420 425 430
ata gac cta tgg tcc tac aat gca gaa ttg ctg gtg gct cta gaa aat
1344
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
435 440 445
caa cat aca att gac tta aca gat gca gaa atg aat aaa tta ttt gag
1392
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
450 455 460
aag act aga cgc cag tta aga gaa aac gca gaa gac atg gga ggt gga
1440
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
465 470 475 480
tgt ttc aag att tac cac aaa tgt gat aat gca tgc att gga tca ata
1488
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser Ile
485 490 495
aga act ggg aca tat gac cat tac ata tac aga gat gaa gca tta aac
1536
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Arg Asp Glu Ala Leu Asn
500 505 510
aac cga ttt cag atc aaa ggt gta gag ttg aaa tca ggc tac aaa gat
1584
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
515 520 525
tgg ata ttg tgg att tca ttc gcc ata tca tgc ttc tta att tgc gtt
1632
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
530 535 540
gtt cta ttg ggt ttc att atg tgg gct tgc caa aga ggc aac atc aga
1680
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Arg Gly Asn Ile Arg
545 550 555 560
tgc aac att tgc att tga
1698
Cys Asn Ile Cys Ile
565
<210> 16
<211> 565
<212> PRT
<213> Вирус гриппа
<400> 16
Met Lys Thr Thr Ile Ile Leu Ile Leu Leu Thr His Trp Ala Tyr Ser
1 5 10 15
Gln Asn Pro Ile Ser Gly Asn Asn Thr Ala Thr Leu Cys Leu Gly His
20 25 30
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Met Ser Asp Asp Gln
35 40 45
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
50 55 60
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
65 70 75 80
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
85 90 95
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Asn Ala Phe Ser Asn Cys
100 105 110
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Ser Leu Arg Ser Ile Val Ala
115 120 125
Ser Ser Gly Thr Leu Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
130 135 140
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
145 150 155 160
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
165 170 175
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
180 185 190
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
195 200 205
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
210 215 220
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
225 230 235 240
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
245 250 255
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
260 265 270
Phe Lys Leu Lys Thr Gly Lys Ser Ser Val Met Arg Ser Asp Ala Pro
275 280 285
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
290 295 300
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
305 310 315 320
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
325 330 335
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
340 345 350
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
355 360 365
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
385 390 395 400
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
405 410 415
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
420 425 430
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
435 440 445
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
450 455 460
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
465 470 475 480
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser Ile
485 490 495
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Arg Asp Glu Ala Leu Asn
500 505 510
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
515 520 525
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
530 535 540
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Arg Gly Asn Ile Arg
545 550 555 560
Cys Asn Ile Cys Ile
565
<210> 17
<211> 2277
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2277)
<400> 17
atg gag aga ata aaa gaa ctg aga gat ctg atg tta caa tcc cgc acc
48
Met Glu Arg Ile Lys Glu Leu Arg Asp Leu Met Leu Gln Ser Arg Thr
1 5 10 15
cgc gag ata cta aca aaa act act gtg gac cac atg gcc ata atc aag
96
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
aaa tac aca tca gga aga caa gag aag aac cct gca ctt agg atg aaa
144
Lys Tyr Thr Ser Gly Arg Gln Glu Lys Asn Pro Ala Leu Arg Met Lys
35 40 45
tgg atg atg gca atg aaa tac cca att aca gca gat aag agg ata atg
192
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Met
50 55 60
gag atg att cct gag aga aat gaa cag gga caa acc ctt tgg agc aaa
240
Glu Met Ile Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
acg aac gat gct ggc tca gac cgc gta atg gta tca cct ctg gca gtg
288
Thr Asn Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
aca tgg tgg aat agg aat gga cca aca acg agc aca att cat tat cca
336
Thr Trp Trp Asn Arg Asn Gly Pro Thr Thr Ser Thr Ile His Tyr Pro
100 105 110
aaa gtc tac aaa act tat ttt gaa aag gtt gaa aga ttg aaa cac gga
384
Lys Val Tyr Lys Thr Tyr Phe Glu Lys Val Glu Arg Leu Lys His Gly
115 120 125
acc ttt ggc ccc gtt cat ttt agg aat caa gtc aag ata aga cga aga
432
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
gtt gat gta aac cct ggt cac gcg gac ctc agt gcc aaa gaa gca caa
480
Val Asp Val Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
gat gtg atc atg gaa gtt gtt ttc cca aat gaa gtg gga gcc aga att
528
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Arg Ile
165 170 175
cta aca tcg gaa tca caa cta aca ata acc aaa gag aaa aag gaa gaa
576
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
ctt cag gac tgc aaa att gct ccc ttg atg gta gca tac atg cta gaa
624
Leu Gln Asp Cys Lys Ile Ala Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
aga gag ttg gtc cga aaa aca agg ttc ctc cca gta gca ggc gga aca
672
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Ala Gly Gly Thr
210 215 220
agc agt gta tac att gaa gtg ttg cat ctg act cag gga aca tgc tgg
720
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
gag caa atg tac acc cca gga gga gaa gtt aga aac gat gat att gat
768
Glu Gln Met Tyr Thr Pro Gly Gly Glu Val Arg Asn Asp Asp Ile Asp
245 250 255
caa agt tta att att gca gcc cgg aac ata gtg aga aga gcg aca gta
816
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Thr Val
260 265 270
tca gca gat cca cta gca tcc cta ctg gaa atg tgc cac agt aca cag
864
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
att ggt gga ata agg atg gta gac atc ctt aag cag aat cca aca gag
912
Ile Gly Gly Ile Arg Met Val Asp Ile Leu Lys Gln Asn Pro Thr Glu
290 295 300
gaa caa gct gtg gat ata tgc aaa gca gca atg gga ttg aga att agc
960
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
tca tca ttc agc ttt ggt gga ttc acc ttc aaa aga aca agt gga tca
1008
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
tca gtc aag aga gaa gaa gaa atg ctt acg ggc aac ctt caa aca ttg
1056
Ser Val Lys Arg Glu Glu Glu Met Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
aaa ata aga gtg cat gag ggc tat gaa gaa ttc aca atg gtc gga aga
1104
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Arg
355 360 365
aga gca aca gcc att atc aga aag gca acc aga aga ttg att caa ttg
1152
Arg Ala Thr Ala Ile Ile Arg Lys Ala Thr Arg Arg Leu Ile Gln Leu
370 375 380
ata gta agt ggg aga gat gaa caa tca att gct gaa gca ata att gta
1200
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
gcc atg gtg ttt tcg caa gaa gat tgc atg ata aaa gca gtt cga ggc
1248
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
gat ttg aac ttt gtt aat aga gca aat cag cgt ttg aac ccc atg cat
1296
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
caa ctc ttg agg cat ttc caa aaa gat gca aaa gtg ctt ttc caa aat
1344
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn
435 440 445
tgg gga att gaa ccc atc gac aat gta atg ggg atg att gga ata ttg
1392
Trp Gly Ile Glu Pro Ile Asp Asn Val Met Gly Met Ile Gly Ile Leu
450 455 460
cct gac atg acc cca agc acc gag atg tca ttg aga gga gtg aga gtc
1440
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Leu Arg Gly Val Arg Val
465 470 475 480
agc aaa atg gga gtg gat gag tac tcc agc act gag aga gtg gtg gtg
1488
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
agc att gac cgt ttt tta aga gtt cgg gat caa agg gga aac ata cta
1536
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Ile Leu
500 505 510
ctg tcc cct gaa gaa gtc agt gaa aca caa gga acg gaa aag ctg aca
1584
Leu Ser Pro Glu Glu Val Ser Glu Thr Gln Gly Thr Glu Lys Leu Thr
515 520 525
ata att tat tcg tca tca atg atg tgg gag att aat ggt ccc gaa tca
1632
Ile Ile Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
gtg ttg gtc aat act tat caa tgg atc atc agg aac tgg gaa att gta
1680
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Ile Val
545 550 555 560
aaa att cag tgg tca cag gac ccc aca atg tta tac aat aag ata gaa
1728
Lys Ile Gln Trp Ser Gln Asp Pro Thr Met Leu Tyr Asn Lys Ile Glu
565 570 575
ttt gag cca ttc caa tcc ctg gtc cct agg gcc acc aga agc caa tac
1776
Phe Glu Pro Phe Gln Ser Leu Val Pro Arg Ala Thr Arg Ser Gln Tyr
580 585 590
agc ggt ttc gta aga acc ctg ttt cag caa atg cga gat gta ctt gga
1824
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
aca ttt gat act gct caa ata ata aaa ctc ctc cct ttt gcc gct gct
1872
Thr Phe Asp Thr Ala Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
cct ccg gaa cag agt agg atg cag ttc tct tct ttg act gtt aat gta
1920
Pro Pro Glu Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
aga ggt tcg gga atg agg ata ctt gta aga ggc aat tcc cca gtg ttc
1968
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
aac tac aat aaa gcc act aaa agg ctc aca gtc ctc gga aag gat gca
2016
Asn Tyr Asn Lys Ala Thr Lys Arg Leu Thr Val Leu Gly Lys Asp Ala
660 665 670
ggt gcg ctt act gag gac cca gat gaa ggt acg gct gga gta gaa tct
2064
Gly Ala Leu Thr Glu Asp Pro Asp Glu Gly Thr Ala Gly Val Glu Ser
675 680 685
gct gtt cta aga ggg ttt ctc att tta ggt aaa gaa aac aag aga tat
2112
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asn Lys Arg Tyr
690 695 700
ggc cca gca cta agc atc aat gaa cta agc aaa ctt gca aaa ggg gag
2160
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Lys Leu Ala Lys Gly Glu
705 710 715 720
aaa gcc aat gta cta att ggg caa ggg gac rta gtg ttg gta atg aaa
2208
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Xaa Val Leu Val Met Lys
725 730 735
cgg aaa cgt gac tct agc ata ctt act gac agc cag aca gcg acc aaa
2256
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
agg att cgg atg gcc atc aat
2277
Arg Ile Arg Met Ala Ile Asn
755
<210> 18
<211> 759
<212> PRT
<213> Вирус гриппа
<220>
<221> misc_feature
<222> (731)..(731)
<223> Хаа в положении 731 в цепях означает Val или Ile
<400> 18
Met Glu Arg Ile Lys Glu Leu Arg Asp Leu Met Leu Gln Ser Arg Thr
1 5 10 15
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
Lys Tyr Thr Ser Gly Arg Gln Glu Lys Asn Pro Ala Leu Arg Met Lys
35 40 45
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Met
50 55 60
Glu Met Ile Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
Thr Asn Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
Thr Trp Trp Asn Arg Asn Gly Pro Thr Thr Ser Thr Ile His Tyr Pro
100 105 110
Lys Val Tyr Lys Thr Tyr Phe Glu Lys Val Glu Arg Leu Lys His Gly
115 120 125
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
Val Asp Val Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Arg Ile
165 170 175
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
Leu Gln Asp Cys Lys Ile Ala Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Ala Gly Gly Thr
210 215 220
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
Glu Gln Met Tyr Thr Pro Gly Gly Glu Val Arg Asn Asp Asp Ile Asp
245 250 255
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Thr Val
260 265 270
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
Ile Gly Gly Ile Arg Met Val Asp Ile Leu Lys Gln Asn Pro Thr Glu
290 295 300
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
Ser Val Lys Arg Glu Glu Glu Met Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Arg
355 360 365
Arg Ala Thr Ala Ile Ile Arg Lys Ala Thr Arg Arg Leu Ile Gln Leu
370 375 380
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn
435 440 445
Trp Gly Ile Glu Pro Ile Asp Asn Val Met Gly Met Ile Gly Ile Leu
450 455 460
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Leu Arg Gly Val Arg Val
465 470 475 480
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Ile Leu
500 505 510
Leu Ser Pro Glu Glu Val Ser Glu Thr Gln Gly Thr Glu Lys Leu Thr
515 520 525
Ile Ile Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Ile Val
545 550 555 560
Lys Ile Gln Trp Ser Gln Asp Pro Thr Met Leu Tyr Asn Lys Ile Glu
565 570 575
Phe Glu Pro Phe Gln Ser Leu Val Pro Arg Ala Thr Arg Ser Gln Tyr
580 585 590
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
Thr Phe Asp Thr Ala Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
Pro Pro Glu Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
Asn Tyr Asn Lys Ala Thr Lys Arg Leu Thr Val Leu Gly Lys Asp Ala
660 665 670
Gly Ala Leu Thr Glu Asp Pro Asp Glu Gly Thr Ala Gly Val Glu Ser
675 680 685
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asn Lys Arg Tyr
690 695 700
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Lys Leu Ala Lys Gly Glu
705 710 715 720
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Xaa Val Leu Val Met Lys
725 730 735
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
Arg Ile Arg Met Ala Ile Asn
755
<210> 19
<211> 2274
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2274)
<400> 19
atg gat gtc aat ccg act cta ctt ttc tta aag gtg cca gcg caa aat
48
Met Asp Val Asn Pro Thr Leu Leu Phe Leu Lys Val Pro Ala Gln Asn
1 5 10 15
gct ata agc aca aca ttc cct tat act gga gat cct ccc tac agt cat
96
Ala Ile Ser Thr Thr Phe Pro Tyr Thr Gly Asp Pro Pro Tyr Ser His
20 25 30
gga aca ggg aca gga tac acc atg gat act gtc aac aga aca cac caa
144
Gly Thr Gly Thr Gly Tyr Thr Met Asp Thr Val Asn Arg Thr His Gln
35 40 45
tat tca gaa aaa ggg aaa tgg aca aca aac act gag att gga gca cca
192
Tyr Ser Glu Lys Gly Lys Trp Thr Thr Asn Thr Glu Ile Gly Ala Pro
50 55 60
caa ctt aat cca atc gat gga cca ctt cct gaa gac aat gaa cca agt
240
Gln Leu Asn Pro Ile Asp Gly Pro Leu Pro Glu Asp Asn Glu Pro Ser
65 70 75 80
ggg tac gcc caa aca gat tgt gta ttg gaa gca atg gct ttc ctt gaa
288
Gly Tyr Ala Gln Thr Asp Cys Val Leu Glu Ala Met Ala Phe Leu Glu
85 90 95
gaa tcc cat ccc gga atc ttt gaa aat tcg tgt ctt gaa acg atg gag
336
Glu Ser His Pro Gly Ile Phe Glu Asn Ser Cys Leu Glu Thr Met Glu
100 105 110
gtg att cag cag aca aga gtg gac aaa cta aca caa ggc cga caa act
384
Val Ile Gln Gln Thr Arg Val Asp Lys Leu Thr Gln Gly Arg Gln Thr
115 120 125
tat gat tgg acc ttg aat agg aat caa cct gcc gca aca gca ctt gct
432
Tyr Asp Trp Thr Leu Asn Arg Asn Gln Pro Ala Ala Thr Ala Leu Ala
130 135 140
aat acg att gaa gta ttc aga tca aat ggt ctg act tcc aat gaa tcg
480
Asn Thr Ile Glu Val Phe Arg Ser Asn Gly Leu Thr Ser Asn Glu Ser
145 150 155 160
ggg aga ttg atg gac ttc ctc aaa gat gtc atg gag tcc atg aac aag
528
Gly Arg Leu Met Asp Phe Leu Lys Asp Val Met Glu Ser Met Asn Lys
165 170 175
gaa gaa atg gaa ata aca aca cac ttc caa cgg aag aga aga gta aga
576
Glu Glu Met Glu Ile Thr Thr His Phe Gln Arg Lys Arg Arg Val Arg
180 185 190
gac aac atg aca aag aga atg gta aca cag aga acc ata ggg aag aaa
624
Asp Asn Met Thr Lys Arg Met Val Thr Gln Arg Thr Ile Gly Lys Lys
195 200 205
aaa caa cga tta aac aga aag agc tat cta atc aga aca tta acc cta
672
Lys Gln Arg Leu Asn Arg Lys Ser Tyr Leu Ile Arg Thr Leu Thr Leu
210 215 220
aac aca atg acc aag gac gct gag aga ggg aaa ttg aaa cga cga gca
720
Asn Thr Met Thr Lys Asp Ala Glu Arg Gly Lys Leu Lys Arg Arg Ala
225 230 235 240
atc gct acc cca ggg atg cag ata aga ggg ttt gta tat ttt gtt gaa
768
Ile Ala Thr Pro Gly Met Gln Ile Arg Gly Phe Val Tyr Phe Val Glu
245 250 255
aca cta gcc cga aga ata tgt gaa aag ctt gaa caa tca gga ttg cca
816
Thr Leu Ala Arg Arg Ile Cys Glu Lys Leu Glu Gln Ser Gly Leu Pro
260 265 270
gtt ggc ggt aat gag aaa aag gcc aaa ctg gct aat gtc gtc aga aaa
864
Val Gly Gly Asn Glu Lys Lys Ala Lys Leu Ala Asn Val Val Arg Lys
275 280 285
atg atg act aat tcc caa gac act gaa ctc tcc ttc acc atc act ggg
912
Met Met Thr Asn Ser Gln Asp Thr Glu Leu Ser Phe Thr Ile Thr Gly
290 295 300
gac aat acc aaa tgg aat gaa aat cag aac cca cgc ata ttc ctg gca
960
Asp Asn Thr Lys Trp Asn Glu Asn Gln Asn Pro Arg Ile Phe Leu Ala
305 310 315 320
atg atc aca tac ata act aga aac cag cca gaa tgg ttc aga aat gtt
1008
Met Ile Thr Tyr Ile Thr Arg Asn Gln Pro Glu Trp Phe Arg Asn Val
325 330 335
cta agc att gca ccg att atg ttc tca aat aaa atg gca aga ctg ggg
1056
Leu Ser Ile Ala Pro Ile Met Phe Ser Asn Lys Met Ala Arg Leu Gly
340 345 350
aaa gga tat atg ttt gaa agc aaa agt atg aaa ttg aga act caa ata
1104
Lys Gly Tyr Met Phe Glu Ser Lys Ser Met Lys Leu Arg Thr Gln Ile
355 360 365
cca gca gaa atg cta gca agc att gac cta aaa tat ttc aat gat tca
1152
Pro Ala Glu Met Leu Ala Ser Ile Asp Leu Lys Tyr Phe Asn Asp Ser
370 375 380
aca aaa aag aaa att gaa aag ata cga cca ctt ctg gtt gac ggg act
1200
Thr Lys Lys Lys Ile Glu Lys Ile Arg Pro Leu Leu Val Asp Gly Thr
385 390 395 400
gct tca ctg agt cct ggc atg atg atg gga atg ttc aac atg ttg agc
1248
Ala Ser Leu Ser Pro Gly Met Met Met Gly Met Phe Asn Met Leu Ser
405 410 415
act gtg ctg ggt gta tcc ata tta aac ctg ggc cag agg aaa tac aca
1296
Thr Val Leu Gly Val Ser Ile Leu Asn Leu Gly Gln Arg Lys Tyr Thr
420 425 430
aag acc aca tac tgg tgg gat ggt ctg caa tca tcc gat gac ttt gct
1344
Lys Thr Thr Tyr Trp Trp Asp Gly Leu Gln Ser Ser Asp Asp Phe Ala
435 440 445
ttg ata gtg aat gcg cct aat cat gaa gga ata caa gct gga gta gac
1392
Leu Ile Val Asn Ala Pro Asn His Glu Gly Ile Gln Ala Gly Val Asp
450 455 460
aga ttc tat aga act tgc aaa ctg gtc ggg atc aac atg agc aaa aag
1440
Arg Phe Tyr Arg Thr Cys Lys Leu Val Gly Ile Asn Met Ser Lys Lys
465 470 475 480
aaa tcc tac ata aat aga act gga aca ttc gaa ttc aca agc ttt ttc
1488
Lys Ser Tyr Ile Asn Arg Thr Gly Thr Phe Glu Phe Thr Ser Phe Phe
485 490 495
tac cgg tat ggt ttt gta gcc aat ttc agc atg gaa cta ccc agt ttt
1536
Tyr Arg Tyr Gly Phe Val Ala Asn Phe Ser Met Glu Leu Pro Ser Phe
500 505 510
ggg gtt tcc gga ata aat gaa tct gca gac atg agc att gga gtg aca
1584
Gly Val Ser Gly Ile Asn Glu Ser Ala Asp Met Ser Ile Gly Val Thr
515 520 525
gtc atc aaa aac aac atg ata aat aat gat ctc ggt cct gcc acg gca
1632
Val Ile Lys Asn Asn Met Ile Asn Asn Asp Leu Gly Pro Ala Thr Ala
530 535 540
caa atg gca ctc caa ctc ttc att aag gat tat cgg tac aca tac cgg
1680
Gln Met Ala Leu Gln Leu Phe Ile Lys Asp Tyr Arg Tyr Thr Tyr Arg
545 550 555 560
tgc cat aga ggt gat acc cag ata caa acc aga aga tct ttt gag ttg
1728
Cys His Arg Gly Asp Thr Gln Ile Gln Thr Arg Arg Ser Phe Glu Leu
565 570 575
aag aaa ctg tgg gaa cag act cga tca aag act ggt cta ctg gta tca
1776
Lys Lys Leu Trp Glu Gln Thr Arg Ser Lys Thr Gly Leu Leu Val Ser
580 585 590
gat ggg ggt cca aac cta tat aac atc aga aac cta cac atc ccg gaa
1824
Asp Gly Gly Pro Asn Leu Tyr Asn Ile Arg Asn Leu His Ile Pro Glu
595 600 605
gtc tgt tta aaa tgg gag cta atg gat gaa gat tat aag ggg agg cta
1872
Val Cys Leu Lys Trp Glu Leu Met Asp Glu Asp Tyr Lys Gly Arg Leu
610 615 620
tgc aat cca ttg aat cct ttc gtt agt cac aaa gaa att gaa tca gtc
1920
Cys Asn Pro Leu Asn Pro Phe Val Ser His Lys Glu Ile Glu Ser Val
625 630 635 640
aac agt gca gta gta atg cct gcg cat ggc cct gcc aaa agc atg gag
1968
Asn Ser Ala Val Val Met Pro Ala His Gly Pro Ala Lys Ser Met Glu
645 650 655
tat gat gct gtt gca aca aca cat tct tgg atc ccc aag agg aac cgg
2016
Tyr Asp Ala Val Ala Thr Thr His Ser Trp Ile Pro Lys Arg Asn Arg
660 665 670
tcc ata ttg aac aca agc caa agg gga ata ctc gaa gat gag cag atg
2064
Ser Ile Leu Asn Thr Ser Gln Arg Gly Ile Leu Glu Asp Glu Gln Met
675 680 685
tat cag aaa tgc tgc aac ctg ttt gaa aaa ttc ttc ccc agc agc tca
2112
Tyr Gln Lys Cys Cys Asn Leu Phe Glu Lys Phe Phe Pro Ser Ser Ser
690 695 700
tac aga aga cca gtc gga att tct agt atg gtt gag gcc atg gtg tcc
2160
Tyr Arg Arg Pro Val Gly Ile Ser Ser Met Val Glu Ala Met Val Ser
705 710 715 720
agg gcc cgc att gat gca cga att gac ttc gaa tct gga cgg ata aag
2208
Arg Ala Arg Ile Asp Ala Arg Ile Asp Phe Glu Ser Gly Arg Ile Lys
725 730 735
aag gat gag ttc gct gag atc atg aag atc tgt tcc acc att gaa gag
2256
Lys Asp Glu Phe Ala Glu Ile Met Lys Ile Cys Ser Thr Ile Glu Glu
740 745 750
ctc aga cgg caa aaa tag
2274
Leu Arg Arg Gln Lys
755
<210> 20
<211> 757
<212> PRT
<213> Вирус гриппа
<400> 20
Met Asp Val Asn Pro Thr Leu Leu Phe Leu Lys Val Pro Ala Gln Asn
1 5 10 15
Ala Ile Ser Thr Thr Phe Pro Tyr Thr Gly Asp Pro Pro Tyr Ser His
20 25 30
Gly Thr Gly Thr Gly Tyr Thr Met Asp Thr Val Asn Arg Thr His Gln
35 40 45
Tyr Ser Glu Lys Gly Lys Trp Thr Thr Asn Thr Glu Ile Gly Ala Pro
50 55 60
Gln Leu Asn Pro Ile Asp Gly Pro Leu Pro Glu Asp Asn Glu Pro Ser
65 70 75 80
Gly Tyr Ala Gln Thr Asp Cys Val Leu Glu Ala Met Ala Phe Leu Glu
85 90 95
Glu Ser His Pro Gly Ile Phe Glu Asn Ser Cys Leu Glu Thr Met Glu
100 105 110
Val Ile Gln Gln Thr Arg Val Asp Lys Leu Thr Gln Gly Arg Gln Thr
115 120 125
Tyr Asp Trp Thr Leu Asn Arg Asn Gln Pro Ala Ala Thr Ala Leu Ala
130 135 140
Asn Thr Ile Glu Val Phe Arg Ser Asn Gly Leu Thr Ser Asn Glu Ser
145 150 155 160
Gly Arg Leu Met Asp Phe Leu Lys Asp Val Met Glu Ser Met Asn Lys
165 170 175
Glu Glu Met Glu Ile Thr Thr His Phe Gln Arg Lys Arg Arg Val Arg
180 185 190
Asp Asn Met Thr Lys Arg Met Val Thr Gln Arg Thr Ile Gly Lys Lys
195 200 205
Lys Gln Arg Leu Asn Arg Lys Ser Tyr Leu Ile Arg Thr Leu Thr Leu
210 215 220
Asn Thr Met Thr Lys Asp Ala Glu Arg Gly Lys Leu Lys Arg Arg Ala
225 230 235 240
Ile Ala Thr Pro Gly Met Gln Ile Arg Gly Phe Val Tyr Phe Val Glu
245 250 255
Thr Leu Ala Arg Arg Ile Cys Glu Lys Leu Glu Gln Ser Gly Leu Pro
260 265 270
Val Gly Gly Asn Glu Lys Lys Ala Lys Leu Ala Asn Val Val Arg Lys
275 280 285
Met Met Thr Asn Ser Gln Asp Thr Glu Leu Ser Phe Thr Ile Thr Gly
290 295 300
Asp Asn Thr Lys Trp Asn Glu Asn Gln Asn Pro Arg Ile Phe Leu Ala
305 310 315 320
Met Ile Thr Tyr Ile Thr Arg Asn Gln Pro Glu Trp Phe Arg Asn Val
325 330 335
Leu Ser Ile Ala Pro Ile Met Phe Ser Asn Lys Met Ala Arg Leu Gly
340 345 350
Lys Gly Tyr Met Phe Glu Ser Lys Ser Met Lys Leu Arg Thr Gln Ile
355 360 365
Pro Ala Glu Met Leu Ala Ser Ile Asp Leu Lys Tyr Phe Asn Asp Ser
370 375 380
Thr Lys Lys Lys Ile Glu Lys Ile Arg Pro Leu Leu Val Asp Gly Thr
385 390 395 400
Ala Ser Leu Ser Pro Gly Met Met Met Gly Met Phe Asn Met Leu Ser
405 410 415
Thr Val Leu Gly Val Ser Ile Leu Asn Leu Gly Gln Arg Lys Tyr Thr
420 425 430
Lys Thr Thr Tyr Trp Trp Asp Gly Leu Gln Ser Ser Asp Asp Phe Ala
435 440 445
Leu Ile Val Asn Ala Pro Asn His Glu Gly Ile Gln Ala Gly Val Asp
450 455 460
Arg Phe Tyr Arg Thr Cys Lys Leu Val Gly Ile Asn Met Ser Lys Lys
465 470 475 480
Lys Ser Tyr Ile Asn Arg Thr Gly Thr Phe Glu Phe Thr Ser Phe Phe
485 490 495
Tyr Arg Tyr Gly Phe Val Ala Asn Phe Ser Met Glu Leu Pro Ser Phe
500 505 510
Gly Val Ser Gly Ile Asn Glu Ser Ala Asp Met Ser Ile Gly Val Thr
515 520 525
Val Ile Lys Asn Asn Met Ile Asn Asn Asp Leu Gly Pro Ala Thr Ala
530 535 540
Gln Met Ala Leu Gln Leu Phe Ile Lys Asp Tyr Arg Tyr Thr Tyr Arg
545 550 555 560
Cys His Arg Gly Asp Thr Gln Ile Gln Thr Arg Arg Ser Phe Glu Leu
565 570 575
Lys Lys Leu Trp Glu Gln Thr Arg Ser Lys Thr Gly Leu Leu Val Ser
580 585 590
Asp Gly Gly Pro Asn Leu Tyr Asn Ile Arg Asn Leu His Ile Pro Glu
595 600 605
Val Cys Leu Lys Trp Glu Leu Met Asp Glu Asp Tyr Lys Gly Arg Leu
610 615 620
Cys Asn Pro Leu Asn Pro Phe Val Ser His Lys Glu Ile Glu Ser Val
625 630 635 640
Asn Ser Ala Val Val Met Pro Ala His Gly Pro Ala Lys Ser Met Glu
645 650 655
Tyr Asp Ala Val Ala Thr Thr His Ser Trp Ile Pro Lys Arg Asn Arg
660 665 670
Ser Ile Leu Asn Thr Ser Gln Arg Gly Ile Leu Glu Asp Glu Gln Met
675 680 685
Tyr Gln Lys Cys Cys Asn Leu Phe Glu Lys Phe Phe Pro Ser Ser Ser
690 695 700
Tyr Arg Arg Pro Val Gly Ile Ser Ser Met Val Glu Ala Met Val Ser
705 710 715 720
Arg Ala Arg Ile Asp Ala Arg Ile Asp Phe Glu Ser Gly Arg Ile Lys
725 730 735
Lys Asp Glu Phe Ala Glu Ile Met Lys Ile Cys Ser Thr Ile Glu Glu
740 745 750
Leu Arg Arg Gln Lys
755
<210> 21
<211> 2151
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2151)
<400> 21
atg gaa gac ttt gtg cga cag tgc ttc aat cca atg atc gtc gag ctt
48
Met Glu Asp Phe Val Arg Gln Cys Phe Asn Pro Met Ile Val Glu Leu
1 5 10 15
gcg gaa aag gca atg aaa gaa tat gga gag aac ccg aaa atc gaa aca
96
Ala Glu Lys Ala Met Lys Glu Tyr Gly Glu Asn Pro Lys Ile Glu Thr
20 25 30
aac aaa ttt gca gca ata tgc act cac ttg gaa gtc tgc ttc atg tac
144
Asn Lys Phe Ala Ala Ile Cys Thr His Leu Glu Val Cys Phe Met Tyr
35 40 45
tcg gat ttt cac ttt att aat gaa ctg ggt gag tca gtg gtc ata gag
192
Ser Asp Phe His Phe Ile Asn Glu Leu Gly Glu Ser Val Val Ile Glu
50 55 60
tct ggt gac cca aat gct ctt ttg aaa cac aga ttt gaa atc att gag
240
Ser Gly Asp Pro Asn Ala Leu Leu Lys His Arg Phe Glu Ile Ile Glu
65 70 75 80
ggg aga gat cga aca atg gca tgg aca gta gta aac agc atc tgc aac
288
Gly Arg Asp Arg Thr Met Ala Trp Thr Val Val Asn Ser Ile Cys Asn
85 90 95
acc aca aga gct gaa aaa cct aaa ttt ctt cca gat tta tac gac tat
336
Thr Thr Arg Ala Glu Lys Pro Lys Phe Leu Pro Asp Leu Tyr Asp Tyr
100 105 110
aag gag aac aga ttt gtt gaa att ggt gtg aca agg aga gaa gtt cac
384
Lys Glu Asn Arg Phe Val Glu Ile Gly Val Thr Arg Arg Glu Val His
115 120 125
ata tac tac ctg gag aag gcc aac aaa ata aag tct gag aaa aca cat
432
Ile Tyr Tyr Leu Glu Lys Ala Asn Lys Ile Lys Ser Glu Lys Thr His
130 135 140
atc cac att ttc tca ttt aca gga gag gaa atg gct aca aaa gcg gac
480
Ile His Ile Phe Ser Phe Thr Gly Glu Glu Met Ala Thr Lys Ala Asp
145 150 155 160
tat act ctt gat gaa gag agt aga gcc agg atc aag acc aga cta ttc
528
Tyr Thr Leu Asp Glu Glu Ser Arg Ala Arg Ile Lys Thr Arg Leu Phe
165 170 175
act ata aga caa gaa atg gcc agt aga ggc ctc tgg gat tcc ttt cgt
576
Thr Ile Arg Gln Glu Met Ala Ser Arg Gly Leu Trp Asp Ser Phe Arg
180 185 190
cag tcc gag aga ggc gaa gag aca att gaa gaa aga ttt gaa atc aca
624
Gln Ser Glu Arg Gly Glu Glu Thr Ile Glu Glu Arg Phe Glu Ile Thr
195 200 205
ggg acg atg cgc aag ctt gcc aat tac agt ctc cca ccg aac ttc tcc
672
Gly Thr Met Arg Lys Leu Ala Asn Tyr Ser Leu Pro Pro Asn Phe Ser
210 215 220
agc ctt gaa aat ttt aga gtc tat gtg gat gga ttc gaa ccg aac ggc
720
Ser Leu Glu Asn Phe Arg Val Tyr Val Asp Gly Phe Glu Pro Asn Gly
225 230 235 240
tgc att gag agt aag ctt tct caa atg tcc aaa gaa gta aat gcc aga
768
Cys Ile Glu Ser Lys Leu Ser Gln Met Ser Lys Glu Val Asn Ala Arg
245 250 255
atc gaa cca ttt tca aag aca aca ccc cga cca ctc aaa atg cca ggt
816
Ile Glu Pro Phe Ser Lys Thr Thr Pro Arg Pro Leu Lys Met Pro Gly
260 265 270
ggt cca ccc tgc cat cag cga tct aaa ttc ttg cta atg gat gct ctg
864
Gly Pro Pro Cys His Gln Arg Ser Lys Phe Leu Leu Met Asp Ala Leu
275 280 285
aaa ctg agc att gag gac cca agt cac gag gga gag gga ata cca cta
912
Lys Leu Ser Ile Glu Asp Pro Ser His Glu Gly Glu Gly Ile Pro Leu
290 295 300
tat gat gca atc aaa tgc atg aaa act ttc ttt gga tgg aaa gag ccc
960
Tyr Asp Ala Ile Lys Cys Met Lys Thr Phe Phe Gly Trp Lys Glu Pro
305 310 315 320
agt att gtt aaa cca cat gaa aag ggt ata aac ccg aac tat ctc caa
1008
Ser Ile Val Lys Pro His Glu Lys Gly Ile Asn Pro Asn Tyr Leu Gln
325 330 335
act tgg aag caa gta tta gaa gaa ata caa gac ctt gag aac gaa gaa
1056
Thr Trp Lys Gln Val Leu Glu Glu Ile Gln Asp Leu Glu Asn Glu Glu
340 345 350
agg acc ccc aag acc aag aat atg aaa aaa aca agc caa ttg aaa tgg
1104
Arg Thr Pro Lys Thr Lys Asn Met Lys Lys Thr Ser Gln Leu Lys Trp
355 360 365
gca cta ggt gaa aat atg gca cca gag aaa gtg gat ttt gag gat tgt
1152
Ala Leu Gly Glu Asn Met Ala Pro Glu Lys Val Asp Phe Glu Asp Cys
370 375 380
aaa gac atc aat gat tta aaa caa tat gac agt gat gag cca gaa aca
1200
Lys Asp Ile Asn Asp Leu Lys Gln Tyr Asp Ser Asp Glu Pro Glu Thr
385 390 395 400
agg tct ctt gca agt tgg att caa agt gag ttc aac aaa gct tgt gag
1248
Arg Ser Leu Ala Ser Trp Ile Gln Ser Glu Phe Asn Lys Ala Cys Glu
405 410 415
ctg aca gat tca agc tgg ata gag ctc gat gaa att ggg gag gat gtc
1296
Leu Thr Asp Ser Ser Trp Ile Glu Leu Asp Glu Ile Gly Glu Asp Val
420 425 430
gcc cca ata gaa tac att gcg agc atg agg aga aat tat ttt act gct
1344
Ala Pro Ile Glu Tyr Ile Ala Ser Met Arg Arg Asn Tyr Phe Thr Ala
435 440 445
gag att tcc cat tgt aga gca aca gaa tat ata atg aaa gga gtg tac
1392
Glu Ile Ser His Cys Arg Ala Thr Glu Tyr Ile Met Lys Gly Val Tyr
450 455 460
atc aac act gct cta ctc aat gca tcc tgt gct gcg atg gat gaa ttt
1440
Ile Asn Thr Ala Leu Leu Asn Ala Ser Cys Ala Ala Met Asp Glu Phe
465 470 475 480
caa tta att ccg atg ata agt aaa tgc agg acc aaa gaa ggg aga agg
1488
Gln Leu Ile Pro Met Ile Ser Lys Cys Arg Thr Lys Glu Gly Arg Arg
485 490 495
aaa aca aat tta tat gga ttc ata ata aag gga agg tcc cat tta aga
1536
Lys Thr Asn Leu Tyr Gly Phe Ile Ile Lys Gly Arg Ser His Leu Arg
500 505 510
aat gat act gac gtg gtg aac ttt gta agt atg gaa ttt tct ctc act
1584
Asn Asp Thr Asp Val Val Asn Phe Val Ser Met Glu Phe Ser Leu Thr
515 520 525
gat cca aga ttt gag cca cac aaa tgg gaa aaa tac tgc gtt cta gaa
1632
Asp Pro Arg Phe Glu Pro His Lys Trp Glu Lys Tyr Cys Val Leu Glu
530 535 540
att gga gac atg ctt cta aga act gct gta ggt caa gtg tca aga ccc
1680
Ile Gly Asp Met Leu Leu Arg Thr Ala Val Gly Gln Val Ser Arg Pro
545 550 555 560
atg ttt ttg tat gta agg aca aat gga acc tct aaa att aaa atg aaa
1728
Met Phe Leu Tyr Val Arg Thr Asn Gly Thr Ser Lys Ile Lys Met Lys
565 570 575
tgg gga atg gaa atg agg cgc tgc ctc ctt cag tct ctg caa cag att
1776
Trp Gly Met Glu Met Arg Arg Cys Leu Leu Gln Ser Leu Gln Gln Ile
580 585 590
gaa agc atg atc gaa gct gag tcc tca gtc aaa gaa aag gac atg acc
1824
Glu Ser Met Ile Glu Ala Glu Ser Ser Val Lys Glu Lys Asp Met Thr
595 600 605
aaa gaa ttt ttt gag aac aaa tca gag aca tgg cct ata gga gag tcc
1872
Lys Glu Phe Phe Glu Asn Lys Ser Glu Thr Trp Pro Ile Gly Glu Ser
610 615 620
ccc aaa gga gtg gaa gag ggc tca atc ggg aag gtt tgc agg acc tta
1920
Pro Lys Gly Val Glu Glu Gly Ser Ile Gly Lys Val Cys Arg Thr Leu
625 630 635 640
tta gca aaa tct gtg ttt aac agt tta tat gca tct cca caa ctg gaa
1968
Leu Ala Lys Ser Val Phe Asn Ser Leu Tyr Ala Ser Pro Gln Leu Glu
645 650 655
ggg ttt tca gct gaa tct agg aaa tta ctt ctc att gtt cag gct ctt
2016
Gly Phe Ser Ala Glu Ser Arg Lys Leu Leu Leu Ile Val Gln Ala Leu
660 665 670
agg gat gac ctg gaa cct gga acc ttt gat att ggg ggg tta tat gaa
2064
Arg Asp Asp Leu Glu Pro Gly Thr Phe Asp Ile Gly Gly Leu Tyr Glu
675 680 685
tca att gag gag tgc ctg att aat gat ccc tgg gtt ttg ctt aat gca
2112
Ser Ile Glu Glu Cys Leu Ile Asn Asp Pro Trp Val Leu Leu Asn Ala
690 695 700
tct tgg ttc aac tcc ttc ctt aca cat gca ctg aag tag
2151
Ser Trp Phe Asn Ser Phe Leu Thr His Ala Leu Lys
705 710 715
<210> 22
<211> 716
<212> PRT
<213> Вирус гриппа
<400> 22
Met Glu Asp Phe Val Arg Gln Cys Phe Asn Pro Met Ile Val Glu Leu
1 5 10 15
Ala Glu Lys Ala Met Lys Glu Tyr Gly Glu Asn Pro Lys Ile Glu Thr
20 25 30
Asn Lys Phe Ala Ala Ile Cys Thr His Leu Glu Val Cys Phe Met Tyr
35 40 45
Ser Asp Phe His Phe Ile Asn Glu Leu Gly Glu Ser Val Val Ile Glu
50 55 60
Ser Gly Asp Pro Asn Ala Leu Leu Lys His Arg Phe Glu Ile Ile Glu
65 70 75 80
Gly Arg Asp Arg Thr Met Ala Trp Thr Val Val Asn Ser Ile Cys Asn
85 90 95
Thr Thr Arg Ala Glu Lys Pro Lys Phe Leu Pro Asp Leu Tyr Asp Tyr
100 105 110
Lys Glu Asn Arg Phe Val Glu Ile Gly Val Thr Arg Arg Glu Val His
115 120 125
Ile Tyr Tyr Leu Glu Lys Ala Asn Lys Ile Lys Ser Glu Lys Thr His
130 135 140
Ile His Ile Phe Ser Phe Thr Gly Glu Glu Met Ala Thr Lys Ala Asp
145 150 155 160
Tyr Thr Leu Asp Glu Glu Ser Arg Ala Arg Ile Lys Thr Arg Leu Phe
165 170 175
Thr Ile Arg Gln Glu Met Ala Ser Arg Gly Leu Trp Asp Ser Phe Arg
180 185 190
Gln Ser Glu Arg Gly Glu Glu Thr Ile Glu Glu Arg Phe Glu Ile Thr
195 200 205
Gly Thr Met Arg Lys Leu Ala Asn Tyr Ser Leu Pro Pro Asn Phe Ser
210 215 220
Ser Leu Glu Asn Phe Arg Val Tyr Val Asp Gly Phe Glu Pro Asn Gly
225 230 235 240
Cys Ile Glu Ser Lys Leu Ser Gln Met Ser Lys Glu Val Asn Ala Arg
245 250 255
Ile Glu Pro Phe Ser Lys Thr Thr Pro Arg Pro Leu Lys Met Pro Gly
260 265 270
Gly Pro Pro Cys His Gln Arg Ser Lys Phe Leu Leu Met Asp Ala Leu
275 280 285
Lys Leu Ser Ile Glu Asp Pro Ser His Glu Gly Glu Gly Ile Pro Leu
290 295 300
Tyr Asp Ala Ile Lys Cys Met Lys Thr Phe Phe Gly Trp Lys Glu Pro
305 310 315 320
Ser Ile Val Lys Pro His Glu Lys Gly Ile Asn Pro Asn Tyr Leu Gln
325 330 335
Thr Trp Lys Gln Val Leu Glu Glu Ile Gln Asp Leu Glu Asn Glu Glu
340 345 350
Arg Thr Pro Lys Thr Lys Asn Met Lys Lys Thr Ser Gln Leu Lys Trp
355 360 365
Ala Leu Gly Glu Asn Met Ala Pro Glu Lys Val Asp Phe Glu Asp Cys
370 375 380
Lys Asp Ile Asn Asp Leu Lys Gln Tyr Asp Ser Asp Glu Pro Glu Thr
385 390 395 400
Arg Ser Leu Ala Ser Trp Ile Gln Ser Glu Phe Asn Lys Ala Cys Glu
405 410 415
Leu Thr Asp Ser Ser Trp Ile Glu Leu Asp Glu Ile Gly Glu Asp Val
420 425 430
Ala Pro Ile Glu Tyr Ile Ala Ser Met Arg Arg Asn Tyr Phe Thr Ala
435 440 445
Glu Ile Ser His Cys Arg Ala Thr Glu Tyr Ile Met Lys Gly Val Tyr
450 455 460
Ile Asn Thr Ala Leu Leu Asn Ala Ser Cys Ala Ala Met Asp Glu Phe
465 470 475 480
Gln Leu Ile Pro Met Ile Ser Lys Cys Arg Thr Lys Glu Gly Arg Arg
485 490 495
Lys Thr Asn Leu Tyr Gly Phe Ile Ile Lys Gly Arg Ser His Leu Arg
500 505 510
Asn Asp Thr Asp Val Val Asn Phe Val Ser Met Glu Phe Ser Leu Thr
515 520 525
Asp Pro Arg Phe Glu Pro His Lys Trp Glu Lys Tyr Cys Val Leu Glu
530 535 540
Ile Gly Asp Met Leu Leu Arg Thr Ala Val Gly Gln Val Ser Arg Pro
545 550 555 560
Met Phe Leu Tyr Val Arg Thr Asn Gly Thr Ser Lys Ile Lys Met Lys
565 570 575
Trp Gly Met Glu Met Arg Arg Cys Leu Leu Gln Ser Leu Gln Gln Ile
580 585 590
Glu Ser Met Ile Glu Ala Glu Ser Ser Val Lys Glu Lys Asp Met Thr
595 600 605
Lys Glu Phe Phe Glu Asn Lys Ser Glu Thr Trp Pro Ile Gly Glu Ser
610 615 620
Pro Lys Gly Val Glu Glu Gly Ser Ile Gly Lys Val Cys Arg Thr Leu
625 630 635 640
Leu Ala Lys Ser Val Phe Asn Ser Leu Tyr Ala Ser Pro Gln Leu Glu
645 650 655
Gly Phe Ser Ala Glu Ser Arg Lys Leu Leu Leu Ile Val Gln Ala Leu
660 665 670
Arg Asp Asp Leu Glu Pro Gly Thr Phe Asp Ile Gly Gly Leu Tyr Glu
675 680 685
Ser Ile Glu Glu Cys Leu Ile Asn Asp Pro Trp Val Leu Leu Asn Ala
690 695 700
Ser Trp Phe Asn Ser Phe Leu Thr His Ala Leu Lys
705 710 715
<210> 23
<211> 838
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(657)
<400> 23
atg gat tcc aac act gtg tca agc ttt cag gta gac tgt ttt ctt tgg
48
Met Asp Ser Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
cat gtc cgc aaa cga ttc gca gac caa gaa ctg ggt gat gcc cca ttc
96
His Val Arg Lys Arg Phe Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
ctt gac cgg ctt cgc cga gac cag aag tcc cta agg gga aga ggt agc
144
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
act ctt ggt ctg gac atc gaa aca gcc act cat gca gga aag cag ata
192
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr His Ala Gly Lys Gln Ile
50 55 60
gtg gag cag att ctg gaa aag gaa tca gat gag gca ctt aaa atg acc
240
Val Glu Gln Ile Leu Glu Lys Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
att gcc tct gtt cct act tca cgc tac tta act gac atg act ctt gat
288
Ile Ala Ser Val Pro Thr Ser Arg Tyr Leu Thr Asp Met Thr Leu Asp
85 90 95
gag atg tca aga gac tgg ttc atg ctc atg ccc aag caa aaa gta aca
336
Glu Met Ser Arg Asp Trp Phe Met Leu Met Pro Lys Gln Lys Val Thr
100 105 110
ggc tcc cta tgt ata aga atg gac cag gca atc atg gat aag aac atc
384
Gly Ser Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
ata ctt aaa gca aac ttt agt gtg att ttc gaa ggg ctg gaa aca cta
432
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Glu Gly Leu Glu Thr Leu
130 135 140
ata cta ctt aga gcc ttc acc gaa gaa gga gca gtc gtt ggc gaa att
480
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Val Val Gly Glu Ile
145 150 155 160
tca cca tta cct tct ctt cca gga cat act aat gag gat gtc aaa aat
528
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Asn Glu Asp Val Lys Asn
165 170 175
gca att ggg gtc ctc atc gga gga ctt aaa tgg aat gat aat acg gtt
576
Ala Ile Gly Val Leu Ile Gly Gly Leu Lys Trp Asn Asp Asn Thr Val
180 185 190
aga atc tct gaa act cta cag aga ttc gct tgg aga agc agt cat gag
624
Arg Ile Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser His Glu
195 200 205
aat ggg aga cct tca ttc cct tca aag cag aaa tgaaaaatgg agagaacaat
677
Asn Gly Arg Pro Ser Phe Pro Ser Lys Gln Lys
210 215
taagccagaa atttgaagaa ataagatggt tgattgaaga agtgcgacat agattgaaaa
737
atacagaaaa tagttttgaa caaataacat ttatgcaagc cttacaacta ttgcttgaag
797
tagaacaaga gataagaact ttctcgtttc agcttattta a
838
<210> 24
<211> 219
<212> PRT
<213> Вирус гриппа
<400> 24
Met Asp Ser Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
His Val Arg Lys Arg Phe Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr His Ala Gly Lys Gln Ile
50 55 60
Val Glu Gln Ile Leu Glu Lys Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
Ile Ala Ser Val Pro Thr Ser Arg Tyr Leu Thr Asp Met Thr Leu Asp
85 90 95
Glu Met Ser Arg Asp Trp Phe Met Leu Met Pro Lys Gln Lys Val Thr
100 105 110
Gly Ser Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Glu Gly Leu Glu Thr Leu
130 135 140
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Val Val Gly Glu Ile
145 150 155 160
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Asn Glu Asp Val Lys Asn
165 170 175
Ala Ile Gly Val Leu Ile Gly Gly Leu Lys Trp Asn Asp Asn Thr Val
180 185 190
Arg Ile Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser His Glu
195 200 205
Asn Gly Arg Pro Ser Phe Pro Ser Lys Gln Lys
210 215
<210> 25
<211> 1497
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1497)
<400> 25
atg gcg tct caa ggc acc aaa cga tcc tat gaa cag atg gaa act gat
48
Met Ala Ser Gln Gly Thr Lys Arg Ser Tyr Glu Gln Met Glu Thr Asp
1 5 10 15
ggg gaa cgc cag aat gca act gaa atc aga gca tct gtc gga agg atg
96
Gly Glu Arg Gln Asn Ala Thr Glu Ile Arg Ala Ser Val Gly Arg Met
20 25 30
gtg gga gga atc ggc cgg ttt tat gtt cag atg tgt act gag ctt aaa
144
Val Gly Gly Ile Gly Arg Phe Tyr Val Gln Met Cys Thr Glu Leu Lys
35 40 45
cta aac gac cat gaa ggg cgg ctg att cag aac agc ata aca ata gaa
192
Leu Asn Asp His Glu Gly Arg Leu Ile Gln Asn Ser Ile Thr Ile Glu
50 55 60
agg atg gta ctt tcg gca ttc gac gaa aga aga aac aag tat ctc gag
240
Arg Met Val Leu Ser Ala Phe Asp Glu Arg Arg Asn Lys Tyr Leu Glu
65 70 75 80
gag cat ccc agt gct ggg aaa gac cct aag aaa acg gga ggc ccg ata
288
Glu His Pro Ser Ala Gly Lys Asp Pro Lys Lys Thr Gly Gly Pro Ile
85 90 95
tac aga agg aaa gat ggg aaa tgg atg agg gaa ctc atc ctc cat gat
336
Tyr Arg Arg Lys Asp Gly Lys Trp Met Arg Glu Leu Ile Leu His Asp
100 105 110
aaa gaa gaa atc atg aga atc tgg cgt cag gcc aac aat ggt gaa gac
384
Lys Glu Glu Ile Met Arg Ile Trp Arg Gln Ala Asn Asn Gly Glu Asp
115 120 125
gct act gct ggt ctt act cat atg atg atc tgg cac tcc aat ctc aat
432
Ala Thr Ala Gly Leu Thr His Met Met Ile Trp His Ser Asn Leu Asn
130 135 140
gac acc aca tac caa aga aca agg gct ctt gtt cgg act ggg atg gat
480
Asp Thr Thr Tyr Gln Arg Thr Arg Ala Leu Val Arg Thr Gly Met Asp
145 150 155 160
ccc aga atg tgc tct ctg atg caa ggc tca acc ctc cca cgg aga tct
528
Pro Arg Met Cys Ser Leu Met Gln Gly Ser Thr Leu Pro Arg Arg Ser
165 170 175
gga gcc gct ggt gct gca gta aaa ggt gtt gga aca atg gta atg gaa
576
Gly Ala Ala Gly Ala Ala Val Lys Gly Val Gly Thr Met Val Met Glu
180 185 190
ctc atc aga atg atc aaa cgc gga ata aat gat cgg aat ttc tgg aga
624
Leu Ile Arg Met Ile Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg
195 200 205
ggt gaa aat ggt cga aga acc aga att gct tat gaa aga atg tgc aat
672
Gly Glu Asn Gly Arg Arg Thr Arg Ile Ala Tyr Glu Arg Met Cys Asn
210 215 220
atc ctc aaa ggg aaa ttt cag aca gca gca caa cgg gct atg atg gac
720
Ile Leu Lys Gly Lys Phe Gln Thr Ala Ala Gln Arg Ala Met Met Asp
225 230 235 240
cag gtg agg gaa ggc cgc aat cct gga aac gct gag att gag gat ctc
768
Gln Val Arg Glu Gly Arg Asn Pro Gly Asn Ala Glu Ile Glu Asp Leu
245 250 255
att ttc ttg gca cga tca gca ctt att ttg aga gga tca gta gcc cat
816
Ile Phe Leu Ala Arg Ser Ala Leu Ile Leu Arg Gly Ser Val Ala His
260 265 270
aaa tca tgc cta cct gcc tgt gtt tat ggc ctt gca gta acc agt ggg
864
Lys Ser Cys Leu Pro Ala Cys Val Tyr Gly Leu Ala Val Thr Ser Gly
275 280 285
tat gac ttt gag aag gaa gga tac tct ctg gtt gga att gat cct ttc
912
Tyr Asp Phe Glu Lys Glu Gly Tyr Ser Leu Val Gly Ile Asp Pro Phe
290 295 300
aaa cta ctc cag aac agt caa att ttc agt cta atc aga cca aaa gaa
960
Lys Leu Leu Gln Asn Ser Gln Ile Phe Ser Leu Ile Arg Pro Lys Glu
305 310 315 320
aac cca gca cac aag agc cag ttg gtg tgg atg gca tgc cat tct gca
1008
Asn Pro Ala His Lys Ser Gln Leu Val Trp Met Ala Cys His Ser Ala
325 330 335
gca ttt gag gac ctg aga gtt tta aat ttc att aga gga acc aaa gta
1056
Ala Phe Glu Asp Leu Arg Val Leu Asn Phe Ile Arg Gly Thr Lys Val
340 345 350
atc cca aga gga cag tta aca acc aga gga gtt caa att gct tca aat
1104
Ile Pro Arg Gly Gln Leu Thr Thr Arg Gly Val Gln Ile Ala Ser Asn
355 360 365
gaa aac atg gag aca ata gat tct agc aca ctt gaa ctg aga agc aaa
1152
Glu Asn Met Glu Thr Ile Asp Ser Ser Thr Leu Glu Leu Arg Ser Lys
370 375 380
tat tgg gca ata agg acc aga agc gga gga aac acc agt caa cag aga
1200
Tyr Trp Ala Ile Arg Thr Arg Ser Gly Gly Asn Thr Ser Gln Gln Arg
385 390 395 400
gca tct gca gga cag ata agt gtg caa cct act ttc tca gta cag aga
1248
Ala Ser Ala Gly Gln Ile Ser Val Gln Pro Thr Phe Ser Val Gln Arg
405 410 415
aat ctt ccc ttt gag aga gca acc att atg gct gca ttc act ggt aac
1296
Asn Leu Pro Phe Glu Arg Ala Thr Ile Met Ala Ala Phe Thr Gly Asn
420 425 430
act gaa ggg agg act tcc gac atg aga acg gaa atc ata agg atg atg
1344
Thr Glu Gly Arg Thr Ser Asp Met Arg Thr Glu Ile Ile Arg Met Met
435 440 445
gaa aat gcc aaa tca gaa gat gtg tct ttc cag ggg cgg gga gtc ttc
1392
Glu Asn Ala Lys Ser Glu Asp Val Ser Phe Gln Gly Arg Gly Val Phe
450 455 460
gag ctc tcg gac gaa aag gca acg aac ccg atc gtg cct tcc ttt gac
1440
Glu Leu Ser Asp Glu Lys Ala Thr Asn Pro Ile Val Pro Ser Phe Asp
465 470 475 480
atg agc aat gaa ggg tct tat ttc ttc gga gac aat gct gag gag ttt
1488
Met Ser Asn Glu Gly Ser Tyr Phe Phe Gly Asp Asn Ala Glu Glu Phe
485 490 495
gac agt taa
1497
Asp Ser
<210> 26
<211> 498
<212> PRT
<213> Вирус гриппа
<400> 26
Met Ala Ser Gln Gly Thr Lys Arg Ser Tyr Glu Gln Met Glu Thr Asp
1 5 10 15
Gly Glu Arg Gln Asn Ala Thr Glu Ile Arg Ala Ser Val Gly Arg Met
20 25 30
Val Gly Gly Ile Gly Arg Phe Tyr Val Gln Met Cys Thr Glu Leu Lys
35 40 45
Leu Asn Asp His Glu Gly Arg Leu Ile Gln Asn Ser Ile Thr Ile Glu
50 55 60
Arg Met Val Leu Ser Ala Phe Asp Glu Arg Arg Asn Lys Tyr Leu Glu
65 70 75 80
Glu His Pro Ser Ala Gly Lys Asp Pro Lys Lys Thr Gly Gly Pro Ile
85 90 95
Tyr Arg Arg Lys Asp Gly Lys Trp Met Arg Glu Leu Ile Leu His Asp
100 105 110
Lys Glu Glu Ile Met Arg Ile Trp Arg Gln Ala Asn Asn Gly Glu Asp
115 120 125
Ala Thr Ala Gly Leu Thr His Met Met Ile Trp His Ser Asn Leu Asn
130 135 140
Asp Thr Thr Tyr Gln Arg Thr Arg Ala Leu Val Arg Thr Gly Met Asp
145 150 155 160
Pro Arg Met Cys Ser Leu Met Gln Gly Ser Thr Leu Pro Arg Arg Ser
165 170 175
Gly Ala Ala Gly Ala Ala Val Lys Gly Val Gly Thr Met Val Met Glu
180 185 190
Leu Ile Arg Met Ile Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg
195 200 205
Gly Glu Asn Gly Arg Arg Thr Arg Ile Ala Tyr Glu Arg Met Cys Asn
210 215 220
Ile Leu Lys Gly Lys Phe Gln Thr Ala Ala Gln Arg Ala Met Met Asp
225 230 235 240
Gln Val Arg Glu Gly Arg Asn Pro Gly Asn Ala Glu Ile Glu Asp Leu
245 250 255
Ile Phe Leu Ala Arg Ser Ala Leu Ile Leu Arg Gly Ser Val Ala His
260 265 270
Lys Ser Cys Leu Pro Ala Cys Val Tyr Gly Leu Ala Val Thr Ser Gly
275 280 285
Tyr Asp Phe Glu Lys Glu Gly Tyr Ser Leu Val Gly Ile Asp Pro Phe
290 295 300
Lys Leu Leu Gln Asn Ser Gln Ile Phe Ser Leu Ile Arg Pro Lys Glu
305 310 315 320
Asn Pro Ala His Lys Ser Gln Leu Val Trp Met Ala Cys His Ser Ala
325 330 335
Ala Phe Glu Asp Leu Arg Val Leu Asn Phe Ile Arg Gly Thr Lys Val
340 345 350
Ile Pro Arg Gly Gln Leu Thr Thr Arg Gly Val Gln Ile Ala Ser Asn
355 360 365
Glu Asn Met Glu Thr Ile Asp Ser Ser Thr Leu Glu Leu Arg Ser Lys
370 375 380
Tyr Trp Ala Ile Arg Thr Arg Ser Gly Gly Asn Thr Ser Gln Gln Arg
385 390 395 400
Ala Ser Ala Gly Gln Ile Ser Val Gln Pro Thr Phe Ser Val Gln Arg
405 410 415
Asn Leu Pro Phe Glu Arg Ala Thr Ile Met Ala Ala Phe Thr Gly Asn
420 425 430
Thr Glu Gly Arg Thr Ser Asp Met Arg Thr Glu Ile Ile Arg Met Met
435 440 445
Glu Asn Ala Lys Ser Glu Asp Val Ser Phe Gln Gly Arg Gly Val Phe
450 455 460
Glu Leu Ser Asp Glu Lys Ala Thr Asn Pro Ile Val Pro Ser Phe Asp
465 470 475 480
Met Ser Asn Glu Gly Ser Tyr Phe Phe Gly Asp Asn Ala Glu Glu Phe
485 490 495
Asp Ser
<210> 27
<211> 1410
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1410)
<400> 27
atg aat cca aat caa aag ata ata aca att gga ttt gca tca ttg ggg
48
Met Asn Pro Asn Gln Lys Ile Ile Thr Ile Gly Phe Ala Ser Leu Gly
1 5 10 15
ata tta atc att aat gtc att ctc cat gta gtc agc att ata gta aca
96
Ile Leu Ile Ile Asn Val Ile Leu His Val Val Ser Ile Ile Val Thr
20 25 30
gta ctg gtc ctc aat aac aat aga aca gat ctg aac tgc aaa ggg acg
144
Val Leu Val Leu Asn Asn Asn Arg Thr Asp Leu Asn Cys Lys Gly Thr
35 40 45
atc ata aga gag tac aat gaa aca gta aga gta gaa aaa att act caa
192
Ile Ile Arg Glu Tyr Asn Glu Thr Val Arg Val Glu Lys Ile Thr Gln
50 55 60
tgg tat aat acc agt aca att aag tac ata gag aga cct tca aat gaa
240
Trp Tyr Asn Thr Ser Thr Ile Lys Tyr Ile Glu Arg Pro Ser Asn Glu
65 70 75 80
tac tac atg aac aac act gaa cca ctt tgt gag gcc caa ggc ttt gca
288
Tyr Tyr Met Asn Asn Thr Glu Pro Leu Cys Glu Ala Gln Gly Phe Ala
85 90 95
cca ttt tcc aaa gat aat gga ata cga att ggg tcg aga ggc cat gtt
336
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Val
100 105 110
ttt gtg ata aga gaa cct ttt gta tca tgt tcg ccc tca gaa tgt aga
384
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ser Glu Cys Arg
115 120 125
acc ttt ttc ctc aca cag ggc tca tta ctc aat gac aaa cat tct aac
432
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
130 135 140
ggc aca gta aag gac cga agt ccg tat agg act ttg atg agt gtc aaa
480
Gly Thr Val Lys Asp Arg Ser Pro Tyr Arg Thr Leu Met Ser Val Lys
145 150 155 160
ata ggg caa tca cct aat gta tat caa gct agg ttt gaa tcg gtg gca
528
Ile Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ser Val Ala
165 170 175
tgg tca gca aca gca tgc cat gat gga aaa aaa tgg atg aca gtt gga
576
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
180 185 190
gtc aca ggg ccc gac aat caa gca att gca gta gtg aac tat gga ggt
624
Val Thr Gly Pro Asp Asn Gln Ala Ile Ala Val Val Asn Tyr Gly Gly
195 200 205
gtt ccg gtt gat att att aat tca tgg gca ggg gat att tta aga acc
672
Val Pro Val Asp Ile Ile Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
210 215 220
caa gaa tca tca tgc acc tgc att aaa gga gac tgt tat tgg gta atg
720
Gln Glu Ser Ser Cys Thr Cys Ile Lys Gly Asp Cys Tyr Trp Val Met
225 230 235 240
act gat gga ccg gca aat agg caa gct aaa tat agg ata ttc aaa gca
768
Thr Asp Gly Pro Ala Asn Arg Gln Ala Lys Tyr Arg Ile Phe Lys Ala
245 250 255
aaa gat gga aga gta att gga cag act gat ata agt ttc aat ggg gga
816
Lys Asp Gly Arg Val Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
260 265 270
cac ata gag gag tgt tct tgt tac ccc aat gaa ggg aag gtg gaa tgc
864
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Glu Gly Lys Val Glu Cys
275 280 285
ata tgc agg gac aat tgg act gga aca aat aga cca att ctg gta ata
912
Ile Cys Arg Asp Asn Trp Thr Gly Thr Asn Arg Pro Ile Leu Val Ile
290 295 300
tct tct gat cta tcg tac aca gtt gga tat ttg tgt gct ggc att ccc
960
Ser Ser Asp Leu Ser Tyr Thr Val Gly Tyr Leu Cys Ala Gly Ile Pro
305 310 315 320
act gac act cct agg gga gag gat agt caa ttc aca ggc tca tgt aca
1008
Thr Asp Thr Pro Arg Gly Glu Asp Ser Gln Phe Thr Gly Ser Cys Thr
325 330 335
agt cct ttg gga aat aaa gga tac ggt gta aaa ggt ttc ggg ttt cga
1056
Ser Pro Leu Gly Asn Lys Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
340 345 350
caa gga act gac gta tgg gcc gga agg aca att agt agg act tca aga
1104
Gln Gly Thr Asp Val Trp Ala Gly Arg Thr Ile Ser Arg Thr Ser Arg
355 360 365
tca gga ttc gaa ata ata aaa atc agg aat ggt tgg aca cag aac agt
1152
Ser Gly Phe Glu Ile Ile Lys Ile Arg Asn Gly Trp Thr Gln Asn Ser
370 375 380
aaa gac caa atc agg agg caa gtg att atc gat gac cca aat tgg tca
1200
Lys Asp Gln Ile Arg Arg Gln Val Ile Ile Asp Asp Pro Asn Trp Ser
385 390 395 400
gga tat agc ggt tct ttc aca ttg ccg gtt gaa cta aca aaa aag gga
1248
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Thr Lys Lys Gly
405 410 415
tgt ttg gtc ccc tgt ttc tgg gtt gaa atg att aga ggt aaa cct gaa
1296
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
420 425 430
gaa aca aca ata tgg acc tct agc agc tcc att gtg atg tgt gga gta
1344
Glu Thr Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
435 440 445
gat cat aaa att gcc agt tgg tca tgg cac gat gga gct att ctt ccc
1392
Asp His Lys Ile Ala Ser Trp Ser Trp His Asp Gly Ala Ile Leu Pro
450 455 460
ttt gac atc gat aag atg
1410
Phe Asp Ile Asp Lys Met
465 470
<210> 28
<211> 470
<212> PRT
<213> Вирус гриппа
<400> 28
Met Asn Pro Asn Gln Lys Ile Ile Thr Ile Gly Phe Ala Ser Leu Gly
1 5 10 15
Ile Leu Ile Ile Asn Val Ile Leu His Val Val Ser Ile Ile Val Thr
20 25 30
Val Leu Val Leu Asn Asn Asn Arg Thr Asp Leu Asn Cys Lys Gly Thr
35 40 45
Ile Ile Arg Glu Tyr Asn Glu Thr Val Arg Val Glu Lys Ile Thr Gln
50 55 60
Trp Tyr Asn Thr Ser Thr Ile Lys Tyr Ile Glu Arg Pro Ser Asn Glu
65 70 75 80
Tyr Tyr Met Asn Asn Thr Glu Pro Leu Cys Glu Ala Gln Gly Phe Ala
85 90 95
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Val
100 105 110
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ser Glu Cys Arg
115 120 125
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
130 135 140
Gly Thr Val Lys Asp Arg Ser Pro Tyr Arg Thr Leu Met Ser Val Lys
145 150 155 160
Ile Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ser Val Ala
165 170 175
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
180 185 190
Val Thr Gly Pro Asp Asn Gln Ala Ile Ala Val Val Asn Tyr Gly Gly
195 200 205
Val Pro Val Asp Ile Ile Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
210 215 220
Gln Glu Ser Ser Cys Thr Cys Ile Lys Gly Asp Cys Tyr Trp Val Met
225 230 235 240
Thr Asp Gly Pro Ala Asn Arg Gln Ala Lys Tyr Arg Ile Phe Lys Ala
245 250 255
Lys Asp Gly Arg Val Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
260 265 270
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Glu Gly Lys Val Glu Cys
275 280 285
Ile Cys Arg Asp Asn Trp Thr Gly Thr Asn Arg Pro Ile Leu Val Ile
290 295 300
Ser Ser Asp Leu Ser Tyr Thr Val Gly Tyr Leu Cys Ala Gly Ile Pro
305 310 315 320
Thr Asp Thr Pro Arg Gly Glu Asp Ser Gln Phe Thr Gly Ser Cys Thr
325 330 335
Ser Pro Leu Gly Asn Lys Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
340 345 350
Gln Gly Thr Asp Val Trp Ala Gly Arg Thr Ile Ser Arg Thr Ser Arg
355 360 365
Ser Gly Phe Glu Ile Ile Lys Ile Arg Asn Gly Trp Thr Gln Asn Ser
370 375 380
Lys Asp Gln Ile Arg Arg Gln Val Ile Ile Asp Asp Pro Asn Trp Ser
385 390 395 400
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Thr Lys Lys Gly
405 410 415
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
420 425 430
Glu Thr Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
435 440 445
Asp His Lys Ile Ala Ser Trp Ser Trp His Asp Gly Ala Ile Leu Pro
450 455 460
Phe Asp Ile Asp Lys Met
465 470
<210> 29
<211> 982
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(756)
<400> 29
atg agt ctt cta acc gag gtc gaa acg tac gtt ctc tct atc gta cca
48
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Val Pro
1 5 10 15
tca ggc ccc ctc aaa gcc gag atc gcg cag aga ctt gaa gat gtc ttt
96
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
gca ggg aag aac acc gat ctt gag gca ctc atg gaa tgg cta aag aca
144
Ala Gly Lys Asn Thr Asp Leu Glu Ala Leu Met Glu Trp Leu Lys Thr
35 40 45
aga cca atc ctg tca cct ctg act aaa ggg att tta gga ttt gta ttc
192
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
acg ctc acc gtg ccc agt gag cga gga ctg cag cgt aga cgc ttt gtc
240
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
caa aat gcc ctt agt gga aac gga gat cca aac aac atg gac aga gca
288
Gln Asn Ala Leu Ser Gly Asn Gly Asp Pro Asn Asn Met Asp Arg Ala
85 90 95
gta aaa ctg tac agg aag ctt aaa aga gaa ata aca ttc cat ggg gca
336
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
aaa gag gtg gca ctc agc tat tcc act ggt gca cta gcc agc tgc atg
384
Lys Glu Val Ala Leu Ser Tyr Ser Thr Gly Ala Leu Ala Ser Cys Met
115 120 125
gga ctc ata tac aac aga atg gga act gtt aca acc gaa gtg gca ttt
432
Gly Leu Ile Tyr Asn Arg Met Gly Thr Val Thr Thr Glu Val Ala Phe
130 135 140
ggc ctg gta tgc gcc aca tgt gaa cag att gct gat tcc cag cat cga
480
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
tct cac agg cag atg gtg aca aca acc aac cca tta atc aga cat gaa
528
Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
aac aga atg gta tta gcc agt acc acg gct aaa gcc atg gaa cag atg
576
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
gca gga tcg agt gag cag gca gca gag gcc atg gag gtt gct agt agg
624
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Arg
195 200 205
gct agg cag atg gta cag gca atg aga acc att ggg acc cac cct agc
672
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
tcc agt gcc ggt ttg aaa gat gat ctc ctt gaa aat tta cag gcc tac
720
Ser Ser Ala Gly Leu Lys Asp Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
cag aaa cgg atg gga gtg caa atg cag cga ttc aag tgatcctctc
766
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
gttattgcag caagtatcat tgggatcttg cacttgatat tgtggattct tgatcgtctt
826
ttcttcaaat tcatttatcg tcgccttaaa tacgggttga aaagagggcc ttctacggaa
886
ggagtacctg agtctatgag ggaagaatat cggcaggaac agcagaatgc tgtggatgtt
946
gacgatggtc attttgtcaa catagagctg gagtaa
982
<210> 30
<211> 252
<212> PRT
<213> Вирус гриппа
<400> 30
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Val Pro
1 5 10 15
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
Ala Gly Lys Asn Thr Asp Leu Glu Ala Leu Met Glu Trp Leu Lys Thr
35 40 45
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
Gln Asn Ala Leu Ser Gly Asn Gly Asp Pro Asn Asn Met Asp Arg Ala
85 90 95
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
Lys Glu Val Ala Leu Ser Tyr Ser Thr Gly Ala Leu Ala Ser Cys Met
115 120 125
Gly Leu Ile Tyr Asn Arg Met Gly Thr Val Thr Thr Glu Val Ala Phe
130 135 140
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Arg
195 200 205
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
Ser Ser Ala Gly Leu Lys Asp Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
<210> 31
<211> 1698
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1698)
<400> 31
atg aag aca acc att att ttg ata cta ctg acc cat tgg gcc tac agt
48
Met Lys Thr Thr Ile Ile Leu Ile Leu Leu Thr His Trp Ala Tyr Ser
1 5 10 15
caa aac cca atc agt gac aac aac aca gcc aca ctg tgt ctg gga cac
96
Gln Asn Pro Ile Ser Asp Asn Asn Thr Ala Thr Leu Cys Leu Gly His
20 25 30
cat gca gta gca aat gga aca ttg gta aaa aca ata agt gat gat caa
144
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Ile Ser Asp Asp Gln
35 40 45
att gag gtg aca aat gct aca gaa tta gtt cag agc att tca atg ggg
192
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
50 55 60
aaa ata tgc aac aaa tca tat aga att cta gat gga aga aat tgc aca
240
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
65 70 75 80
tta ata gat gca atg cta gga gac ccc cac tgt gac gcc ttt cag tat
288
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
85 90 95
gag agt tgg gac ctc ttt ata gaa aga agc agc gct ttc agc aat tgc
336
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Ser Ala Phe Ser Asn Cys
100 105 110
tac cca tat gac atc cct gac tat gca tcg ctc cga tcc att gta gca
384
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Ser Leu Arg Ser Ile Val Ala
115 120 125
tcc tca gga aca ttg gaa ttc aca gca gag gga ttc aca tgg aca ggt
432
Ser Ser Gly Thr Leu Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
130 135 140
gtc act caa aac gga aga agt gga gcc tgc aaa agg gga tca gcc gat
480
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
145 150 155 160
agt ttc ttt agc cga ctg aat tgg cta aca aaa tct gga agc tct tac
528
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
165 170 175
ccc aca ttg aat gtg aca atg cct aac aat aaa aat ttc gac aag cta
576
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
180 185 190
tac atc tgg ggg att cat cac ccg agc tca aat caa gag cag aca aaa
624
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
195 200 205
ttg tac atc caa gaa tca gga cga gta aca gtc tca aca aaa aga agt
672
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
210 215 220
caa caa aca ata atc cct aac atc gga tct aga ccg ttg gtc aga ggt
720
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
225 230 235 240
caa tca ggc agg ata agc ata tac tgg acc att gta aaa cct gga gat
768
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
245 250 255
atc cta atg ata aac agt aat ggc aac tta gtt gca ccg cgg gga tat
816
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
260 265 270
ttt aaa ttg aaa aca ggg aaa agc tct gta atg aga tca gat gta ccc
864
Phe Lys Leu Lys Thr Gly Lys Ser Ser Val Met Arg Ser Asp Val Pro
275 280 285
ata gac att tgt gtg tct gaa tgt att aca cca aat gga agc atc tcc
912
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
290 295 300
aac gac aag cca ttc caa aat gtg aac aaa gtt aca tat gga aaa tgc
960
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
305 310 315 320
ccc aag tat atc agg caa aac act tta aag ctg gcc act ggg atg agg
1008
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
325 330 335
aat gta cca gaa aag caa acc aga gga atc ttt gga gca ata gcg gga
1056
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
340 345 350
ttc atc gaa aac ggc tgg gaa gga atg gtt gat ggg tgg tat ggg ttc
1104
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
355 360 365
cga tat caa aac tct gaa gga aca ggg caa gct gca gat cta aag agc
1152
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
370 375 380
act caa gca gcc atc gac cag att aat gga aag tta aac aga gtg att
1200
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
385 390 395 400
gaa aga acc aat gag aaa ttc cat caa ata gag aag gaa ttc tca gaa
1248
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
405 410 415
gta gaa gga aga att cag gac ttg gag aaa tat gta gaa gac acc aaa
1296
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
420 425 430
ata gac cta tgg tcc tac aat gca gaa ttg ctg gtg gct cta gaa aat
1344
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
435 440 445
caa cat aca att gac tta aca gat gca gaa atg aat aaa tta ttt gag
1392
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
450 455 460
aag act aga cgc cag tta aga gaa aac gca gaa gac atg gga ggt gga
1440
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
465 470 475 480
tgt ttc aag att tac cac aaa tgt gat aat gca tgc att gga tca ata
1488
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser Ile
485 490 495
aga act ggg aca tat gac cat tac ata tac aga gat gaa gca tta aac
1536
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Arg Asp Glu Ala Leu Asn
500 505 510
aac cga ttt cag atc aaa ggt gta gag ttg aaa tca ggc tac aaa gat
1584
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
515 520 525
tgg ata ctg tgg att tca ttc gcc ata tca tgc ttc tta att tgc gtt
1632
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
530 535 540
gtt cta ttg ggt ttc att atg tgg gct tgc caa aaa ggc aac atc aga
1680
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile Arg
545 550 555 560
tgc aac att tgc att tga
1698
Cys Asn Ile Cys Ile
565
<210> 32
<211> 565
<212> PRT
<213> Вирус гриппа
<400> 32
Met Lys Thr Thr Ile Ile Leu Ile Leu Leu Thr His Trp Ala Tyr Ser
1 5 10 15
Gln Asn Pro Ile Ser Asp Asn Asn Thr Ala Thr Leu Cys Leu Gly His
20 25 30
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Ile Ser Asp Asp Gln
35 40 45
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
50 55 60
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
65 70 75 80
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
85 90 95
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Ser Ala Phe Ser Asn Cys
100 105 110
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Ser Leu Arg Ser Ile Val Ala
115 120 125
Ser Ser Gly Thr Leu Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
130 135 140
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
145 150 155 160
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
165 170 175
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
180 185 190
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
195 200 205
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
210 215 220
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
225 230 235 240
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
245 250 255
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
260 265 270
Phe Lys Leu Lys Thr Gly Lys Ser Ser Val Met Arg Ser Asp Val Pro
275 280 285
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
290 295 300
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
305 310 315 320
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
325 330 335
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
340 345 350
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
355 360 365
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
385 390 395 400
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
405 410 415
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
420 425 430
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
435 440 445
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
450 455 460
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
465 470 475 480
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser Ile
485 490 495
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Arg Asp Glu Ala Leu Asn
500 505 510
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
515 520 525
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
530 535 540
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile Arg
545 550 555 560
Cys Asn Ile Cys Ile
565
<210> 33
<211> 549
<212> PRT
<213> Вирус гриппа
<400> 33
Gln Asn Pro Ile Ser Gly Asn Asn Thr Ala Thr Leu Cys Leu Gly His
1 5 10 15
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Met Ser Asp Asp Gln
20 25 30
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
35 40 45
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
50 55 60
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
65 70 75 80
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Asn Ala Phe Ser Asn Cys
85 90 95
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Ser Leu Arg Ser Ile Val Ala
100 105 110
Ser Ser Gly Thr Leu Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
115 120 125
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
130 135 140
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
145 150 155 160
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
165 170 175
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
180 185 190
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
195 200 205
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
210 215 220
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
225 230 235 240
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
245 250 255
Phe Lys Leu Lys Thr Gly Lys Ser Ser Val Met Arg Ser Asp Ala Pro
260 265 270
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
275 280 285
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
290 295 300
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
305 310 315 320
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
325 330 335
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
340 345 350
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
355 360 365
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
370 375 380
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
385 390 395 400
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
405 410 415
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
420 425 430
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
435 440 445
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
450 455 460
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser Ile
465 470 475 480
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Arg Asp Glu Ala Leu Asn
485 490 495
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
500 505 510
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
515 520 525
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Arg Gly Asn Ile Arg
530 535 540
Cys Asn Ile Cys Ile
545
<210> 34
<211> 549
<212> PRT
<213> Вирус гриппа
<400> 34
Gln Asn Pro Ile Ser Asp Asn Asn Thr Ala Thr Leu Cys Leu Gly His
1 5 10 15
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Ile Ser Asp Asp Gln
20 25 30
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
35 40 45
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
50 55 60
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
65 70 75 80
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Ser Ala Phe Ser Asn Cys
85 90 95
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Ser Leu Arg Ser Ile Val Ala
100 105 110
Ser Ser Gly Thr Leu Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
115 120 125
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
130 135 140
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
145 150 155 160
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
165 170 175
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
180 185 190
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
195 200 205
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
210 215 220
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
225 230 235 240
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
245 250 255
Phe Lys Leu Lys Thr Gly Lys Ser Ser Val Met Arg Ser Asp Val Pro
260 265 270
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
275 280 285
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
290 295 300
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
305 310 315 320
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
325 330 335
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
340 345 350
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
355 360 365
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
370 375 380
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
385 390 395 400
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
405 410 415
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
420 425 430
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
435 440 445
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
450 455 460
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser Ile
465 470 475 480
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Arg Asp Glu Ala Leu Asn
485 490 495
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
500 505 510
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
515 520 525
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile Arg
530 535 540
Cys Asn Ile Cys Ile
545
<210> 35
<211> 9
<212> ДНК
<213> Вирус гриппа
<400> 35
gagagttgg
9
<210> 36
<211> 9
<212> ДНК
<213> Вирус гриппа
<400> 36
ccgttggtc
9
<210> 37
<211> 9
<212> ДНК
<213> Вирус гриппа
<400> 37
caaaccaga
9
<210> 38
<211> 9
<212> ДНК
<213> Вирус гриппа
<400> 38
agaactggg
9
<210> 39
<211> 15
<212> ДНК
<213> Вирус гриппа
<400> 39
tatgagagtt gggac
15
<210> 40
<211> 15
<212> ДНК
<213> Вирус гриппа
<400> 40
agaccgttgg tcaga
15
<210> 41
<211> 15
<212> ДНК
<213> Вирус гриппа
<400> 41
aagcaaacca gagga
15
<210> 42
<211> 15
<212> ДНК
<213> Вирус гриппа
<400> 42
ataagaactg ggaca
15
<210> 43
<211> 9
<212> ДНК
<213> Вирус гриппа
<400> 43
acaatgagt
9
<210> 44
<211> 15
<212> ДНК
<213> Вирус гриппа
<400> 44
aaaacaatga gtgat
15
<210> 45
<211> 9
<212> ДНК
<213> Вирус гриппа
<400> 45
gatgtaccc
9
<210> 46
<211> 15
<212> ДНК
<213> Вирус гриппа
<400> 46
tcagatgtac ccata
15
<210> 47
<211> 2280
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2280)
<400> 47
atg gag aga ata aaa gaa ctg aga gat ctg atg tta caa tcc cgc acc
48
Met Glu Arg Ile Lys Glu Leu Arg Asp Leu Met Leu Gln Ser Arg Thr
1 5 10 15
cgc gag ata cta aca aaa act act gtg gac cac atg gcc ata atc aag
96
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
aaa tac aca tca gga aga caa gag aag aac cct gca ctt agg atg aaa
144
Lys Tyr Thr Ser Gly Arg Gln Glu Lys Asn Pro Ala Leu Arg Met Lys
35 40 45
tgg atg atg gca atg aaa tac cca att aca gca gat aag agg ata atg
192
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Met
50 55 60
gag atg att cct gag aga aat gaa cag gga caa acc ctt tgg agc aaa
240
Glu Met Ile Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
acg aac gat gct ggc tca gac cgc gta atg gta tca cct ctg gca gtg
288
Thr Asn Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
aca tgg tgg aat agg aat gga cca aca acg aac aca att cat tat cca
336
Thr Trp Trp Asn Arg Asn Gly Pro Thr Thr Asn Thr Ile His Tyr Pro
100 105 110
aaa gtc tac aaa act tat ttt gaa aag gtt gaa aga ttg aaa cac gga
384
Lys Val Tyr Lys Thr Tyr Phe Glu Lys Val Glu Arg Leu Lys His Gly
115 120 125
acc ttt ggc ccc gtt cat ttt agg aat caa gtc aag ata aga cga aga
432
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
gtt gat gta aac cct ggt cac gcg gac ctc agt gct aaa gaa gca caa
480
Val Asp Val Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
gat gtg atc atg gaa gtt gtt ttc cca aat gaa gtg gga gcc aga att
528
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Arg Ile
165 170 175
cta aca tca gaa tca caa cta aca ata acc aaa gag aaa aag gaa gaa
576
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
ctt cag gac tgc aaa att gct ccc ttg atg gta gca tac atg cta gaa
624
Leu Gln Asp Cys Lys Ile Ala Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
aga gag ttg gtc cga aaa aca agg ttc ctc cca gta gta ggc gga aca
672
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Val Gly Gly Thr
210 215 220
agc agt gta tac att gaa gtg ttg cat ctg act cag gga aca tgc tgg
720
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
gag caa atg tac acc cca gga gga aaa gtt aga aac gat gat att gat
768
Glu Gln Met Tyr Thr Pro Gly Gly Lys Val Arg Asn Asp Asp Ile Asp
245 250 255
caa agt tta att att gca gcc cgg aac ata gtg aga aga gca aca gta
816
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Thr Val
260 265 270
tca gca gat cca cta gca tcc cta ctg gaa atg tgc cac agt aca cag
864
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
att ggt gga aca agg atg gta gac atc ctt aag cag aac cca aca gag
912
Ile Gly Gly Thr Arg Met Val Asp Ile Leu Lys Gln Asn Pro Thr Glu
290 295 300
gaa caa gct gtg gat ata tgc aaa gca gca atg gga ttg aga att agc
960
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
tca tca ttc agc ttt ggt gga ttc acc ttc aaa agg aca agt gga tca
1008
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
tca gtc aag aga gaa gaa gaa atg ctt acg ggc aac ctt caa aca ttg
1056
Ser Val Lys Arg Glu Glu Glu Met Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
aaa ata aga gtg cat gag ggc tat gaa gaa ttc aca atg gtc gga aga
1104
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Arg
355 360 365
aga gca aca gcc att atc aga aag gca acc aga aga ttg att caa ttg
1152
Arg Ala Thr Ala Ile Ile Arg Lys Ala Thr Arg Arg Leu Ile Gln Leu
370 375 380
ata gta agt ggg aga gat gaa caa tca att gct gaa gca ata att gta
1200
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
gcc atg gtg ttt tcg caa gaa gat tgc atg ata aaa gca gtt cga ggc
1248
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
gat ttg aac ttt gtt aat aga gca aat cag cgt ttg aac ccc atg cat
1296
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
caa ctc ttg agg cat ttc caa aaa gat gca aaa gtg ctt ttc caa aat
1344
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn
435 440 445
tgg gga att gaa ccc atc gac aat gta atg ggg atg att gga ata ttg
1392
Trp Gly Ile Glu Pro Ile Asp Asn Val Met Gly Met Ile Gly Ile Leu
450 455 460
cct gac atg acc cca agc acc gag atg tca ttg aga gga gtg aga gtc
1440
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Leu Arg Gly Val Arg Val
465 470 475 480
agc aaa atg gga gtg gat gag tac tcc agc act gag aga gtg gtg gtg
1488
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
agc att gac cgt ttt tta aga gtt cgg gat caa agg gga aac ata cta
1536
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Ile Leu
500 505 510
ctg tcc cct gaa gaa gtc agt gaa aca caa gga acg gaa aag ctg aca
1584
Leu Ser Pro Glu Glu Val Ser Glu Thr Gln Gly Thr Glu Lys Leu Thr
515 520 525
ata att tat tcg tca tca atg atg tgg gag att aat ggt ccc gaa tca
1632
Ile Ile Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
gtg ttg gtc aat act tat caa tgg atc atc aga aac tgg gaa att gta
1680
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Ile Val
545 550 555 560
aaa att cag tgg tca cag gac ccc aca atg tta tac aat aag ata gaa
1728
Lys Ile Gln Trp Ser Gln Asp Pro Thr Met Leu Tyr Asn Lys Ile Glu
565 570 575
ttt gaa cca ttc caa tcc ctg gtc cct agg gcc acc aga agc caa tac
1776
Phe Glu Pro Phe Gln Ser Leu Val Pro Arg Ala Thr Arg Ser Gln Tyr
580 585 590
agc ggt ttc gta aga acc ctg ttt cag caa atg cga gat gta ctt gga
1824
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
aca ttt gat act gct caa ata ata aaa ctc ctc cct ttt gcc gct gct
1872
Thr Phe Asp Thr Ala Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
cct ccg gaa cag agt agg atg cag ttc tct tct ttg act gtt aat gta
1920
Pro Pro Glu Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
aga ggt tcg gga atg agg ata ctt gta aga ggc aat tcc cca gtg ttc
1968
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
aac tac aat aaa gtc act aaa agg ctc aca gtc ctc gga aag gat gca
2016
Asn Tyr Asn Lys Val Thr Lys Arg Leu Thr Val Leu Gly Lys Asp Ala
660 665 670
ggt gcg ctt act gag gac cca gat gaa ggt acg gct gga gta gag tct
2064
Gly Ala Leu Thr Glu Asp Pro Asp Glu Gly Thr Ala Gly Val Glu Ser
675 680 685
gct gtt cta aga ggg ttt ctc att tta ggt aaa gaa aac aag aga tat
2112
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asn Lys Arg Tyr
690 695 700
ggc cca gca cta agc atc aat gaa ctt agc aaa ctt gca aaa ggg gag
2160
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Lys Leu Ala Lys Gly Glu
705 710 715 720
aaa gcc aat gta cta att ggg caa ggg gac gta gtg ttg gta atg aaa
2208
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Val Val Leu Val Met Lys
725 730 735
cgg aaa cgt gac tct agc ata ctt act gac agc cag aca gcg acc aaa
2256
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
agg att cgg atg gcc atc aat tag
2280
Arg Ile Arg Met Ala Ile Asn
755
<210> 48
<211> 759
<212> PRT
<213> Вирус гриппа
<400> 48
Met Glu Arg Ile Lys Glu Leu Arg Asp Leu Met Leu Gln Ser Arg Thr
1 5 10 15
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
Lys Tyr Thr Ser Gly Arg Gln Glu Lys Asn Pro Ala Leu Arg Met Lys
35 40 45
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Met
50 55 60
Glu Met Ile Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
Thr Asn Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
Thr Trp Trp Asn Arg Asn Gly Pro Thr Thr Asn Thr Ile His Tyr Pro
100 105 110
Lys Val Tyr Lys Thr Tyr Phe Glu Lys Val Glu Arg Leu Lys His Gly
115 120 125
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
Val Asp Val Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Arg Ile
165 170 175
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
Leu Gln Asp Cys Lys Ile Ala Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Val Gly Gly Thr
210 215 220
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
Glu Gln Met Tyr Thr Pro Gly Gly Lys Val Arg Asn Asp Asp Ile Asp
245 250 255
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Thr Val
260 265 270
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
Ile Gly Gly Thr Arg Met Val Asp Ile Leu Lys Gln Asn Pro Thr Glu
290 295 300
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
Ser Val Lys Arg Glu Glu Glu Met Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Arg
355 360 365
Arg Ala Thr Ala Ile Ile Arg Lys Ala Thr Arg Arg Leu Ile Gln Leu
370 375 380
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn
435 440 445
Trp Gly Ile Glu Pro Ile Asp Asn Val Met Gly Met Ile Gly Ile Leu
450 455 460
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Leu Arg Gly Val Arg Val
465 470 475 480
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Ile Leu
500 505 510
Leu Ser Pro Glu Glu Val Ser Glu Thr Gln Gly Thr Glu Lys Leu Thr
515 520 525
Ile Ile Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Ile Val
545 550 555 560
Lys Ile Gln Trp Ser Gln Asp Pro Thr Met Leu Tyr Asn Lys Ile Glu
565 570 575
Phe Glu Pro Phe Gln Ser Leu Val Pro Arg Ala Thr Arg Ser Gln Tyr
580 585 590
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
Thr Phe Asp Thr Ala Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
Pro Pro Glu Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
Asn Tyr Asn Lys Val Thr Lys Arg Leu Thr Val Leu Gly Lys Asp Ala
660 665 670
Gly Ala Leu Thr Glu Asp Pro Asp Glu Gly Thr Ala Gly Val Glu Ser
675 680 685
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asn Lys Arg Tyr
690 695 700
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Lys Leu Ala Lys Gly Glu
705 710 715 720
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Val Val Leu Val Met Lys
725 730 735
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
Arg Ile Arg Met Ala Ile Asn
755
<210> 49
<211> 2274
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2274)
<400> 49
atg gat gtc aat ccg act cta ctt ttc tta aag gtg cca gcg caa aat
48
Met Asp Val Asn Pro Thr Leu Leu Phe Leu Lys Val Pro Ala Gln Asn
1 5 10 15
gct ata agc aca aca ttc cct tat act gga gat cct ccc tac agt cat
96
Ala Ile Ser Thr Thr Phe Pro Tyr Thr Gly Asp Pro Pro Tyr Ser His
20 25 30
gga aca ggg aca gga tac acc atg gat act gtc aac aga aca cac caa
144
Gly Thr Gly Thr Gly Tyr Thr Met Asp Thr Val Asn Arg Thr His Gln
35 40 45
tat tca gaa aaa ggg aaa tgg aca aca aac act gag att gga gca cca
192
Tyr Ser Glu Lys Gly Lys Trp Thr Thr Asn Thr Glu Ile Gly Ala Pro
50 55 60
caa ctt aat cca atc gat gga cca ctt cct gaa gac aat gaa cca agt
240
Gln Leu Asn Pro Ile Asp Gly Pro Leu Pro Glu Asp Asn Glu Pro Ser
65 70 75 80
ggg tac gcc caa aca gat tgt gta ttg gaa gca atg gct ttc ctt gaa
288
Gly Tyr Ala Gln Thr Asp Cys Val Leu Glu Ala Met Ala Phe Leu Glu
85 90 95
gaa tcc cat ccc gga atc ttt gaa aat tcg tgt ctt gaa acg atg gag
336
Glu Ser His Pro Gly Ile Phe Glu Asn Ser Cys Leu Glu Thr Met Glu
100 105 110
gtg att cag cag aca aga gtg gac aaa cta aca caa ggc cga caa act
384
Val Ile Gln Gln Thr Arg Val Asp Lys Leu Thr Gln Gly Arg Gln Thr
115 120 125
tat gat tgg acc ttg aat agg aat caa cct gcc gca aca gca ctt gct
432
Tyr Asp Trp Thr Leu Asn Arg Asn Gln Pro Ala Ala Thr Ala Leu Ala
130 135 140
aat acg att gaa gta ttc aga tca aat ggt ctg acc tcc aat gaa tcg
480
Asn Thr Ile Glu Val Phe Arg Ser Asn Gly Leu Thr Ser Asn Glu Ser
145 150 155 160
ggg aga ttg atg gac ttc ctc aaa gat gtc atg gag tcc atg aac aag
528
Gly Arg Leu Met Asp Phe Leu Lys Asp Val Met Glu Ser Met Asn Lys
165 170 175
gag gaa atg gaa ata aca aca cac ttc caa cgg aag aga aga gta aga
576
Glu Glu Met Glu Ile Thr Thr His Phe Gln Arg Lys Arg Arg Val Arg
180 185 190
gac aac atg aca aag aga atg ata aca cag aga acc ata gga aag aaa
624
Asp Asn Met Thr Lys Arg Met Ile Thr Gln Arg Thr Ile Gly Lys Lys
195 200 205
aaa caa cga tta agc aga aag agc tat cta atc aga aca tta acc cta
672
Lys Gln Arg Leu Ser Arg Lys Ser Tyr Leu Ile Arg Thr Leu Thr Leu
210 215 220
aac aca atg acc aag gac gct gag aga ggg aaa ttg aaa cga cga gca
720
Asn Thr Met Thr Lys Asp Ala Glu Arg Gly Lys Leu Lys Arg Arg Ala
225 230 235 240
atc gct acc cca ggg atg cag ata aga gga ttt gta tat ttt gtt gaa
768
Ile Ala Thr Pro Gly Met Gln Ile Arg Gly Phe Val Tyr Phe Val Glu
245 250 255
aca cta gct cga aga ata tgt gaa aag ctt gaa caa tca gga ttg cca
816
Thr Leu Ala Arg Arg Ile Cys Glu Lys Leu Glu Gln Ser Gly Leu Pro
260 265 270
gtt ggc ggt aat gag aaa aag gcc aaa ctg gct aat gtc gtc aga aaa
864
Val Gly Gly Asn Glu Lys Lys Ala Lys Leu Ala Asn Val Val Arg Lys
275 280 285
atg atg act aat tcc caa gac act gaa ctc tcc ttc acc atc act ggg
912
Met Met Thr Asn Ser Gln Asp Thr Glu Leu Ser Phe Thr Ile Thr Gly
290 295 300
gac aat acc aaa tgg aat gaa aat cag aac cca cgc ata ttc ctg gca
960
Asp Asn Thr Lys Trp Asn Glu Asn Gln Asn Pro Arg Ile Phe Leu Ala
305 310 315 320
atg atc aca tac ata act aga gat cag cca gaa tgg ttc aga aat gtt
1008
Met Ile Thr Tyr Ile Thr Arg Asp Gln Pro Glu Trp Phe Arg Asn Val
325 330 335
cta agc att gca ccg att atg ttc tca aat aaa atg gca aga ctg ggg
1056
Leu Ser Ile Ala Pro Ile Met Phe Ser Asn Lys Met Ala Arg Leu Gly
340 345 350
aaa gga tat atg ttt gaa agc aaa agt atg aaa ttg aga act caa ata
1104
Lys Gly Tyr Met Phe Glu Ser Lys Ser Met Lys Leu Arg Thr Gln Ile
355 360 365
cca gca gaa atg cta gca agc att gac cta aaa tat ttc aat gat tca
1152
Pro Ala Glu Met Leu Ala Ser Ile Asp Leu Lys Tyr Phe Asn Asp Ser
370 375 380
aca aaa aag aaa att gaa aag ata cga cca ctc ctg gtt gac ggg act
1200
Thr Lys Lys Lys Ile Glu Lys Ile Arg Pro Leu Leu Val Asp Gly Thr
385 390 395 400
gct tca ctg agt cct ggc atg atg atg gga atg ttc aac atg ttg agc
1248
Ala Ser Leu Ser Pro Gly Met Met Met Gly Met Phe Asn Met Leu Ser
405 410 415
act gtg ctg ggt gta tcc ata tta aac ctg ggc cag agg aaa tat aca
1296
Thr Val Leu Gly Val Ser Ile Leu Asn Leu Gly Gln Arg Lys Tyr Thr
420 425 430
aag acc aca tac tgg tgg gat ggt ctg caa tca tcc gat gac ttt gct
1344
Lys Thr Thr Tyr Trp Trp Asp Gly Leu Gln Ser Ser Asp Asp Phe Ala
435 440 445
ttg ata gtg aat gcg cct aat cat gaa gga ata caa gct gga gta gac
1392
Leu Ile Val Asn Ala Pro Asn His Glu Gly Ile Gln Ala Gly Val Asp
450 455 460
aga ttc tat aga act tgc aaa ctg gtc ggg atc aac atg agc aaa aag
1440
Arg Phe Tyr Arg Thr Cys Lys Leu Val Gly Ile Asn Met Ser Lys Lys
465 470 475 480
aag tcc tac ata aat aga act gga aca ttc gaa ttc aca agc ttt ttc
1488
Lys Ser Tyr Ile Asn Arg Thr Gly Thr Phe Glu Phe Thr Ser Phe Phe
485 490 495
tac cgg tat ggt ttt gta gcc aat ttc agc atg gaa cta ccc agt ttt
1536
Tyr Arg Tyr Gly Phe Val Ala Asn Phe Ser Met Glu Leu Pro Ser Phe
500 505 510
ggg gtt tcc gga ata aat gaa tct gca gac atg agc att gga gtg aca
1584
Gly Val Ser Gly Ile Asn Glu Ser Ala Asp Met Ser Ile Gly Val Thr
515 520 525
gtc atc aaa aac aac atg ata aat aat gat ctc ggt cct gcc acg gca
1632
Val Ile Lys Asn Asn Met Ile Asn Asn Asp Leu Gly Pro Ala Thr Ala
530 535 540
caa atg gca ctc caa ctc ttc att aag gat tat cgg tac aca tac cgg
1680
Gln Met Ala Leu Gln Leu Phe Ile Lys Asp Tyr Arg Tyr Thr Tyr Arg
545 550 555 560
tgc cat aga ggt gat acc cag ata caa acc aga aga tct ttt gag ttg
1728
Cys His Arg Gly Asp Thr Gln Ile Gln Thr Arg Arg Ser Phe Glu Leu
565 570 575
aag aaa ctg tgg gaa cag act cga tca aag act ggt cta ctg gta tca
1776
Lys Lys Leu Trp Glu Gln Thr Arg Ser Lys Thr Gly Leu Leu Val Ser
580 585 590
gat ggg ggt cca aac cta tat aac atc aga aac cta cac atc ccg gaa
1824
Asp Gly Gly Pro Asn Leu Tyr Asn Ile Arg Asn Leu His Ile Pro Glu
595 600 605
gtc tgt tta aaa tgg gag cta atg gat gaa gat tat aag ggg agg cta
1872
Val Cys Leu Lys Trp Glu Leu Met Asp Glu Asp Tyr Lys Gly Arg Leu
610 615 620
tgc aat cca ttg aat cct ttc gtt agt cac aaa gaa att gaa tca gtc
1920
Cys Asn Pro Leu Asn Pro Phe Val Ser His Lys Glu Ile Glu Ser Val
625 630 635 640
aac agt gca gta gta atg cct gct cat ggc cct gcc aaa agc atg gag
1968
Asn Ser Ala Val Val Met Pro Ala His Gly Pro Ala Lys Ser Met Glu
645 650 655
tat gat gct gtt gca aca aca cat tct tgg atc ccc aag agg aac cgg
2016
Tyr Asp Ala Val Ala Thr Thr His Ser Trp Ile Pro Lys Arg Asn Arg
660 665 670
tcc ata ttg aac aca agc caa agg gga ata cta gaa gat gag cag atg
2064
Ser Ile Leu Asn Thr Ser Gln Arg Gly Ile Leu Glu Asp Glu Gln Met
675 680 685
tat cag aaa tgc tgc aac ctg ttt gaa aaa ttc ttc ccc agc agc tca
2112
Tyr Gln Lys Cys Cys Asn Leu Phe Glu Lys Phe Phe Pro Ser Ser Ser
690 695 700
tac aga aga cca gtc gga att tct agt atg gtt gag gcc atg gta tcc
2160
Tyr Arg Arg Pro Val Gly Ile Ser Ser Met Val Glu Ala Met Val Ser
705 710 715 720
agg gcc cgc att gat gca cga att gac ttc gaa tct gga cgg ata aag
2208
Arg Ala Arg Ile Asp Ala Arg Ile Asp Phe Glu Ser Gly Arg Ile Lys
725 730 735
aag gat gag ttc gct gag atc atg aag atc tgt tcc acc att gaa gag
2256
Lys Asp Glu Phe Ala Glu Ile Met Lys Ile Cys Ser Thr Ile Glu Glu
740 745 750
ctc aga cgg caa aaa tag
2274
Leu Arg Arg Gln Lys
755
<210> 50
<211> 757
<212> PRT
<213> Вирус гриппа
<400> 50
Met Asp Val Asn Pro Thr Leu Leu Phe Leu Lys Val Pro Ala Gln Asn
1 5 10 15
Ala Ile Ser Thr Thr Phe Pro Tyr Thr Gly Asp Pro Pro Tyr Ser His
20 25 30
Gly Thr Gly Thr Gly Tyr Thr Met Asp Thr Val Asn Arg Thr His Gln
35 40 45
Tyr Ser Glu Lys Gly Lys Trp Thr Thr Asn Thr Glu Ile Gly Ala Pro
50 55 60
Gln Leu Asn Pro Ile Asp Gly Pro Leu Pro Glu Asp Asn Glu Pro Ser
65 70 75 80
Gly Tyr Ala Gln Thr Asp Cys Val Leu Glu Ala Met Ala Phe Leu Glu
85 90 95
Glu Ser His Pro Gly Ile Phe Glu Asn Ser Cys Leu Glu Thr Met Glu
100 105 110
Val Ile Gln Gln Thr Arg Val Asp Lys Leu Thr Gln Gly Arg Gln Thr
115 120 125
Tyr Asp Trp Thr Leu Asn Arg Asn Gln Pro Ala Ala Thr Ala Leu Ala
130 135 140
Asn Thr Ile Glu Val Phe Arg Ser Asn Gly Leu Thr Ser Asn Glu Ser
145 150 155 160
Gly Arg Leu Met Asp Phe Leu Lys Asp Val Met Glu Ser Met Asn Lys
165 170 175
Glu Glu Met Glu Ile Thr Thr His Phe Gln Arg Lys Arg Arg Val Arg
180 185 190
Asp Asn Met Thr Lys Arg Met Ile Thr Gln Arg Thr Ile Gly Lys Lys
195 200 205
Lys Gln Arg Leu Ser Arg Lys Ser Tyr Leu Ile Arg Thr Leu Thr Leu
210 215 220
Asn Thr Met Thr Lys Asp Ala Glu Arg Gly Lys Leu Lys Arg Arg Ala
225 230 235 240
Ile Ala Thr Pro Gly Met Gln Ile Arg Gly Phe Val Tyr Phe Val Glu
245 250 255
Thr Leu Ala Arg Arg Ile Cys Glu Lys Leu Glu Gln Ser Gly Leu Pro
260 265 270
Val Gly Gly Asn Glu Lys Lys Ala Lys Leu Ala Asn Val Val Arg Lys
275 280 285
Met Met Thr Asn Ser Gln Asp Thr Glu Leu Ser Phe Thr Ile Thr Gly
290 295 300
Asp Asn Thr Lys Trp Asn Glu Asn Gln Asn Pro Arg Ile Phe Leu Ala
305 310 315 320
Met Ile Thr Tyr Ile Thr Arg Asp Gln Pro Glu Trp Phe Arg Asn Val
325 330 335
Leu Ser Ile Ala Pro Ile Met Phe Ser Asn Lys Met Ala Arg Leu Gly
340 345 350
Lys Gly Tyr Met Phe Glu Ser Lys Ser Met Lys Leu Arg Thr Gln Ile
355 360 365
Pro Ala Glu Met Leu Ala Ser Ile Asp Leu Lys Tyr Phe Asn Asp Ser
370 375 380
Thr Lys Lys Lys Ile Glu Lys Ile Arg Pro Leu Leu Val Asp Gly Thr
385 390 395 400
Ala Ser Leu Ser Pro Gly Met Met Met Gly Met Phe Asn Met Leu Ser
405 410 415
Thr Val Leu Gly Val Ser Ile Leu Asn Leu Gly Gln Arg Lys Tyr Thr
420 425 430
Lys Thr Thr Tyr Trp Trp Asp Gly Leu Gln Ser Ser Asp Asp Phe Ala
435 440 445
Leu Ile Val Asn Ala Pro Asn His Glu Gly Ile Gln Ala Gly Val Asp
450 455 460
Arg Phe Tyr Arg Thr Cys Lys Leu Val Gly Ile Asn Met Ser Lys Lys
465 470 475 480
Lys Ser Tyr Ile Asn Arg Thr Gly Thr Phe Glu Phe Thr Ser Phe Phe
485 490 495
Tyr Arg Tyr Gly Phe Val Ala Asn Phe Ser Met Glu Leu Pro Ser Phe
500 505 510
Gly Val Ser Gly Ile Asn Glu Ser Ala Asp Met Ser Ile Gly Val Thr
515 520 525
Val Ile Lys Asn Asn Met Ile Asn Asn Asp Leu Gly Pro Ala Thr Ala
530 535 540
Gln Met Ala Leu Gln Leu Phe Ile Lys Asp Tyr Arg Tyr Thr Tyr Arg
545 550 555 560
Cys His Arg Gly Asp Thr Gln Ile Gln Thr Arg Arg Ser Phe Glu Leu
565 570 575
Lys Lys Leu Trp Glu Gln Thr Arg Ser Lys Thr Gly Leu Leu Val Ser
580 585 590
Asp Gly Gly Pro Asn Leu Tyr Asn Ile Arg Asn Leu His Ile Pro Glu
595 600 605
Val Cys Leu Lys Trp Glu Leu Met Asp Glu Asp Tyr Lys Gly Arg Leu
610 615 620
Cys Asn Pro Leu Asn Pro Phe Val Ser His Lys Glu Ile Glu Ser Val
625 630 635 640
Asn Ser Ala Val Val Met Pro Ala His Gly Pro Ala Lys Ser Met Glu
645 650 655
Tyr Asp Ala Val Ala Thr Thr His Ser Trp Ile Pro Lys Arg Asn Arg
660 665 670
Ser Ile Leu Asn Thr Ser Gln Arg Gly Ile Leu Glu Asp Glu Gln Met
675 680 685
Tyr Gln Lys Cys Cys Asn Leu Phe Glu Lys Phe Phe Pro Ser Ser Ser
690 695 700
Tyr Arg Arg Pro Val Gly Ile Ser Ser Met Val Glu Ala Met Val Ser
705 710 715 720
Arg Ala Arg Ile Asp Ala Arg Ile Asp Phe Glu Ser Gly Arg Ile Lys
725 730 735
Lys Asp Glu Phe Ala Glu Ile Met Lys Ile Cys Ser Thr Ile Glu Glu
740 745 750
Leu Arg Arg Gln Lys
755
<210> 51
<211> 2151
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2151)
<400> 51
atg gaa gac ttt gtg cga cag tgc ttc aat cca atg atc gtc gag ctt
48
Met Glu Asp Phe Val Arg Gln Cys Phe Asn Pro Met Ile Val Glu Leu
1 5 10 15
gcg gaa aag gca atg aaa gaa tat gga gag aac ccg aaa atc gaa aca
96
Ala Glu Lys Ala Met Lys Glu Tyr Gly Glu Asn Pro Lys Ile Glu Thr
20 25 30
aac aaa ttt gca gca ata tgc act cac ttg gaa gtc tgc ttc atg tac
144
Asn Lys Phe Ala Ala Ile Cys Thr His Leu Glu Val Cys Phe Met Tyr
35 40 45
tcg gat ttc cac ttt ata aat gaa ctg ggt gag tca gtg gtc ata gag
192
Ser Asp Phe His Phe Ile Asn Glu Leu Gly Glu Ser Val Val Ile Glu
50 55 60
tct ggt gac cca aat gct ctt ttg aaa cac aga ttt gaa atc att gag
240
Ser Gly Asp Pro Asn Ala Leu Leu Lys His Arg Phe Glu Ile Ile Glu
65 70 75 80
ggg aga gat cga aca atg gca tgg aca gta gta aac agc atc tgc aac
288
Gly Arg Asp Arg Thr Met Ala Trp Thr Val Val Asn Ser Ile Cys Asn
85 90 95
acc aca aga gct gaa aaa cct aaa ttt ctt cca gat tta tac gac tat
336
Thr Thr Arg Ala Glu Lys Pro Lys Phe Leu Pro Asp Leu Tyr Asp Tyr
100 105 110
aaa gag aac aga ttt gtt gaa att ggt gtg aca agg aga gaa gtt cac
384
Lys Glu Asn Arg Phe Val Glu Ile Gly Val Thr Arg Arg Glu Val His
115 120 125
ata tac tac ctg gag aag gcc aac aaa ata aag tct gag aaa aca cat
432
Ile Tyr Tyr Leu Glu Lys Ala Asn Lys Ile Lys Ser Glu Lys Thr His
130 135 140
atc cac att ttc tca ttt aca gga gaa gaa atg gct aca aaa gcg gac
480
Ile His Ile Phe Ser Phe Thr Gly Glu Glu Met Ala Thr Lys Ala Asp
145 150 155 160
tat act ctt gat gaa gag agt aga gcc agg atc aag acc aga cta ttc
528
Tyr Thr Leu Asp Glu Glu Ser Arg Ala Arg Ile Lys Thr Arg Leu Phe
165 170 175
act ata aga caa gaa atg gcc agt aga ggc ctc tgg gat tcc ttt cgt
576
Thr Ile Arg Gln Glu Met Ala Ser Arg Gly Leu Trp Asp Ser Phe Arg
180 185 190
cag tcc gag aga ggc gaa gag aca att gaa gaa aga ttt gaa atc aca
624
Gln Ser Glu Arg Gly Glu Glu Thr Ile Glu Glu Arg Phe Glu Ile Thr
195 200 205
ggg acg atg cgc aag ctt gcc aat tac agt ctc cca ccg aac ttc tcc
672
Gly Thr Met Arg Lys Leu Ala Asn Tyr Ser Leu Pro Pro Asn Phe Ser
210 215 220
agc ctt gaa aat ttt aga gtc tat ata gat gga ttc gaa ccg aac ggc
720
Ser Leu Glu Asn Phe Arg Val Tyr Ile Asp Gly Phe Glu Pro Asn Gly
225 230 235 240
tgc att gag agt aag ctt tct caa atg tcc aaa gaa gta aat gcc aaa
768
Cys Ile Glu Ser Lys Leu Ser Gln Met Ser Lys Glu Val Asn Ala Lys
245 250 255
ata gaa cca ttt tca aag aca aca ccc cga cca ctc aaa atg cca ggt
816
Ile Glu Pro Phe Ser Lys Thr Thr Pro Arg Pro Leu Lys Met Pro Gly
260 265 270
ggt cca ccc tgc cat cag cga tcc aaa ttc ttg cta atg gat gct ctg
864
Gly Pro Pro Cys His Gln Arg Ser Lys Phe Leu Leu Met Asp Ala Leu
275 280 285
aaa ctg agc att gag gac cca agt cac gag gga gag ggg ata cca cta
912
Lys Leu Ser Ile Glu Asp Pro Ser His Glu Gly Glu Gly Ile Pro Leu
290 295 300
tat gat gca atc aaa tgc atg aaa act ttc ttt gga tgg aaa gag ccc
960
Tyr Asp Ala Ile Lys Cys Met Lys Thr Phe Phe Gly Trp Lys Glu Pro
305 310 315 320
agt att gtt aaa cca cat aaa aag ggt ata aac ccg aac tat ctc caa
1008
Ser Ile Val Lys Pro His Lys Lys Gly Ile Asn Pro Asn Tyr Leu Gln
325 330 335
act tgg aag caa gta tta gaa gaa ata caa gac ctt gag aac gaa gaa
1056
Thr Trp Lys Gln Val Leu Glu Glu Ile Gln Asp Leu Glu Asn Glu Glu
340 345 350
agg acc ccc aag acc aag aat atg aaa aaa aca agc caa ttg aaa tgg
1104
Arg Thr Pro Lys Thr Lys Asn Met Lys Lys Thr Ser Gln Leu Lys Trp
355 360 365
gca cta ggt gaa aat atg gca cca gag aaa gtg gat ttt gag gat tgt
1152
Ala Leu Gly Glu Asn Met Ala Pro Glu Lys Val Asp Phe Glu Asp Cys
370 375 380
aaa gac atc aat gat tta aaa caa tat gac agt gat gag cca gaa gca
1200
Lys Asp Ile Asn Asp Leu Lys Gln Tyr Asp Ser Asp Glu Pro Glu Ala
385 390 395 400
agg tct ctt gca agt tgg att caa agt gag ttc aac aag gct tgt gag
1248
Arg Ser Leu Ala Ser Trp Ile Gln Ser Glu Phe Asn Lys Ala Cys Glu
405 410 415
ctg aca gat tca agc tgg ata gag ctc gat gaa att ggg gag gat gtc
1296
Leu Thr Asp Ser Ser Trp Ile Glu Leu Asp Glu Ile Gly Glu Asp Val
420 425 430
gcc cca ata gaa tac att gcg agc atg agg aga aat tat ttt act gct
1344
Ala Pro Ile Glu Tyr Ile Ala Ser Met Arg Arg Asn Tyr Phe Thr Ala
435 440 445
gag att tcc cat tgt aga gca aca gaa tat ata atg aaa gga gtg tac
1392
Glu Ile Ser His Cys Arg Ala Thr Glu Tyr Ile Met Lys Gly Val Tyr
450 455 460
atc aac act gct cta ctc aat gca tcc tgt gct gcg atg gat gaa ttt
1440
Ile Asn Thr Ala Leu Leu Asn Ala Ser Cys Ala Ala Met Asp Glu Phe
465 470 475 480
caa tta att ccg atg ata agt aaa tgc agg acc aaa gaa ggg aga agg
1488
Gln Leu Ile Pro Met Ile Ser Lys Cys Arg Thr Lys Glu Gly Arg Arg
485 490 495
aaa aca aat tta tat gga ttc ata ata aag gga agg tcc cat tta aga
1536
Lys Thr Asn Leu Tyr Gly Phe Ile Ile Lys Gly Arg Ser His Leu Arg
500 505 510
aat gat act gac gtg gtg aac ttt gta agt atg gaa ttt tct ctc act
1584
Asn Asp Thr Asp Val Val Asn Phe Val Ser Met Glu Phe Ser Leu Thr
515 520 525
gat cca aga ttt gag cca cac aaa tgg gaa aaa tac tgc gtt cta gaa
1632
Asp Pro Arg Phe Glu Pro His Lys Trp Glu Lys Tyr Cys Val Leu Glu
530 535 540
att gga gac atg ctt tta aga act gct gta ggt caa gtg tca aga ccc
1680
Ile Gly Asp Met Leu Leu Arg Thr Ala Val Gly Gln Val Ser Arg Pro
545 550 555 560
atg ttt ttg tat gta agg aca aat gga acc tct aaa att aaa atg aaa
1728
Met Phe Leu Tyr Val Arg Thr Asn Gly Thr Ser Lys Ile Lys Met Lys
565 570 575
tgg gga atg gaa atg agg cgc tgc ctc ctt cag tct ctg caa cag att
1776
Trp Gly Met Glu Met Arg Arg Cys Leu Leu Gln Ser Leu Gln Gln Ile
580 585 590
gaa agc atg atc gaa gct gag tcc tca gtc aaa gaa aag gac atg acc
1824
Glu Ser Met Ile Glu Ala Glu Ser Ser Val Lys Glu Lys Asp Met Thr
595 600 605
aaa gaa ttt ttt gag aac aaa tca gag aca tgg cct ata gga gag tcc
1872
Lys Glu Phe Phe Glu Asn Lys Ser Glu Thr Trp Pro Ile Gly Glu Ser
610 615 620
ccc aaa gga gtg gaa gag ggc tca atc ggg aag gtt tgc agg acc tta
1920
Pro Lys Gly Val Glu Glu Gly Ser Ile Gly Lys Val Cys Arg Thr Leu
625 630 635 640
tta gca aaa tct gtg ttt aac agt tta tat gca tct cca caa ctg gaa
1968
Leu Ala Lys Ser Val Phe Asn Ser Leu Tyr Ala Ser Pro Gln Leu Glu
645 650 655
gga ttt tca gct gaa tct agg aaa tta ctt ctc att gtt cag gct ctt
2016
Gly Phe Ser Ala Glu Ser Arg Lys Leu Leu Leu Ile Val Gln Ala Leu
660 665 670
aga gat gac ctg gaa cct gga acc ttt gat att ggg ggg tta tat gaa
2064
Arg Asp Asp Leu Glu Pro Gly Thr Phe Asp Ile Gly Gly Leu Tyr Glu
675 680 685
tca att gag gag tgc ctg att aat gat ccc tgg gtt ttg ctt aat gca
2112
Ser Ile Glu Glu Cys Leu Ile Asn Asp Pro Trp Val Leu Leu Asn Ala
690 695 700
tct tgg ttc aac tcc ttc ctc aca cat gca ctg aag tag
2151
Ser Trp Phe Asn Ser Phe Leu Thr His Ala Leu Lys
705 710 715
<210> 52
<211> 716
<212> PRT
<213> Вирус гриппа
<400> 52
Met Glu Asp Phe Val Arg Gln Cys Phe Asn Pro Met Ile Val Glu Leu
1 5 10 15
Ala Glu Lys Ala Met Lys Glu Tyr Gly Glu Asn Pro Lys Ile Glu Thr
20 25 30
Asn Lys Phe Ala Ala Ile Cys Thr His Leu Glu Val Cys Phe Met Tyr
35 40 45
Ser Asp Phe His Phe Ile Asn Glu Leu Gly Glu Ser Val Val Ile Glu
50 55 60
Ser Gly Asp Pro Asn Ala Leu Leu Lys His Arg Phe Glu Ile Ile Glu
65 70 75 80
Gly Arg Asp Arg Thr Met Ala Trp Thr Val Val Asn Ser Ile Cys Asn
85 90 95
Thr Thr Arg Ala Glu Lys Pro Lys Phe Leu Pro Asp Leu Tyr Asp Tyr
100 105 110
Lys Glu Asn Arg Phe Val Glu Ile Gly Val Thr Arg Arg Glu Val His
115 120 125
Ile Tyr Tyr Leu Glu Lys Ala Asn Lys Ile Lys Ser Glu Lys Thr His
130 135 140
Ile His Ile Phe Ser Phe Thr Gly Glu Glu Met Ala Thr Lys Ala Asp
145 150 155 160
Tyr Thr Leu Asp Glu Glu Ser Arg Ala Arg Ile Lys Thr Arg Leu Phe
165 170 175
Thr Ile Arg Gln Glu Met Ala Ser Arg Gly Leu Trp Asp Ser Phe Arg
180 185 190
Gln Ser Glu Arg Gly Glu Glu Thr Ile Glu Glu Arg Phe Glu Ile Thr
195 200 205
Gly Thr Met Arg Lys Leu Ala Asn Tyr Ser Leu Pro Pro Asn Phe Ser
210 215 220
Ser Leu Glu Asn Phe Arg Val Tyr Ile Asp Gly Phe Glu Pro Asn Gly
225 230 235 240
Cys Ile Glu Ser Lys Leu Ser Gln Met Ser Lys Glu Val Asn Ala Lys
245 250 255
Ile Glu Pro Phe Ser Lys Thr Thr Pro Arg Pro Leu Lys Met Pro Gly
260 265 270
Gly Pro Pro Cys His Gln Arg Ser Lys Phe Leu Leu Met Asp Ala Leu
275 280 285
Lys Leu Ser Ile Glu Asp Pro Ser His Glu Gly Glu Gly Ile Pro Leu
290 295 300
Tyr Asp Ala Ile Lys Cys Met Lys Thr Phe Phe Gly Trp Lys Glu Pro
305 310 315 320
Ser Ile Val Lys Pro His Lys Lys Gly Ile Asn Pro Asn Tyr Leu Gln
325 330 335
Thr Trp Lys Gln Val Leu Glu Glu Ile Gln Asp Leu Glu Asn Glu Glu
340 345 350
Arg Thr Pro Lys Thr Lys Asn Met Lys Lys Thr Ser Gln Leu Lys Trp
355 360 365
Ala Leu Gly Glu Asn Met Ala Pro Glu Lys Val Asp Phe Glu Asp Cys
370 375 380
Lys Asp Ile Asn Asp Leu Lys Gln Tyr Asp Ser Asp Glu Pro Glu Ala
385 390 395 400
Arg Ser Leu Ala Ser Trp Ile Gln Ser Glu Phe Asn Lys Ala Cys Glu
405 410 415
Leu Thr Asp Ser Ser Trp Ile Glu Leu Asp Glu Ile Gly Glu Asp Val
420 425 430
Ala Pro Ile Glu Tyr Ile Ala Ser Met Arg Arg Asn Tyr Phe Thr Ala
435 440 445
Glu Ile Ser His Cys Arg Ala Thr Glu Tyr Ile Met Lys Gly Val Tyr
450 455 460
Ile Asn Thr Ala Leu Leu Asn Ala Ser Cys Ala Ala Met Asp Glu Phe
465 470 475 480
Gln Leu Ile Pro Met Ile Ser Lys Cys Arg Thr Lys Glu Gly Arg Arg
485 490 495
Lys Thr Asn Leu Tyr Gly Phe Ile Ile Lys Gly Arg Ser His Leu Arg
500 505 510
Asn Asp Thr Asp Val Val Asn Phe Val Ser Met Glu Phe Ser Leu Thr
515 520 525
Asp Pro Arg Phe Glu Pro His Lys Trp Glu Lys Tyr Cys Val Leu Glu
530 535 540
Ile Gly Asp Met Leu Leu Arg Thr Ala Val Gly Gln Val Ser Arg Pro
545 550 555 560
Met Phe Leu Tyr Val Arg Thr Asn Gly Thr Ser Lys Ile Lys Met Lys
565 570 575
Trp Gly Met Glu Met Arg Arg Cys Leu Leu Gln Ser Leu Gln Gln Ile
580 585 590
Glu Ser Met Ile Glu Ala Glu Ser Ser Val Lys Glu Lys Asp Met Thr
595 600 605
Lys Glu Phe Phe Glu Asn Lys Ser Glu Thr Trp Pro Ile Gly Glu Ser
610 615 620
Pro Lys Gly Val Glu Glu Gly Ser Ile Gly Lys Val Cys Arg Thr Leu
625 630 635 640
Leu Ala Lys Ser Val Phe Asn Ser Leu Tyr Ala Ser Pro Gln Leu Glu
645 650 655
Gly Phe Ser Ala Glu Ser Arg Lys Leu Leu Leu Ile Val Gln Ala Leu
660 665 670
Arg Asp Asp Leu Glu Pro Gly Thr Phe Asp Ile Gly Gly Leu Tyr Glu
675 680 685
Ser Ile Glu Glu Cys Leu Ile Asn Asp Pro Trp Val Leu Leu Asn Ala
690 695 700
Ser Trp Phe Asn Ser Phe Leu Thr His Ala Leu Lys
705 710 715
<210> 53
<211> 844
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(690)
<400> 53
atg gat tcc aac act gtg tca agc ttt cag gta gac tgt ttt ctt tgg
48
Met Asp Ser Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
cat gtc cgt aaa cga ttc gca gac caa gaa ctg ggt gat gcc cca ttc
96
His Val Arg Lys Arg Phe Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
ctt gac cgg ctt cgc cga gac cag aag tcc cta agg gga aga ggt agc
144
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
act ctt ggt ctg gac atc gaa aca gcc act cat gca gga aag cag ata
192
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr His Ala Gly Lys Gln Ile
50 55 60
gtg gag cag att ctg gaa aag gaa tca gat gag gca ctt aaa atg acc
240
Val Glu Gln Ile Leu Glu Lys Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
att gcc tct gtt cct gct tca cgc tac tta act gac atg act ctt gat
288
Ile Ala Ser Val Pro Ala Ser Arg Tyr Leu Thr Asp Met Thr Leu Asp
85 90 95
gag atg tca aga gac tgg ttc atg ctc atg ccc aag caa aaa gta aca
336
Glu Met Ser Arg Asp Trp Phe Met Leu Met Pro Lys Gln Lys Val Thr
100 105 110
ggc tcc cta tgt ata aga atg gac cag gca atc atg gat aag aac atc
384
Gly Ser Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
ata ctt aaa gca aac ttt agt gtg att ttc gaa agg ctg gaa aca cta
432
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Glu Arg Leu Glu Thr Leu
130 135 140
ata cta ctt aga gcc ttc acc gaa gaa gga gca gtc gtt ggc gaa att
480
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Val Val Gly Glu Ile
145 150 155 160
tca cca tta cct tct ctt cca gga cat act aat gag gat gtc aaa aat
528
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Asn Glu Asp Val Lys Asn
165 170 175
gca att ggg gtc ctc atc gga gga ctt aaa tgg aat gat aat acg gtt
576
Ala Ile Gly Val Leu Ile Gly Gly Leu Lys Trp Asn Asp Asn Thr Val
180 185 190
aga atc tct gaa act cta cag aga ttc gct tgg aga agc agt cat gaa
624
Arg Ile Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser His Glu
195 200 205
aat ggg aga cct tca ttc cct tca aaa cag aaa cga aaa atg gag aga
672
Asn Gly Arg Pro Ser Phe Pro Ser Lys Gln Lys Arg Lys Met Glu Arg
210 215 220
aca att aag cca gaa att tgaagaaata agatggttga ttgaagaagt
720
Thr Ile Lys Pro Glu Ile
225 230
gcgacataga ttgaaaaata cagaaaatag ttttgaacaa ataacattta tgcaagcctt
780
acaactattg cttgaagtag aacaagagat aagaactttc tcgtttcagc ttatttaatg
840
ataa
844
<210> 54
<211> 230
<212> PRT
<213> Вирус гриппа
<400> 54
Met Asp Ser Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
His Val Arg Lys Arg Phe Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr His Ala Gly Lys Gln Ile
50 55 60
Val Glu Gln Ile Leu Glu Lys Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
Ile Ala Ser Val Pro Ala Ser Arg Tyr Leu Thr Asp Met Thr Leu Asp
85 90 95
Glu Met Ser Arg Asp Trp Phe Met Leu Met Pro Lys Gln Lys Val Thr
100 105 110
Gly Ser Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Glu Arg Leu Glu Thr Leu
130 135 140
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Val Val Gly Glu Ile
145 150 155 160
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Asn Glu Asp Val Lys Asn
165 170 175
Ala Ile Gly Val Leu Ile Gly Gly Leu Lys Trp Asn Asp Asn Thr Val
180 185 190
Arg Ile Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser His Glu
195 200 205
Asn Gly Arg Pro Ser Phe Pro Ser Lys Gln Lys Arg Lys Met Glu Arg
210 215 220
Thr Ile Lys Pro Glu Ile
225 230
<210> 55
<211> 1497
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1497)
<400> 55
atg gcg tct caa ggc acc aaa cga tcc tat gaa cag atg gaa act gat
48
Met Ala Ser Gln Gly Thr Lys Arg Ser Tyr Glu Gln Met Glu Thr Asp
1 5 10 15
ggg gaa cgc cag aat gca act gaa atc aga gca tct gtc gga agg atg
96
Gly Glu Arg Gln Asn Ala Thr Glu Ile Arg Ala Ser Val Gly Arg Met
20 25 30
gtg gga gga atc gga cgg ttt tat gtc cag atg tgt act gag ctt aaa
144
Val Gly Gly Ile Gly Arg Phe Tyr Val Gln Met Cys Thr Glu Leu Lys
35 40 45
cta aac gac cat gaa ggg cgg ctg att cag aac agc ata aca ata gaa
192
Leu Asn Asp His Glu Gly Arg Leu Ile Gln Asn Ser Ile Thr Ile Glu
50 55 60
agg atg gtg ctt tcg gca ttc gac gaa aga aga aac aag tat ctc gag
240
Arg Met Val Leu Ser Ala Phe Asp Glu Arg Arg Asn Lys Tyr Leu Glu
65 70 75 80
gag cat ccc agt gct ggg aaa gac cct aag aaa acg gga ggc ccg ata
288
Glu His Pro Ser Ala Gly Lys Asp Pro Lys Lys Thr Gly Gly Pro Ile
85 90 95
tac aga aga aaa gat ggg aaa tgg atg agg gaa ctc atc ctc cat gat
336
Tyr Arg Arg Lys Asp Gly Lys Trp Met Arg Glu Leu Ile Leu His Asp
100 105 110
aaa gaa gaa atc atg aga atc tgg cgt cag gcc aac aat ggt gaa gac
384
Lys Glu Glu Ile Met Arg Ile Trp Arg Gln Ala Asn Asn Gly Glu Asp
115 120 125
gct act gct ggt ctt act cat atg atg atc tgg cac tcc aat ctc aat
432
Ala Thr Ala Gly Leu Thr His Met Met Ile Trp His Ser Asn Leu Asn
130 135 140
gac acc aca tac caa aga aca agg gct ctt gtt cgg act ggg atg gat
480
Asp Thr Thr Tyr Gln Arg Thr Arg Ala Leu Val Arg Thr Gly Met Asp
145 150 155 160
ccc aga atg tgc tct ctg atg caa ggc tca acc ctc cca cgg aga tct
528
Pro Arg Met Cys Ser Leu Met Gln Gly Ser Thr Leu Pro Arg Arg Ser
165 170 175
gga gcc gct ggt gct gca gta aaa ggc gtt gga aca atg gta atg gaa
576
Gly Ala Ala Gly Ala Ala Val Lys Gly Val Gly Thr Met Val Met Glu
180 185 190
ctc atc aga atg atc aag cgc gga ata aat gat cgg aat ttc tgg aga
624
Leu Ile Arg Met Ile Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg
195 200 205
ggt gaa aat ggt cga aga acc aga att gct tat gaa aga atg tgc aat
672
Gly Glu Asn Gly Arg Arg Thr Arg Ile Ala Tyr Glu Arg Met Cys Asn
210 215 220
atc ctc aaa ggg aaa ttt cag aca gca gca caa cgg gct atg atg gac
720
Ile Leu Lys Gly Lys Phe Gln Thr Ala Ala Gln Arg Ala Met Met Asp
225 230 235 240
cag gtg agg gaa ggc cgc aat cct gga aac gct gag att gag gat ctc
768
Gln Val Arg Glu Gly Arg Asn Pro Gly Asn Ala Glu Ile Glu Asp Leu
245 250 255
att ttc ttg gca cga tca gca ctt att ttg aga gga tca gta gcc cat
816
Ile Phe Leu Ala Arg Ser Ala Leu Ile Leu Arg Gly Ser Val Ala His
260 265 270
aaa tca tgc cta cct gcc tgt gtt tat ggc ctt gca gta acc agt ggg
864
Lys Ser Cys Leu Pro Ala Cys Val Tyr Gly Leu Ala Val Thr Ser Gly
275 280 285
tat gac ttt gag aag gaa gga tac tct ctg gtt gga att gat cct ttc
912
Tyr Asp Phe Glu Lys Glu Gly Tyr Ser Leu Val Gly Ile Asp Pro Phe
290 295 300
aaa cta ctc cag aac agt caa att ttc agt cta atc aga cca aaa gaa
960
Lys Leu Leu Gln Asn Ser Gln Ile Phe Ser Leu Ile Arg Pro Lys Glu
305 310 315 320
aac cca gca cac aaa agc cag ttg gtg tgg atg gca tgc cat tct gca
1008
Asn Pro Ala His Lys Ser Gln Leu Val Trp Met Ala Cys His Ser Ala
325 330 335
gca ttt gag gat ctg aga gtt tta aat ttc att aga gga acc aaa gta
1056
Ala Phe Glu Asp Leu Arg Val Leu Asn Phe Ile Arg Gly Thr Lys Val
340 345 350
atc cca aga gga cag tta aca acc aga gga gtt caa att gct tca aat
1104
Ile Pro Arg Gly Gln Leu Thr Thr Arg Gly Val Gln Ile Ala Ser Asn
355 360 365
gaa aac atg gag aca ata aat tct agc aca ctt gaa ctg aga agc aaa
1152
Glu Asn Met Glu Thr Ile Asn Ser Ser Thr Leu Glu Leu Arg Ser Lys
370 375 380
tat tgg gca ata agg acc aga agc gga gga aac acc agt caa cag aga
1200
Tyr Trp Ala Ile Arg Thr Arg Ser Gly Gly Asn Thr Ser Gln Gln Arg
385 390 395 400
gca tct gca gga cag ata agt gtg caa cct act ttc tca gta cag aga
1248
Ala Ser Ala Gly Gln Ile Ser Val Gln Pro Thr Phe Ser Val Gln Arg
405 410 415
aat ctt ccc ttt gag aga gca acc att atg gct gca ttc act ggt aac
1296
Asn Leu Pro Phe Glu Arg Ala Thr Ile Met Ala Ala Phe Thr Gly Asn
420 425 430
act gaa gga agg act tcc gac atg aga acg gaa atc ata agg atg atg
1344
Thr Glu Gly Arg Thr Ser Asp Met Arg Thr Glu Ile Ile Arg Met Met
435 440 445
gaa aat gcc aaa tca gaa gat gtg tct ttc cag ggg cgg gga gtc ttc
1392
Glu Asn Ala Lys Ser Glu Asp Val Ser Phe Gln Gly Arg Gly Val Phe
450 455 460
gag ctc tcg gac gaa aag gca acg aac ccg atc gtg cct tcc ttt gac
1440
Glu Leu Ser Asp Glu Lys Ala Thr Asn Pro Ile Val Pro Ser Phe Asp
465 470 475 480
atg agc aat gaa ggg tct tat ttc ttc gga gac aat gct gag gag ttt
1488
Met Ser Asn Glu Gly Ser Tyr Phe Phe Gly Asp Asn Ala Glu Glu Phe
485 490 495
gac agt taa
1497
Asp Ser
<210> 56
<211> 498
<212> PRT
<213> Вирус гриппа
<400> 56
Met Ala Ser Gln Gly Thr Lys Arg Ser Tyr Glu Gln Met Glu Thr Asp
1 5 10 15
Gly Glu Arg Gln Asn Ala Thr Glu Ile Arg Ala Ser Val Gly Arg Met
20 25 30
Val Gly Gly Ile Gly Arg Phe Tyr Val Gln Met Cys Thr Glu Leu Lys
35 40 45
Leu Asn Asp His Glu Gly Arg Leu Ile Gln Asn Ser Ile Thr Ile Glu
50 55 60
Arg Met Val Leu Ser Ala Phe Asp Glu Arg Arg Asn Lys Tyr Leu Glu
65 70 75 80
Glu His Pro Ser Ala Gly Lys Asp Pro Lys Lys Thr Gly Gly Pro Ile
85 90 95
Tyr Arg Arg Lys Asp Gly Lys Trp Met Arg Glu Leu Ile Leu His Asp
100 105 110
Lys Glu Glu Ile Met Arg Ile Trp Arg Gln Ala Asn Asn Gly Glu Asp
115 120 125
Ala Thr Ala Gly Leu Thr His Met Met Ile Trp His Ser Asn Leu Asn
130 135 140
Asp Thr Thr Tyr Gln Arg Thr Arg Ala Leu Val Arg Thr Gly Met Asp
145 150 155 160
Pro Arg Met Cys Ser Leu Met Gln Gly Ser Thr Leu Pro Arg Arg Ser
165 170 175
Gly Ala Ala Gly Ala Ala Val Lys Gly Val Gly Thr Met Val Met Glu
180 185 190
Leu Ile Arg Met Ile Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg
195 200 205
Gly Glu Asn Gly Arg Arg Thr Arg Ile Ala Tyr Glu Arg Met Cys Asn
210 215 220
Ile Leu Lys Gly Lys Phe Gln Thr Ala Ala Gln Arg Ala Met Met Asp
225 230 235 240
Gln Val Arg Glu Gly Arg Asn Pro Gly Asn Ala Glu Ile Glu Asp Leu
245 250 255
Ile Phe Leu Ala Arg Ser Ala Leu Ile Leu Arg Gly Ser Val Ala His
260 265 270
Lys Ser Cys Leu Pro Ala Cys Val Tyr Gly Leu Ala Val Thr Ser Gly
275 280 285
Tyr Asp Phe Glu Lys Glu Gly Tyr Ser Leu Val Gly Ile Asp Pro Phe
290 295 300
Lys Leu Leu Gln Asn Ser Gln Ile Phe Ser Leu Ile Arg Pro Lys Glu
305 310 315 320
Asn Pro Ala His Lys Ser Gln Leu Val Trp Met Ala Cys His Ser Ala
325 330 335
Ala Phe Glu Asp Leu Arg Val Leu Asn Phe Ile Arg Gly Thr Lys Val
340 345 350
Ile Pro Arg Gly Gln Leu Thr Thr Arg Gly Val Gln Ile Ala Ser Asn
355 360 365
Glu Asn Met Glu Thr Ile Asn Ser Ser Thr Leu Glu Leu Arg Ser Lys
370 375 380
Tyr Trp Ala Ile Arg Thr Arg Ser Gly Gly Asn Thr Ser Gln Gln Arg
385 390 395 400
Ala Ser Ala Gly Gln Ile Ser Val Gln Pro Thr Phe Ser Val Gln Arg
405 410 415
Asn Leu Pro Phe Glu Arg Ala Thr Ile Met Ala Ala Phe Thr Gly Asn
420 425 430
Thr Glu Gly Arg Thr Ser Asp Met Arg Thr Glu Ile Ile Arg Met Met
435 440 445
Glu Asn Ala Lys Ser Glu Asp Val Ser Phe Gln Gly Arg Gly Val Phe
450 455 460
Glu Leu Ser Asp Glu Lys Ala Thr Asn Pro Ile Val Pro Ser Phe Asp
465 470 475 480
Met Ser Asn Glu Gly Ser Tyr Phe Phe Gly Asp Asn Ala Glu Glu Phe
485 490 495
Asp Ser
<210> 57
<211> 1413
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1413)
<400> 57
atg aat cca aat caa aag ata ata gca att gga ttt gca tca ttg ggg
48
Met Asn Pro Asn Gln Lys Ile Ile Ala Ile Gly Phe Ala Ser Leu Gly
1 5 10 15
ata tta atc att aat gtc att ctc cat gta gtc agc att ata gta aca
96
Ile Leu Ile Ile Asn Val Ile Leu His Val Val Ser Ile Ile Val Thr
20 25 30
gta ctg gtc ctc aat aac aat aga aca gat ctg aac tgc aaa ggg acg
144
Val Leu Val Leu Asn Asn Asn Arg Thr Asp Leu Asn Cys Lys Gly Thr
35 40 45
atc ata aga gaa tac aat gaa aca gta aga gta gaa aaa ctt act caa
192
Ile Ile Arg Glu Tyr Asn Glu Thr Val Arg Val Glu Lys Leu Thr Gln
50 55 60
tgg tat aat acc agt aca att aag tac ata gag aga cct tca aat gaa
240
Trp Tyr Asn Thr Ser Thr Ile Lys Tyr Ile Glu Arg Pro Ser Asn Glu
65 70 75 80
tac tac atg aat aac act gaa cca ctt tgt gag gcc caa ggc ttt gca
288
Tyr Tyr Met Asn Asn Thr Glu Pro Leu Cys Glu Ala Gln Gly Phe Ala
85 90 95
cca ttt tcc aaa gat aat gga ata cga att ggg tcg aga ggc cat gtt
336
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Val
100 105 110
ttt gtg ata aga gaa cct ttt gta tca tgt tcg ccc tca gaa tgt aga
384
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ser Glu Cys Arg
115 120 125
acc ttt ttc ctc aca cag ggc tca tta ctc aat gac aaa cat tct aac
432
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
130 135 140
ggc aca ata aag gat cga agt ccg tat agg act ttg atg agt gtc aaa
480
Gly Thr Ile Lys Asp Arg Ser Pro Tyr Arg Thr Leu Met Ser Val Lys
145 150 155 160
ata ggg caa tca cct aat gta tat caa gct agg ttt gaa tcg gtg gca
528
Ile Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ser Val Ala
165 170 175
tgg tca gca aca gca tgc cat gat gga aaa aaa tgg atg aca gtt gga
576
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
180 185 190
gtc aca ggg ccc gac aat caa gca att gca gta gtg aac tat gga ggt
624
Val Thr Gly Pro Asp Asn Gln Ala Ile Ala Val Val Asn Tyr Gly Gly
195 200 205
gtt ccg gtt gat att att aat tca tgg gca ggg gat att tta aga acc
672
Val Pro Val Asp Ile Ile Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
210 215 220
caa gaa tca tca tgc acc tgc att aaa gga gac tgt tat tgg gta atg
720
Gln Glu Ser Ser Cys Thr Cys Ile Lys Gly Asp Cys Tyr Trp Val Met
225 230 235 240
act gat gga ccg gca aat agg caa gct aaa tat agg ata ttc aaa gca
768
Thr Asp Gly Pro Ala Asn Arg Gln Ala Lys Tyr Arg Ile Phe Lys Ala
245 250 255
aaa gat gga aga gta att gga caa act gat ata agt ttc aat ggg gga
816
Lys Asp Gly Arg Val Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
260 265 270
cac ata gag gag tgt tct tgt tac ccc aat gaa ggg aag gtg gaa tgc
864
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Glu Gly Lys Val Glu Cys
275 280 285
ata tgc agg gac aat tgg act gga aca aat aga cca att ctg gta ata
912
Ile Cys Arg Asp Asn Trp Thr Gly Thr Asn Arg Pro Ile Leu Val Ile
290 295 300
tct tct gat cta tcg tac aca gtt gga tat ttg tgt gct ggc att ccc
960
Ser Ser Asp Leu Ser Tyr Thr Val Gly Tyr Leu Cys Ala Gly Ile Pro
305 310 315 320
act gac act cct agg gga gag gat agt caa ttc aca ggc tca tgt aca
1008
Thr Asp Thr Pro Arg Gly Glu Asp Ser Gln Phe Thr Gly Ser Cys Thr
325 330 335
agt cct ttg gga aat aaa gga tac ggt gta aaa ggc ttc ggg ttt cga
1056
Ser Pro Leu Gly Asn Lys Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
340 345 350
caa gga act gac gta tgg gcc gga agg aca att agt agg act tca aga
1104
Gln Gly Thr Asp Val Trp Ala Gly Arg Thr Ile Ser Arg Thr Ser Arg
355 360 365
tca gga ttc gaa ata ata aaa atc agg aat ggt tgg aca cag aac agt
1152
Ser Gly Phe Glu Ile Ile Lys Ile Arg Asn Gly Trp Thr Gln Asn Ser
370 375 380
aag gac caa atc agg agg caa gtg att atc gat gac cca aat tgg tca
1200
Lys Asp Gln Ile Arg Arg Gln Val Ile Ile Asp Asp Pro Asn Trp Ser
385 390 395 400
gga tat agc ggt tct ttc aca ttg ccg gtt gaa ctg aca aaa aag gga
1248
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Thr Lys Lys Gly
405 410 415
tgt ttg gtc ccc tgt ttc tgg gtt gaa atg att aga ggt aaa cct gaa
1296
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
420 425 430
gaa aca aca ata tgg acc tct agc agc tcc att gtg atg tgt gga gta
1344
Glu Thr Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
435 440 445
gat cat aaa att gcc agt tgg tca tgg cac gat gga gct att ctt ccc
1392
Asp His Lys Ile Ala Ser Trp Ser Trp His Asp Gly Ala Ile Leu Pro
450 455 460
ttt gac atc gat aag atg taa
1413
Phe Asp Ile Asp Lys Met
465 470
<210> 58
<211> 470
<212> PRT
<213> Вирус гриппа
<400> 58
Met Asn Pro Asn Gln Lys Ile Ile Ala Ile Gly Phe Ala Ser Leu Gly
1 5 10 15
Ile Leu Ile Ile Asn Val Ile Leu His Val Val Ser Ile Ile Val Thr
20 25 30
Val Leu Val Leu Asn Asn Asn Arg Thr Asp Leu Asn Cys Lys Gly Thr
35 40 45
Ile Ile Arg Glu Tyr Asn Glu Thr Val Arg Val Glu Lys Leu Thr Gln
50 55 60
Trp Tyr Asn Thr Ser Thr Ile Lys Tyr Ile Glu Arg Pro Ser Asn Glu
65 70 75 80
Tyr Tyr Met Asn Asn Thr Glu Pro Leu Cys Glu Ala Gln Gly Phe Ala
85 90 95
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Val
100 105 110
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ser Glu Cys Arg
115 120 125
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
130 135 140
Gly Thr Ile Lys Asp Arg Ser Pro Tyr Arg Thr Leu Met Ser Val Lys
145 150 155 160
Ile Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ser Val Ala
165 170 175
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
180 185 190
Val Thr Gly Pro Asp Asn Gln Ala Ile Ala Val Val Asn Tyr Gly Gly
195 200 205
Val Pro Val Asp Ile Ile Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
210 215 220
Gln Glu Ser Ser Cys Thr Cys Ile Lys Gly Asp Cys Tyr Trp Val Met
225 230 235 240
Thr Asp Gly Pro Ala Asn Arg Gln Ala Lys Tyr Arg Ile Phe Lys Ala
245 250 255
Lys Asp Gly Arg Val Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
260 265 270
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Glu Gly Lys Val Glu Cys
275 280 285
Ile Cys Arg Asp Asn Trp Thr Gly Thr Asn Arg Pro Ile Leu Val Ile
290 295 300
Ser Ser Asp Leu Ser Tyr Thr Val Gly Tyr Leu Cys Ala Gly Ile Pro
305 310 315 320
Thr Asp Thr Pro Arg Gly Glu Asp Ser Gln Phe Thr Gly Ser Cys Thr
325 330 335
Ser Pro Leu Gly Asn Lys Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
340 345 350
Gln Gly Thr Asp Val Trp Ala Gly Arg Thr Ile Ser Arg Thr Ser Arg
355 360 365
Ser Gly Phe Glu Ile Ile Lys Ile Arg Asn Gly Trp Thr Gln Asn Ser
370 375 380
Lys Asp Gln Ile Arg Arg Gln Val Ile Ile Asp Asp Pro Asn Trp Ser
385 390 395 400
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Thr Lys Lys Gly
405 410 415
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
420 425 430
Glu Thr Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
435 440 445
Asp His Lys Ile Ala Ser Trp Ser Trp His Asp Gly Ala Ile Leu Pro
450 455 460
Phe Asp Ile Asp Lys Met
465 470
<210> 59
<211> 981
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(756)
<400> 59
atg agt ctt cta acc gag gtc gaa acg tac gtt ctc tct atc gta cca
48
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Val Pro
1 5 10 15
tca ggc ccc ctc aaa gcc gag atc gcg cag aga ctt gaa gat gtc ttt
96
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
gcg gga aag aac acc gat ctt gag gca ctc atg gaa tgg cta aag aca
144
Ala Gly Lys Asn Thr Asp Leu Glu Ala Leu Met Glu Trp Leu Lys Thr
35 40 45
aga cca atc ctg tca cct ctg act aaa ggg att tta gga ttt gta ttc
192
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
acg ctc acc gtg ccc agt gag cga gga ctg cag cgt aga cgc ttt gtc
240
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
caa aat gcc ctt agt gga aac gga gat cca aac aac atg gac aga gca
288
Gln Asn Ala Leu Ser Gly Asn Gly Asp Pro Asn Asn Met Asp Arg Ala
85 90 95
gta aaa ctg tac agg aag ctt aaa aga gaa ata aca ttc cat ggg gca
336
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
aaa gag gtg gca ctc agc tat tcc act ggt gca cta gcc agc tgc atg
384
Lys Glu Val Ala Leu Ser Tyr Ser Thr Gly Ala Leu Ala Ser Cys Met
115 120 125
gga ctc ata tac aac aga atg gga act gtt aca acc gaa gtg gca ttt
432
Gly Leu Ile Tyr Asn Arg Met Gly Thr Val Thr Thr Glu Val Ala Phe
130 135 140
ggc ctg gta tgc gcc aca tgt gaa cag att gct gat tcc cag cat cga
480
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
tct cac agg cag atg gtg aca aca acc aac cca tta atc aga cat gaa
528
Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
aac aga atg gta tta gcc agt acc acg gct aaa gcc atg gaa cag atg
576
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
gca gga tcg agt gag cag gca gca gag gcc atg gag gtt gct agt agg
624
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Arg
195 200 205
gct agg cag atg gta cag gca atg aga acc att ggg acc cac cct agc
672
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
tcc agt gcc ggt ttg aaa gat gat ctc ctt gaa aat tta cag gcc tac
720
Ser Ser Ala Gly Leu Lys Asp Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
cag aaa cgg atg gga gtg caa atg cag cga ttc aag tgatcctctc
766
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
gtcattgcag caagtatcat tgggatcttg cacttgatat tgtggattct tgatcgtctt
826
ttcttcaaat tcatttatcg tcgccttaaa tacgggttga aaagagggcc ttctacggaa
886
ggagtacctg agtctatgag ggaagaatat cggcaggaac agcagaatgc tgtggatgtt
946
gacgatggtc attttgtcaa catagagctg gagta
981
<210> 60
<211> 252
<212> PRT
<213> Вирус гриппа
<400> 60
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Val Pro
1 5 10 15
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
Ala Gly Lys Asn Thr Asp Leu Glu Ala Leu Met Glu Trp Leu Lys Thr
35 40 45
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
Gln Asn Ala Leu Ser Gly Asn Gly Asp Pro Asn Asn Met Asp Arg Ala
85 90 95
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
Lys Glu Val Ala Leu Ser Tyr Ser Thr Gly Ala Leu Ala Ser Cys Met
115 120 125
Gly Leu Ile Tyr Asn Arg Met Gly Thr Val Thr Thr Glu Val Ala Phe
130 135 140
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Arg
195 200 205
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
Ser Ser Ala Gly Leu Lys Asp Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
<210> 61
<211> 1698
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1698)
<400> 61
atg aag aca acc att att tta ata cta ctg acc cat tgg gcc tac agt
48
Met Lys Thr Thr Ile Ile Leu Ile Leu Leu Thr His Trp Ala Tyr Ser
1 5 10 15
caa aac cca atc agt ggc aat aac aca gcc aca ctg tgt ctg gga cac
96
Gln Asn Pro Ile Ser Gly Asn Asn Thr Ala Thr Leu Cys Leu Gly His
20 25 30
cat gca gta gca aat gga aca ttg gta aaa aca atg agt gat gat caa
144
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Met Ser Asp Asp Gln
35 40 45
att gag gtg aca aat gct aca gaa tta gtt cag agc att tca atg ggg
192
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
50 55 60
aaa ata tgc aac aaa tca tat aga att cta gat gga aga aat tgc aca
240
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
65 70 75 80
tta ata gat gca atg cta gga gac ccc cac tgt gac gcc ttt cag tat
288
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
85 90 95
gag agt tgg gac ctc ttt ata gaa aga agc agc gct ttc agc aat tgc
336
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Ser Ala Phe Ser Asn Cys
100 105 110
tac cca tat gac atc cct gac tat gca tcg ctc cga tcc att gta gca
384
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Ser Leu Arg Ser Ile Val Ala
115 120 125
tcc tca ggg aca gtg gaa ttc aca gca gag gga ttc aca tgg aca ggt
432
Ser Ser Gly Thr Val Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
130 135 140
gta act caa aac gga aga agt gga gcc tgc aaa agg gga tca gcc gat
480
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
145 150 155 160
agt ttc ttt agc cga ctg aat tgg cta aca aaa tct gga agc tct tac
528
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
165 170 175
ccc aca ttg aat gtg aca atg cct aac aat aaa aat ttc gac aag cta
576
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
180 185 190
tac atc tgg ggg att cat cac ccg agc tca aat caa gag cag aca aaa
624
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
195 200 205
ttg tac atc caa gaa tca gga cga gta aca gtc tca aca aaa aga agt
672
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
210 215 220
caa caa aca ata atc cct aac atc gga tct aga ccg ttg gtc aga ggt
720
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
225 230 235 240
caa tca ggc agg ata agc ata tac tgg acc att gta aaa cct gga gat
768
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
245 250 255
atc cta atg ata aac agt aat ggc aac tta gtt gca ccg cgg gga tat
816
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
260 265 270
ttt aaa ttg aac aca ggg aaa agc tct gta atg aga tcc gat gta ccc
864
Phe Lys Leu Asn Thr Gly Lys Ser Ser Val Met Arg Ser Asp Val Pro
275 280 285
ata gac att tgt gtg tct gaa tgt att aca cca aat gga agc atc tcc
912
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
290 295 300
aac gac aag cca ttc caa aat gtg aac aaa gtt aca tat gga aaa tgc
960
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
305 310 315 320
ccc aag tat atc agg caa aac act tta aag ctg gcc act ggg atg agg
1008
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
325 330 335
aat gta cca gaa aag caa acc aga gga atc ttt gga gca ata gcg gga
1056
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
340 345 350
ttc atc gaa aac ggc tgg gaa gga atg gtt gat ggg tgg tat ggg ttc
1104
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
355 360 365
cga tat caa aac tct gaa gga aca ggg caa gct gca gat cta aag agc
1152
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
370 375 380
act caa gca gcc atc gac cag att aat gga aag tta aac aga gtg att
1200
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
385 390 395 400
gaa aga acc aat gag aaa ttc cat caa ata gag aag gaa ttc tca gaa
1248
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
405 410 415
gta gaa gga aga att cag gac ttg gag aaa tat gta gaa gac acc aaa
1296
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
420 425 430
ata gac cta tgg tcc tac aat gca gaa ttg ctg gtg gct cta gaa aat
1344
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
435 440 445
caa cat aca att gac tta aca gat gca gaa atg aat aaa tta ttt gag
1392
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
450 455 460
aag act aga cgc cag tta aga gaa aac gca gaa gac atg gga ggt gga
1440
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
465 470 475 480
tgt ttc aag att tac cac aaa tgt gat aat gca tgc att gaa tca ata
1488
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Glu Ser Ile
485 490 495
aga act ggg aca tat gac cat tac ata tac aaa gat gaa gca tta aac
1536
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Lys Asp Glu Ala Leu Asn
500 505 510
aat cga ttt cag atc aaa ggt gta gag ttg aaa tca ggc tac aaa gat
1584
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
515 520 525
tgg ata ctg tgg att tca ttc gcc ata tca tgc ttc tta att tgc gtt
1632
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
530 535 540
gtt cta ttg ggt ttc att atg tgg gct tgc caa aaa ggc aac atc aga
1680
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile Arg
545 550 555 560
tgc aac att tgc att tga
1698
Cys Asn Ile Cys Ile
565
<210> 62
<211> 565
<212> PRT
<213> Вирус гриппа
<400> 62
Met Lys Thr Thr Ile Ile Leu Ile Leu Leu Thr His Trp Ala Tyr Ser
1 5 10 15
Gln Asn Pro Ile Ser Gly Asn Asn Thr Ala Thr Leu Cys Leu Gly His
20 25 30
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Met Ser Asp Asp Gln
35 40 45
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
50 55 60
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
65 70 75 80
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
85 90 95
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Ser Ala Phe Ser Asn Cys
100 105 110
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Ser Leu Arg Ser Ile Val Ala
115 120 125
Ser Ser Gly Thr Val Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
130 135 140
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
145 150 155 160
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
165 170 175
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
180 185 190
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
195 200 205
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
210 215 220
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
225 230 235 240
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
245 250 255
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
260 265 270
Phe Lys Leu Asn Thr Gly Lys Ser Ser Val Met Arg Ser Asp Val Pro
275 280 285
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
290 295 300
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
305 310 315 320
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
325 330 335
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
340 345 350
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
355 360 365
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
385 390 395 400
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
405 410 415
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
420 425 430
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
435 440 445
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
450 455 460
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
465 470 475 480
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Glu Ser Ile
485 490 495
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Lys Asp Glu Ala Leu Asn
500 505 510
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
515 520 525
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
530 535 540
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile Arg
545 550 555 560
Cys Asn Ile Cys Ile
565
<210> 63
<211> 2280
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2280)
<400> 63
atg gag aga ata aaa gaa ctg aga gat ctg atg tta caa tcc cgc acc
48
Met Glu Arg Ile Lys Glu Leu Arg Asp Leu Met Leu Gln Ser Arg Thr
1 5 10 15
cgc gag ata cta aca aaa act act gtg gac cac atg gcc ata atc aag
96
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
aaa tac aca tca gga aga caa gag aag aac cct gca ctt agg atg aaa
144
Lys Tyr Thr Ser Gly Arg Gln Glu Lys Asn Pro Ala Leu Arg Met Lys
35 40 45
tgg atg atg gca atg aaa tac cca att aca gca gat aag agg ata atg
192
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Met
50 55 60
gag atg att cct gag aga aat gaa cag gga caa acc ctt tgg agc aaa
240
Glu Met Ile Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
acg aac gat gct ggc tca gac cgc gta atg gta tca cct ctg gca gtg
288
Thr Asn Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
aca tgg tgg aat agg aat gga cca aca acg aac aca att cat tat cca
336
Thr Trp Trp Asn Arg Asn Gly Pro Thr Thr Asn Thr Ile His Tyr Pro
100 105 110
aaa gtc tac aaa act tat ttt gaa aag gtt gaa aga ttg aaa cac gga
384
Lys Val Tyr Lys Thr Tyr Phe Glu Lys Val Glu Arg Leu Lys His Gly
115 120 125
acc ttt ggc ccc gtt cat ttt agg aat caa gtc aag ata aga cga aga
432
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
gtt gat gta aac cct ggt cac gcg gac ctc agt gct aaa gaa gca caa
480
Val Asp Val Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
gat gtg atc atg gaa gtt gtt ttc cca aat gaa gtg gga gcc aga att
528
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Arg Ile
165 170 175
cta aca tca gaa tca caa cta aca ata acc aaa gag aaa aag gaa gaa
576
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
ctt cag gac tgc aaa att gct ccc ttg atg gta gca tac atg cta gaa
624
Leu Gln Asp Cys Lys Ile Ala Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
aga gag ttg gtc cga aaa aca agg ttc ctc cca gta gta ggc gga aca
672
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Val Gly Gly Thr
210 215 220
agc agt gta tac att gaa gtg ttg cat ctg act cag gga aca tgc tgg
720
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
gag caa atg tac acc cca gga gga aaa gtt aga aac gat gat att gat
768
Glu Gln Met Tyr Thr Pro Gly Gly Lys Val Arg Asn Asp Asp Ile Asp
245 250 255
caa agt tta att att gca gcc cgg aac ata gtg aga aga gca aca gta
816
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Thr Val
260 265 270
tca gca gat cca cta gca tcc cta ctg gaa atg tgc cac agt aca cag
864
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
att ggt gga aca agg atg gta gac atc ctt aag cag aac cca aca gag
912
Ile Gly Gly Thr Arg Met Val Asp Ile Leu Lys Gln Asn Pro Thr Glu
290 295 300
gaa caa gct gtg gat ata tgc aaa gca gca atg gga ttg aga att agc
960
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
tca tca ttc agc ttt ggt gga ttc acc ttc aaa agg aca agt gga tca
1008
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
tca gtc aag aga gaa gaa gaa atg ctt acg ggc aac ctt caa aca ttg
1056
Ser Val Lys Arg Glu Glu Glu Met Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
aaa ata aga gtg cat gag ggc tat gaa gaa ttc aca atg gtc gga aga
1104
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Arg
355 360 365
aga gca aca gcc att atc aga aag gca acc aga aga ttg att caa ttg
1152
Arg Ala Thr Ala Ile Ile Arg Lys Ala Thr Arg Arg Leu Ile Gln Leu
370 375 380
ata gta agt ggg aga gat gaa caa tca att gct gaa gca ata att gta
1200
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
gcc atg gtg ttt tcg caa gaa gat tgc atg ata aaa gca gtt cga ggc
1248
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
gat ttg aac ttt gtt aat aga gca aat cag cgt ttg aac ccc atg cat
1296
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
caa ctc ttg agg cat ttc caa aaa gat gca aaa gtg ctt ttc caa aat
1344
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn
435 440 445
tgg gga att gaa ccc atc gac aat gta atg ggg atg att gga ata ttg
1392
Trp Gly Ile Glu Pro Ile Asp Asn Val Met Gly Met Ile Gly Ile Leu
450 455 460
cct gac atg acc cca agc acc gag atg tca ttg aga gga gtg aga gtc
1440
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Leu Arg Gly Val Arg Val
465 470 475 480
agc aaa atg gga gtg gat gag tac tcc agc act gag aga gtg gtg gtg
1488
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
agc att gac cgt ttt tta aga gtt cgg gat caa agg gga aac ata cta
1536
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Ile Leu
500 505 510
ctg tcc cct gaa gaa gtc agt gaa aca caa gga acg gaa aag ctg aca
1584
Leu Ser Pro Glu Glu Val Ser Glu Thr Gln Gly Thr Glu Lys Leu Thr
515 520 525
ata att tat tcg tca tca atg atg tgg gag att aat ggt ccc gaa tca
1632
Ile Ile Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
gtg ttg gtc aat act tat caa tgg atc atc aga aac tgg gaa att gta
1680
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Ile Val
545 550 555 560
aaa att cag tgg tca cag gac ccc aca atg tta tac aat aag ata gaa
1728
Lys Ile Gln Trp Ser Gln Asp Pro Thr Met Leu Tyr Asn Lys Ile Glu
565 570 575
ttt gaa cca ttc caa tcc ctg gtc cct agg gcc acc aga agc caa tac
1776
Phe Glu Pro Phe Gln Ser Leu Val Pro Arg Ala Thr Arg Ser Gln Tyr
580 585 590
agc ggt ttc gta aga acc ctg ttt cag caa atg cga gat gta ctt gga
1824
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
aca ttt gat act gct caa ata ata aaa ctc ctc cct ttt gcc gct gct
1872
Thr Phe Asp Thr Ala Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
cct ccg gaa cag agt agg atg cag ttc tct tct ttg act gtt aat gta
1920
Pro Pro Glu Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
aga ggt tcg gga atg agg ata ctt gta aga ggc aat tcc cca gtg ttc
1968
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
aac tac aat aaa gtc act aaa agg ctc aca gtc ctc gga aag gat gca
2016
Asn Tyr Asn Lys Val Thr Lys Arg Leu Thr Val Leu Gly Lys Asp Ala
660 665 670
ggt gcg ctt act gag gac cca gat gaa ggt acg gct gga gta gag tct
2064
Gly Ala Leu Thr Glu Asp Pro Asp Glu Gly Thr Ala Gly Val Glu Ser
675 680 685
gct gtt cta aga ggg ttt ctc att tta ggt aaa gaa aac aag aga tat
2112
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asn Lys Arg Tyr
690 695 700
ggc cca gca cta agc atc aat gaa ctt agc aaa ctt gca aaa ggg gag
2160
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Lys Leu Ala Lys Gly Glu
705 710 715 720
aaa gcc aat gta cta att ggg caa ggg gac gta gtg ttg gta atg aaa
2208
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Val Val Leu Val Met Lys
725 730 735
cgg aaa cgt gac tct agc ata ctt act gac agc cag aca gcg acc aaa
2256
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
agg att cgg atg gcc atc aat tag
2280
Arg Ile Arg Met Ala Ile Asn
755
<210> 64
<211> 759
<212> PRT
<213> Вирус гриппа
<400> 64
Met Glu Arg Ile Lys Glu Leu Arg Asp Leu Met Leu Gln Ser Arg Thr
1 5 10 15
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
Lys Tyr Thr Ser Gly Arg Gln Glu Lys Asn Pro Ala Leu Arg Met Lys
35 40 45
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Met
50 55 60
Glu Met Ile Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
Thr Asn Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
Thr Trp Trp Asn Arg Asn Gly Pro Thr Thr Asn Thr Ile His Tyr Pro
100 105 110
Lys Val Tyr Lys Thr Tyr Phe Glu Lys Val Glu Arg Leu Lys His Gly
115 120 125
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
Val Asp Val Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Arg Ile
165 170 175
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
Leu Gln Asp Cys Lys Ile Ala Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Val Gly Gly Thr
210 215 220
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
Glu Gln Met Tyr Thr Pro Gly Gly Lys Val Arg Asn Asp Asp Ile Asp
245 250 255
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Thr Val
260 265 270
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
Ile Gly Gly Thr Arg Met Val Asp Ile Leu Lys Gln Asn Pro Thr Glu
290 295 300
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
Ser Val Lys Arg Glu Glu Glu Met Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Arg
355 360 365
Arg Ala Thr Ala Ile Ile Arg Lys Ala Thr Arg Arg Leu Ile Gln Leu
370 375 380
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn
435 440 445
Trp Gly Ile Glu Pro Ile Asp Asn Val Met Gly Met Ile Gly Ile Leu
450 455 460
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Leu Arg Gly Val Arg Val
465 470 475 480
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Ile Leu
500 505 510
Leu Ser Pro Glu Glu Val Ser Glu Thr Gln Gly Thr Glu Lys Leu Thr
515 520 525
Ile Ile Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Ile Val
545 550 555 560
Lys Ile Gln Trp Ser Gln Asp Pro Thr Met Leu Tyr Asn Lys Ile Glu
565 570 575
Phe Glu Pro Phe Gln Ser Leu Val Pro Arg Ala Thr Arg Ser Gln Tyr
580 585 590
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
Thr Phe Asp Thr Ala Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
Pro Pro Glu Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
Asn Tyr Asn Lys Val Thr Lys Arg Leu Thr Val Leu Gly Lys Asp Ala
660 665 670
Gly Ala Leu Thr Glu Asp Pro Asp Glu Gly Thr Ala Gly Val Glu Ser
675 680 685
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asn Lys Arg Tyr
690 695 700
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Lys Leu Ala Lys Gly Glu
705 710 715 720
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Val Val Leu Val Met Lys
725 730 735
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
Arg Ile Arg Met Ala Ile Asn
755
<210> 65
<211> 2274
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2274)
<400> 65
atg gat gtc aat ccg act cta ctt ttc tta aag gtg cca gcg caa aat
48
Met Asp Val Asn Pro Thr Leu Leu Phe Leu Lys Val Pro Ala Gln Asn
1 5 10 15
gct ata agc aca aca ttc cct tat act gga gat cct ccc tac agt cat
96
Ala Ile Ser Thr Thr Phe Pro Tyr Thr Gly Asp Pro Pro Tyr Ser His
20 25 30
gga aca ggg aca gga tac acc atg gat act gtc aac aga aca cac caa
144
Gly Thr Gly Thr Gly Tyr Thr Met Asp Thr Val Asn Arg Thr His Gln
35 40 45
tat tca gaa aaa ggg aaa tgg aca aca aac act gag att gga gca cca
192
Tyr Ser Glu Lys Gly Lys Trp Thr Thr Asn Thr Glu Ile Gly Ala Pro
50 55 60
caa ctt aat cca atc gat gga cca ctt cct gaa gac aat gaa cca agt
240
Gln Leu Asn Pro Ile Asp Gly Pro Leu Pro Glu Asp Asn Glu Pro Ser
65 70 75 80
ggg tac gcc caa aca gat tgt gta ttg gaa gca atg gct ttc ctt gaa
288
Gly Tyr Ala Gln Thr Asp Cys Val Leu Glu Ala Met Ala Phe Leu Glu
85 90 95
gaa tcc cat ccc gga atc ttt gaa aat tcg tgt ctt gaa acg atg gag
336
Glu Ser His Pro Gly Ile Phe Glu Asn Ser Cys Leu Glu Thr Met Glu
100 105 110
gtg att cag cag aca aga gtg gac aaa cta aca caa ggc cga caa act
384
Val Ile Gln Gln Thr Arg Val Asp Lys Leu Thr Gln Gly Arg Gln Thr
115 120 125
tat gat tgg acc ttg aat agg aat caa cct gcc gca aca gca ctt gct
432
Tyr Asp Trp Thr Leu Asn Arg Asn Gln Pro Ala Ala Thr Ala Leu Ala
130 135 140
aat acg att gaa gta ttc aga tca aat ggt ctg acc tcc aat gaa tcg
480
Asn Thr Ile Glu Val Phe Arg Ser Asn Gly Leu Thr Ser Asn Glu Ser
145 150 155 160
ggg aga ttg atg gac ttc ctc aaa gat gtc atg gag tcc atg aac aag
528
Gly Arg Leu Met Asp Phe Leu Lys Asp Val Met Glu Ser Met Asn Lys
165 170 175
gag gaa atg gaa ata aca aca cac ttc caa cgg aag aga aga gta aga
576
Glu Glu Met Glu Ile Thr Thr His Phe Gln Arg Lys Arg Arg Val Arg
180 185 190
gac aac atg aca aag aga atg ata aca cag aga acc ata gga aag aaa
624
Asp Asn Met Thr Lys Arg Met Ile Thr Gln Arg Thr Ile Gly Lys Lys
195 200 205
aaa caa cga tta agc aga aag agc tat cta atc aga aca tta acc cta
672
Lys Gln Arg Leu Ser Arg Lys Ser Tyr Leu Ile Arg Thr Leu Thr Leu
210 215 220
aac aca atg acc aag gac gct gag aga ggg aaa ttg aaa cga cga gca
720
Asn Thr Met Thr Lys Asp Ala Glu Arg Gly Lys Leu Lys Arg Arg Ala
225 230 235 240
atc gct acc cca ggg atg cag ata aga gga ttt gta tat ttt gtt gaa
768
Ile Ala Thr Pro Gly Met Gln Ile Arg Gly Phe Val Tyr Phe Val Glu
245 250 255
aca cta gct cga aga ata tgt gaa aag ctt gaa caa tca gga ttg cca
816
Thr Leu Ala Arg Arg Ile Cys Glu Lys Leu Glu Gln Ser Gly Leu Pro
260 265 270
gtt ggc ggt aat gag aaa aag gcc aaa ctg gct aat gtc gtc aga aaa
864
Val Gly Gly Asn Glu Lys Lys Ala Lys Leu Ala Asn Val Val Arg Lys
275 280 285
atg atg act aat tcc caa gac act gaa ctc tcc ttc acc atc act ggg
912
Met Met Thr Asn Ser Gln Asp Thr Glu Leu Ser Phe Thr Ile Thr Gly
290 295 300
gac aat acc aaa tgg aat gaa aat cag aac cca cgc ata ttc ctg gca
960
Asp Asn Thr Lys Trp Asn Glu Asn Gln Asn Pro Arg Ile Phe Leu Ala
305 310 315 320
atg atc aca tac ata act aga gat cag cca gaa tgg ttc aga aat gtt
1008
Met Ile Thr Tyr Ile Thr Arg Asp Gln Pro Glu Trp Phe Arg Asn Val
325 330 335
cta agc att gca ccg att atg ttc tca aat aaa atg gca aga ctg ggg
1056
Leu Ser Ile Ala Pro Ile Met Phe Ser Asn Lys Met Ala Arg Leu Gly
340 345 350
aaa gga tat atg ttt gaa agc aaa agt atg aaa ttg aga act caa ata
1104
Lys Gly Tyr Met Phe Glu Ser Lys Ser Met Lys Leu Arg Thr Gln Ile
355 360 365
cca gca gaa atg cta gca agc att gac cta aaa tat ttc aat gat tca
1152
Pro Ala Glu Met Leu Ala Ser Ile Asp Leu Lys Tyr Phe Asn Asp Ser
370 375 380
aca aaa aag aaa att gaa aag ata cga cca ctc ctg gtt gac ggg act
1200
Thr Lys Lys Lys Ile Glu Lys Ile Arg Pro Leu Leu Val Asp Gly Thr
385 390 395 400
gct tca ctg agt cct ggc atg atg atg gga atg ttc aac atg ttg agc
1248
Ala Ser Leu Ser Pro Gly Met Met Met Gly Met Phe Asn Met Leu Ser
405 410 415
act gtg ctg ggt gta tcc ata tta aac ctg ggc cag agg aaa tat aca
1296
Thr Val Leu Gly Val Ser Ile Leu Asn Leu Gly Gln Arg Lys Tyr Thr
420 425 430
aag acc aca tac tgg tgg gat ggt ctg caa tca tcc gat gac ttt gct
1344
Lys Thr Thr Tyr Trp Trp Asp Gly Leu Gln Ser Ser Asp Asp Phe Ala
435 440 445
ttg ata gtg aat gcg cct aat cat gaa gga ata caa gct gga gta gac
1392
Leu Ile Val Asn Ala Pro Asn His Glu Gly Ile Gln Ala Gly Val Asp
450 455 460
aga ttc tat aga act tgc aaa ctg gtc ggg atc aac atg agc aaa aag
1440
Arg Phe Tyr Arg Thr Cys Lys Leu Val Gly Ile Asn Met Ser Lys Lys
465 470 475 480
aag tcc tac ata aat aga act gga aca ttc gaa ttc aca agc ttt ttc
1488
Lys Ser Tyr Ile Asn Arg Thr Gly Thr Phe Glu Phe Thr Ser Phe Phe
485 490 495
tac cgg tat ggt ttt gta gcc aat ttc agc atg gaa cta ccc agt ttt
1536
Tyr Arg Tyr Gly Phe Val Ala Asn Phe Ser Met Glu Leu Pro Ser Phe
500 505 510
ggg gtt tcc gga ata aat gaa tct gca gac atg agc att gga gtg aca
1584
Gly Val Ser Gly Ile Asn Glu Ser Ala Asp Met Ser Ile Gly Val Thr
515 520 525
gtc atc aaa aac aac atg ata aat aat gat ctc ggt cct gcc acg gca
1632
Val Ile Lys Asn Asn Met Ile Asn Asn Asp Leu Gly Pro Ala Thr Ala
530 535 540
caa atg gca ctc caa ctc ttc att aag gat tat cgg tac aca tac cgg
1680
Gln Met Ala Leu Gln Leu Phe Ile Lys Asp Tyr Arg Tyr Thr Tyr Arg
545 550 555 560
tgc cat aga ggt gat acc cag ata caa acc aga aga tct ttt gag ttg
1728
Cys His Arg Gly Asp Thr Gln Ile Gln Thr Arg Arg Ser Phe Glu Leu
565 570 575
aag aaa ctg tgg gaa cag act cga tca aag act ggt cta ctg gta tca
1776
Lys Lys Leu Trp Glu Gln Thr Arg Ser Lys Thr Gly Leu Leu Val Ser
580 585 590
gat ggg ggt cca aac cta tat aac atc aga aac cta cac atc ccg gaa
1824
Asp Gly Gly Pro Asn Leu Tyr Asn Ile Arg Asn Leu His Ile Pro Glu
595 600 605
gtc tgt tta aaa tgg gag cta atg gat gaa gat tat aag ggg agg cta
1872
Val Cys Leu Lys Trp Glu Leu Met Asp Glu Asp Tyr Lys Gly Arg Leu
610 615 620
tgc aat cca ttg aat cct ttc gtt agt cac aaa gaa att gaa tca gtc
1920
Cys Asn Pro Leu Asn Pro Phe Val Ser His Lys Glu Ile Glu Ser Val
625 630 635 640
aac agt gca gta gta atg cct gct cat ggc cct gcc aaa agc atg gag
1968
Asn Ser Ala Val Val Met Pro Ala His Gly Pro Ala Lys Ser Met Glu
645 650 655
tat gat gct gtt gca aca aca cat tct tgg atc ccc aag agg aac cgg
2016
Tyr Asp Ala Val Ala Thr Thr His Ser Trp Ile Pro Lys Arg Asn Arg
660 665 670
tcc ata ttg aac aca agc caa agg gga ata cta gaa gat gag cag atg
2064
Ser Ile Leu Asn Thr Ser Gln Arg Gly Ile Leu Glu Asp Glu Gln Met
675 680 685
tat cag aaa tgc tgc aac ctg ttt gaa aaa ttc ttc ccc agc agc tca
2112
Tyr Gln Lys Cys Cys Asn Leu Phe Glu Lys Phe Phe Pro Ser Ser Ser
690 695 700
tac aga aga cca gtc gga att tct agt atg gtt gag gcc atg gta tcc
2160
Tyr Arg Arg Pro Val Gly Ile Ser Ser Met Val Glu Ala Met Val Ser
705 710 715 720
agg gcc cgc att gat gca cga att gac ttc gaa tct gga cgg ata aag
2208
Arg Ala Arg Ile Asp Ala Arg Ile Asp Phe Glu Ser Gly Arg Ile Lys
725 730 735
aag gat gag ttc gct gag atc atg aag atc tgt tcc acc att gaa gag
2256
Lys Asp Glu Phe Ala Glu Ile Met Lys Ile Cys Ser Thr Ile Glu Glu
740 745 750
ctc aga cgg caa aaa tag
2274
Leu Arg Arg Gln Lys
755
<210> 66
<211> 757
<212> PRT
<213> Вирус гриппа
<400> 66
Met Asp Val Asn Pro Thr Leu Leu Phe Leu Lys Val Pro Ala Gln Asn
1 5 10 15
Ala Ile Ser Thr Thr Phe Pro Tyr Thr Gly Asp Pro Pro Tyr Ser His
20 25 30
Gly Thr Gly Thr Gly Tyr Thr Met Asp Thr Val Asn Arg Thr His Gln
35 40 45
Tyr Ser Glu Lys Gly Lys Trp Thr Thr Asn Thr Glu Ile Gly Ala Pro
50 55 60
Gln Leu Asn Pro Ile Asp Gly Pro Leu Pro Glu Asp Asn Glu Pro Ser
65 70 75 80
Gly Tyr Ala Gln Thr Asp Cys Val Leu Glu Ala Met Ala Phe Leu Glu
85 90 95
Glu Ser His Pro Gly Ile Phe Glu Asn Ser Cys Leu Glu Thr Met Glu
100 105 110
Val Ile Gln Gln Thr Arg Val Asp Lys Leu Thr Gln Gly Arg Gln Thr
115 120 125
Tyr Asp Trp Thr Leu Asn Arg Asn Gln Pro Ala Ala Thr Ala Leu Ala
130 135 140
Asn Thr Ile Glu Val Phe Arg Ser Asn Gly Leu Thr Ser Asn Glu Ser
145 150 155 160
Gly Arg Leu Met Asp Phe Leu Lys Asp Val Met Glu Ser Met Asn Lys
165 170 175
Glu Glu Met Glu Ile Thr Thr His Phe Gln Arg Lys Arg Arg Val Arg
180 185 190
Asp Asn Met Thr Lys Arg Met Ile Thr Gln Arg Thr Ile Gly Lys Lys
195 200 205
Lys Gln Arg Leu Ser Arg Lys Ser Tyr Leu Ile Arg Thr Leu Thr Leu
210 215 220
Asn Thr Met Thr Lys Asp Ala Glu Arg Gly Lys Leu Lys Arg Arg Ala
225 230 235 240
Ile Ala Thr Pro Gly Met Gln Ile Arg Gly Phe Val Tyr Phe Val Glu
245 250 255
Thr Leu Ala Arg Arg Ile Cys Glu Lys Leu Glu Gln Ser Gly Leu Pro
260 265 270
Val Gly Gly Asn Glu Lys Lys Ala Lys Leu Ala Asn Val Val Arg Lys
275 280 285
Met Met Thr Asn Ser Gln Asp Thr Glu Leu Ser Phe Thr Ile Thr Gly
290 295 300
Asp Asn Thr Lys Trp Asn Glu Asn Gln Asn Pro Arg Ile Phe Leu Ala
305 310 315 320
Met Ile Thr Tyr Ile Thr Arg Asp Gln Pro Glu Trp Phe Arg Asn Val
325 330 335
Leu Ser Ile Ala Pro Ile Met Phe Ser Asn Lys Met Ala Arg Leu Gly
340 345 350
Lys Gly Tyr Met Phe Glu Ser Lys Ser Met Lys Leu Arg Thr Gln Ile
355 360 365
Pro Ala Glu Met Leu Ala Ser Ile Asp Leu Lys Tyr Phe Asn Asp Ser
370 375 380
Thr Lys Lys Lys Ile Glu Lys Ile Arg Pro Leu Leu Val Asp Gly Thr
385 390 395 400
Ala Ser Leu Ser Pro Gly Met Met Met Gly Met Phe Asn Met Leu Ser
405 410 415
Thr Val Leu Gly Val Ser Ile Leu Asn Leu Gly Gln Arg Lys Tyr Thr
420 425 430
Lys Thr Thr Tyr Trp Trp Asp Gly Leu Gln Ser Ser Asp Asp Phe Ala
435 440 445
Leu Ile Val Asn Ala Pro Asn His Glu Gly Ile Gln Ala Gly Val Asp
450 455 460
Arg Phe Tyr Arg Thr Cys Lys Leu Val Gly Ile Asn Met Ser Lys Lys
465 470 475 480
Lys Ser Tyr Ile Asn Arg Thr Gly Thr Phe Glu Phe Thr Ser Phe Phe
485 490 495
Tyr Arg Tyr Gly Phe Val Ala Asn Phe Ser Met Glu Leu Pro Ser Phe
500 505 510
Gly Val Ser Gly Ile Asn Glu Ser Ala Asp Met Ser Ile Gly Val Thr
515 520 525
Val Ile Lys Asn Asn Met Ile Asn Asn Asp Leu Gly Pro Ala Thr Ala
530 535 540
Gln Met Ala Leu Gln Leu Phe Ile Lys Asp Tyr Arg Tyr Thr Tyr Arg
545 550 555 560
Cys His Arg Gly Asp Thr Gln Ile Gln Thr Arg Arg Ser Phe Glu Leu
565 570 575
Lys Lys Leu Trp Glu Gln Thr Arg Ser Lys Thr Gly Leu Leu Val Ser
580 585 590
Asp Gly Gly Pro Asn Leu Tyr Asn Ile Arg Asn Leu His Ile Pro Glu
595 600 605
Val Cys Leu Lys Trp Glu Leu Met Asp Glu Asp Tyr Lys Gly Arg Leu
610 615 620
Cys Asn Pro Leu Asn Pro Phe Val Ser His Lys Glu Ile Glu Ser Val
625 630 635 640
Asn Ser Ala Val Val Met Pro Ala His Gly Pro Ala Lys Ser Met Glu
645 650 655
Tyr Asp Ala Val Ala Thr Thr His Ser Trp Ile Pro Lys Arg Asn Arg
660 665 670
Ser Ile Leu Asn Thr Ser Gln Arg Gly Ile Leu Glu Asp Glu Gln Met
675 680 685
Tyr Gln Lys Cys Cys Asn Leu Phe Glu Lys Phe Phe Pro Ser Ser Ser
690 695 700
Tyr Arg Arg Pro Val Gly Ile Ser Ser Met Val Glu Ala Met Val Ser
705 710 715 720
Arg Ala Arg Ile Asp Ala Arg Ile Asp Phe Glu Ser Gly Arg Ile Lys
725 730 735
Lys Asp Glu Phe Ala Glu Ile Met Lys Ile Cys Ser Thr Ile Glu Glu
740 745 750
Leu Arg Arg Gln Lys
755
<210> 67
<211> 2151
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(2151)
<400> 67
atg gaa gac ttt gtg cga cag tgc ttc aat cca atg atc gtc gag ctt
48
Met Glu Asp Phe Val Arg Gln Cys Phe Asn Pro Met Ile Val Glu Leu
1 5 10 15
gcg gaa aag gca atg aaa gaa tat gga gag aac ccg aaa atc gaa aca
96
Ala Glu Lys Ala Met Lys Glu Tyr Gly Glu Asn Pro Lys Ile Glu Thr
20 25 30
aac aaa ttt gca gca ata tgc act cac ttg gaa gtc tgc ttc atg tac
144
Asn Lys Phe Ala Ala Ile Cys Thr His Leu Glu Val Cys Phe Met Tyr
35 40 45
tcg gat ttc cac ttt ata aat gaa ctg ggt gag tca gtg gtc ata gag
192
Ser Asp Phe His Phe Ile Asn Glu Leu Gly Glu Ser Val Val Ile Glu
50 55 60
tct ggt gac cca aat gct ctt ttg aaa cac aga ttt gaa atc att gag
240
Ser Gly Asp Pro Asn Ala Leu Leu Lys His Arg Phe Glu Ile Ile Glu
65 70 75 80
ggg aga gat cga aca atg gca tgg aca gta gta aac agc atc tgc aac
288
Gly Arg Asp Arg Thr Met Ala Trp Thr Val Val Asn Ser Ile Cys Asn
85 90 95
acc aca aga gct gaa aaa cct aaa ttt ctt cca gat tta tac gac tat
336
Thr Thr Arg Ala Glu Lys Pro Lys Phe Leu Pro Asp Leu Tyr Asp Tyr
100 105 110
aaa gag aac aga ttt gtt gaa att ggt gtg aca agg aga gaa gtt cac
384
Lys Glu Asn Arg Phe Val Glu Ile Gly Val Thr Arg Arg Glu Val His
115 120 125
ata tac tac ctg gag aag gcc aac aaa ata aag tct gag aaa aca cat
432
Ile Tyr Tyr Leu Glu Lys Ala Asn Lys Ile Lys Ser Glu Lys Thr His
130 135 140
atc cac att ttc tca ttt aca gga gaa gaa atg gct aca aaa gcg gac
480
Ile His Ile Phe Ser Phe Thr Gly Glu Glu Met Ala Thr Lys Ala Asp
145 150 155 160
tat act ctt gat gaa gag agt aga gcc agg atc aag acc aga cta ttc
528
Tyr Thr Leu Asp Glu Glu Ser Arg Ala Arg Ile Lys Thr Arg Leu Phe
165 170 175
act ata aga caa gaa atg gcc agt aga ggc ctc tgg gat tcc ttt cgt
576
Thr Ile Arg Gln Glu Met Ala Ser Arg Gly Leu Trp Asp Ser Phe Arg
180 185 190
cag tcc gag aga ggc gaa gag aca att gaa gaa aga ttt gaa atc aca
624
Gln Ser Glu Arg Gly Glu Glu Thr Ile Glu Glu Arg Phe Glu Ile Thr
195 200 205
ggg acg atg cgc aag ctt gcc aat tac agt ctc cca ccg aac ttc tcc
672
Gly Thr Met Arg Lys Leu Ala Asn Tyr Ser Leu Pro Pro Asn Phe Ser
210 215 220
agc ctt gaa aat ttt aga gtc tat ata gat gga ttc gaa ccg aac ggc
720
Ser Leu Glu Asn Phe Arg Val Tyr Ile Asp Gly Phe Glu Pro Asn Gly
225 230 235 240
tgc att gag agt aag ctt tct caa atg tcc aaa gaa gta aat gcc aaa
768
Cys Ile Glu Ser Lys Leu Ser Gln Met Ser Lys Glu Val Asn Ala Lys
245 250 255
ata gaa cca ttt tca aag aca aca ccc cga cca ctc aaa atg cca ggt
816
Ile Glu Pro Phe Ser Lys Thr Thr Pro Arg Pro Leu Lys Met Pro Gly
260 265 270
ggt cca ccc tgc cat cag cga tcc aaa ttc ttg cta atg gat gct ctg
864
Gly Pro Pro Cys His Gln Arg Ser Lys Phe Leu Leu Met Asp Ala Leu
275 280 285
aaa ctg agc att gag gac cca agt cac gag gga gag ggg ata cca cta
912
Lys Leu Ser Ile Glu Asp Pro Ser His Glu Gly Glu Gly Ile Pro Leu
290 295 300
tat gat gca atc aaa tgc atg aaa act ttc ttt gga tgg aaa gag ccc
960
Tyr Asp Ala Ile Lys Cys Met Lys Thr Phe Phe Gly Trp Lys Glu Pro
305 310 315 320
agt att gtt aaa cca cat aaa aag ggt ata aac ccg aac tat ctc caa
1008
Ser Ile Val Lys Pro His Lys Lys Gly Ile Asn Pro Asn Tyr Leu Gln
325 330 335
act tgg aag caa gta tta gaa gaa ata caa gac ctt gag aac gaa gaa
1056
Thr Trp Lys Gln Val Leu Glu Glu Ile Gln Asp Leu Glu Asn Glu Glu
340 345 350
agg acc ccc aag acc aag aat atg aaa aaa aca agc caa ttg aaa tgg
1104
Arg Thr Pro Lys Thr Lys Asn Met Lys Lys Thr Ser Gln Leu Lys Trp
355 360 365
gca cta ggt gaa aat atg gca cca gag aaa gtg gat ttt gag gat tgt
1152
Ala Leu Gly Glu Asn Met Ala Pro Glu Lys Val Asp Phe Glu Asp Cys
370 375 380
aaa gac atc aat gat tta aaa caa tat gac agt gat gag cca gaa gca
1200
Lys Asp Ile Asn Asp Leu Lys Gln Tyr Asp Ser Asp Glu Pro Glu Ala
385 390 395 400
agg tct ctt gca agt tgg att caa agt gag ttc aac aag gct tgt gag
1248
Arg Ser Leu Ala Ser Trp Ile Gln Ser Glu Phe Asn Lys Ala Cys Glu
405 410 415
ctg aca gat tca agc tgg ata gag ctc gat gaa att ggg gag gat gtc
1296
Leu Thr Asp Ser Ser Trp Ile Glu Leu Asp Glu Ile Gly Glu Asp Val
420 425 430
gcc cca ata gaa tac att gcg agc atg agg aga aat tat ttt act gct
1344
Ala Pro Ile Glu Tyr Ile Ala Ser Met Arg Arg Asn Tyr Phe Thr Ala
435 440 445
gag att tcc cat tgt aga gca aca gaa tat ata atg aaa gga gtg tac
1392
Glu Ile Ser His Cys Arg Ala Thr Glu Tyr Ile Met Lys Gly Val Tyr
450 455 460
atc aac act gct cta ctc aat gca tcc tgt gct gcg atg gat gaa ttt
1440
Ile Asn Thr Ala Leu Leu Asn Ala Ser Cys Ala Ala Met Asp Glu Phe
465 470 475 480
caa tta att ccg atg ata agt aaa tgc agg acc aaa gaa ggg aga agg
1488
Gln Leu Ile Pro Met Ile Ser Lys Cys Arg Thr Lys Glu Gly Arg Arg
485 490 495
aaa aca aat tta tat gga ttc ata ata aag gga agg tcc cat tta aga
1536
Lys Thr Asn Leu Tyr Gly Phe Ile Ile Lys Gly Arg Ser His Leu Arg
500 505 510
aat gat act gac gtg gtg aac ttt gta agt atg gaa ttt tct ctc act
1584
Asn Asp Thr Asp Val Val Asn Phe Val Ser Met Glu Phe Ser Leu Thr
515 520 525
gat cca aga ttt gag cca cac aaa tgg gaa aaa tac tgc gtt cta gaa
1632
Asp Pro Arg Phe Glu Pro His Lys Trp Glu Lys Tyr Cys Val Leu Glu
530 535 540
att gga gac atg ctt tta aga act gct gta ggt caa gtg tca aga ccc
1680
Ile Gly Asp Met Leu Leu Arg Thr Ala Val Gly Gln Val Ser Arg Pro
545 550 555 560
atg ttt ttg tat gta agg aca aat gga acc tct aaa att aaa atg aaa
1728
Met Phe Leu Tyr Val Arg Thr Asn Gly Thr Ser Lys Ile Lys Met Lys
565 570 575
tgg gga atg gaa atg agg cgc tgc ctc ctt cag tct ctg caa cag att
1776
Trp Gly Met Glu Met Arg Arg Cys Leu Leu Gln Ser Leu Gln Gln Ile
580 585 590
gaa agc atg atc gaa gct gag tcc tca gtc aaa gaa aag gac atg acc
1824
Glu Ser Met Ile Glu Ala Glu Ser Ser Val Lys Glu Lys Asp Met Thr
595 600 605
aaa gaa ttt ttt gag aac aaa tca gag aca tgg cct ata gga gag tcc
1872
Lys Glu Phe Phe Glu Asn Lys Ser Glu Thr Trp Pro Ile Gly Glu Ser
610 615 620
ccc aaa gga gtg gaa gag ggc tca atc ggg aag gtt tgc agg acc tta
1920
Pro Lys Gly Val Glu Glu Gly Ser Ile Gly Lys Val Cys Arg Thr Leu
625 630 635 640
tta gca aaa tct gtg ttt aac agt tta tat gca tct cca caa ctg gaa
1968
Leu Ala Lys Ser Val Phe Asn Ser Leu Tyr Ala Ser Pro Gln Leu Glu
645 650 655
gga ttt tca gct gaa tct agg aaa tta ctt ctc att gtt cag gct ctt
2016
Gly Phe Ser Ala Glu Ser Arg Lys Leu Leu Leu Ile Val Gln Ala Leu
660 665 670
aga gat gac ctg gaa cct gga acc ttt gat att ggg ggg tta tat gaa
2064
Arg Asp Asp Leu Glu Pro Gly Thr Phe Asp Ile Gly Gly Leu Tyr Glu
675 680 685
tca att gag gag tgc ctg att aat gat ccc tgg gtt ttg ctt aat gca
2112
Ser Ile Glu Glu Cys Leu Ile Asn Asp Pro Trp Val Leu Leu Asn Ala
690 695 700
tct tgg ttc aac tcc ttc ctc aca cat gca ctg aag tag
2151
Ser Trp Phe Asn Ser Phe Leu Thr His Ala Leu Lys
705 710 715
<210> 68
<211> 716
<212> PRT
<213> Вирус гриппа
<400> 68
Met Glu Asp Phe Val Arg Gln Cys Phe Asn Pro Met Ile Val Glu Leu
1 5 10 15
Ala Glu Lys Ala Met Lys Glu Tyr Gly Glu Asn Pro Lys Ile Glu Thr
20 25 30
Asn Lys Phe Ala Ala Ile Cys Thr His Leu Glu Val Cys Phe Met Tyr
35 40 45
Ser Asp Phe His Phe Ile Asn Glu Leu Gly Glu Ser Val Val Ile Glu
50 55 60
Ser Gly Asp Pro Asn Ala Leu Leu Lys His Arg Phe Glu Ile Ile Glu
65 70 75 80
Gly Arg Asp Arg Thr Met Ala Trp Thr Val Val Asn Ser Ile Cys Asn
85 90 95
Thr Thr Arg Ala Glu Lys Pro Lys Phe Leu Pro Asp Leu Tyr Asp Tyr
100 105 110
Lys Glu Asn Arg Phe Val Glu Ile Gly Val Thr Arg Arg Glu Val His
115 120 125
Ile Tyr Tyr Leu Glu Lys Ala Asn Lys Ile Lys Ser Glu Lys Thr His
130 135 140
Ile His Ile Phe Ser Phe Thr Gly Glu Glu Met Ala Thr Lys Ala Asp
145 150 155 160
Tyr Thr Leu Asp Glu Glu Ser Arg Ala Arg Ile Lys Thr Arg Leu Phe
165 170 175
Thr Ile Arg Gln Glu Met Ala Ser Arg Gly Leu Trp Asp Ser Phe Arg
180 185 190
Gln Ser Glu Arg Gly Glu Glu Thr Ile Glu Glu Arg Phe Glu Ile Thr
195 200 205
Gly Thr Met Arg Lys Leu Ala Asn Tyr Ser Leu Pro Pro Asn Phe Ser
210 215 220
Ser Leu Glu Asn Phe Arg Val Tyr Ile Asp Gly Phe Glu Pro Asn Gly
225 230 235 240
Cys Ile Glu Ser Lys Leu Ser Gln Met Ser Lys Glu Val Asn Ala Lys
245 250 255
Ile Glu Pro Phe Ser Lys Thr Thr Pro Arg Pro Leu Lys Met Pro Gly
260 265 270
Gly Pro Pro Cys His Gln Arg Ser Lys Phe Leu Leu Met Asp Ala Leu
275 280 285
Lys Leu Ser Ile Glu Asp Pro Ser His Glu Gly Glu Gly Ile Pro Leu
290 295 300
Tyr Asp Ala Ile Lys Cys Met Lys Thr Phe Phe Gly Trp Lys Glu Pro
305 310 315 320
Ser Ile Val Lys Pro His Lys Lys Gly Ile Asn Pro Asn Tyr Leu Gln
325 330 335
Thr Trp Lys Gln Val Leu Glu Glu Ile Gln Asp Leu Glu Asn Glu Glu
340 345 350
Arg Thr Pro Lys Thr Lys Asn Met Lys Lys Thr Ser Gln Leu Lys Trp
355 360 365
Ala Leu Gly Glu Asn Met Ala Pro Glu Lys Val Asp Phe Glu Asp Cys
370 375 380
Lys Asp Ile Asn Asp Leu Lys Gln Tyr Asp Ser Asp Glu Pro Glu Ala
385 390 395 400
Arg Ser Leu Ala Ser Trp Ile Gln Ser Glu Phe Asn Lys Ala Cys Glu
405 410 415
Leu Thr Asp Ser Ser Trp Ile Glu Leu Asp Glu Ile Gly Glu Asp Val
420 425 430
Ala Pro Ile Glu Tyr Ile Ala Ser Met Arg Arg Asn Tyr Phe Thr Ala
435 440 445
Glu Ile Ser His Cys Arg Ala Thr Glu Tyr Ile Met Lys Gly Val Tyr
450 455 460
Ile Asn Thr Ala Leu Leu Asn Ala Ser Cys Ala Ala Met Asp Glu Phe
465 470 475 480
Gln Leu Ile Pro Met Ile Ser Lys Cys Arg Thr Lys Glu Gly Arg Arg
485 490 495
Lys Thr Asn Leu Tyr Gly Phe Ile Ile Lys Gly Arg Ser His Leu Arg
500 505 510
Asn Asp Thr Asp Val Val Asn Phe Val Ser Met Glu Phe Ser Leu Thr
515 520 525
Asp Pro Arg Phe Glu Pro His Lys Trp Glu Lys Tyr Cys Val Leu Glu
530 535 540
Ile Gly Asp Met Leu Leu Arg Thr Ala Val Gly Gln Val Ser Arg Pro
545 550 555 560
Met Phe Leu Tyr Val Arg Thr Asn Gly Thr Ser Lys Ile Lys Met Lys
565 570 575
Trp Gly Met Glu Met Arg Arg Cys Leu Leu Gln Ser Leu Gln Gln Ile
580 585 590
Glu Ser Met Ile Glu Ala Glu Ser Ser Val Lys Glu Lys Asp Met Thr
595 600 605
Lys Glu Phe Phe Glu Asn Lys Ser Glu Thr Trp Pro Ile Gly Glu Ser
610 615 620
Pro Lys Gly Val Glu Glu Gly Ser Ile Gly Lys Val Cys Arg Thr Leu
625 630 635 640
Leu Ala Lys Ser Val Phe Asn Ser Leu Tyr Ala Ser Pro Gln Leu Glu
645 650 655
Gly Phe Ser Ala Glu Ser Arg Lys Leu Leu Leu Ile Val Gln Ala Leu
660 665 670
Arg Asp Asp Leu Glu Pro Gly Thr Phe Asp Ile Gly Gly Leu Tyr Glu
675 680 685
Ser Ile Glu Glu Cys Leu Ile Asn Asp Pro Trp Val Leu Leu Asn Ala
690 695 700
Ser Trp Phe Asn Ser Phe Leu Thr His Ala Leu Lys
705 710 715
<210> 69
<211> 844
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(690)
<400> 69
atg gat tcc aac act gtg tca agc ttt cag gta gac tgt ttt ctt tgg
48
Met Asp Ser Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
cat gtc cgt aaa cga ttc gca gac caa gaa ctg ggt gat gcc cca ttc
96
His Val Arg Lys Arg Phe Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
ctt gac cgg ctt cgc cga gac cag aag tcc cta agg gga aga ggt agc
144
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
act ctt ggt ctg gac atc gaa aca gcc act cat gca gga aag cag ata
192
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr His Ala Gly Lys Gln Ile
50 55 60
gtg gag cag att ctg gaa aag gaa tca gat gag gca ctt aaa atg acc
240
Val Glu Gln Ile Leu Glu Lys Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
att gcc tct gtt cct gct tca cgc tac tta act gac atg act ctt gat
288
Ile Ala Ser Val Pro Ala Ser Arg Tyr Leu Thr Asp Met Thr Leu Asp
85 90 95
gag atg tca aga gac tgg ttc atg ctc atg ccc aag caa aaa gta aca
336
Glu Met Ser Arg Asp Trp Phe Met Leu Met Pro Lys Gln Lys Val Thr
100 105 110
ggc tcc cta tgt ata aga atg gac cag gca atc atg gat aag aac atc
384
Gly Ser Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
ata ctt aaa gca aac ttt agt gtg att ttc gaa agg ctg gaa aca cta
432
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Glu Arg Leu Glu Thr Leu
130 135 140
ata cta ctt aga gcc ttc acc gaa gaa gga gca gtc gtt ggc gaa att
480
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Val Val Gly Glu Ile
145 150 155 160
tca cca tta cct tct ctt cca gga cat act aat gag gat gtc aaa aat
528
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Asn Glu Asp Val Lys Asn
165 170 175
gca att ggg gtc ctc atc gga gga ctt aaa tgg aat gat aat acg gtt
576
Ala Ile Gly Val Leu Ile Gly Gly Leu Lys Trp Asn Asp Asn Thr Val
180 185 190
aga atc tct gaa act cta cag aga ttc gct tgg aga agc agt cat gaa
624
Arg Ile Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser His Glu
195 200 205
aat ggg aga cct tca ttc cct tca aaa cag aaa cga aaa atg gag aga
672
Asn Gly Arg Pro Ser Phe Pro Ser Lys Gln Lys Arg Lys Met Glu Arg
210 215 220
aca att aag cca gaa att tgaagaaata agatggttga ttgaagaagt
720
Thr Ile Lys Pro Glu Ile
225 230
gcgacataga ttgaaaaata cagaaaatag ttttgaacaa ataacattta tgcaagcctt
780
acaactattg cttgaagtag aacaagagat aagaactttc tcgtttcagc ttatttaatg
840
ataa
844
<210> 70
<211> 230
<212> PRT
<213> Вирус гриппа
<400> 70
Met Asp Ser Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
His Val Arg Lys Arg Phe Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr His Ala Gly Lys Gln Ile
50 55 60
Val Glu Gln Ile Leu Glu Lys Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
Ile Ala Ser Val Pro Ala Ser Arg Tyr Leu Thr Asp Met Thr Leu Asp
85 90 95
Glu Met Ser Arg Asp Trp Phe Met Leu Met Pro Lys Gln Lys Val Thr
100 105 110
Gly Ser Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Glu Arg Leu Glu Thr Leu
130 135 140
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Val Val Gly Glu Ile
145 150 155 160
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Asn Glu Asp Val Lys Asn
165 170 175
Ala Ile Gly Val Leu Ile Gly Gly Leu Lys Trp Asn Asp Asn Thr Val
180 185 190
Arg Ile Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser His Glu
195 200 205
Asn Gly Arg Pro Ser Phe Pro Ser Lys Gln Lys Arg Lys Met Glu Arg
210 215 220
Thr Ile Lys Pro Glu Ile
225 230
<210> 71
<211> 1497
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1497)
<400> 71
atg gcg tct caa ggc acc aaa cga tcc tat gaa cag atg gaa act gat
48
Met Ala Ser Gln Gly Thr Lys Arg Ser Tyr Glu Gln Met Glu Thr Asp
1 5 10 15
ggg gaa cgc cag aat gca act gaa atc aga gca tct gtc gga agg atg
96
Gly Glu Arg Gln Asn Ala Thr Glu Ile Arg Ala Ser Val Gly Arg Met
20 25 30
gtg gga gga atc gga cgg ttt tat gtc cag atg tgt act gag ctt aaa
144
Val Gly Gly Ile Gly Arg Phe Tyr Val Gln Met Cys Thr Glu Leu Lys
35 40 45
cta aac gac cat gaa ggg cgg ctg att cag aac agc ata aca ata gaa
192
Leu Asn Asp His Glu Gly Arg Leu Ile Gln Asn Ser Ile Thr Ile Glu
50 55 60
agg atg gtg ctt tcg gca ttc gac gaa aga aga aac aag tat ctc gag
240
Arg Met Val Leu Ser Ala Phe Asp Glu Arg Arg Asn Lys Tyr Leu Glu
65 70 75 80
gag cat ccc agt gct ggg aaa gac cct aag aaa acg gga ggc ccg ata
288
Glu His Pro Ser Ala Gly Lys Asp Pro Lys Lys Thr Gly Gly Pro Ile
85 90 95
tac aga aga aaa gat ggg aaa tgg atg agg gaa ctc atc ctc cat gat
336
Tyr Arg Arg Lys Asp Gly Lys Trp Met Arg Glu Leu Ile Leu His Asp
100 105 110
aaa gaa gaa atc atg aga atc tgg cgt cag gcc aac aat ggt gaa gac
384
Lys Glu Glu Ile Met Arg Ile Trp Arg Gln Ala Asn Asn Gly Glu Asp
115 120 125
gct act gct ggt ctt act cat atg atg atc tgg cac tcc aat ctc aat
432
Ala Thr Ala Gly Leu Thr His Met Met Ile Trp His Ser Asn Leu Asn
130 135 140
gac acc aca tac caa aga aca agg gct ctt gtt cgg act ggg atg gat
480
Asp Thr Thr Tyr Gln Arg Thr Arg Ala Leu Val Arg Thr Gly Met Asp
145 150 155 160
ccc aga atg tgc tct ctg atg caa ggc tca acc ctc cca cgg aga tct
528
Pro Arg Met Cys Ser Leu Met Gln Gly Ser Thr Leu Pro Arg Arg Ser
165 170 175
gga gcc gct ggt gct gca gta aaa ggc gtt gga aca atg gta atg gaa
576
Gly Ala Ala Gly Ala Ala Val Lys Gly Val Gly Thr Met Val Met Glu
180 185 190
ctc atc aga atg atc aag cgc gga ata aat gat cgg aat ttc tgg aga
624
Leu Ile Arg Met Ile Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg
195 200 205
ggt gaa aat ggt cga aga acc aga att gct tat gaa aga atg tgc aat
672
Gly Glu Asn Gly Arg Arg Thr Arg Ile Ala Tyr Glu Arg Met Cys Asn
210 215 220
atc ctc aaa ggg aaa ttt cag aca gca gca caa cgg gct atg atg gac
720
Ile Leu Lys Gly Lys Phe Gln Thr Ala Ala Gln Arg Ala Met Met Asp
225 230 235 240
cag gtg agg gaa ggc cgc aat cct gga aac gct gag att gag gat ctc
768
Gln Val Arg Glu Gly Arg Asn Pro Gly Asn Ala Glu Ile Glu Asp Leu
245 250 255
att ttc ttg gca cga tca gca ctt att ttg aga gga tca gta gcc cat
816
Ile Phe Leu Ala Arg Ser Ala Leu Ile Leu Arg Gly Ser Val Ala His
260 265 270
aaa tca tgc cta cct gcc tgt gtt tat ggc ctt gca cta acc agt ggg
864
Lys Ser Cys Leu Pro Ala Cys Val Tyr Gly Leu Ala Leu Thr Ser Gly
275 280 285
tat gac ttt gag aag gaa gga tac tct ctg gtt gga att gat cct ttc
912
Tyr Asp Phe Glu Lys Glu Gly Tyr Ser Leu Val Gly Ile Asp Pro Phe
290 295 300
aaa cta ctc cag aac agt caa att ttc agt cta atc aga cca aaa gaa
960
Lys Leu Leu Gln Asn Ser Gln Ile Phe Ser Leu Ile Arg Pro Lys Glu
305 310 315 320
aac cca gca cac aaa agc cag ttg gtg tgg atg gca tgc cat tct gca
1008
Asn Pro Ala His Lys Ser Gln Leu Val Trp Met Ala Cys His Ser Ala
325 330 335
gca ttt gag gat ctg aga gtt tta aat ttc att aga gga acc aaa gta
1056
Ala Phe Glu Asp Leu Arg Val Leu Asn Phe Ile Arg Gly Thr Lys Val
340 345 350
atc cca aga gga cag tta aca acc aga gga gtt caa att gct tca aat
1104
Ile Pro Arg Gly Gln Leu Thr Thr Arg Gly Val Gln Ile Ala Ser Asn
355 360 365
gaa aac atg gag aca ata aat tct agc aca ctt gaa ctg aga agc aaa
1152
Glu Asn Met Glu Thr Ile Asn Ser Ser Thr Leu Glu Leu Arg Ser Lys
370 375 380
tat tgg gca ata agg acc aga agc gga gga aac acc agt caa cag aga
1200
Tyr Trp Ala Ile Arg Thr Arg Ser Gly Gly Asn Thr Ser Gln Gln Arg
385 390 395 400
gca tct gca gga cag ata agt gtg caa cct act ttc tca gta cag aga
1248
Ala Ser Ala Gly Gln Ile Ser Val Gln Pro Thr Phe Ser Val Gln Arg
405 410 415
aat ctt ccc ttt gag aga gca acc att atg gct gca ttc act ggt aac
1296
Asn Leu Pro Phe Glu Arg Ala Thr Ile Met Ala Ala Phe Thr Gly Asn
420 425 430
act gaa gga agg act tcc gac atg aga acg gaa atc ata agg atg atg
1344
Thr Glu Gly Arg Thr Ser Asp Met Arg Thr Glu Ile Ile Arg Met Met
435 440 445
gaa aat gcc aaa tca gaa gat gtg tct ttc cag ggg cgg gga gtc ttc
1392
Glu Asn Ala Lys Ser Glu Asp Val Ser Phe Gln Gly Arg Gly Val Phe
450 455 460
gag ctc tcg gac gaa aag gca acg aac ccg atc gtg cct tcc ttt gac
1440
Glu Leu Ser Asp Glu Lys Ala Thr Asn Pro Ile Val Pro Ser Phe Asp
465 470 475 480
atg agc aat gaa ggg tct tat ttc ttc gga gac aat gct gag gag ttt
1488
Met Ser Asn Glu Gly Ser Tyr Phe Phe Gly Asp Asn Ala Glu Glu Phe
485 490 495
gac agt taa
1497
Asp Ser
<210> 72
<211> 498
<212> PRT
<213> Вирус гриппа
<400> 72
Met Ala Ser Gln Gly Thr Lys Arg Ser Tyr Glu Gln Met Glu Thr Asp
1 5 10 15
Gly Glu Arg Gln Asn Ala Thr Glu Ile Arg Ala Ser Val Gly Arg Met
20 25 30
Val Gly Gly Ile Gly Arg Phe Tyr Val Gln Met Cys Thr Glu Leu Lys
35 40 45
Leu Asn Asp His Glu Gly Arg Leu Ile Gln Asn Ser Ile Thr Ile Glu
50 55 60
Arg Met Val Leu Ser Ala Phe Asp Glu Arg Arg Asn Lys Tyr Leu Glu
65 70 75 80
Glu His Pro Ser Ala Gly Lys Asp Pro Lys Lys Thr Gly Gly Pro Ile
85 90 95
Tyr Arg Arg Lys Asp Gly Lys Trp Met Arg Glu Leu Ile Leu His Asp
100 105 110
Lys Glu Glu Ile Met Arg Ile Trp Arg Gln Ala Asn Asn Gly Glu Asp
115 120 125
Ala Thr Ala Gly Leu Thr His Met Met Ile Trp His Ser Asn Leu Asn
130 135 140
Asp Thr Thr Tyr Gln Arg Thr Arg Ala Leu Val Arg Thr Gly Met Asp
145 150 155 160
Pro Arg Met Cys Ser Leu Met Gln Gly Ser Thr Leu Pro Arg Arg Ser
165 170 175
Gly Ala Ala Gly Ala Ala Val Lys Gly Val Gly Thr Met Val Met Glu
180 185 190
Leu Ile Arg Met Ile Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg
195 200 205
Gly Glu Asn Gly Arg Arg Thr Arg Ile Ala Tyr Glu Arg Met Cys Asn
210 215 220
Ile Leu Lys Gly Lys Phe Gln Thr Ala Ala Gln Arg Ala Met Met Asp
225 230 235 240
Gln Val Arg Glu Gly Arg Asn Pro Gly Asn Ala Glu Ile Glu Asp Leu
245 250 255
Ile Phe Leu Ala Arg Ser Ala Leu Ile Leu Arg Gly Ser Val Ala His
260 265 270
Lys Ser Cys Leu Pro Ala Cys Val Tyr Gly Leu Ala Leu Thr Ser Gly
275 280 285
Tyr Asp Phe Glu Lys Glu Gly Tyr Ser Leu Val Gly Ile Asp Pro Phe
290 295 300
Lys Leu Leu Gln Asn Ser Gln Ile Phe Ser Leu Ile Arg Pro Lys Glu
305 310 315 320
Asn Pro Ala His Lys Ser Gln Leu Val Trp Met Ala Cys His Ser Ala
325 330 335
Ala Phe Glu Asp Leu Arg Val Leu Asn Phe Ile Arg Gly Thr Lys Val
340 345 350
Ile Pro Arg Gly Gln Leu Thr Thr Arg Gly Val Gln Ile Ala Ser Asn
355 360 365
Glu Asn Met Glu Thr Ile Asn Ser Ser Thr Leu Glu Leu Arg Ser Lys
370 375 380
Tyr Trp Ala Ile Arg Thr Arg Ser Gly Gly Asn Thr Ser Gln Gln Arg
385 390 395 400
Ala Ser Ala Gly Gln Ile Ser Val Gln Pro Thr Phe Ser Val Gln Arg
405 410 415
Asn Leu Pro Phe Glu Arg Ala Thr Ile Met Ala Ala Phe Thr Gly Asn
420 425 430
Thr Glu Gly Arg Thr Ser Asp Met Arg Thr Glu Ile Ile Arg Met Met
435 440 445
Glu Asn Ala Lys Ser Glu Asp Val Ser Phe Gln Gly Arg Gly Val Phe
450 455 460
Glu Leu Ser Asp Glu Lys Ala Thr Asn Pro Ile Val Pro Ser Phe Asp
465 470 475 480
Met Ser Asn Glu Gly Ser Tyr Phe Phe Gly Asp Asn Ala Glu Glu Phe
485 490 495
Asp Ser
<210> 73
<211> 1413
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1413)
<400> 73
atg aat cca aat caa aag ata ata gca att gga ttt gca tca ttg ggg
48
Met Asn Pro Asn Gln Lys Ile Ile Ala Ile Gly Phe Ala Ser Leu Gly
1 5 10 15
ata tta atc att aat gtc att ctc cat gta gtc agc att ata gta aca
96
Ile Leu Ile Ile Asn Val Ile Leu His Val Val Ser Ile Ile Val Thr
20 25 30
gta ctg gtc ctc aat aac aat aga aca gat ctg aac tgc aaa ggg acg
144
Val Leu Val Leu Asn Asn Asn Arg Thr Asp Leu Asn Cys Lys Gly Thr
35 40 45
atc ata aga gaa tac aat gaa aca gta aga gta gaa aaa ctt act caa
192
Ile Ile Arg Glu Tyr Asn Glu Thr Val Arg Val Glu Lys Leu Thr Gln
50 55 60
tgg tat aat acc agt aca att aag tac ata gag aga cct tca aat gaa
240
Trp Tyr Asn Thr Ser Thr Ile Lys Tyr Ile Glu Arg Pro Ser Asn Glu
65 70 75 80
tac tac atg aat aac act gaa cca ctt tgt gag gcc caa ggc ttt gca
288
Tyr Tyr Met Asn Asn Thr Glu Pro Leu Cys Glu Ala Gln Gly Phe Ala
85 90 95
cca ttt tcc aaa gat aat gga ata cga att ggg tcg aga ggc cat gtt
336
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Val
100 105 110
ttt gtg ata aga gaa cct ttt gta tca tgt tcg ccc tca gaa tgt aga
384
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ser Glu Cys Arg
115 120 125
acc ttt ttc ctc aca cag ggc tca tta ctc aat gac aaa cat tct aac
432
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
130 135 140
ggc aca ata aag gat cga agt ccg tat agg act ttg atg agt gtc aaa
480
Gly Thr Ile Lys Asp Arg Ser Pro Tyr Arg Thr Leu Met Ser Val Lys
145 150 155 160
ata ggg caa tca cct aat gta tat caa gct agg ttt gaa tcg gtg gca
528
Ile Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ser Val Ala
165 170 175
tgg tca gca aca gca tgc cat gat gga aaa aaa tgg atg aca gtt gga
576
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
180 185 190
gtc aca ggg ccc gac aat caa gca att gca gta gtg aac tat gga ggt
624
Val Thr Gly Pro Asp Asn Gln Ala Ile Ala Val Val Asn Tyr Gly Gly
195 200 205
gtt ccg gtt gat att att aat tca tgg gca ggg gat att tta aga acc
672
Val Pro Val Asp Ile Ile Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
210 215 220
caa gaa tca tca tgc acc tgc att aaa gga gac tgt tat tgg gta atg
720
Gln Glu Ser Ser Cys Thr Cys Ile Lys Gly Asp Cys Tyr Trp Val Met
225 230 235 240
act gat gga ccg gca aat agg caa gct aaa tat agg ata ttc aaa gca
768
Thr Asp Gly Pro Ala Asn Arg Gln Ala Lys Tyr Arg Ile Phe Lys Ala
245 250 255
aaa gat gga aga gta att gga caa act gat ata agt ttc aat ggg gga
816
Lys Asp Gly Arg Val Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
260 265 270
cac ata gag gag tgt tct tgt tac ccc aat gaa ggg aag gtg gaa tgc
864
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Glu Gly Lys Val Glu Cys
275 280 285
ata tgc agg gac aat tgg act gga aca aat aga cca att ctg gta ata
912
Ile Cys Arg Asp Asn Trp Thr Gly Thr Asn Arg Pro Ile Leu Val Ile
290 295 300
tct tct gat cta tcg tac aca gtt gga tat ttg tgt gct ggc att ccc
960
Ser Ser Asp Leu Ser Tyr Thr Val Gly Tyr Leu Cys Ala Gly Ile Pro
305 310 315 320
act gac act cct agg gga gag gat agt caa ttc aca ggc tca tgt aca
1008
Thr Asp Thr Pro Arg Gly Glu Asp Ser Gln Phe Thr Gly Ser Cys Thr
325 330 335
agt cct ttg gga aat aaa gga tac ggt gta aaa ggc ttc ggg ttt cga
1056
Ser Pro Leu Gly Asn Lys Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
340 345 350
caa gga act gac gta tgg gcc gga agg aca att agt agg act tca aga
1104
Gln Gly Thr Asp Val Trp Ala Gly Arg Thr Ile Ser Arg Thr Ser Arg
355 360 365
tca gga ttc gaa ata ata aaa atc agg aat ggt tgg aca cag aac agt
1152
Ser Gly Phe Glu Ile Ile Lys Ile Arg Asn Gly Trp Thr Gln Asn Ser
370 375 380
aag gac caa atc agg agg caa gtg att atc gat gac cca aat tgg tca
1200
Lys Asp Gln Ile Arg Arg Gln Val Ile Ile Asp Asp Pro Asn Trp Ser
385 390 395 400
gga tat agc ggt tct ttc aca ttg ccg gtt gaa ctg aca aaa aag gga
1248
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Thr Lys Lys Gly
405 410 415
tgt ttg gtc ccc tgt ttc tgg gtt gaa atg att aga ggt aaa cct gaa
1296
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
420 425 430
gaa aca aca ata tgg acc tct agc agc tcc att gtg atg tgt gga gta
1344
Glu Thr Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
435 440 445
gat cat aaa att gcc agt tgg tca tgg cac gat gga gct att ctt ccc
1392
Asp His Lys Ile Ala Ser Trp Ser Trp His Asp Gly Ala Ile Leu Pro
450 455 460
ttt gac atc gat aag atg taa
1413
Phe Asp Ile Asp Lys Met
465 470
<210> 74
<211> 470
<212> PRT
<213> Вирус гриппа
<400> 74
Met Asn Pro Asn Gln Lys Ile Ile Ala Ile Gly Phe Ala Ser Leu Gly
1 5 10 15
Ile Leu Ile Ile Asn Val Ile Leu His Val Val Ser Ile Ile Val Thr
20 25 30
Val Leu Val Leu Asn Asn Asn Arg Thr Asp Leu Asn Cys Lys Gly Thr
35 40 45
Ile Ile Arg Glu Tyr Asn Glu Thr Val Arg Val Glu Lys Leu Thr Gln
50 55 60
Trp Tyr Asn Thr Ser Thr Ile Lys Tyr Ile Glu Arg Pro Ser Asn Glu
65 70 75 80
Tyr Tyr Met Asn Asn Thr Glu Pro Leu Cys Glu Ala Gln Gly Phe Ala
85 90 95
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Val
100 105 110
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ser Glu Cys Arg
115 120 125
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
130 135 140
Gly Thr Ile Lys Asp Arg Ser Pro Tyr Arg Thr Leu Met Ser Val Lys
145 150 155 160
Ile Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ser Val Ala
165 170 175
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
180 185 190
Val Thr Gly Pro Asp Asn Gln Ala Ile Ala Val Val Asn Tyr Gly Gly
195 200 205
Val Pro Val Asp Ile Ile Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
210 215 220
Gln Glu Ser Ser Cys Thr Cys Ile Lys Gly Asp Cys Tyr Trp Val Met
225 230 235 240
Thr Asp Gly Pro Ala Asn Arg Gln Ala Lys Tyr Arg Ile Phe Lys Ala
245 250 255
Lys Asp Gly Arg Val Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
260 265 270
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Glu Gly Lys Val Glu Cys
275 280 285
Ile Cys Arg Asp Asn Trp Thr Gly Thr Asn Arg Pro Ile Leu Val Ile
290 295 300
Ser Ser Asp Leu Ser Tyr Thr Val Gly Tyr Leu Cys Ala Gly Ile Pro
305 310 315 320
Thr Asp Thr Pro Arg Gly Glu Asp Ser Gln Phe Thr Gly Ser Cys Thr
325 330 335
Ser Pro Leu Gly Asn Lys Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
340 345 350
Gln Gly Thr Asp Val Trp Ala Gly Arg Thr Ile Ser Arg Thr Ser Arg
355 360 365
Ser Gly Phe Glu Ile Ile Lys Ile Arg Asn Gly Trp Thr Gln Asn Ser
370 375 380
Lys Asp Gln Ile Arg Arg Gln Val Ile Ile Asp Asp Pro Asn Trp Ser
385 390 395 400
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Thr Lys Lys Gly
405 410 415
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
420 425 430
Glu Thr Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
435 440 445
Asp His Lys Ile Ala Ser Trp Ser Trp His Asp Gly Ala Ile Leu Pro
450 455 460
Phe Asp Ile Asp Lys Met
465 470
<210> 75
<211> 981
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(756)
<400> 75
atg agt ctt cta acc gag gtc gaa acg tac gtt ctc tct atc gta cca
48
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Val Pro
1 5 10 15
tca ggc ccc ctc aaa gcc gag atc gcg cag aga ctt gaa gat gtc ttt
96
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
gcg gga aag aac acc gat ctt gag gca ctc atg gaa tgg cta aag aca
144
Ala Gly Lys Asn Thr Asp Leu Glu Ala Leu Met Glu Trp Leu Lys Thr
35 40 45
aga cca atc ctg tca cct ctg act aaa ggg att tta gga ttt gta ttc
192
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
acg ctc acc gtg ccc agt gag cga gga ctg cag cgt aga cgc ttt gtc
240
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
caa aat gcc ctt agt gga aac gga gat cca aac aac atg gac aga gca
288
Gln Asn Ala Leu Ser Gly Asn Gly Asp Pro Asn Asn Met Asp Arg Ala
85 90 95
gta aaa ctg tac agg aag ctt aaa aga gaa ata aca ttc cat ggg gca
336
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
aaa gag gtg gca ctc agc tat tcc act ggt gca cta gcc agc tgc atg
384
Lys Glu Val Ala Leu Ser Tyr Ser Thr Gly Ala Leu Ala Ser Cys Met
115 120 125
gga ctc ata tac aac aga atg gga act gtt aca acc gaa gtg gca ttt
432
Gly Leu Ile Tyr Asn Arg Met Gly Thr Val Thr Thr Glu Val Ala Phe
130 135 140
ggc ctg gta tgc gcc aca tgt gaa cag att gct gat tcc cag cat cga
480
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
tct cac agg cag atg gtg aca aca acc aac cca tta atc aga cat gaa
528
Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
aac aga atg gta tta gcc agt acc acg gct aaa gcc atg gaa cag atg
576
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
gca gga tcg agt gag cag gca gca gag gcc atg gag gtt gct agt agg
624
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Arg
195 200 205
gct agg cag atg gta cag gca atg aga acc att ggg acc cac cct agc
672
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
tcc agt gcc ggt ttg aaa gat gat ctc ctt gaa aat tta cag gcc tac
720
Ser Ser Ala Gly Leu Lys Asp Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
cag aaa cgg atg gga gtg caa atg cag cga ttc aag tgatcctctc
766
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
gtcattgcag caagtatcat tgggatcttg cacttgatat tgtggattct tgatcgtctt
826
ttcttcaaat tcatttatcg tcgccttaaa tacgggttga aaagagggcc ttctacggaa
886
ggagtacctg agtctatgag ggaagaatat cggcaggaac agcagaatgc tgtggatgtt
946
gacgatggtc attttgtcaa catagagctg gagta
981
<210> 76
<211> 252
<212> PRT
<213> Вирус гриппа
<400> 76
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Val Pro
1 5 10 15
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
Ala Gly Lys Asn Thr Asp Leu Glu Ala Leu Met Glu Trp Leu Lys Thr
35 40 45
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
Gln Asn Ala Leu Ser Gly Asn Gly Asp Pro Asn Asn Met Asp Arg Ala
85 90 95
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
Lys Glu Val Ala Leu Ser Tyr Ser Thr Gly Ala Leu Ala Ser Cys Met
115 120 125
Gly Leu Ile Tyr Asn Arg Met Gly Thr Val Thr Thr Glu Val Ala Phe
130 135 140
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Arg
195 200 205
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
Ser Ser Ala Gly Leu Lys Asp Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
<210> 77
<211> 1698
<212> ДНК
<213> Вирус гриппа
<220>
<221> CDS
<222> (1)..(1698)
<400> 77
atg aag aca acc att att tta ata cta ctg acc cat tgg gcc tac agt
48
Met Lys Thr Thr Ile Ile Leu Ile Leu Leu Thr His Trp Ala Tyr Ser
1 5 10 15
caa aac cca atc agt ggc aat aac aca gcc aca ctg tgt ctg gga cac
96
Gln Asn Pro Ile Ser Gly Asn Asn Thr Ala Thr Leu Cys Leu Gly His
20 25 30
cat gca gta gca aat gga aca ttg gta aaa aca atg agt gat gat caa
144
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Met Ser Asp Asp Gln
35 40 45
att gag gtg aca aat gct aca gaa tta gtt cag agc att tca atg ggg
192
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
50 55 60
aaa ata tgc aac aaa tca tat aga att cta gat gga aga aat tgc aca
240
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
65 70 75 80
tta ata gat gca atg cta gga gac ccc cac tgt gac gcc ttt cag tat
288
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
85 90 95
gag agt tgg gac ctc ttt ata gaa aga agc agc gct ttc agc aat tgc
336
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Ser Ala Phe Ser Asn Cys
100 105 110
tac cca tat gac atc cct gac tat gca ccg ctc cga tcc att gta gca
384
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Pro Leu Arg Ser Ile Val Ala
115 120 125
tcc tca ggg aca gtg gaa ttc aca gca gag gga ttc aca tgg aca ggt
432
Ser Ser Gly Thr Val Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
130 135 140
gta act caa aac gga aga agt gga gcc tgc aaa agg gga tca gcc gat
480
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
145 150 155 160
agt ttc ttt agc cga ctg aat tgg cta aca aaa tct gga agc tct tac
528
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
165 170 175
ccc aca ttg aat gtg aca atg cct aac aat aaa aat ttc gac aag cta
576
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
180 185 190
tac atc tgg ggg att cat cac ccg agc tca aat caa gag cag aca aaa
624
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
195 200 205
ttg tac atc caa gaa tca gga cga gta aca gtc tca aca aaa aga agt
672
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
210 215 220
caa caa aca ata atc cct aac atc gga tct aga ccg ttg gtc aga ggt
720
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
225 230 235 240
caa tca ggc agg ata agc ata tac tgg acc att gta aaa cct gga gat
768
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
245 250 255
atc cta atg ata aac agt aat ggc aac tta gtt gca ccg cgg gga tat
816
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
260 265 270
ttt aaa ttg aac aca ggg aaa agc tct gta atg aga tcc gat gta ccc
864
Phe Lys Leu Asn Thr Gly Lys Ser Ser Val Met Arg Ser Asp Val Pro
275 280 285
ata gac att tgt gtg tct gaa tgt att aca cca aat gga agc atc tcc
912
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
290 295 300
aac gac aag cca ttc caa aat gtg aac aaa gtt aca tat gga aaa tgc
960
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
305 310 315 320
ccc aag tat atc agg caa aac act tta aag ctg gcc act ggg atg agg
1008
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
325 330 335
aat gta cca gaa aag caa acc aga gga atc ttt gga gca ata gcg gga
1056
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
340 345 350
ttc atc gaa aac ggc tgg gaa gga atg gtt gat ggg tgg tat ggg ttc
1104
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
355 360 365
cga tat caa aac tct gaa gga aca ggg caa gct gca gat cta aag agc
1152
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
370 375 380
act caa gca gcc atc gac cag att aat gga aag tta aac aga gtg att
1200
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
385 390 395 400
gaa aga acc aat gag aaa ttc cat caa ata gag aag gaa ttc tca gaa
1248
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
405 410 415
gta gaa gga aga att cag gac ttg gag aaa tat gta gaa gac acc aaa
1296
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
420 425 430
ata gac cta tgg tcc tac aat gca gaa ttg ctg gtg gct cta gaa aat
1344
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
435 440 445
caa cat aca att gac tta aca gat gca gaa atg aat aaa tta ttt gag
1392
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
450 455 460
aag act aga cgc cag tta aga gaa aac gca gaa gac atg gga ggt gga
1440
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
465 470 475 480
tgt ttc aag att tac cac aaa tgt gat aat gca tgc att gaa tca ata
1488
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Glu Ser Ile
485 490 495
aga act ggg aca tat gac cat tac ata tac aaa gat gaa gca tta aac
1536
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Lys Asp Glu Ala Leu Asn
500 505 510
aat cga ttt cag atc aaa ggt gta gag ttg aaa tca ggc tac aaa gat
1584
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
515 520 525
tgg ata ctg tgg att tca ttc gcc ata tca tgc ttc tta att tgc gtt
1632
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
530 535 540
gtt cta ttg ggt ttc att atg tgg gct tgc caa aaa ggc aac atc aga
1680
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile Arg
545 550 555 560
tgc aac att tgc att tga
1698
Cys Asn Ile Cys Ile
565
<210> 78
<211> 565
<212> PRT
<213> Вирус гриппа
<400> 78
Met Lys Thr Thr Ile Ile Leu Ile Leu Leu Thr His Trp Ala Tyr Ser
1 5 10 15
Gln Asn Pro Ile Ser Gly Asn Asn Thr Ala Thr Leu Cys Leu Gly His
20 25 30
His Ala Val Ala Asn Gly Thr Leu Val Lys Thr Met Ser Asp Asp Gln
35 40 45
Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ile Ser Met Gly
50 55 60
Lys Ile Cys Asn Lys Ser Tyr Arg Ile Leu Asp Gly Arg Asn Cys Thr
65 70 75 80
Leu Ile Asp Ala Met Leu Gly Asp Pro His Cys Asp Ala Phe Gln Tyr
85 90 95
Glu Ser Trp Asp Leu Phe Ile Glu Arg Ser Ser Ala Phe Ser Asn Cys
100 105 110
Tyr Pro Tyr Asp Ile Pro Asp Tyr Ala Pro Leu Arg Ser Ile Val Ala
115 120 125
Ser Ser Gly Thr Val Glu Phe Thr Ala Glu Gly Phe Thr Trp Thr Gly
130 135 140
Val Thr Gln Asn Gly Arg Ser Gly Ala Cys Lys Arg Gly Ser Ala Asp
145 150 155 160
Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr Lys Ser Gly Ser Ser Tyr
165 170 175
Pro Thr Leu Asn Val Thr Met Pro Asn Asn Lys Asn Phe Asp Lys Leu
180 185 190
Tyr Ile Trp Gly Ile His His Pro Ser Ser Asn Gln Glu Gln Thr Lys
195 200 205
Leu Tyr Ile Gln Glu Ser Gly Arg Val Thr Val Ser Thr Lys Arg Ser
210 215 220
Gln Gln Thr Ile Ile Pro Asn Ile Gly Ser Arg Pro Leu Val Arg Gly
225 230 235 240
Gln Ser Gly Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly Asp
245 250 255
Ile Leu Met Ile Asn Ser Asn Gly Asn Leu Val Ala Pro Arg Gly Tyr
260 265 270
Phe Lys Leu Asn Thr Gly Lys Ser Ser Val Met Arg Ser Asp Val Pro
275 280 285
Ile Asp Ile Cys Val Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile Ser
290 295 300
Asn Asp Lys Pro Phe Gln Asn Val Asn Lys Val Thr Tyr Gly Lys Cys
305 310 315 320
Pro Lys Tyr Ile Arg Gln Asn Thr Leu Lys Leu Ala Thr Gly Met Arg
325 330 335
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
340 345 350
Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
355 360 365
Arg Tyr Gln Asn Ser Glu Gly Thr Gly Gln Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Val Ile
385 390 395 400
Glu Arg Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser Glu
405 410 415
Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys
420 425 430
Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu Asn
435 440 445
Gln His Thr Ile Asp Leu Thr Asp Ala Glu Met Asn Lys Leu Phe Glu
450 455 460
Lys Thr Arg Arg Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Gly Gly
465 470 475 480
Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Glu Ser Ile
485 490 495
Arg Thr Gly Thr Tyr Asp His Tyr Ile Tyr Lys Asp Glu Ala Leu Asn
500 505 510
Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp
515 520 525
Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Ile Cys Val
530 535 540
Val Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile Arg
545 550 555 560
Cys Asn Ile Cys Ile
565
<210> 79
<211> 20
<212> ДНК
<213> Вирус гриппа
<400> 79
tatgcatcgc tccgatccat
20
<210> 80
<211> 21
<212> ДНК
<213> Вирус гриппа
<400> 80
gctccacttc ttccgttttg a
21
<210> 81
<211> 30
<212> ДНК
<213> Вирус гриппа
<400> 81
aattcacagc agagggattc acatggacag
30
<210> 82
<211> 24
<212> ДНК
<213> Influenza Virus
<220>
<221> вариация
<222> (7)..(7)
<223> r = a или g
<400> 82
catggartgg ctaaagacaa gacc
24
<210> 83
<211> 24
<212> ДНК
<213> Вирус гриппа
<220>
<221> вариация
<222> (18)..(18)
<223> k = g или t
<400> 83
agggcatttt ggacaaakcg tcta
24
<210> 84
<211> 18
<212> ДНК
<213> Вирус гриппа
<400> 84
acgctcaccg tgcccagt
18
<210> 85
<211> 28
<212> ДНК
<213> Вирус гриппа
<400> 85
tattcgtctc agggagcaaa agcagggg
28
<210> 86
<211> 42
<212> ДНК
<213> Вирус гриппа
<400> 86
tgtaatacga ctcactatag ggctccactt cttccgtttt ga
42
<210> 87
<211> 30
<212> ДНК
<213> Вирус гриппа
<400> 87
gatcgctctt cagggagcaa aagcaggtag
30
<210> 88
<211> 40
<212> ДНК
<213> Вирус гриппа
<400> 88
tgtaatacga ctcactatag ggcattttgg acaaagcgtc
40
<---
Claims (9)
1. Вирус гриппа собачьих, содержащий полинуклеотид, кодирующий гемагглютинин (НА), содержащий аминокислотную последовательность SEQ ID NO: 33 или SEQ ID NO: 34 или аминокислотную последовательность, имеющую более 95% идентичности аминокислотной последовательности SEQ ID NO: 34 или SEQ ID NO: 34, где указанный белок HA включает серин в положении 82, лейцин в положении 221, треонин в положении 327 и треонин в положении 482 аминокислотной последовательности.
2. Вирус гриппа собачьих, содержащий полинуклеотид, кодирующий гемагглютинин (НА), где указанный полинуклеотид кодирует гемагглютинин (НА), который содержит аминокислотную последовательность SEQ ID NO: 16 или SEQ ID NO: 32 или аминокислотную последовательность, имеющую идентичность аминокислотной последовательности более 95% с SEQ ID NO: 16 или SEQ ID NO: 32.
3. Вирус гриппа собачьих, содержащий полинуклеотид, кодирующий гемагглютинин (НА), где указанный полинуклеотид содержит нуклеотидную последовательность SEQ ID NO: 15 или SEQ ID NO: 31 или нуклеотидную последовательность, имеющую 98% или более идентичность последовательности с SEQ ID NO: 15 или SEQ ID NO: 31.
4. Вирус гриппа собачьих по п. 1, где указанный полинуклеотид кодирует гемагглютинин (НА), содержащий аминокислотную последовательность SEQ ID NO: 34 или аминокислотную последовательность, имеющую идентичность аминокислотной последовательности более 95% с SEQ ID NO: 34, где указанный белок HA включает серин в положении 82, лейцин в положении 221, треонин в положении 327 и треонин в положении 482 аминокислотной последовательности.
5. Вирус гриппа собачьих по п.4, где указанный полинуклеотид кодирует гемагглютинин (НА), который содержит аминокислотную последовательность SEQ ID NO: 32 или аминокислотную последовательность, имеющую идентичность аминокислотной последовательности более 95% с SEQ ID NO: 32.
6. Вирус гриппа собачьих по п.4, где указанный полинуклеотид содержит нуклеотидную последовательность SEQ ID NO: 31 или нуклеотидную последовательность, имеющую 98% или более идентичность последовательности SEQ ID NO: 31.
7. Вирус гриппа собачьих по любому из пп.4-6, где указанный вирус гриппа собачьих представляет собой вирусный вектор.
8. Вакцина против вируса гриппа, который способен инфицировать животное из группы псовых, содержащая в эффективном количестве вирус гриппа собачьих по любому из пп. 1-7.
9. Способ индуцирования иммунного ответа у животного против вируса гриппа, который способен инфицировать животное из группы псовых, где указанный способ включает введение указанному животному эффективного количества вируса гриппа собачьих по любому из пп.1-7.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67344305P | 2005-04-21 | 2005-04-21 | |
US60/673,443 | 2005-04-21 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2011153597A Division RU2711791C2 (ru) | 2005-04-21 | 2011-12-27 | Материалы и методы, используемые для лечения респираторных заболеваний у собак |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2020100038A RU2020100038A (ru) | 2021-07-09 |
RU2811752C2 true RU2811752C2 (ru) | 2024-01-16 |
Family
ID=
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2084524C1 (ru) * | 1994-09-30 | 1997-07-20 | Научно-исследовательский институт экспериментальной медицины РАМН | Штамм а/17/техас/91/1/3 (h1n1) для производства живой гриппозной интраназальной вакцины для взрослых |
AU9715898A (en) * | 1995-04-28 | 1999-03-04 | Protein Sciences Corporation | Improved virus vaccines |
RU97121580A (ru) * | 1995-05-26 | 1999-10-27 | Эм Джи-Пи эм Си, Л.Л.Си. | Способ получения гемагглютининовых поливалентных вакцин против гриппа |
US20020071848A1 (en) * | 1995-04-28 | 2002-06-13 | Gale Eugene Smith | Virus vaccines |
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2084524C1 (ru) * | 1994-09-30 | 1997-07-20 | Научно-исследовательский институт экспериментальной медицины РАМН | Штамм а/17/техас/91/1/3 (h1n1) для производства живой гриппозной интраназальной вакцины для взрослых |
AU9715898A (en) * | 1995-04-28 | 1999-03-04 | Protein Sciences Corporation | Improved virus vaccines |
US20020071848A1 (en) * | 1995-04-28 | 2002-06-13 | Gale Eugene Smith | Virus vaccines |
RU97121580A (ru) * | 1995-05-26 | 1999-10-27 | Эм Джи-Пи эм Си, Л.Л.Си. | Способ получения гемагглютининовых поливалентных вакцин против гриппа |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11160859B2 (en) | Materials and methods for respiratory disease control in canines | |
RU2711791C2 (ru) | Материалы и методы, используемые для лечения респираторных заболеваний у собак | |
EP2407480B1 (en) | Materials for respiratory disease control in canines | |
AU2020264347B2 (en) | Influenza viruses able to infect canids, uses thereof | |
RU2811752C2 (ru) | Материалы и методы, используемые для лечения респираторных заболеваний у собак | |
AU2020233708B2 (en) | Materials and methods for respiratory disease control in canines | |
US11865172B2 (en) | Materials and methods for respiratory disease control in canines | |
RU2802222C2 (ru) | Вирус гриппа, способный инфицировать собачьих, и его применение | |
CRAWFORD et al. | Patent 2606429 Summary |