EA046157B1 - Композиции и способы селективной регуляции экспрессии генов - Google Patents
Композиции и способы селективной регуляции экспрессии генов Download PDFInfo
- Publication number
- EA046157B1 EA046157B1 EA202193162 EA046157B1 EA 046157 B1 EA046157 B1 EA 046157B1 EA 202193162 EA202193162 EA 202193162 EA 046157 B1 EA046157 B1 EA 046157B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- certain embodiments
- seq
- scn1a
- dbd
- etf
- Prior art date
Links
- 238000000034 method Methods 0.000 title description 72
- 239000000203 mixture Substances 0.000 title description 13
- 230000014493 regulation of gene expression Effects 0.000 title 1
- 230000027455 binding Effects 0.000 claims description 304
- 230000014509 gene expression Effects 0.000 claims description 301
- 108090000623 proteins and genes Proteins 0.000 claims description 301
- 210000004027 cell Anatomy 0.000 claims description 272
- 239000002679 microRNA Substances 0.000 claims description 158
- 102000040430 polynucleotide Human genes 0.000 claims description 133
- 108091033319 polynucleotide Proteins 0.000 claims description 133
- 239000002157 polynucleotide Substances 0.000 claims description 133
- 150000007523 nucleic acids Chemical group 0.000 claims description 119
- 230000001105 regulatory effect Effects 0.000 claims description 112
- 210000002569 neuron Anatomy 0.000 claims description 77
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 76
- 102000040945 Transcription factor Human genes 0.000 claims description 63
- 108091023040 Transcription factor Proteins 0.000 claims description 63
- 239000013604 expression vector Substances 0.000 claims description 61
- 239000013598 vector Substances 0.000 claims description 60
- 108700011259 MicroRNAs Proteins 0.000 claims description 51
- 206010010904 Convulsion Diseases 0.000 claims description 43
- 238000011282 treatment Methods 0.000 claims description 40
- 201000007547 Dravet syndrome Diseases 0.000 claims description 38
- 208000036572 Myoclonic epilepsy Diseases 0.000 claims description 37
- 206010073677 Severe myoclonic epilepsy of infancy Diseases 0.000 claims description 37
- 238000004519 manufacturing process Methods 0.000 claims description 37
- 239000013603 viral vector Substances 0.000 claims description 36
- 206010015037 epilepsy Diseases 0.000 claims description 27
- 239000008194 pharmaceutical composition Substances 0.000 claims description 25
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 24
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 19
- 239000013607 AAV vector Substances 0.000 claims description 17
- 241000702421 Dependoparvovirus Species 0.000 claims description 17
- 241000288906 Primates Species 0.000 claims description 16
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 14
- 108060005874 Parvalbumin Proteins 0.000 claims description 12
- 102000001675 Parvalbumin Human genes 0.000 claims description 12
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 11
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 10
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 10
- 239000003814 drug Substances 0.000 claims description 9
- 241000271566 Aves Species 0.000 claims description 7
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 5
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 5
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 5
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 5
- 241000283690 Bos taurus Species 0.000 claims description 5
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 4
- 241000649046 Adeno-associated virus 11 Species 0.000 claims description 4
- 241000649047 Adeno-associated virus 12 Species 0.000 claims description 4
- 241000282465 Canis Species 0.000 claims description 4
- 241000283073 Equus caballus Species 0.000 claims description 3
- 229940126601 medicinal product Drugs 0.000 claims 2
- 239000013644 scAAV2 vector Substances 0.000 claims 1
- 102000004169 proteins and genes Human genes 0.000 description 148
- 235000018102 proteins Nutrition 0.000 description 143
- 239000011701 zinc Substances 0.000 description 136
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 135
- 229910052725 zinc Inorganic materials 0.000 description 135
- 108091070501 miRNA Proteins 0.000 description 109
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 95
- 239000012634 fragment Substances 0.000 description 89
- 230000004568 DNA-binding Effects 0.000 description 81
- 102000003839 Human Proteins Human genes 0.000 description 79
- 108090000144 Human Proteins Proteins 0.000 description 79
- 108700019146 Transgenes Proteins 0.000 description 79
- 101001049697 Homo sapiens Early growth response protein 1 Proteins 0.000 description 73
- 241000282414 Homo sapiens Species 0.000 description 61
- 101000944074 Homo sapiens Cbp/p300-interacting transactivator 4 Proteins 0.000 description 60
- 102100023226 Early growth response protein 1 Human genes 0.000 description 56
- 108091028049 Mir-221 microRNA Proteins 0.000 description 55
- 238000013518 transcription Methods 0.000 description 54
- 230000035897 transcription Effects 0.000 description 54
- 102100033487 Cbp/p300-interacting transactivator 4 Human genes 0.000 description 53
- 201000010099 disease Diseases 0.000 description 53
- 101000896450 Homo sapiens Early growth response protein 3 Proteins 0.000 description 52
- 239000002245 particle Substances 0.000 description 52
- 102000039446 nucleic acids Human genes 0.000 description 51
- 108020004707 nucleic acids Proteins 0.000 description 51
- 230000003612 virological effect Effects 0.000 description 49
- 241000700605 Viruses Species 0.000 description 42
- 208000035475 disorder Diseases 0.000 description 42
- 230000001965 increasing effect Effects 0.000 description 41
- 210000002845 virion Anatomy 0.000 description 41
- 102100021717 Early growth response protein 3 Human genes 0.000 description 40
- 101000944098 Homo sapiens Cbp/p300-interacting transactivator 2 Proteins 0.000 description 40
- 108091070946 miR-128 stem-loop Proteins 0.000 description 40
- 108091061917 miR-221 stem-loop Proteins 0.000 description 39
- 108091063489 miR-221-1 stem-loop Proteins 0.000 description 39
- 108091055391 miR-221-2 stem-loop Proteins 0.000 description 39
- 108091031076 miR-221-3 stem-loop Proteins 0.000 description 39
- 108020005004 Guide RNA Proteins 0.000 description 36
- 239000002773 nucleotide Substances 0.000 description 36
- 125000003729 nucleotide group Chemical group 0.000 description 35
- 239000013612 plasmid Substances 0.000 description 35
- 102100033471 Cbp/p300-interacting transactivator 2 Human genes 0.000 description 34
- 230000006870 function Effects 0.000 description 33
- 108091026890 Coding region Proteins 0.000 description 32
- 101000855520 Homo sapiens Cyclic AMP-responsive element-binding protein 3 Proteins 0.000 description 32
- 102100026398 Cyclic AMP-responsive element-binding protein 3 Human genes 0.000 description 30
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 29
- 230000035772 mutation Effects 0.000 description 29
- 101710149136 Protein Vpr Proteins 0.000 description 28
- 101000895309 Homo sapiens Cyclic AMP-responsive element-binding protein 3-like protein 4 Proteins 0.000 description 27
- 238000013461 design Methods 0.000 description 26
- 208000024891 symptom Diseases 0.000 description 26
- 101710185494 Zinc finger protein Proteins 0.000 description 25
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 25
- 230000003213 activating effect Effects 0.000 description 25
- 210000003169 central nervous system Anatomy 0.000 description 25
- 241000699670 Mus sp. Species 0.000 description 23
- 235000001014 amino acid Nutrition 0.000 description 22
- 238000004806 packaging method and process Methods 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 21
- 230000005847 immunogenicity Effects 0.000 description 21
- 210000001519 tissue Anatomy 0.000 description 21
- 241001465754 Metazoa Species 0.000 description 20
- -1 VP64 Proteins 0.000 description 20
- 210000000349 chromosome Anatomy 0.000 description 20
- 230000002964 excitative effect Effects 0.000 description 20
- 238000001415 gene therapy Methods 0.000 description 20
- 230000004913 activation Effects 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 18
- 230000000694 effects Effects 0.000 description 17
- 108091033409 CRISPR Proteins 0.000 description 16
- 101150022529 Scn1a gene Proteins 0.000 description 16
- 125000000539 amino acid group Chemical group 0.000 description 16
- 150000001413 amino acids Chemical class 0.000 description 16
- 238000002347 injection Methods 0.000 description 16
- 239000007924 injection Substances 0.000 description 16
- 108091080321 miR-222 stem-loop Proteins 0.000 description 16
- 101000631760 Homo sapiens Sodium channel protein type 1 subunit alpha Proteins 0.000 description 15
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 15
- 238000003556 assay Methods 0.000 description 15
- 108020004999 messenger RNA Proteins 0.000 description 15
- 230000009467 reduction Effects 0.000 description 15
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 14
- 108090000565 Capsid Proteins Proteins 0.000 description 14
- 102100023321 Ceruloplasmin Human genes 0.000 description 14
- 238000000185 intracerebroventricular administration Methods 0.000 description 14
- 230000001537 neural effect Effects 0.000 description 14
- 230000001225 therapeutic effect Effects 0.000 description 14
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 13
- 210000000234 capsid Anatomy 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 102100028910 Sodium channel protein type 1 subunit alpha Human genes 0.000 description 12
- 238000001727 in vivo Methods 0.000 description 12
- 230000002829 reductive effect Effects 0.000 description 12
- 241000701161 unidentified adenovirus Species 0.000 description 12
- 241000713666 Lentivirus Species 0.000 description 11
- 108010067390 Viral Proteins Proteins 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 11
- 239000003623 enhancer Substances 0.000 description 11
- 210000001320 hippocampus Anatomy 0.000 description 11
- 208000024827 Alzheimer disease Diseases 0.000 description 10
- 241000282693 Cercopithecidae Species 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- 241000699666 Mus <mouse, genus> Species 0.000 description 9
- 238000010459 TALEN Methods 0.000 description 9
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 9
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 9
- 239000005090 green fluorescent protein Substances 0.000 description 9
- 238000003018 immunoassay Methods 0.000 description 9
- 102000004196 processed proteins & peptides Human genes 0.000 description 9
- 230000010076 replication Effects 0.000 description 9
- 230000001177 retroviral effect Effects 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 241001430294 unidentified retrovirus Species 0.000 description 9
- 238000011510 Elispot assay Methods 0.000 description 8
- 241000124008 Mammalia Species 0.000 description 8
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 8
- 238000011161 development Methods 0.000 description 8
- 230000018109 developmental process Effects 0.000 description 8
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 8
- 201000008186 generalized epilepsy with febrile seizures plus Diseases 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 210000001767 medulla oblongata Anatomy 0.000 description 8
- 230000009437 off-target effect Effects 0.000 description 8
- 230000008685 targeting Effects 0.000 description 8
- 108091006106 transcriptional activators Proteins 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 239000003981 vehicle Substances 0.000 description 8
- 101100337966 Arabidopsis thaliana GSDA gene Proteins 0.000 description 7
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 7
- 101000799048 Homo sapiens Probable inactive tRNA-specific adenosine deaminase-like protein 3 Proteins 0.000 description 7
- 101000799057 Homo sapiens tRNA-specific adenosine deaminase 2 Proteins 0.000 description 7
- 208000012902 Nervous system disease Diseases 0.000 description 7
- 208000018737 Parkinson disease Diseases 0.000 description 7
- 102100034006 Probable inactive tRNA-specific adenosine deaminase-like protein 3 Human genes 0.000 description 7
- 108010052164 Sodium Channels Proteins 0.000 description 7
- 102000018674 Sodium Channels Human genes 0.000 description 7
- 101150016368 TAD1 gene Proteins 0.000 description 7
- 108700009124 Transcription Initiation Site Proteins 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 208000015114 central nervous system disease Diseases 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000000126 in silico method Methods 0.000 description 7
- 208000015181 infectious disease Diseases 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 239000013608 rAAV vector Substances 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 230000004083 survival effect Effects 0.000 description 7
- 102100034045 tRNA-specific adenosine deaminase 2 Human genes 0.000 description 7
- 108010039224 Amidophosphoribosyltransferase Proteins 0.000 description 6
- 208000014644 Brain disease Diseases 0.000 description 6
- 108010053770 Deoxyribonucleases Proteins 0.000 description 6
- 102000016911 Deoxyribonucleases Human genes 0.000 description 6
- 208000032274 Encephalopathy Diseases 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 108020004485 Nonsense Codon Proteins 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 238000011529 RT qPCR Methods 0.000 description 6
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 6
- 210000001222 gaba-ergic neuron Anatomy 0.000 description 6
- 238000010362 genome editing Methods 0.000 description 6
- 102000052687 human CITED4 Human genes 0.000 description 6
- 210000004962 mammalian cell Anatomy 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 241000701447 unidentified baculovirus Species 0.000 description 6
- 241001529453 unidentified herpesvirus Species 0.000 description 6
- 102100035857 Glutamate decarboxylase 2 Human genes 0.000 description 5
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 5
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 101000873786 Homo sapiens Glutamate decarboxylase 2 Proteins 0.000 description 5
- 241000282567 Macaca fascicularis Species 0.000 description 5
- 238000011530 RNeasy Mini Kit Methods 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000000969 carrier Substances 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000001037 epileptic effect Effects 0.000 description 5
- 210000005153 frontal cortex Anatomy 0.000 description 5
- 238000001476 gene delivery Methods 0.000 description 5
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 230000037434 nonsense mutation Effects 0.000 description 5
- 230000001936 parietal effect Effects 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 210000000278 spinal cord Anatomy 0.000 description 5
- 108091006146 Channels Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 230000004543 DNA replication Effects 0.000 description 4
- 102100023227 E3 SUMO-protein ligase EGR2 Human genes 0.000 description 4
- 102100021720 Early growth response protein 4 Human genes 0.000 description 4
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 4
- 102100035902 Glutamate decarboxylase 1 Human genes 0.000 description 4
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 4
- 102100030087 Homeobox protein DLX-1 Human genes 0.000 description 4
- 102100022373 Homeobox protein DLX-5 Human genes 0.000 description 4
- 101001049692 Homo sapiens E3 SUMO-protein ligase EGR2 Proteins 0.000 description 4
- 101000896533 Homo sapiens Early growth response protein 4 Proteins 0.000 description 4
- 101000873546 Homo sapiens Glutamate decarboxylase 1 Proteins 0.000 description 4
- 101000864690 Homo sapiens Homeobox protein DLX-1 Proteins 0.000 description 4
- 101000901627 Homo sapiens Homeobox protein DLX-5 Proteins 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 101150111110 NKX2-1 gene Proteins 0.000 description 4
- 241000282577 Pan troglodytes Species 0.000 description 4
- 241001494479 Pecora Species 0.000 description 4
- 241000282405 Pongo abelii Species 0.000 description 4
- CGNLCCVKSWNSDG-UHFFFAOYSA-N SYBR Green I Chemical compound CN(C)CCCN(CCC)C1=CC(C=C2N(C3=CC=CC=C3S2)C)=C2C=CC=CC2=[N+]1C1=CC=CC=C1 CGNLCCVKSWNSDG-UHFFFAOYSA-N 0.000 description 4
- 239000012190 activator Substances 0.000 description 4
- 101150063416 add gene Proteins 0.000 description 4
- 230000002146 bilateral effect Effects 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 4
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 4
- 210000001947 dentate gyrus Anatomy 0.000 description 4
- 230000005714 functional activity Effects 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 238000007913 intrathecal administration Methods 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 241001515942 marmosets Species 0.000 description 4
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000010172 mouse model Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 208000002320 spinal muscular atrophy Diseases 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 241000272525 Anas platyrhynchos Species 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 3
- 102000008169 Co-Repressor Proteins Human genes 0.000 description 3
- 108010060434 Co-Repressor Proteins Proteins 0.000 description 3
- 241000699800 Cricetinae Species 0.000 description 3
- 208000024658 Epilepsy syndrome Diseases 0.000 description 3
- 208000002877 Epileptic Syndromes Diseases 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 241000282575 Gorilla Species 0.000 description 3
- 241000282560 Macaca mulatta Species 0.000 description 3
- 208000019695 Migraine disease Diseases 0.000 description 3
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 229920002873 Polyethylenimine Polymers 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- 241000282887 Suidae Species 0.000 description 3
- 208000034799 Tauopathies Diseases 0.000 description 3
- 108020005038 Terminator Codon Proteins 0.000 description 3
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000001961 anticonvulsive agent Substances 0.000 description 3
- 210000001130 astrocyte Anatomy 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000036760 body temperature Effects 0.000 description 3
- 210000003855 cell nucleus Anatomy 0.000 description 3
- 230000008045 co-localization Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 239000003344 environmental pollutant Substances 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 230000000971 hippocampal effect Effects 0.000 description 3
- 208000013403 hyperactivity Diseases 0.000 description 3
- 230000002977 hyperthermial effect Effects 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 238000003364 immunohistochemistry Methods 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000000099 in vitro assay Methods 0.000 description 3
- 230000002458 infectious effect Effects 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000004777 loss-of-function mutation Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 206010027599 migraine Diseases 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000004770 neurodegeneration Effects 0.000 description 3
- 230000009871 nonspecific binding Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 231100000719 pollutant Toxicity 0.000 description 3
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 3
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 3
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 108010054624 red fluorescent protein Proteins 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 208000011580 syndromic disease Diseases 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 102100032282 26S proteasome non-ATPase regulatory subunit 14 Human genes 0.000 description 2
- 208000000044 Amnesia Diseases 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 206010003658 Atrial Fibrillation Diseases 0.000 description 2
- 206010003805 Autism Diseases 0.000 description 2
- 102100027878 Bardet-Biedl syndrome 5 protein Human genes 0.000 description 2
- 102100032438 Beta-1,3-galactosyltransferase 1 Human genes 0.000 description 2
- 102100028282 Bile salt export pump Human genes 0.000 description 2
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 2
- 241000714266 Bovine leukemia virus Species 0.000 description 2
- 206010059027 Brugada syndrome Diseases 0.000 description 2
- 101150061077 CERS6 gene Proteins 0.000 description 2
- 101150044789 Cap gene Proteins 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 241000713756 Caprine arthritis encephalitis virus Species 0.000 description 2
- 102100035434 Ceramide synthase 6 Human genes 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 102100029653 Cordon-bleu protein-like 1 Human genes 0.000 description 2
- 102100031061 Cysteine/serine-rich nuclear protein 3 Human genes 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 2
- 101710096438 DNA-binding protein Proteins 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 102100036504 Dehydrogenase/reductase SDR family member 9 Human genes 0.000 description 2
- 206010012559 Developmental delay Diseases 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 102100037985 Dickkopf-related protein 3 Human genes 0.000 description 2
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 102100037237 E3 ubiquitin-protein ligase UBR3 Human genes 0.000 description 2
- 201000008009 Early infantile epileptic encephalopathy Diseases 0.000 description 2
- 206010071545 Early infantile epileptic encephalopathy with burst-suppression Diseases 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 241000713730 Equine infectious anemia virus Species 0.000 description 2
- 102100037789 FAST kinase domain-containing protein 1, mitochondrial Human genes 0.000 description 2
- 241000713800 Feline immunodeficiency virus Species 0.000 description 2
- 102100037010 Fidgetin Human genes 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 102100040004 Gamma-glutamylcyclotransferase Human genes 0.000 description 2
- 208000003098 Ganglion Cysts Diseases 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- 108010008945 General Transcription Factors Proteins 0.000 description 2
- 102000006580 General Transcription Factors Human genes 0.000 description 2
- 101710088083 Glomulin Proteins 0.000 description 2
- 102100023911 Growth factor receptor-bound protein 14 Human genes 0.000 description 2
- 206010019468 Hemiplegia Diseases 0.000 description 2
- 101000590281 Homo sapiens 26S proteasome non-ATPase regulatory subunit 14 Proteins 0.000 description 2
- 101000697666 Homo sapiens Bardet-Biedl syndrome 5 protein Proteins 0.000 description 2
- 101000798380 Homo sapiens Beta-1,3-galactosyltransferase 1 Proteins 0.000 description 2
- 101000939779 Homo sapiens Cordon-bleu protein-like 1 Proteins 0.000 description 2
- 101000922013 Homo sapiens Cysteine/serine-rich nuclear protein 3 Proteins 0.000 description 2
- 101000928746 Homo sapiens Dehydrogenase/reductase SDR family member 9 Proteins 0.000 description 2
- 101000951342 Homo sapiens Dickkopf-related protein 3 Proteins 0.000 description 2
- 101000908391 Homo sapiens Dipeptidyl peptidase 4 Proteins 0.000 description 2
- 101000878541 Homo sapiens FAST kinase domain-containing protein 1, mitochondrial Proteins 0.000 description 2
- 101000878296 Homo sapiens Fidgetin Proteins 0.000 description 2
- 101000886680 Homo sapiens Gamma-glutamylcyclotransferase Proteins 0.000 description 2
- 101000904875 Homo sapiens Growth factor receptor-bound protein 14 Proteins 0.000 description 2
- 101000852596 Homo sapiens Inositol-trisphosphate 3-kinase A Proteins 0.000 description 2
- 101001015064 Homo sapiens Integrin beta-6 Proteins 0.000 description 2
- 101001006875 Homo sapiens Kelch-like protein 23 Proteins 0.000 description 2
- 101001027192 Homo sapiens Kelch-like protein 41 Proteins 0.000 description 2
- 101000711455 Homo sapiens Kinetochore protein Spc25 Proteins 0.000 description 2
- 101000583016 Homo sapiens Myosin-IIIb Proteins 0.000 description 2
- 101000886179 Homo sapiens Polypeptide N-acetylgalactosaminyltransferase 3 Proteins 0.000 description 2
- 101000884614 Homo sapiens Protein CFAP210 Proteins 0.000 description 2
- 101001071164 Homo sapiens Pyridoxal phosphate phosphatase PHOSPHO2 Proteins 0.000 description 2
- 101000668165 Homo sapiens RNA-binding motif, single-stranded-interacting protein 1 Proteins 0.000 description 2
- 101000880310 Homo sapiens SH3 and cysteine-rich domain-containing protein Proteins 0.000 description 2
- 101000701497 Homo sapiens STE20/SPS1-related proline-alanine-rich protein kinase Proteins 0.000 description 2
- 101001126009 Homo sapiens Secretory phospholipase A2 receptor Proteins 0.000 description 2
- 101000684826 Homo sapiens Sodium channel protein type 2 subunit alpha Proteins 0.000 description 2
- 101000684820 Homo sapiens Sodium channel protein type 3 subunit alpha Proteins 0.000 description 2
- 101000694025 Homo sapiens Sodium channel protein type 7 subunit alpha Proteins 0.000 description 2
- 101000654386 Homo sapiens Sodium channel protein type 9 subunit alpha Proteins 0.000 description 2
- 101000595526 Homo sapiens T-box brain protein 1 Proteins 0.000 description 2
- 101000788669 Homo sapiens Zinc finger MYM-type protein 2 Proteins 0.000 description 2
- 101000788739 Homo sapiens Zinc finger MYM-type protein 3 Proteins 0.000 description 2
- 101000788741 Homo sapiens Zinc finger MYM-type protein 4 Proteins 0.000 description 2
- 101001012529 Homo sapiens rRNA N6-adenosine-methyltransferase METTL5 Proteins 0.000 description 2
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 102100027004 Inhibin beta A chain Human genes 0.000 description 2
- 102100036405 Inositol-trisphosphate 3-kinase A Human genes 0.000 description 2
- 102100033011 Integrin beta-6 Human genes 0.000 description 2
- 101150008942 J gene Proteins 0.000 description 2
- 102100027795 Kelch-like protein 23 Human genes 0.000 description 2
- 102100037644 Kelch-like protein 41 Human genes 0.000 description 2
- 108700021430 Kruppel-Like Factor 4 Proteins 0.000 description 2
- 102100022742 Lupus La protein Human genes 0.000 description 2
- 102100025169 Max-binding protein MNT Human genes 0.000 description 2
- 108010093662 Member 11 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 2
- 208000000060 Migraine with aura Diseases 0.000 description 2
- 208000016285 Movement disease Diseases 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 101100058900 Mus musculus Ca12 gene Proteins 0.000 description 2
- 101100041845 Mus musculus Scn1a gene Proteins 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 102100030369 Myosin-IIIb Human genes 0.000 description 2
- 101150011840 NOSTRIN gene Proteins 0.000 description 2
- 102100039030 Nostrin Human genes 0.000 description 2
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 2
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 206010061334 Partial seizures Diseases 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- 101710093976 Plasmid-derived single-stranded DNA-binding protein Proteins 0.000 description 2
- 102100039685 Polypeptide N-acetylgalactosaminyltransferase 3 Human genes 0.000 description 2
- 102100023832 Prolyl endopeptidase FAP Human genes 0.000 description 2
- 108010007568 Protamines Proteins 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 102100038136 Protein CFAP210 Human genes 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- 102100025793 Putative sodium-coupled neutral amino acid transporter 11 Human genes 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 2
- 102100036843 Pyridoxal phosphate phosphatase PHOSPHO2 Human genes 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- 102100039692 RNA-binding motif, single-stranded-interacting protein 1 Human genes 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 102100037646 SH3 and cysteine-rich domain-containing protein Human genes 0.000 description 2
- 108091006931 SLC38A11 Proteins 0.000 description 2
- 108091006265 SLC4A10 Proteins 0.000 description 2
- 102100030491 STE20/SPS1-related proline-alanine-rich protein kinase Human genes 0.000 description 2
- 101150064913 SV2B gene Proteins 0.000 description 2
- 101150112804 SYT17 gene Proteins 0.000 description 2
- 102100029392 Secretory phospholipase A2 receptor Human genes 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- 102100023776 Signal peptidase complex subunit 2 Human genes 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 2
- 101150028062 Slc17a7 gene Proteins 0.000 description 2
- 102100023150 Sodium channel protein type 2 subunit alpha Human genes 0.000 description 2
- 102100023720 Sodium channel protein type 3 subunit alpha Human genes 0.000 description 2
- 102100027190 Sodium channel protein type 7 subunit alpha Human genes 0.000 description 2
- 102100031367 Sodium channel protein type 9 subunit alpha Human genes 0.000 description 2
- 102000006633 Sodium-Bicarbonate Symporters Human genes 0.000 description 2
- 102100036415 Synaptotagmin-17 Human genes 0.000 description 2
- 208000005400 Synovial Cyst Diseases 0.000 description 2
- 102100036083 T-box brain protein 1 Human genes 0.000 description 2
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 2
- 102100025085 Zinc finger MYM-type protein 2 Human genes 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 210000005013 brain tissue Anatomy 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 210000005056 cell body Anatomy 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 230000003081 coactivator Effects 0.000 description 2
- 230000003920 cognitive function Effects 0.000 description 2
- 231100000870 cognitive problem Toxicity 0.000 description 2
- 238000009295 crossflow filtration Methods 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 208000013257 developmental and epileptic encephalopathy Diseases 0.000 description 2
- 229940090124 dipeptidyl peptidase 4 (dpp-4) inhibitors for blood glucose lowering Drugs 0.000 description 2
- 210000005064 dopaminergic neuron Anatomy 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 210000001951 dura mater Anatomy 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 108700004025 env Genes Proteins 0.000 description 2
- 201000002933 epilepsy with generalized tonic-clonic seizures Diseases 0.000 description 2
- 230000017188 evasion or tolerance of host immune response Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 201000007830 familial atrial fibrillation Diseases 0.000 description 2
- 208000014205 familial febrile seizures Diseases 0.000 description 2
- 206010067039 familial hemiplegic migraine Diseases 0.000 description 2
- 238000013230 female C57BL/6J mice Methods 0.000 description 2
- 108700004026 gag Genes Proteins 0.000 description 2
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 208000013069 generalized epilepsy with febrile seizures plus 1 Diseases 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 238000009650 gentamicin protection assay Methods 0.000 description 2
- 238000011194 good manufacturing practice Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 102000056756 human CREB3 Human genes 0.000 description 2
- 210000000688 human artificial chromosome Anatomy 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 108010019691 inhibin beta A subunit Proteins 0.000 description 2
- 210000001926 inhibitory interneuron Anatomy 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 210000001153 interneuron Anatomy 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000011813 knockout mouse model Methods 0.000 description 2
- 230000013016 learning Effects 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000003094 microcapsule Substances 0.000 description 2
- 210000000274 microglia Anatomy 0.000 description 2
- 230000007659 motor function Effects 0.000 description 2
- 210000002161 motor neuron Anatomy 0.000 description 2
- 208000005264 motor neuron disease Diseases 0.000 description 2
- 210000004498 neuroglial cell Anatomy 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 108700004029 pol Genes Proteins 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 201000008752 progressive muscular atrophy Diseases 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 102100029739 rRNA N6-adenosine-methyltransferase METTL5 Human genes 0.000 description 2
- 101150066583 rep gene Proteins 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 239000008174 sterile solution Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 208000028325 tonic-clonic seizure Diseases 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 101150113424 ubr3 gene Proteins 0.000 description 2
- 210000005167 vascular cell Anatomy 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- 102100038028 1-phosphatidylinositol 3-phosphate 5-kinase Human genes 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- 102100033282 ADP-ribosylation factor GTPase-activating protein 2 Human genes 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 102100040799 AN1-type zinc finger protein 3 Human genes 0.000 description 1
- 102100036605 AN1-type zinc finger protein 6 Human genes 0.000 description 1
- 102100022385 Activity-dependent neuroprotector homeobox protein Human genes 0.000 description 1
- 241000300529 Adeno-associated virus 13 Species 0.000 description 1
- 208000006888 Agnosia Diseases 0.000 description 1
- 241001047040 Agnosia Species 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 102000013455 Amyloid beta-Peptides Human genes 0.000 description 1
- 108010090849 Amyloid beta-Peptides Proteins 0.000 description 1
- 244000303258 Annona diversifolia Species 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 206010003062 Apraxia Diseases 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 108010001572 Basic-Leucine Zipper Transcription Factors Proteins 0.000 description 1
- 102000000806 Basic-Leucine Zipper Transcription Factors Human genes 0.000 description 1
- 206010006100 Bradykinesia Diseases 0.000 description 1
- 201000009707 Brugada syndrome 1 Diseases 0.000 description 1
- 208000005079 Brugada syndrome 5 Diseases 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 101710186200 CCAAT/enhancer-binding protein Proteins 0.000 description 1
- 238000010454 CRISPR gRNA design Methods 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101100011365 Caenorhabditis elegans egl-13 gene Proteins 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 101710182302 Cbp/p300-interacting transactivator 2 Proteins 0.000 description 1
- 101710182300 Cbp/p300-interacting transactivator 4 Proteins 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 208000004051 Chronic Traumatic Encephalopathy Diseases 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 1
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 1
- 102100021306 Cyclic AMP-responsive element-binding protein 3-like protein 3 Human genes 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102100023586 DBF4-type zinc finger-containing protein 2 Human genes 0.000 description 1
- 101150026402 DBP gene Proteins 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 238000012287 DNA Binding Assay Methods 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 101100239628 Danio rerio myca gene Proteins 0.000 description 1
- 208000012239 Developmental disease Diseases 0.000 description 1
- 101100321435 Dictyostelium discoideum zfand gene Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101150029662 E1 gene Proteins 0.000 description 1
- 102100035989 E3 SUMO-protein ligase PIAS1 Human genes 0.000 description 1
- 102100030837 E3 SUMO-protein ligase PIAS3 Human genes 0.000 description 1
- 102100030987 E3 SUMO-protein ligase PIAS4 Human genes 0.000 description 1
- 102100025800 E3 SUMO-protein ligase ZBED1 Human genes 0.000 description 1
- 102100034745 E3 ubiquitin-protein ligase HERC2 Human genes 0.000 description 1
- 108050002772 E3 ubiquitin-protein ligase Mdm2 Proteins 0.000 description 1
- 102000012199 E3 ubiquitin-protein ligase Mdm2 Human genes 0.000 description 1
- 102100023078 Early endosome antigen 1 Human genes 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 102100028773 Endonuclease 8-like 3 Human genes 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 208000002091 Febrile Seizures Diseases 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 208000000666 Fowlpox Diseases 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 208000003078 Generalized Epilepsy Diseases 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- 241000699694 Gerbillinae Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 102100022557 Hepatocyte growth factor-regulated tyrosine kinase substrate Human genes 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- 102100032801 Histone-lysine N-methyltransferase SMYD1 Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108700005087 Homeobox Genes Proteins 0.000 description 1
- 101000927511 Homo sapiens ADP-ribosylation factor GTPase-activating protein 2 Proteins 0.000 description 1
- 101000964568 Homo sapiens AN1-type zinc finger protein 3 Proteins 0.000 description 1
- 101000782083 Homo sapiens AN1-type zinc finger protein 6 Proteins 0.000 description 1
- 101000755474 Homo sapiens Activity-dependent neuroprotector homeobox protein Proteins 0.000 description 1
- 101000895303 Homo sapiens Cyclic AMP-responsive element-binding protein 3-like protein 3 Proteins 0.000 description 1
- 101000976560 Homo sapiens DBF4-type zinc finger-containing protein 2 Proteins 0.000 description 1
- 101000927847 Homo sapiens DNA ligase 3 Proteins 0.000 description 1
- 101000583444 Homo sapiens E3 SUMO-protein ligase PIAS3 Proteins 0.000 description 1
- 101000583450 Homo sapiens E3 SUMO-protein ligase PIAS4 Proteins 0.000 description 1
- 101000786317 Homo sapiens E3 SUMO-protein ligase ZBED1 Proteins 0.000 description 1
- 101000872516 Homo sapiens E3 ubiquitin-protein ligase HERC2 Proteins 0.000 description 1
- 101001050162 Homo sapiens Early endosome antigen 1 Proteins 0.000 description 1
- 101001123819 Homo sapiens Endonuclease 8-like 3 Proteins 0.000 description 1
- 101001045469 Homo sapiens Hepatocyte growth factor-regulated tyrosine kinase substrate Proteins 0.000 description 1
- 101000708638 Homo sapiens Histone-lysine N-methyltransferase SMYD1 Proteins 0.000 description 1
- 101000998494 Homo sapiens INO80 complex subunit B Proteins 0.000 description 1
- 101001040800 Homo sapiens Integral membrane protein GPR180 Proteins 0.000 description 1
- 101001139134 Homo sapiens Krueppel-like factor 4 Proteins 0.000 description 1
- 101001139130 Homo sapiens Krueppel-like factor 5 Proteins 0.000 description 1
- 101001005128 Homo sapiens LIM domain kinase 1 Proteins 0.000 description 1
- 101000613958 Homo sapiens Lysine-specific demethylase 2A Proteins 0.000 description 1
- 101000613960 Homo sapiens Lysine-specific histone demethylase 1B Proteins 0.000 description 1
- 101001028659 Homo sapiens MORC family CW-type zinc finger protein 1 Proteins 0.000 description 1
- 101000687968 Homo sapiens Membrane-associated tyrosine- and threonine-specific cdc2-inhibitory kinase Proteins 0.000 description 1
- 101000581507 Homo sapiens Methyl-CpG-binding domain protein 1 Proteins 0.000 description 1
- 101000583839 Homo sapiens Muscleblind-like protein 1 Proteins 0.000 description 1
- 101000708645 Homo sapiens N-lysine methyltransferase SMYD2 Proteins 0.000 description 1
- 101000973618 Homo sapiens NF-kappa-B essential modulator Proteins 0.000 description 1
- 101001024605 Homo sapiens Next to BRCA1 gene 1 protein Proteins 0.000 description 1
- 101001109700 Homo sapiens Nuclear receptor subfamily 4 group A member 1 Proteins 0.000 description 1
- 101001071233 Homo sapiens PHD finger protein 1 Proteins 0.000 description 1
- 101100174573 Homo sapiens PIKFYVE gene Proteins 0.000 description 1
- 101000915562 Homo sapiens Palmitoyltransferase ZDHHC2 Proteins 0.000 description 1
- 101000976669 Homo sapiens Palmitoyltransferase ZDHHC8 Proteins 0.000 description 1
- 101001098517 Homo sapiens Paxillin Proteins 0.000 description 1
- 101001091194 Homo sapiens Peptidyl-prolyl cis-trans isomerase G Proteins 0.000 description 1
- 101001131990 Homo sapiens Peroxidasin homolog Proteins 0.000 description 1
- 101000890327 Homo sapiens Peroxynitrite isomerase THAP4 Proteins 0.000 description 1
- 101001067140 Homo sapiens Porphobilinogen deaminase Proteins 0.000 description 1
- 101001047090 Homo sapiens Potassium voltage-gated channel subfamily H member 2 Proteins 0.000 description 1
- 101000952097 Homo sapiens Probable ATP-dependent RNA helicase DDX59 Proteins 0.000 description 1
- 101001083769 Homo sapiens Probable helicase with zinc finger domain Proteins 0.000 description 1
- 101000611939 Homo sapiens Programmed cell death protein 2 Proteins 0.000 description 1
- 101000721172 Homo sapiens Protein DBF4 homolog A Proteins 0.000 description 1
- 101000721176 Homo sapiens Protein DBF4 homolog B Proteins 0.000 description 1
- 101000984042 Homo sapiens Protein lin-28 homolog A Proteins 0.000 description 1
- 101100078258 Homo sapiens RUNX1T1 gene Proteins 0.000 description 1
- 101000857634 Homo sapiens Receptor-transporting protein 1 Proteins 0.000 description 1
- 101000635777 Homo sapiens Receptor-transporting protein 4 Proteins 0.000 description 1
- 101000742854 Homo sapiens Roquin-1 Proteins 0.000 description 1
- 101000661816 Homo sapiens Suppression of tumorigenicity 18 protein Proteins 0.000 description 1
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 1
- 101000890301 Homo sapiens THAP domain-containing protein 1 Proteins 0.000 description 1
- 101000596543 Homo sapiens THAP domain-containing protein 11 Proteins 0.000 description 1
- 101000658648 Homo sapiens Tetratricopeptide repeat protein 21B Proteins 0.000 description 1
- 101000819074 Homo sapiens Transcription factor GATA-4 Proteins 0.000 description 1
- 101000819088 Homo sapiens Transcription factor GATA-6 Proteins 0.000 description 1
- 101000845264 Homo sapiens Transcription termination factor 2 Proteins 0.000 description 1
- 101000791652 Homo sapiens YY1-associated factor 2 Proteins 0.000 description 1
- 101000786321 Homo sapiens Zinc finger BED domain-containing protein 4 Proteins 0.000 description 1
- 101000786335 Homo sapiens Zinc finger BED domain-containing protein 6 Proteins 0.000 description 1
- 101000788823 Homo sapiens Zinc finger CW-type PWWP domain protein 1 Proteins 0.000 description 1
- 101000785626 Homo sapiens Zinc finger E-box-binding homeobox 1 Proteins 0.000 description 1
- 101000915578 Homo sapiens Zinc finger HIT domain-containing protein 3 Proteins 0.000 description 1
- 101000802348 Homo sapiens Zinc finger SWIM domain-containing protein 5 Proteins 0.000 description 1
- 101000802350 Homo sapiens Zinc finger SWIM domain-containing protein 6 Proteins 0.000 description 1
- 101000723887 Homo sapiens Zinc finger matrin-type protein 1 Proteins 0.000 description 1
- 101000723893 Homo sapiens Zinc finger matrin-type protein 3 Proteins 0.000 description 1
- 101000915491 Homo sapiens Zinc finger matrin-type protein 5 Proteins 0.000 description 1
- 101000744882 Homo sapiens Zinc finger protein 185 Proteins 0.000 description 1
- 101000785710 Homo sapiens Zinc finger protein 281 Proteins 0.000 description 1
- 101000760284 Homo sapiens Zinc finger protein 32 Proteins 0.000 description 1
- 101000782294 Homo sapiens Zinc finger protein 638 Proteins 0.000 description 1
- 101000760275 Homo sapiens Zinc finger protein 746 Proteins 0.000 description 1
- 101000802329 Homo sapiens Zinc finger protein 750 Proteins 0.000 description 1
- 101000857270 Homo sapiens Zinc finger protein GLIS1 Proteins 0.000 description 1
- 101000857276 Homo sapiens Zinc finger protein GLIS3 Proteins 0.000 description 1
- 101000633054 Homo sapiens Zinc finger protein SNAI2 Proteins 0.000 description 1
- 101000788690 Homo sapiens Zinc fingers and homeoboxes protein 1 Proteins 0.000 description 1
- 101000744862 Homo sapiens Zygote arrest protein 1 Proteins 0.000 description 1
- 101000795753 Homo sapiens mRNA decay activator protein ZFP36 Proteins 0.000 description 1
- 101000802094 Homo sapiens mRNA decay activator protein ZFP36L1 Proteins 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 206010020843 Hyperthermia Diseases 0.000 description 1
- 208000006083 Hypokinesia Diseases 0.000 description 1
- 108010044240 IFIH1 Interferon-Induced Helicase Proteins 0.000 description 1
- 102100033278 INO80 complex subunit B Human genes 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000003781 Inhibitor of growth protein 1 Human genes 0.000 description 1
- 108090000191 Inhibitor of growth protein 1 Proteins 0.000 description 1
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 1
- 102100027353 Interferon-induced helicase C domain-containing protein 1 Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- ZSBXGIUJOOQZMP-UHFFFAOYSA-N Isomatrine Natural products C1CCC2CN3C(=O)CCCC3C3C2N1CCC3 ZSBXGIUJOOQZMP-UHFFFAOYSA-N 0.000 description 1
- 102100020677 Krueppel-like factor 4 Human genes 0.000 description 1
- 102100020680 Krueppel-like factor 5 Human genes 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 102100026023 LIM domain kinase 1 Human genes 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 102100030657 Lethal(3)malignant brain tumor-like protein 1 Human genes 0.000 description 1
- 101710173086 Lethal(3)malignant brain tumor-like protein 1 Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102100033284 Leucine-rich repeats and immunoglobulin-like domains protein 3 Human genes 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100040598 Lysine-specific demethylase 2A Human genes 0.000 description 1
- 102100040596 Lysine-specific histone demethylase 1B Human genes 0.000 description 1
- 102100037200 MORC family CW-type zinc finger protein 1 Human genes 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241000282561 Macaca nemestrina Species 0.000 description 1
- 102100030417 Matrilysin Human genes 0.000 description 1
- 108090000855 Matrilysin Proteins 0.000 description 1
- NLSTZAFFNDSJGQ-UHFFFAOYSA-N Matrin Natural products O=C1CCCN2CC3CCNC4CCCC(C34)C12 NLSTZAFFNDSJGQ-UHFFFAOYSA-N 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 102100024262 Membrane-associated tyrosine- and threonine-specific cdc2-inhibitory kinase Human genes 0.000 description 1
- 208000026139 Memory disease Diseases 0.000 description 1
- 102100027383 Methyl-CpG-binding domain protein 1 Human genes 0.000 description 1
- 208000019022 Mood disease Diseases 0.000 description 1
- 101001049696 Mus musculus Early growth response protein 1 Proteins 0.000 description 1
- 101100476480 Mus musculus S100a8 gene Proteins 0.000 description 1
- 102100030965 Muscleblind-like protein 1 Human genes 0.000 description 1
- 102100031623 Myelin transcription factor 1-like protein Human genes 0.000 description 1
- 101150059596 Myt1l gene Proteins 0.000 description 1
- 102100032806 N-lysine methyltransferase SMYD2 Human genes 0.000 description 1
- 102100022219 NF-kappa-B essential modulator Human genes 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 102100037001 Next to BRCA1 gene 1 protein Human genes 0.000 description 1
- 241000714209 Norwalk virus Species 0.000 description 1
- 102100022679 Nuclear receptor subfamily 4 group A member 1 Human genes 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 208000021384 Obsessive-Compulsive disease Diseases 0.000 description 1
- 241000702244 Orthoreovirus Species 0.000 description 1
- RQTDRJMAUKHGHV-UHFFFAOYSA-N P.P.I Chemical compound P.P.I RQTDRJMAUKHGHV-UHFFFAOYSA-N 0.000 description 1
- 102100036879 PHD finger protein 1 Human genes 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102100035593 POU domain, class 2, transcription factor 1 Human genes 0.000 description 1
- 101710084414 POU domain, class 2, transcription factor 1 Proteins 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 102100028614 Palmitoyltransferase ZDHHC2 Human genes 0.000 description 1
- 102100023491 Palmitoyltransferase ZDHHC8 Human genes 0.000 description 1
- 102100023498 Palmitoyltransferase ZDHHC9 Human genes 0.000 description 1
- 208000027089 Parkinsonian disease Diseases 0.000 description 1
- 206010034010 Parkinsonism Diseases 0.000 description 1
- 102100034850 Peptidyl-prolyl cis-trans isomerase G Human genes 0.000 description 1
- 102100034601 Peroxidasin homolog Human genes 0.000 description 1
- 102100040041 Peroxynitrite isomerase THAP4 Human genes 0.000 description 1
- CXOFVDLJLONNDW-UHFFFAOYSA-N Phenytoin Chemical compound N1C(=O)NC(=O)C1(C=1C=CC=CC=1)C1=CC=CC=C1 CXOFVDLJLONNDW-UHFFFAOYSA-N 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 108010064218 Poly (ADP-Ribose) Polymerase-1 Proteins 0.000 description 1
- 102100023712 Poly [ADP-ribose] polymerase 1 Human genes 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 1
- 208000032319 Primary lateral sclerosis Diseases 0.000 description 1
- 102100037436 Probable ATP-dependent RNA helicase DDX59 Human genes 0.000 description 1
- 102100031018 Probable helicase with zinc finger domain Human genes 0.000 description 1
- 102100040676 Programmed cell death protein 2 Human genes 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 102100024952 Protein CBFA2T1 Human genes 0.000 description 1
- 102100025198 Protein DBF4 homolog A Human genes 0.000 description 1
- 102100025199 Protein DBF4 homolog B Human genes 0.000 description 1
- 108010038241 Protein Inhibitors of Activated STAT Proteins 0.000 description 1
- 102100025460 Protein lin-28 homolog A Human genes 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 206010037213 Psychomotor retardation Diseases 0.000 description 1
- 208000028017 Psychotic disease Diseases 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 102000004229 RNA-binding protein EWS Human genes 0.000 description 1
- 108090000740 RNA-binding protein EWS Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108700040655 RUNX1 Translocation Partner 1 Proteins 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 1
- 102100025426 Receptor-transporting protein 1 Human genes 0.000 description 1
- 102100030854 Receptor-transporting protein 4 Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 241000084978 Rena Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 206010038997 Retroviral infections Diseases 0.000 description 1
- 241000712907 Retroviridae Species 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 102100038043 Roquin-1 Human genes 0.000 description 1
- 101150057235 SCN1B gene Proteins 0.000 description 1
- 101150086694 SLC22A3 gene Proteins 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102100022332 Sharpin Human genes 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 206010041349 Somnolence Diseases 0.000 description 1
- 241000713675 Spumavirus Species 0.000 description 1
- 102100025560 Squalene monooxygenase Human genes 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108050009621 Synapsin Proteins 0.000 description 1
- 102000001435 Synapsin Human genes 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 102100040045 THAP domain-containing protein 1 Human genes 0.000 description 1
- 102100035063 THAP domain-containing protein 11 Human genes 0.000 description 1
- 102100034908 Tetratricopeptide repeat protein 21B Human genes 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 102100021380 Transcription factor GATA-4 Human genes 0.000 description 1
- 102100021382 Transcription factor GATA-6 Human genes 0.000 description 1
- 102100031080 Transcription termination factor 2 Human genes 0.000 description 1
- 208000030886 Traumatic Brain injury Diseases 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 208000026911 Tuberous sclerosis complex Diseases 0.000 description 1
- 101150008036 UL29 gene Proteins 0.000 description 1
- 101150011902 UL52 gene Proteins 0.000 description 1
- 206010046298 Upper motor neurone lesion Diseases 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 241000711975 Vesicular stomatitis virus Species 0.000 description 1
- 241000271897 Viperidae Species 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000713325 Visna/maedi virus Species 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 102100027644 YY1-associated factor 2 Human genes 0.000 description 1
- 108091009220 ZDHHC9 Proteins 0.000 description 1
- 102100025788 Zinc finger BED domain-containing protein 4 Human genes 0.000 description 1
- 102100025792 Zinc finger BED domain-containing protein 6 Human genes 0.000 description 1
- 102100025363 Zinc finger CW-type PWWP domain protein 1 Human genes 0.000 description 1
- 102100026457 Zinc finger E-box-binding homeobox 1 Human genes 0.000 description 1
- 102100028598 Zinc finger HIT domain-containing protein 3 Human genes 0.000 description 1
- 102100025417 Zinc finger MYM-type protein 3 Human genes 0.000 description 1
- 102100025418 Zinc finger MYM-type protein 4 Human genes 0.000 description 1
- 102100034655 Zinc finger SWIM domain-containing protein 5 Human genes 0.000 description 1
- 102100034685 Zinc finger SWIM domain-containing protein 6 Human genes 0.000 description 1
- 102100028499 Zinc finger matrin-type protein 1 Human genes 0.000 description 1
- 102100028482 Zinc finger matrin-type protein 3 Human genes 0.000 description 1
- 102100028542 Zinc finger matrin-type protein 5 Human genes 0.000 description 1
- 102100040032 Zinc finger protein 185 Human genes 0.000 description 1
- 102100026316 Zinc finger protein 281 Human genes 0.000 description 1
- 102100024703 Zinc finger protein 32 Human genes 0.000 description 1
- 102100035806 Zinc finger protein 638 Human genes 0.000 description 1
- 102100024714 Zinc finger protein 746 Human genes 0.000 description 1
- 102100034644 Zinc finger protein 750 Human genes 0.000 description 1
- 102100025883 Zinc finger protein GLIS1 Human genes 0.000 description 1
- 102100025879 Zinc finger protein GLIS3 Human genes 0.000 description 1
- 102100029570 Zinc finger protein SNAI2 Human genes 0.000 description 1
- 102100025105 Zinc fingers and homeoboxes protein 1 Human genes 0.000 description 1
- 102100040034 Zygote arrest protein 1 Human genes 0.000 description 1
- ZVQOOHYFBIDMTQ-UHFFFAOYSA-N [methyl(oxido){1-[6-(trifluoromethyl)pyridin-3-yl]ethyl}-lambda(6)-sulfanylidene]cyanamide Chemical compound N#CN=S(C)(=O)C(C)C1=CC=C(C(F)(F)F)N=C1 ZVQOOHYFBIDMTQ-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000036982 action potential Effects 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 229910052586 apatite Inorganic materials 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 208000029560 autism spectrum disease Diseases 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 229960000686 benzalkonium chloride Drugs 0.000 description 1
- CADWTSSKOVRVJC-UHFFFAOYSA-N benzyl(dimethyl)azanium;chloride Chemical compound [Cl-].C[NH+](C)CC1=CC=CC=C1 CADWTSSKOVRVJC-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 210000001052 bipolar neuron Anatomy 0.000 description 1
- HUTDDBSSHVOYJR-UHFFFAOYSA-H bis[(2-oxo-1,3,2$l^{5},4$l^{2}-dioxaphosphaplumbetan-2-yl)oxy]lead Chemical compound [Pb+2].[Pb+2].[Pb+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O HUTDDBSSHVOYJR-UHFFFAOYSA-H 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 230000007177 brain activity Effects 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229960000623 carbamazepine Drugs 0.000 description 1
- FFGPTBGBLSHEPO-UHFFFAOYSA-N carbamazepine Chemical compound C1=CC2=CC=CC=C2N(C(=O)N)C2=CC=CC=C21 FFGPTBGBLSHEPO-UHFFFAOYSA-N 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 238000000423 cell based assay Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 210000001612 chondrocyte Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 201000003740 cowpox Diseases 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 208000017004 dementia pugilistica Diseases 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 210000005110 dorsal hippocampus Anatomy 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 206010013663 drug dependence Diseases 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 238000001983 electron spin resonance imaging Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 210000003989 endothelium vascular Anatomy 0.000 description 1
- 230000026502 entry into host cell Effects 0.000 description 1
- 101150030339 env gene Proteins 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 230000008029 eradication Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 201000007186 focal epilepsy Diseases 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003371 gabaergic effect Effects 0.000 description 1
- 101150098622 gag gene Proteins 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 210000004565 granule cell Anatomy 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000012510 hollow fiber Substances 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000005099 host tropism Effects 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 230000036031 hyperthermia Effects 0.000 description 1
- 201000001993 idiopathic generalized epilepsy Diseases 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 239000010954 inorganic particle Substances 0.000 description 1
- 206010022437 insomnia Diseases 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000001738 isopycnic centrifugation Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 201000010901 lateral sclerosis Diseases 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 101150111214 lin-28 gene Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 102100031622 mRNA decay activator protein ZFP36 Human genes 0.000 description 1
- 102100034702 mRNA decay activator protein ZFP36L1 Human genes 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 230000008384 membrane barrier Effects 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 230000006984 memory degeneration Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 208000023060 memory loss Diseases 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 108010041420 microbial alkaline proteinase inhibitor Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 210000003078 multipolar neuron Anatomy 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 230000002151 myoclonic effect Effects 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 238000001728 nano-filtration Methods 0.000 description 1
- 239000002088 nanocapsule Substances 0.000 description 1
- 239000007908 nanoemulsion Substances 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000032965 negative regulation of cell volume Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 230000008587 neuronal excitability Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 230000012223 nuclear import Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000004248 oligodendroglia Anatomy 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- VSIIXMUUUJUKCM-UHFFFAOYSA-D pentacalcium;fluoride;triphosphate Chemical compound [F-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O VSIIXMUUUJUKCM-UHFFFAOYSA-D 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 229960002036 phenytoin Drugs 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 101150088264 pol gene Proteins 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 229920001606 poly(lactic acid-co-glycolic acid) Polymers 0.000 description 1
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 239000004926 polymethyl methacrylate Substances 0.000 description 1
- 108010055896 polyornithine Proteins 0.000 description 1
- 229920002714 polyornithine Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 230000001144 postural effect Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 201000002241 progressive bulbar palsy Diseases 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 229940070353 protamines Drugs 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 201000000196 pseudobulbar palsy Diseases 0.000 description 1
- 210000001510 pseudounipolar neuron Anatomy 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 102220285550 rs730881360 Human genes 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 210000004116 schwann cell Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 108010088972 sharpin Proteins 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 208000022925 sleep disturbance Diseases 0.000 description 1
- 210000001057 smooth muscle myoblast Anatomy 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000002047 solid lipid nanoparticle Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 208000020431 spinal cord injury Diseases 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- SFVFIFLLYFPGHH-UHFFFAOYSA-M stearalkonium chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CC1=CC=CC=C1 SFVFIFLLYFPGHH-UHFFFAOYSA-M 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 210000003699 striated muscle Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 208000011117 substance-related disease Diseases 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 201000008914 temporal lobe epilepsy Diseases 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000009529 traumatic brain injury Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 208000009999 tuberous sclerosis Diseases 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 210000003242 unipolar neuron Anatomy 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 210000005111 ventral hippocampus Anatomy 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000006648 viral gene expression Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 150000003751 zinc Chemical class 0.000 description 1
Description
Ссылка
По заявке на настоящий патент испрашивается приоритет в соответствии с предварительной заявкой на патент США № 62/854238, поданной 29 мая 2019 г.; предварительной заявкой на патент США № 62/857727, поданной 5 июня 2019 г.; и предварительной заявкой на патент США № 63/008569, поданной 10 апреля 2020 г., каждая из которых полностью включена в настоящий документ посредством ссылки.
Перечень последовательностей
Настоящая заявка содержит Перечень последовательностей, который был представлен в электронном виде в формате ASCII и полностью включен в настоящий документ посредством ссылки. Указанная копия ASCII, созданная 28 мая 2020 г., называется 46482-724_601_SL.txt и имеет размер 418483 байта.
Предшествующий уровень техники настоящего изобретения
Широкий спектр заболеваний человека связан с аномальной экспрессией генов. В некоторых случаях генетическая мутация в гене вызывает нарушение его регуляции, подавление или отсутствие экспрессии вообще, что приводит к гаплонедостаточности. В некоторых случаях генетическая мутация в гене вызывает его активацию, что приводит к сверхэкспрессии гена. При лечении генетических нарушений или заболеваний существует множество проблем. Один из подходов - генная терапия, которая включает в себя терапевтическую доставку нуклеиновой кислоты в клетки пациента. Тем не менее, различные проблемы, связанные с генной терапией, остаются нерешенными, такие как нежелательный иммунный ответ, вызванный генной терапией, нецелевые эффекты, ограничения клонирующей способности носителей генной терапии (например, вирусов), поддержание терапевтического эффекта в течение более длительного периода времени и т.д. Центральная нервная система (ЦНС) ставит множество уникальных задач для разработки терапии, направленной на устранение основного нарушения экспрессии гена и/или белка. Хотя существуют лекарственные средства, которые помогают управлять симптомами заболеваний/нарушений ЦНС, многие заболевания/нарушения ЦНС, например, синдром Драве, не имеют специальных способов лечения или устранения. Таким образом, существует потребность в новых композициях и способах, способных модулировать экспрессию любого эндогенного гена, чтобы помочь обратить вспять эффекты заболевания или нарушения, в частности, в терапии со сниженной иммуногенностью, уменьшенными нецелевыми эффектами, повышенной специфичностью для целевого гена и/или повышенной терапевтической эффективностью.
Сущность настоящего изобретения
Согласно одному аспекту в настоящей заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит ДНК-связывающий домен (DBD), функционально связанный по меньшей мере с двумя активирующими транскрипцию доменами (TAD) следующим образом: TAD1-TAD2-DBD, DBD-TAD3-TAD4 или TAD1TAD2-DBD-TAD3-TAD4. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 независимо выбраны из следующего: VP16, VP64, Viper, CITED2, CITED4, CREB3 или их функциональных фрагментов. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления линкер отсутствует по меньшей мере между двумя доменами TAD.
Согласно определенным вариантам осуществления существует линкер по меньшей мере между двумя доменами TAD. Согласно определенным вариантам осуществления линкер содержит или состоит из GGSGGGSG (SEQ ID NO: 177) или GGSGGGSGGGSGGGSG (SEQ ID NO: 178).
Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 18-27 нуклеотидов.
Согласно определенным вариантам осуществления DBD характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления DBD характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления каждый из DBD и по меньшей мере двух TAD характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления каждый из DBD и по меньшей мере двух TAD характеризуется идентичностью последовательности, состав
- 1 046157 ляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.
Согласно определенным вариантам осуществления DBD содержит направляющую РНК и инактивированный нуклеазами белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.
Согласно определенным вариантам осуществления DBD содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления DBD содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления DBD содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления DBD содержит девять цинковых пальцев. Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 27 нуклеотидов.
Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления DBD содержит последовательность, содержащую любую из SEQ ID NO: 148-151.
Согласно определенным вариантам осуществления DBD получен из EGR1 человека или EGR3 человека.
Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-98. Согласно определенным вариантам осуществления DBD содержит SEQ ID NO: 77-98.
Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 92. Согласно определенным вариантам осуществления DBD содержит SEQ ID NO: 92.
Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 130 или 131. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 130 или 131.
Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 72 или 73. Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность любой из SEQ ID NO: 72 или 73.
Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в PV-содержащих нейронах, чем в других типах клеток. Согласно определенным вариантам осуществления регуляторный элемент содержит любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит SEQ ID NO: 2 или 3.
Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК характеризуется идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит любую из SEQ ID NO: 7, 14 или 15.
Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.
Согласно другому аспекту в заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит ДНКсвязывающий домен, функционально связанный с активирующим транскрипцию доменом, причем ДНКсвязывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147), и причем тег HA отсутствует (SEQ ID NO: 303) между ДНК-связывающим доменом и активирующим транскрипцию доменом. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR или VP64 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит VP64.
Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 18-27 нуклеотидов. Согласно определенным вариантам осуществления ДНКсвязывающий домен представляет собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=6-9. Согласно определенным вариантам осуществления ДНК-связывающий домен представляет
- 2 046157 собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=6. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=9. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 27 нуклеотидов.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, содержащую любую из SEQ ID NO: 148-151.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.
Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в PV-содержащих нейронах, чем в других типах клеток. Согласно определенным вариантам осуществления регуляторный элемент содержит любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит SEQ ID NO: 2 или 3.
Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 127. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 127.
Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 93 или 71. Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность любой из SEQ ID NO: 93 или 71.
Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК характеризуется идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит любую из SEQ ID NO: 7, 14 или 15.
Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус. Согласно другому аспекту в заявке представлен полинуклеотид, содержащий селективный в отношении PV сайт связывания микроРНК, содержащий последовательность, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к SEQ ID NO: 14 или 15, причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит SEQ ID NO: 14. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит SEQ ID NO: 15. Согласно другому аспекту в заявке представлена кассета экспрессии, содержащая селективный в отношении PV сайт связывания микроРНК и промотор и/или энхансер. Согласно определенным вариантам осуществления промотор и/или энхансер представляет собой селективный в отношении PV регуляторный элемент, который управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих нейронах (PV), чем в других типах клеток. Согласно определенным вариантам осуществления селективный в отношении PV регуляторный элемент функционально связан с трансгеном. Согласно другому аспекту в настоящей заявке представлена кассета экспрессии, содержащая регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один сайт связывания микроРНК, причем регуляторный элемент управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих (PV) нейронах, чем в других типах клеток, и причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах. Согласно определенным вариантам осуществления кассета экспрессии не содержит SEQ ID NO: 67. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания для MIR221 (SEQ ID NO:
- 3 046157
11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9), по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11) и по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит SEQ ID NO: 7, 14 или 15.
Согласно определенным вариантам осуществления трансген кодирует полипептид, содержащий не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке. Согласно определенным вариантам осуществления фактор транскрипции связывается с областью генома, содержащей 18-27 нуклеотидов. Согласно определенным вариантам осуществления фактор транскрипции содержит ДНК-связывающий домен. Согласно определенным вариантам осуществления фактор транскрипции содержит ДНК-связывающий домен и активирующий транскрипцию домен. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления как ДНКсвязывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит направляющую РНК и инактивированный нуклеазой белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит девять цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 27 нуклеотидов.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, содержащую любую из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 92-98. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 92-98.
Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147).
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.
Согласно определенным вариантам осуществления ДНК-связывающий домен происходит от EGR1 человека или EGR3 человека.
Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR, VP64, CITED2, CITED4 или CREB3 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность CITED2, CITED4 или CREB3 человека или их функциональный фрагмент.
Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую SEQ ID NO: 2 или 3.
Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 105, 106 и 127-129. Согласно определенным вариантам
- 4 046157 осуществления не встречающийся в природе фактор транскрипции содержит любую из SEQ ID NO: 105, 106 и 127-129.
Согласно определенным вариантам осуществления трансген содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 71, 74, 75, 76 или 184. Согласно определенным вариантам осуществления трансген содержит любую из SEQ ID NO: 71, 74, 75, 76 или 184.
Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.
Согласно другому аспекту в настоящей заявке представлен способ селективной экспрессии трансгена в парвальбумин-содержащих нейронах (PV) приматов, предусматривающий введение примату вирусного вектора, содержащего трансген и по меньшей мере один сайт связывания микроРНК, причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах.
Согласно определенным вариантам осуществления вирусный вектор дополнительно содержит регуляторный элемент, функционально связанный с трансгеном, причем регуляторный элемент управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих нейронах (PV), чем в других типах клеток. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9), по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11) и по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит SEQ ID NO: 7, 14 или 15.
Согласно определенным вариантам осуществления трансген содержит последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCNIA в клетке.
Согласно определенным вариантам осуществления фактор транскрипции связывается с областью генома, содержащей 18-27 нуклеотидов.
Согласно определенным вариантам осуществления фактор транскрипции содержит ДНКсвязывающий домен.
Согласно определенным вариантам осуществления фактор транскрипции содержит ДНКсвязывающий домен и активирующий транскрипцию домен.
Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит направляющую РНК и инактивированный нуклеазой белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит девять цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен свя
- 5 046157 зывается с геномной областью, содержащей 27 нуклеотидов.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, имеющую любую из SEQ ID NO: 148-151.
Согласно определенным вариантам осуществления ДНК-связывающий домен происходит из EGR1 человека или EGR3 человека.
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 92-98. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 92-98.
Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147).
Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.
Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR, VP64, CITED2, CITED4 или CREB3 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность CITED2, CITED4 или CREB3 человека или их функциональный фрагмент.
Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую SEQ ID NO: 2 или 3.
Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 105, 106 и 127-129. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит любую из SEQ ID NO: 105, 106 и 127-129.
Согласно определенным вариантам осуществления трансген содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 71, 74, 75, 76 или 184. Согласно определенным вариантам осуществления трансген содержит любую из SEQ ID NO: 71, 74, 75, 76 или 184.
Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.
Согласно определенным вариантам осуществления притма представляет собой человека. Согласно определенным вариантам осуществления примат представляет собой отличного от человека примата. Согласно определенным вариантам осуществления отличный от человека примат представляет собой обезьяну старого мира, орангутана, гориллу, шимпанзе, мартышку, яванского макака, макака-резус или свинохвостого макака.
Согласно другому аспекту в настоящей заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 128 или 129. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 128 или 129.
Согласно другому аспекту в настоящей заявке представлен способ увеличения экспрессии SCNIA в клетке путем введения любой из кассет экспрессии, представленных в настоящем документе. Согласно определенным вариантам осуществления клетка представляет собой нервную клетку. Согласно определенным вариантам осуществления нервная клетка выбрана из группы, состоящей из униполярных, биполярных, мультиполярных или псевдоуниполярных нейронов. Согласно определенным вариантам осуществления клетка представляет собой ГАМКергический нейрон. Согласно определенным вариантам осуществления клетка представляет собой PV-содержащий нейрон. Согласно определенным вариантам осуществления клетка не представляет собой нервную клетку. Согласно определенным вариантам осуществления клетка представляет собой глиальную клетку. Согласно определенным вариантам осуществления глиальная клетка выбрана из группы, состоящей из астроцитов, олигодендроцитов, эпендимных клеток, шванновских клеток и сателлитных клеток. Согласно определенным вариантам осуществления клетка находится внутри субъекта. Согласно определенным вариантам осуществления субъект представляет собой млекопитающее. Согласно определенным вариантам осуществления субъект представляет
- 6 046157 собой человека. Согласно определенным вариантам осуществления увеличение экспрессии SCN1A лечит заболевание, нарушение или симптом. Согласно определенным вариантам осуществления нарушение представляет собой нарушение центральной нервной системы. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления гаплонедостаточность является результатом того, что субъект является гетерозиготным по мутации потери функции гена SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную со вставкой, делецией или заменой в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с точечной мутацией в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой синдром Драве. Согласно определенным вариантам осуществления симптом нарушение центральной нервной системы представляет собой гиперактивность нейронов. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает снижение гиперактивности нейронов. Согласно определенным вариантам осуществления симптомом нарушения центральной нервной системы являются припадки. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает снижение частоты припадков. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает уменьшение тяжести припадков.
Согласно другому аспекту в настоящей заявке представлен способ увеличения экспрессии SCNIA в ЦНС путем введения любой из кассет экспрессии, представленных в настоящем документе. Согласно определенным вариантам осуществления кассету экспрессии вводят посредством одностороннего интрацеребровентрикулярного (ICV) введения. Согласно определенным вариантам осуществления кассету экспрессии вводят посредством двустороннего интрацеребровентрикулярного (ICV) введения. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в головном мозге. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит во фронтальной коре, теменной коре, височной коре, гиппокампе, продолговатом мозге и/или затылочной коре. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в позвоночнике. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в спинном мозге и/или межпозвонковом узле.
Включение по ссылке
Все публикации, патенты и заявки на патенты, упомянутые в настоящем описании, включены в настоящий документ посредством ссылки в той же степени, как если бы каждая отдельная публикация, патент или заявка на патент были специально и индивидуально указаны для включения посредством ссылки.
Краткое описание графических материалов
Новые особенности настоящего изобретения подробно изложены в прилагаемой формуле изобретения. Лучшее понимание особенностей и преимуществ настоящего изобретения будет получено при обращении к нижеследующему подробному описанию, в котором излагаются иллюстративные случаи, в которых используются принципы настоящего изобретения, и прилагаемым графическим материалам, на которых показано следующее.
На фиг. 1 показана активация эндогенного SCN1A с использованием сконструированных факторов транскрипции, которые связываются с различными областями на хромосоме 2 (со ссылкой на GRCh38.p12). Данные представлены в виде кратного изменения экспрессии SCN1A по сравнению с контрольным (EGFP-KASH) состоянием.
На фиг. 2A, фиг. 2B и фиг. 2C показана относительная экспрессия эндогенного SCN1A в клетках HEK293 с использованием SCN1A-специфических активаторов транскрипции (смотрите табл. 1). Данные представлены в виде кратного изменения относительно контрольных условий и показаны на шкале Logi0.
На фиг. 3A показана относительная экспрессия эндогенного SCN1A в нейронах ГАМК с использованием SCN1A-специфического активатора транскрипции (конструкция 30). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP).
На фиг. 3B показана относительная экспрессия эндогенного SCN1A в нейронах ГАМК с использованием SCN1A-специфических активаторов транскрипции (конструкции 25 и 16). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP) в Log10.
На фиг. 4 показана относительная экспрессия эндогенного SCN1A и 40 ближайших соседних генов, управляемых специфическим фактором транскрипции SCN1A (конструкция 30). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP-KASH) в Log10.
На фиг. 5A и фиг. 5B показана экспрессия SCN1A-специфического активатора транскрипции in vivo по сравнению с контрольной кассетой экспрессии, которая экспрессировала eGFP. На фиг. 5A показана относительная экспрессию гена SCN1A у мышей, которым инъецировали либо контрольный eGFP, либо конструкцию 4, содержащую активатор транскрипции SCN1A. На фиг. 5B показано изменение экспрессии SCN1A с точки зрения среднего процента eGFP. Эти эксперименты показывают, что активация транскрипции с помощью конструкции 4 привела к усилению экспрессии SCN1A приблизительно на 20-30%.
На фиг. 6A, фиг. 6B, фиг. 6C, фиг. 6D, фиг. 6E, фиг. 6F и фиг. 6G показано влияние на гипертерми- 7 046157 ческие припадки на мышиной модели синдрома Драве с нокаутом Scn1atm1Kea с использованием различных факторов транскрипции, специфических для SCN1A, по сравнению с контролем. Мышам P1 Scn1a +/- (гетерозиготные; HET) вводили либо AAV9-EGFP, либо вектор AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (одна из конструкций 31-34, 42 и 43). Мышей P26-P28, подвергнутых инфузии, подвергали тесту на припадки, вызванные гипертермией, и регистрировали внутреннюю температуру, при которой они испытывали тонико-клонический припадок. На фиг. 6D показано прямое сравнение между конструкцией 32, которая содержит тег HA, расположенным между DBD и TAD, и конструкцией 34, которая не содержит тега HA. На фиг. 6E показано прямое сравнение между конструкцией 31, которая содержит сайт связывания микроРНК m1, расположенный между кодирующей областью и хвостом полиА, и конструкцией 32, которая не содержит сайт связывания микроРНК m1. На фиг. 6H проиллюстрировано влияние на гипертермические припадки в модели синдрома Драве у мышей с мутантным Scn1aRX использованием конструкции 31 (по сравнению с контролем в виде введенного PBS).
На фиг. 7A, фиг. 7B, фиг. 7C и фиг. 7D показана выживаемость в модели синдрома Драве у мышей с нокаутом Scn1atm1Kea в различных условиях. На фиг. 7A показано сравнение мышей дикого типа (PBS WT) и Scn1a +/- (PBS HET) в анализе выживаемости. Мышам P1 Scn1a +/- (N=53) и Scn1a +/+ (N=54) вливали PBS. Мышей наблюдали в их домашней клетке ежедневно, и в случае какой-либо смертности регистрировали дату. Наблюдалась значительная разница в выживаемости между животными Scn1a +/- и Scn1a +/+ (P<0,0001). На фиг. 7B-D показано влияние на выживаемость в мышиной модели синдрома Драве для мышей, обработанных различными факторами транскрипции, специфическими для SCN1A, по сравнению с контролем. Мышам P1 Scn1a +/- вливали либо PBS, либо вектор AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (конструкции 31 или 33). Мышей наблюдали в их домашней клетке ежедневно, и в случае какой-либо смертности регистрировали дату. На фиг. 7D показано прямое сравнение между конструкцией 31, которая содержит сайт связывания микроРНК m1, расположенным между кодирующей областью и хвостом полиА, и конструкцией 33, которая не содержит сайт связывания микроРНК m1. На фиг. 7E показана выживаемость в модели синдрома Драве у мышей с мутантным Scn1aRX с использованием конструкции 31 (по сравнению с контролем, инъецированным PBS).
На фиг. 8 показана относительная экспрессия мРНК Scn1A в различных тканях головного мозга после интрапаренхимальной доставки вектора AAV9, кодирующего SCN1A-специфический фактор транскрипции (конструкция 33), введенного двум яванским макакам в дозе 1,2х1012 копий генома/животное, нормализованных по двум необработанным контрольным животным. Всех животных умерщвляли через 28 дней после инъекции и количественно определяли мРНК Scn1A в образцах тканей с помощью Taqman PCR. Данные представлены как нормализованная экспрессия целевой мРНК в различных срезах ткани головного мозга. Аналогичные результаты были зарегистрированы с другим набором праймеров/зонда, полученных из гена Scn1a.
На фиг. 9A-F показан характер экспрессии EGFP в области зубчатой извилины гиппокампа мартышки после обработки векторами AAV9, содержащими трансген EGFP под контролем промотора EF1a, промотора RE 2 (SEQ ID NO: 2) или промотора RE 2 (SEQ ID NO: 2) с сайтом связывания микроРНК m1 (SEQ ID NO: 7), расположенным между кодирующей областью EGFP и сайтом polyA. Типичная область зубчатой извилины гиппокампа показана для каждого вектора обработки. В верхнем ряду показаны ядра клеток, окрашенные DAPI, а в нижнем ряду показаны GFP-положительные области, окрашенные антителом к GFP. На фиг. 9A (обработка EF1a) область hylus CA4 гиппокампа обведена, а стрелки указывают на слой тела гранулярных клеток зубчатых клеток (DG). Фиг. 9B и фиг. 9C сосредоточены в той же области. Область CA4, которая представляет собой смесь возбуждающих и тормозных интернейронов, выделена, поскольку это была единственная область со значительной экспрессией в условии RE 2 + m1. При управляемой EF1a и RE 2 экспрессии трансгена экспрессия GFP была более распространенной и включала в себя другие области гиппокампа. Считается, что слой клеток DG содержит в основном возбуждающие нейроны. Экспрессия GFP, управляемая EF1a и RE 2, видна в слое клеток DG (фиг. 9D и фиг. 9E), но не присутствует у животных, обработанных RE 2 + m1 (фиг. 9F) (белые стрелки).
На фиг. 10A-L показано, что характер экспрессии EGFP в области зубчатой извилины гиппокампа мартышки после обработки векторами AAV9, содержащими трансген EGFP под контролем промотора EF1a, промотора RE 2 (SEQ ID NO: 2) или промотора RE 2 (SEQ ID NO: 2) с сайтом связывания микроРНК m1 (SEQ ID NO: 7), расположенным между кодирующей областью EGFP и сайтом polyA, в первую очередь локализован на парвальбумин-положительных (PV) клетках у животных, получавших RE 2 и RE 2 + m1. Типичная область зубчатой извилины гиппокампа показана для каждого вектора обработки. В верхнем ряду показаны GFP-положительные области, а в следующем нижнем ряду показаны те же области, окрашенные ингибирующим маркером интернейронов для PV. Область в рамке на фиг. 10A-F показана при большем увеличении на фиг. 10G-L. Экспрессия GFP, управляемая RE 2 и RE 2 + m1, в основном совмещена с ингибирующим маркером PV-содержащих интернейронов (белые стрелки на фиг. 10H и 10K, 10I и 10L), тогда как в EG-EF1a экспрессия GFP не так легко локализуется в PVположительных клетках (белые стрелки на фиг. 10G и 10J). Кроме того, GFP-положительные клетки характеризуются отчетливо выраженной морфологией интернейронов высокоразветвленных клеток с пи
- 8 046157 рамидным клеточным телом у животных, получавших RE 2 и RE 2 + ml (стрелки на фиг. 10H и 10I), по сравнению с менее отчетливой морфологией клеточного тела у животных, получавших EF1a (стрелки на фиг. 10G).
На фиг. 11 показан VG/диплоидный геном в образцах тканей фронтальной коры (FC), ростральной теменной коры (Rostral PC), височной коры (TC), каудальной теменной коры (Caudal PC), гиппокампа (Hip), продолговатого мозга (Med) и затылочной коры (OC) животных, получавших AAV9-REgabaeTFSCNiA, вводимые в дозе 4,8E+13 или 8E+13 мкг/животное посредством одностороннего интрацеребровентрикулярного (ICV) введения (пример 10 и пример 11). Каждая точка данных представляет VG/диплоидный геном для образца ткани, а горизонтальные полосы представляют средний VG/диплоидный геном для всех образцов ткани для каждого животного.
На фиг. 12 показаны транскрипты/мкг РНК в образцах тканей фронтальной коры (FC), ростральной теменной коры (Rostral PC), височной коры (TC), каудальной теменной коры (Caudal PC), гиппокампа (Hip), продолговатого мозга (Med) и затылочной коры (OC) животных, получавших AAV9-REgabaeTFSCN1A, вводимые в дозе 4,8E+13 или 8E+13 геномов вектора/животное посредством одностороннего интрацеребровентрикулярного (ICV) введения (пример 10 и пример 11). Каждая точка данных представляет геномы вектора/диплоидный геном для образца ткани, а горизонтальные полосы представляют собой среднее отношение геномы вектора/диплоидный геном для всех образцов ткани для каждого животного. Средние транскрипты для ARFGAP2 составляли 1,85Е+6/мкг РНК и обозначены пунктирной верхней граничной линией. Предел обнаружения обозначен пунктирной нижней граничной линией.
На фиг. 13 показано биораспределение вектора (геномы вектора/диплоидный геном) и экспрессия трансгена (транскрипты/мкг РНК) в образцах периферической ткани вне головного мозга. Показанные образцы периферической ткани представляют собой спинной мозг C2/L4 (SC C2/L4), межпозвонковый узел C2/L4 (DRG C2/L4), печень, селезенка, сердце, почки, легкие, поджелудочная железа и семенники/яичники. Среднее значение VCN (векторное биораспределение) и транскрипта (экспрессия трансгена) в головном мозге приматов показано пунктирной линией.
Подробное описание настоящего изобретения
В настоящем документе представлены сконструированные факторы транскрипции или eTF, которые не встречаются в природе и были разработаны для связывания с целевым сайтом генома и модуляции экспрессии представляющего интерес эндогенного гена. Такие eTF могут быть созданы для усиления или подавления экспрессии (экспрессии РНК и/или белка) представляющего интерес гена. В настоящем документе также представлены сайты связывания микроРНК, которые могут быть включены в вирусный вектор и обеспечивать селективную экспрессию трансгена в парвальбумин-содержащих нейронах (PV).
Согласно одному аспекту в настоящей заявке представлены eTF, которые способны повышать экспрессию гена альфа-субъединицы 1 натриевого потенциалзависимого канала (SCN1A) и повышать экспрессию его соответствующего белкового продукта Nav1.1, a также способы их применения для лечения заболеваний или нарушений, связанных с дефицитом Nav1.1, такие как, например, синдром Драве.
Согласно другому аспекту в настоящей заявке предусмотрены сайты связывания микроРНК, которые снижают экспрессию мРНК, содержащей сайт связывания микроРНК, в возбуждающих нейронах, тем самым приводя к селективной экспрессии гена в ГАМКергических нейронах или парвальбуминсодержащих нейронах (PV), и способы их применения для селективной экспрессии представляющего интерес гена в нейронах PV.
Определения.
Используемые в настоящем документе формы единственного числа предназначены для включения и форм множественного числа, если контекст явно не указывает на иное. Кроме того, в той степени, в которой термины включая в себя, включает в себя, имеющий, имеет, с или их варианты используются либо в подробном описании, либо в формуле изобретения, такие термины предназначены для включения аналогично термину содержащий.
Термин приблизительно или примерно означает в пределах допустимого диапазона ошибок для конкретного значения, определенного специалистом в настоящей области техники, который будет частично зависеть от того, как значение измеряется или определяется, т.е. ограничения системы измерения. Например, приблизительно может означать в пределах одного или более чем одного стандартного отклонения в соответствии с практикой в настоящей области техники. В качестве альтернативы приблизительно может означать диапазон до 20%, до 15%, до 10%, до 5% или до 1% от заданного значения.
Термины определение, измерение, оценка, оценивание, анализ и их грамматические эквиваленты могут использоваться в настоящем документе взаимозаменяемо для обозначения любой формы измерения и включают в себя определение того, присутствует элемент или нет (например, обнаружение). Эти термины могут включать в себя как количественные, так и/или качественные определения. Оценка может быть относительной или абсолютной.
Термин экспрессия относится к процессу, с помощью которого последовательность нуклеиновой кислоты или полинуклеотид транскрибируется с матрицы ДНК (например, в мРНК или другой транскрипт РНК), и/или процессу, посредством которого транскрибированная мРНК впоследствии транслируется в пептиды, полипептиды или белки. Транскрипты и кодируемые полипептиды можно вместе назы
- 9 046157 вать генным продуктом. Если полинуклеотид происходит из геномной ДНК, экспрессия может включать в себя сплайсинг мРНК в эукариотической клетке.
Используемые в настоящем документе термины функционально связанный, функциональная связь или их грамматические эквиваленты относятся к сопоставлению генетических элементов, например, промотора, энхансера, последовательности полиаденилирования и т.д., причем элементы находятся во взаимосвязи, позволяющей им работать ожидаемым образом. Например, регуляторный элемент, который может включать в себя промоторные и/или энхансерные последовательности, функционально связан с кодирующей областью, если регуляторный элемент помогает инициировать транскрипцию кодирующей последовательности. Между регуляторным элементом и кодирующей областью могут быть промежуточные остатки, пока сохраняется эта функциональная связь. Используемый в настоящем документе термин вектор относится к макромолекуле или ассоциации макромолекул, которая содержит полинуклеотид или ассоциируется с ним и которая может использоваться для опосредования доставки полинуклеотида в клетку. Примеры векторов включают в себя плазмиды, вирусные векторы, липосомы и другие носители для доставки генов. Вектор, как правило, содержит генетические элементы, например, регуляторные элементы, функционально связанные с геном для облегчения экспрессии гена в мишени.
Используемые в настоящем документе термины кассета экспрессии и кассета нуклеиновой кислоты взаимозаменяемо относятся к комбинации последовательностей нуклеиновых кислот или элементов, которые экспрессируются вместе или функционально связаны для экспрессии. В некоторых случаях кассета экспрессии относится к комбинации регуляторных элементов и гена или генов, с которыми они функционально связаны для экспрессии.
Термин AAV представляет собой сокращение от аденоассоциированного вируса и может использоваться для обозначения самого вируса или его производного. Термин охватывает все серотипы, подтипы, а также встречающиеся в природе и рекомбинантные формы, если не требуется иное. Сокращение rAAV относится к рекомбинантному аденоассоциированному вирусу, также называемому рекомбинантным вектором AAV (или вектором rAAV). Термин AAV включает в себя AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10 и их гибриды, AAV птиц, AAV крупного рогатого скота, AAV собак, AAV лошадей, AAV приматов, AAV не приматов и AAV овец. Геномные последовательности различных серотипов AAV, а также последовательности нативных концевых повторов (TR), белков Rep и субъединиц капсида известны в настоящей области техники. Такие последовательности можно найти в литературе или в общедоступных базах данных, таких как GenBank. Используемый в настоящем документе термин вектор rAAV относится к вектору AAV, содержащему полинуклеотидную последовательность, не имеющую происхождения AAV (т.е. полинуклеотид, гетерологичный AAV), как правило, последовательность, представляющую интерес для генетической трансформации клетки. В общем, гетерологичный полинуклеотид фланкирован по меньшей мере одной, а обычно двумя последовательностями инвертированных концевых повторов AAV (ITR). Вектор rAAV может быть одноцепочечным (ssAAV) или самокомплементарным (scAAV). Вирус AAV или вирусная частица AAV относится к вирусной частице, состоящей по меньшей мере из одного капсидного белка AAV и инкапсидированного полинуклеотидного вектора rAAV. Если частица содержит гетерологичный полинуклеотид (т.е. полинуклеотид, отличный от генома AAV дикого типа, такой как трансген, который должен быть доставлен в клетку млекопитающего), ее обычно называют векторной частицей rAAV или просто частицей rAAV. Таким образом, получение частицы rAAV обязательно включает в себя производство вектора rAAV, поскольку такой вектор содержится в частице rAAV.
Используемые в настоящем документе термины лечить, лечение, терапия и т.п. относятся к облегчению, задержке или замедлению прогрессирования, профилактике, ослаблению, уменьшению эффектов или симптомов, предотвращению возникновения, ингибированию или облегчению начало заболеваний или нарушений. Способы настоящего раскрытия можно использовать с любым млекопитающим. Примеры млекопитающих включают в себя, без ограничения, крыс, кошек, собак, лошадей, коров, овец, свиней и, более предпочтительно, людей. Терапевтический эффект включает в себя искоренение или улучшение основного подлежащего лечению заболевания. Кроме того, терапевтический эффект достигается за счет устранения или облегчения одного или нескольких физиологических симптомов, связанных с основным заболеванием, так что улучшение наблюдается у субъекта, несмотря на то, что субъект все еще может страдать от основного нарушения. В некоторых случаях с профилактической целью терапевтическое средство можно вводить субъекту с риском развития определенного заболевания или субъекту, сообщающему об одном или нескольких физиологических симптомах заболевания, даже если диагноз этого заболевания не был поставлен. Способы настоящего раскрытия можно использовать с любым млекопитающим. В некоторых случаях лечение может привести к уменьшению или прекращению симптомов (например, снижению частоты, продолжительности и/или тяжести припадков). Профилактический эффект включает в себя отсрочку или устранение появления заболевания или состояния, отсрочку или устранение появления симптомов заболевания или состояния, замедление, остановку или обращение вспять прогрессирования заболевания или состояния или любую их комбинацию.
Термин эффективное количество или терапевтически эффективное количество относится к тому количеству описанной в настоящем документе композиции, которого достаточно для воздействия на
- 10 046157 предполагаемое применение, включая в себя, без ограничения, лечение заболевания, как определено ниже. Терапевтически эффективное количество может варьироваться в зависимости от предполагаемого лечебного применения (in vivo) или субъекта и подвергаемого лечению патологического состояния, например, массы и возраста субъекта, тяжести патологического состояния, способа введения и т.п., что может легко определить специалист в настоящей области техники. Этот термин также применяется к дозе, которая вызовет конкретный ответ в целевой клетке. Конкретная доза будет варьироваться в зависимости от конкретной выбранной композиции, схемы дозированного введения, которую необходимо соблюдать, вводится ли она в комбинации с другими соединениями, времени введения, ткани, в которую ее вводят, и физической системы доставки, в которой она вводится.
Фрагмент нуклеотидной или пептидной последовательности относится к последовательности, которая короче эталонной или полноразмерной последовательности.
Вариант молекулы относится к аллельным вариациям таких последовательностей, т.е. к последовательности, по существу сходной по структуре и биологической активности либо со всей молекулой, либо с ее фрагментом.
Функциональный фрагмент последовательности ДНК или белка относится к фрагменту, который сохраняет биологическую активность (функциональную или структурную), которая по существу аналогична биологической активности полноразмерной последовательности ДНК или белка. Биологическая активность последовательности ДНК может заключаться в ее способности влиять на экспрессию способом, который, как известно, приписывается полноразмерной последовательности.
Термины субъект и индивидуум используются в настоящем документе взаимозаменяемо для обозначения позвоночного животного, предпочтительно, млекопитающего, более предпочтительно, человека. Описанные в настоящем документе способы могут быть применимы в терапевтических целях для человека, в ветеринарии и/или в доклинических исследованиях на животных моделях заболевания или состояния.
Термин in vivo относится к событию, которое происходит в организме субъекта.
Термин in vitro относится к событию, которое происходит вне тела субъекта. Например, анализ in vitro включает в себя любой анализ, проводимый вне субъекта. Анализы in vitro включают в себя анализы на основе клеток, в которых используются живые или мертвые клетки. Анализы in vitro также включают в себя бесклеточный анализ, в котором не используются интактные клетки.
В общем, идентичность последовательностей или гомология последовательностей, которые могут использоваться взаимозаменяемо, относятся к точному соответствию нуклеотид-нуклеотид или аминокислота-аминокислота двух полинуклеотидных или полипептидных последовательностей, соответственно. Как правило, способы определения идентичности последовательностей включают в себя сравнение двух нуклеотидных или аминокислотных последовательностей и определение их процентной идентичности. Сравнение последовательностей, например, с целью оценки идентичности, может быть выполнено с помощью любого подходящего алгоритма выравнивания, включая в себя, без ограничения, алгоритм Нидлмана-Вунша (см., например, выравниватель EMBOSS Needle, доступный на www.ebi.ac.uk/Tools/psa/emboss_needle/, необязательно с настройками по умолчанию), алгоритм BLAST (см., например, инструмент выравнивания BLAST, доступный на blast.ncbi.nlm.nih.gov/Blast.cgi, необязательно с настройками по умолчанию) и алгоритм Смита-Уотермана (см., например, выравниватель EMBOSS Water, доступный на www.ebi.ac.uk/Tools/psa/emboss_water/, необязательно с настройками по умолчанию). Оптимальное выравнивание можно оценить с использованием любых подходящих параметров выбранного алгоритма, включая в себя параметры по умолчанию. Процент идентичности, также называемый процент гомологии, между двумя последовательностями может быть рассчитан как количество точных совпадений между двумя оптимально выровненными последовательностями, деленное на длину эталонной последовательности и умноженное на 100. Процент идентичности также может быть определен, например, путем сравнения информации о последовательностях с использованием усовершенствованной компьютерной программы BLAST, включая в себя версию 2.2.9, доступную в Национальных институтах здравоохранения. Программа BLAST основана на способе совмещения Karlin and Altschul, Proc. Natl. Acad. Sci. USA 87:2264-2268 (1990) и как описано в Altschul, et al., J. Mol. Biol. 215:403-410 (1990); Karlin and Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5877 (1993) и Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997). Вкратце, программа BLAST определяет идентичность как количество идентичных выровненных символов (т.е. нуклеотидов или аминокислот), деленное на общее количество символов в более короткой из двух последовательностей. Программа может использоваться для определения процента идентичности по всей длине сравниваемых последовательностей. Параметры по умолчанию предоставляются для оптимизации поиска с помощью коротких последовательностей запросов, например, с помощью программы blastp. Программа также позволяет использовать фильтр SEG для маскировки сегментов последовательностей запросов, как это определено программой SEG Wootton and Federhen, Computers and Chemistry 17: 149-163 (1993). Высокая идентичность последовательностей, как правило, включает в себя диапазоны идентичности последовательностей от приблизительно 80% до 100% и целые числа между ними. Используемый в настоящем документе термин сконструированный применительно к белку относится к не встречающемуся в природе белку, включая в себя, без ограниче
- 11 046157 ния, белок, полученный из встречающегося в природе белка, или когда встречающийся в природе белок модифицирован или перепрограммирован, чтобы иметь определенное свойство.
Используемые в настоящем документе термины синтетический и искусственный используются взаимозаменяемо для обозначения белка или его домена, который характеризуется низкой идентичностью последовательности (например, идентичность последовательности составляет менее чем 50%) по отношению к встречающемуся в природе белку человека. Например, домены VPR и VP64 представляют собой синтетические домены трансактивации.
Используемый в настоящем документе термин сконструированный фактор транскрипции или eTF относится к не встречающемуся в природе ДНК-связывающему белку или не встречающемуся в природе модулятору транскрипции, который был модифицирован или перепрограммирован для связывания со специфическим целевым сайтом связывания и/или включения модифицированного или замененного эффекторного домена транскрипции.
Используемый в настоящем документе термин ДНК-связывающий домен может использоваться для обозначения одного или нескольких ДНК-связывающих мотивов, таких как цинковый палец или основной мотив спираль-петля-спираль (bHLH), индивидуально или вместе как часть ДНКсвязывающего белка.
Термины активирующий транскрипцию домен, домен активации транскрипции, домен трансактивации, транс-активирующий домен и TAD используются в настоящем документе взаимозаменяемо и относятся к домену белка, который вместе с ДНК-связывающим доменом может активировать транскрипцию с промотора, контактируя с транскрипционным аппаратом (например, с общими факторами транскрипции и/или РНК-полимеразой) либо напрямую, либо через другие белки, известные как коактиваторы.
Термины домен репрессора транскрипции и TRD используются в настоящем документе взаимозаменяемо и относятся к домену белка, который в сочетании с ДНК-связывающим доменом может репрессировать транскрипцию с промотора, контактируя с транскрипционным механизмом (например, общие факторы транскрипции и/или РНК-полимераза) либо напрямую, либо через другие белки, известные как корепрессоры.
Термин GRCh38.p12 относится к заплаточному релизу 12 Консорциума эталонных геномов Human Build 38 (GRCh38.p12), имеющему регистрационный номер сборки GenBank GCA_000001405.27 и датированному 21 декабря 2017 года.
Если не указано иное, все термины, использованные в настоящем документе, характеризуются тем же значением, что и для специалиста в настоящей области техники, и в практике настоящего изобретения будут использоваться традиционные способы молекулярной биологии, микробиологии и технологии рекомбинантных ДНК, которые находятся в пределах знания специалистов в настоящей области техники.
Сконструированные факторы транскрипции (eTF), которые активируют SCN1A
Согласно одному аспекту в настоящей заявке представлены eTF, которые способны повышать экспрессию гена альфа-субъединицы 1 натриевого канала с регулируемым напряжением (SCN1A) и увеличивать экспрессию его соответствующего белкового продукта Nav1.1. Ген SCN1A принадлежит к семейству генов, кодирующих субъединицы, используемые для сборки натриевых каналов. Эти каналы, которые транспортируют положительно заряженные ионы натрия в клетки, играют ключевую роль в способности клетки генерировать и передавать электрические сигналы. Ген SCN1A кодирует одну часть (альфасубъединицу) натриевого канала, называемого Nav1.1. Эти каналы в основном находятся в головном мозге, где они контролируют поток ионов натрия в клетки. Каналы Nav1.1 участвуют в передаче сигналов от одной нервной клетки (или нейрона) к другой. Было обнаружено, что несколько мутаций в гене SCN1A вызывают генетическую эпилепсию с фебрильными припадками плюс (GEFS+), которая представляет собой спектр припадочных расстройств различной степени тяжести. Эти состояния включают в себя простые фебрильные (связанные с лихорадкой) припадки, которые начинаются в младенчестве и обычно прекращаются к 5 годам, и фебрильные припадки плюс (FS+). FS+ включает в себя фебрильные и другие типы припадков, в том числе не связанные с лихорадкой (афебрильные припадки), которые продолжаются во взрослом возрасте. Спектр GEFS+ также включает в себя другие состояния, такие как синдром Драве (также известный как тяжелая миоклоническая эпилепсия младенчества или SMEI), которые вызывают более серьезные припадки, которые длятся дольше и которые трудно контролировать. Эти повторяющиеся припадки (эпилепсия) могут со временем обостряться и часто сопровождаются снижением функции головного мозга. Многие другие мутации были связаны с семейной гемиплегической мигренью, формой мигренозной головной боли, которая передается в семье, и по меньшей мере одна мутация была связана с эффективностью некоторых противосудорожных лекарственных средств. Таким образом, представленный в настоящем документе eTF, который увеличивает экспрессию SCN1A, можно использовать для лечения множества заболеваний или нарушений, связанных с мутациями в канале Nav1.1.
Факторы транскрипции (TF) представляют собой белки, которые связываются с определенными последовательностями в геноме и контролируют экспрессию генов. Сконструированные факторы транскрипции или eTF, представленные в настоящем документе, которые активируют SCN1A, представляют собой не встречающиеся в природе белки, которые содержат ДНК-связывающий домен (DBD) и по
- 12 046157 меньшей мере один домен, который является модулятором транскрипции, например, либо домен активации транскрипции (TAD), либо транскрипционный репрессорный домен (TRD). Согласно одному варианту осуществления eTF, который активирует SCN1A, может содержать DBD и TAD (например, TADDBD или DBD-TAD), причем DBD и TAD могут происходить из одного и того же белка или из разных белков. Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и два TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, и оба TAD происходят из второго белка, DBD и один TAD происходит из первого белка, а второй TAD происходит из второго белка, или DBD происходит из первого белка, один TAD происходит из второго белка, а второй TAD происходит из третьего белка (например, TAD1-DBD-TAD1, TAD1-DBDTAD2, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 или DBD-TAD1-TAD2). Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и три TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, a TAD происходят из одного или нескольких разных белков, или причем DBD и все TAD происходят из разных белков, например, TADX-TADX-TADX-DBD, TADX-TADX-DBD-TADX, TADX-DBD-TADX-TADX или DBDTADX-TADX-TADX, где каждый X выбран независимо и может быть таким же или отличным от одного или всех других TAD. Примеры включают в себя, например, TAD1-TAD1-DBD-TAD1, TAD1-TAD1DBD-TAD2, TAD1-TAD2-DBD-TAD1, TAD1-TAD2-DBD-TAD2, TAD1-TAD2-DBD-TAD3, TAD1-DBDTAD1-TAD1, TAD1- DBD-TAD2-TAD2, TAD1-DBD-TAD1-TAD2, TAD2-DBD-TAD1-TAD2, TAD1DBD-TAD2-TAD3, TAD1-TAD1-TAD1-DBD, TAD1-TAD2-TAD2-DBD, TAD1-TAD2-TAD2-DBD, TAD1TAD2-TAD3-DBD, DBD-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2, DBD-TAD1-TAD2-TAD2 или
DBD-TAD1-TAD2-TAD3 и т.д. Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и четыре TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, a TAD происходят из одного или нескольких разных белки, или причем DBD и все TAD происходят из разных белков, например, TADX-TADX-TADX-TADX-DBD, TADXTADX-TADX-DBD-TADX, TADX-TADX-DBD-TADX-TADX, TADX- DBD-TADX-TADX-TADX или DBDTADX-TADX-TADX-TADX, где каждый X выбирается независимо и может быть таким же или отличаться от одного или всех других TAD. Примеры включают в себя, например, TAD1-TAD1-DBD-TAD1-TAD1,
TAD 1 -TAD 1-DBD-TAD2-TAD2, TAD1-TAD2-DBD-TAD1-TAD3, TAD 1 -TAD 1 -TAD 1-DBD-TAD2, TAD 1-DBD-TAD2-TAD3-TAD4, TAD 1-DBD-TAD2-TAD3-TAD4,
TAD 1-TAD2-DBD-TAD1-TAD2, TAD 1-TAD3-DBD-TAD1-TAD2, TAD 1-TAD2-TAD3-DBD-TAD4, TAD 1 -DBD-TAD 1-TAD2-TAD3, TAD 1 -TAD 1 -TAD 1 -TAD 1 -DBD,
TAD 1-TAD2-DBD-TAD2-TAD1, TAD 1-TAD2-DBD-TAD3-TAD4, TAD 1 -DBD-TAD 1 -TAD 1-TAD2, TAD2-DBD-TAD1-TAD2-TAD3, TAD 1-TAD2-TAD2-TAD3-DBD,
TAD1-TAD2-TAD3-TAD4-DBD, DBD-TAD1-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2-TAD2, DBDTAD1-TAD2-TAD3-TAD4 или DBD-TAD1-TAD2-TAD3-TAD3 и т.д. Согласно одному варианту осуществления eTF, который активирует SCN1A, содержит DBD и два TAD, которые расположены на одном конце DBD (например, N-конце или C-конце), причем DBD происходит из первого белка, и оба TAD происходят из второго белка, или DBD происходит из первого белка, один TAD происходит из второго белка, а второй TAD происходит из третьего белка (например, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 или DBD-TAD1-TAD2). Согласно определенным вариантам осуществления DBD может представлять собой синтетическую конструкцию, содержащую домены из нескольких белков.
Согласно определенным вариантам осуществления DBD и TAD и/или два TAD могут быть напрямую конъюгированы, например, без промежуточной аминокислотной последовательности, DBD и TAD и/или два TAD могут быть конъюгированы с использованием пептидного линкера или их комбинаций. Согласно определенным вариантам осуществления DBD конъюгирован с TAD и/или один TAD конъюгирован со вторым TAD через линкер, содержащий 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50, 60, 70, 75, 80, 90 или 100 аминокислот или 1-5, 1-10, 1-20, 1-30, 1-40, 1-50, 1-75,
1-100, 5-10, 5-20, 5-30, 5-40, 5-50, 5-75, 5-100, 10-20, 10-30, 10-40, 10-50, 10-75, 10-100, 20-30, 20-40, 2050, 20-75 или 20-100 аминокислот. В некоторых случаях DBD и TAD и/или два TAD конъюгированы через встречающиеся в природе промежуточные остатки, обнаруженные во встречающихся в природе белках, из которых происходят домены. Согласно другим вариантам осуществления DBD и TAD и/или два TAD конъюгированы через синтетическую или экзогенную линкерную последовательность. Подходящие линкеры могут быть гибкими, расщепляемыми, нерасщепляемыми, гидрофильными и/или гидрофобными. Согласно определенным вариантам осуществления DBD и TAD и/или два TAD могут быть слиты вместе через линкер, содержащий множество остатков глицина и/или серина. Примеры пептидных линкеров глицина/серина включают в себя [GS]n, [GGGS]n (SEQ ID NO: 179), [GGGGS]n (SEQ ID NO: 180), [GGSG]n (SEQ ID NO: 181), где n представляет собой целое число, равное или больше 1. Согласно определенным вариантам осуществления линкер, используемый для конъюгирования DBD и TAD и/или двух TAD, представляет собой GGSGGGSG (SEQ ID NO: 177). Согласно определенным вариантам осуществления линкер, используемый для конъюгирования DBD и TAD и/или двух TAD, представляет собой GGSGGGSGGGSGGGSG (SEQ ID NO: 178). Согласно определенным вариантам осуществления, когда DBD конъюгирован с двумя TAD, первый и второй TAD могут быть конъюгированы с DBD с одинаковыми или разными линкерами, или один TAD может быть конъюгирован с DBD с помощью линкера, а
- 13 046157 другой TAD может быть конъюгирован напрямую с DBD (например, без промежуточной линкерной последовательности), или оба TAD могут быть непосредственно конъюгированы с DBD (например, без промежуточных линкерных последовательностей). Согласно определенным вариантам осуществления, когда DBD конъюгирован с двумя TAD на одном и том же конце (например, N-конце или C-конце), линкер, соединяющий два TAD, может быть таким же или отличаться от линкера, соединяющего TAD с DBD, или TAD могут быть конъюгированы друг с другом с помощью линкера, но TAD напрямую конъюгированы с DBD (например, без промежуточной линкерной последовательности), или TAD могут быть напрямую конъюгированы друг с другом (например, без промежуточных линкерных последовательностей), но TAD конъюгированы с DBD с помощью линкера. Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, не содержат один или несколько тегов HA (например, SEQ ID NO: 171), расположенных между DBD и одним или несколькими TAD.
Представленные в настоящем документе eTF, которые активируют SCN1A, обладают свойствами, отличными от природных факторов транскрипции. Согласно определенным вариантам осуществления eTF, который активирует SCN1A, содержит DBD, полученный из встречающегося в природе белка, который был модифицирован таким образом, что DBD связывается с другим целевым сайтом по сравнению с встречающимся в природе белком, из которого он получен, и eTF, содержащий такой модифицированный DBD модулирует экспрессию другого гена (например, SCN1A) по сравнению с природным белком, из которого получен DBD (например, геном, отличным от SCN1A). Согласно другим вариантам осуществления eTF, представленный в настоящем документе, который активирует SCN1A, содержит TAD, полученный из встречающегося в природе белка, который был модифицирован таким образом, что eTF, содержащий такой модифицированный TAD, модулирует экспрессию другого гена (например, SCN1A) по сравнению с встречающимся в природе белком, из которого получен TAD (например, ген, отличный от SCN1A), и/или eTF, содержащий такой модифицированный TAD, по-разному модулирует экспрессию SCN1A (например, активирует или подавляет) по сравнению с встречающимся в природе белком, из которого получен TAD. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, полученный из встречающегося в природе белка, и TAD, полученный из встречающегося в природе белка (одного и того же или разных белков), причем как DBD, так и TAD были модифицированы. Согласно таким вариантам осуществления DBD может связываться с другим целевым сайтом по сравнению с встречающимся в природе белком, из которого он был получен, eTF, содержащий такой модифицированный DBD и TAD, модулирует экспрессию другого гена (например, SCN1A) по сравнению с встречающимся в природе белком, из которых получены домены (например, ген(-ы), отличный от SCN1A), и/или eTF, содержащий такие модифицированные DBD и TAD, по-разному модулирует экспрессию SCN1A (например, активирует или подавляет) по сравнению с встречающимися в природе белками, из которых получены домены DBD и TAD.
ДНК-связывающие домены (DBD).
Приведенные в настоящем документе eTF, которые активируют SCN1A, могут содержать любой подходящий DBD, который связывается с представляющим интерес целевым сайтом (например, целевой сайт, который приводит к положительной регуляции SCN1A при связывании с помощью eTF, представленного в настоящем документе). Согласно определенным вариантам осуществления DBD может представлять собой синтетически разработанный DBD. Согласно другим вариантам осуществления DBD может быть получен из встречающегося в природе белка. Семейства DBD включают в себя основную спираль-петлю-спираль (bHLH) (например, c-Myc), основную лейциновую молнию (например, C/EBP), спираль-поворот-спираль (например, Oct-1) и цинковые пальцы (например, EGR1 или EGR3). Эти семейства демонстрируют широкий спектр специфичностей связывания ДНК и генных мишеней. Как предполагается в настоящем документе, любой из известных белков фактора транскрипции человека может служить в качестве белковой платформы для конструирования и/или перепрограммирования DBD для распознавания конкретного целевого сайта, что приводит к модуляции экспрессии эндогенного гена SCN1A. Согласно иллюстративным вариантам осуществления DBD, представленный в настоящем документе, содержит домен типа цинковые пальцы, связывающий домен TALEN или комплекс gRNA/Cas.
Представленный в настоящем документе DBD может быть разработан для распознавания любого целевого сайта, который приводит к активации SCN1A. Согласно иллюстративным вариантам осуществления DBD разработан для распознавания местоположения в геноме и повышения экспрессии эндогенного гена SCN1A, связанного с eTF. Сайты связывания, способные модулировать экспрессию эндогенного гена SCNIA при связывании с помощью представленного в настоящем документе eTF, могут быть расположены в любом месте генома, что приводит к модуляции экспрессии гена SCN1A. Согласно различным вариантам осуществления сайт связывания может быть расположен на хромосоме, отличной от SCN1A, на той же хромосоме, что и SCN1A, выше против хода транскрипции от сайта начала транскрипции (TSS) гена SCN1A, ниже по ходу транскрипции от TSS гена SCN1A, проксимальнее от TSS гена SCN1A, дистальнее от TSS гена SCN1A, в кодирующей области гена SCN1A, в интроне гена SCN1A, ниже по ходу транскрипции от полиА-хвоста гена SCN1A, в промоторной последовательности, которая регулирует ген SCN1A, или в последовательности энхансера, которая регулирует ген SCN1A.
- 14 046157
DBD может быть разработан для связывания с целевым сайтом связывания любой длины при условии, что он обеспечивает специфическое распознавание последовательности целевого сайта связывания посредством DBD, например, с минимальным или нулевым связыванием вне мишени. Согласно определенным вариантам осуществления целевой сайт связывания может модулировать экспрессию SCN1A при связывании с eTF на уровне, который является по меньшей мере 2-кратным, 5-кратным, 10-кратным, 20-кратным, 50-кратным, 75-кратным, 100-кратным, 150-кратным, 200-кратным, 250-кратным, 500кратным или более по сравнению со всеми другими генами. Согласно определенным вариантам осуществления целевой сайт связывания может модулировать экспрессию SCNIA при связывании с eTF на уровне, который является по меньшей мере 2-кратным, 5-кратным, 10-кратным, 20-кратным, 50-кратным, 75-кратным, 100-кратным, 150-кратным, 200-кратным, 250-кратным, 500-кратным или более по сравнению с 40 ближайшими соседними генами (например, 40 генов, расположенных ближе всего к хромосоме, выше против хода транскрипции или ниже по ходу транскрипции от кодирующей последовательности SCN1A). Согласно определенным вариантам осуществления целевой сайт связывания может составлять по меньшей мере 5 п.н., 10 п.н., 15 п.н., 20 п.н., 25 п.н., 30 п.н., 35 п.н., 40 п.н., 45 п.н. или 50 п.н. или более. Конкретная длина сайта связывания определяется типом DBD в eTF. В общем, чем больше длина сайта связывания, тем выше специфичность связывания и модуляции экспрессии гена (например, более длинные сайты связывания характеризуются меньшим количеством нецелевых эффектов). Согласно определенным вариантам осуществления, eTF, содержащий DBD, распознающий более длинный целевой сайт связывания, имеет меньше нецелевых эффектов, связанных с неспецифическим связыванием (таких как, например, модуляция экспрессии нецелевого гена или отличного от SCN1A гена) относительно нецелевых эффектов, наблюдаемых с eTF, имеющим DBD, который связывается с более коротким целевым сайтом. В некоторых случаях снижение нецелевого связывания по меньшей мере в 1,2, 1,3, 1,4, 1,5, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз ниже по сравнению с сопоставимым eTF, имеющим DBD, который распознает более короткий целевой сайт связывания.
Согласно определенным вариантам осуществления представленный в настоящем документе DBD может быть модифицирован, чтобы иметь повышенную аффинность связывания, так что он связывается с целевым сайтом связывания в течение более длительного периода времени, так что TAD, конъюгированный с DBD, может рекрутировать больше факторов транскрипции и/или рекрутировать такой фактор транскрипции на более длительный период времени, чтобы оказывать большее влияние на уровень экспрессии эндогенного гена SCN1A. Согласно определенным вариантам осуществления DBD может быть модифицирован для увеличения его специфического связывания (или целевого связывания) с желаемым целевым сайтом и/или модифицирован для уменьшения его неспецифического или нецелевого связывания.
Согласно различным вариантам осуществления связывание между DBD или eTF и целевым сайтом связывания может быть определено с использованием различных способов. Согласно определенным вариантам осуществления специфическое связывание между DBD или eTF и целевым сайтом связывания может быть определено с использованием анализа определения изменения подвижности, анализа защиты от ДНКазы или любого другого способа in vitro, известного в настоящей области техники для анализа связывания белок-ДНК. Согласно другим вариантам осуществления специфическое связывание между eTF и целевым сайтом связывания можно определить с помощью функционального анализа, например, путем измерения экспрессии (РНК или белка) гена (например, SCN1A), когда целевой сайт связывания связан с eTF. Например, целевой сайт связывания может быть расположен выше против хода транскрипции от репортерного гена (такого как, например, eGFP) или гена SCN1A в векторе, содержащемся в клетке или интегрированном в геном клетки, причем клетка экспрессирует eTF. Альтернативно, экспрессирующий eTF вектор может быть введен в тип клеток, который в природе содержит ген SCN1A. Более высокие уровни экспрессии репортерного гена (или SCN1A) в присутствии eTF по сравнению с контролем (например, без eTF или eTF, который распознает другой целевой сайт) указывают на то, что DBD eTF связывается с целевым сайтом. Подходящие in vitro (например, неклеточные) системы транскрипции и трансляции также могут быть использованы аналогичным образом. Согласно определенным вариантам осуществления eTF, который связывается с целевым сайтом, может характеризоваться по меньшей мере 2-кратной, 3-кратной, 5-кратной, 10-кратной, 15-кратной, 20-кратной, 30-кратной, 50-кратной, 75кратной, 100-кратной, 150-кратной или большей экспрессией репортерного гена или SCN1A по сравнению с контролем (например, без eTF или с eTF, который распознает другой целевой сайт).
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, размер которого составляет по меньшей мере 9 п.н., 12 п.н., 15 п.н., 18 п.н., 21 п.н., 24 п.н., 27 п.н., 30 п.н., 33 п.н. или 36 п.н.; более чем 9 п.н., 12 п.н., 15 п.н., 18 п.н., 21 п.н., 24 п.н., 27 п.н. или 30 п.н.; или 9-33 п.н., 9-30 п.н., 9-27 п.н., 9-24 п.н., 9-21 п.н., 9-18 п.н., 9-15 п.н., 9-12 п.н., 12-33 п.н., 12-30 п.н., 12-27 п.н., 12-24 п.н., 12-21 п.н., 12-18 п.н., 12-15 п.н., 15-33 п.н., 15-30 п.н., 15-27 п.н., 15-24 п.н., 15-21 п.н., 15-18 п.н., 18-33 п.н., 18-30 п.н., 18-27 п.н., 1824 п.н., 18-21 п.н., 21-33 п.н., 21-30 п.н., 21-27 п.н., 21-24 п.н., 24-33 п.н., 24-30 п.н., 24-27 п.н., 27-33 п.н., 27-30 п.н. или 30-33 п.н.. Согласно иллюстративным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который составляет
- 15 046157
18-27 п.н., 18 п.н. или 27 п.н.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, расположенный на хромосоме 2. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, расположенный на хромосоме 2 в пределах 110 т.п.н., 100 т.п.н., 90 т.п.н., 80 т.п.н., 70 т.п.н., 60 т.п.н., 50 т.п.н., 40 т.п.н., 30 т.п.н., 20 т.п.н., 10 т.п.н., 5 т.п.н., 4 т.п.н., 3 т.п.н., 2 т.п.н. или 1 т.п.н. выше против хода транскрипции или ниже по ходу транскрипции от ТСС SCN1A. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах 110 т.п.н. выше против хода транскрипции от TSS SCN1A. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах 110 т.п.н. ниже по ходу транскрипции от TSS SCN1A. Согласно иллюстративным вариантам осуществления такие целевые сайты связывания составляют 18-27 п.н., 18 п.н. или 27 п.н.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах положений 166179652-165989571, в пределах положений 166128050-166127958, в пределах положений 166155414-166140590, в пределах положений 166179652-1661777272 или в пределах положений 1659990246-165989592 (все со ссылкой на GRCh38.p12). Согласно иллюстративным вариантам осуществления такие целевые сайты связывания составляют 18-27 п.н., 18 п.н. или 27 п.н.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166178880, 166177369, 166177362, 166177299, 166177299, 166155393, 166155264, 166149373, 166149176, 166149165, 166149118, 166148953, 166148565, 166142396, 166142391, 166142344, 166142239, 166141162, 166140928, 166140590, 165990076, 165989684, 165989571, 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12) и (iii) способен вызывать по меньшей мере 1,2-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 25, 30, 31 или 35-66 или состоящим из нее, и (ii) способен вызывать по меньшей мере 1,2-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать как минимум 2кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 30, 31, 37, 38, 45, 47, 48, 49, 55, 61, 62 или 64 или состоящим из нее, и (ii) способен вызывать по меньшей мере 2-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., и (ii) перекрывается с положением на хромосоме 2, выбранным из 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 5-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 30, 31, 37 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 5-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166128002, 166128037, или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 15-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 30, 37 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 15-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
- 16 046157
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 20-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 30 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 20-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2 в положении 166128025 и (iii) способен вызывать по меньшей мере 25-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим или состоящим из SEQ ID NO: 30, и (ii) способен вызывать по меньшей мере 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н. и (ii) связывается с геномной областью, которая находится в пределах по меньшей мере 1 т.п.н., 750 п.н., 500 п.н., 400 п.н., 300 п.н., 200 п.н., 100 п.н. или 50 п.н. геномного местоположения, имеющего последовательность любой из SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2кратное, 5-кратное, 15-кратное, 20-кратное или 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н. и (ii) связывается с областью генома, которая по меньшей мере частично перекрывается с геномным местоположением, имеющим последовательность любой из SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2-кратное, 5-кратное, 15-кратное, 20-кратное или 25-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, имеющий любую из следующих последовательностей: SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2-кратное, 5-кратное, 15кратное, 20-кратное или 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, приводит по меньшей мере к 1,5-кратному, 2-кратному, 3-кратному, 4-кратному, 5-кратному, 6-кратному, 7-кратному, 8-кратному, 9-кратному, 10-кратному, 15-кратному, 20-кратному, 25-кратному, 50-кратному, 100-кратному или более или по меньшей мере 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более активации экспрессии SCN1A (РНК SCN1A и/или белок Nav1.1) в клетке или in vivo по сравнению с контролем (например, без eTF или с eTF, который не распознает целевой сайт). Согласно различным вариантам осуществления активация экспрессии SCNIA может быть обнаружена с помощью способов ПЦР, вестерн-блоттинга или иммуноанализов.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, связывается с целевым сайтом, который способен увеличивать экспрессию SCNIA по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2 раза, 3 раза, 4 раза, 5 раз, 8 раз, 10 раз, 12 раз, 15 раз, 18 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз, 75 раз, 100 раз или больше или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более относительно контроля в анализе активации транскрипции. Иллюстративный анализ активации транскрипции SCN1A представлен в настоящем документе в примере 3. Вкратце, HEK293 трансфицируют плазмидой, несущей eTF или контрольную репортерную конструкцию eGFP. Через 48 часов после трансфекции клетки собирают, выделяют РНК и подвергают обратной транскрипции, а полученные образцы кДНК анализируют с помощью кПЦР (например, с использованием праймеров, имеющих SEQ ID NO: 185 и 186) для количественного определения содержания эндогенного транскрипта SCN1A. GAPDH можно использовать в качестве эталонного гена для определения относительных уровней экспрессии SCN1A.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, кото
- 17 046157 рый активирует SCN1A, характеризуется минимальными нецелевыми эффектами, например, нецелевыми эффектами, связанными с неспецифическим связыванием, такими как, например, модуляция экспрессии нецелевого гена или отличного от SCN1A гена. Согласно одному варианту осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, специфически активирует SCN1A по сравнению с контролем, по меньшей мере в 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз или 50 раз больше, чем экспрессия, произведенная eTF для одного или нескольких нецелевых генов по сравнению с контролем. Согласно иллюстративному варианту осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, специфически активирует транскрипцию гена SCN1A по сравнению с контролем, по меньшей мере, в 15 раз больше, чем транскрипция 40 ближайших соседних генов (например, 40 ближайших генов, расположенных к кодирующей последовательности SCN1A на хромосоме 2), производимая eTF относительно контроля, например, PLA2R1, ITGB6, RBMS1, TANK, PSMD14, TBR1, SLC4A10, DPP4, FAP, IFIH1, GCA, FIGN, GRB14, COBLL1, SLC38A11, SCN3A, SCN2A, CSRNP3, GALNT3, TTC21B, SCN9A, SCN7A, B3GALT1, STK39, CERS6, NOSTRIN, SPC25, ABCB11, DHRS9, BBS5, KLHL41, FASTKD1, PPIG, CCDC173, PHOSPHO2, KLHL23, SSB, METTL5, UBR3 и MYO3B (смотрите табл. 14). Согласно различным вариантам осуществления активация транскрипции гена SCN1A может быть обнаружена с помощью способов ПЦР.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, способен снижать частоту припадков в анализе гипертермических припадков (HTS) в модели синдрома Драве на мышах Scn1atm1kea. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен снижать частоту припадков при температуре 42,6°C в анализе HTS по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2,0 раза или более или по меньшей мере на 20%, 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% или более по сравнению с контролем (например, обработанный PBS или воздействие вектором AAV, содержащим последовательность, кодирующую eGFP). Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен снижать частоту припадков при температуре 42,6°C в анализе HTS, так что по меньшей мере у 60%, 62%, 65%, 70%, 75%, 76%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% мышей, участвовавших в анализе, не наблюдалось припадков при температуре 42,6°C. Иллюстративный анализ HTS описан в настоящем документе в примере 6. Вкратце, пометам детенышей, полученным от самцов мышей Scn1a +/-, скрещенных с самками мышей C57Bl/6J, может быть введен вектор AAV9, кодирующий eTF, который активирует SCN1A, как предусмотрено в настоящем документе, или контрольный вектор, кодирующий eGFP, посредством двустороннего ICV в P1. Мышам можно вводить дозу ~1,0E10-5,0E12 копий геномов/мышь. Анализ HTS проводят на гетерозиготных мышах P26-P28 SCNIA и SCNIA дикого типа на смешанном фоне 129Stac X C57BL/6 путем повышения температуры тела мышей (в контролируемых условиях и с контролем температуры тела) на ~0,5°C каждые 2 минуты до начала первого тоникоклонического припадка, сопровождающегося потерей положения тела, или до достижения температуры тела 43°C. Считается, что у мыши не было припадка, если не было обнаружено припадка с потерей положения тела в течение всего периода эксперимента.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, способен увеличивать выживаемость мыши, гетерозиготной по SCN1A, например, линии мышей Scn1atm1kea. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен увеличивать выживаемость гетерозиготных мышей SCN1A при P100 по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2,0 раза или более, или по меньшей мере на 20%, 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% или более, как по сравнению с контролем (например, обработанным PBS или обработанным вектором AAV, содержащим последовательность, кодирующую eGFP). Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен увеличивать выживаемость гетерозиготных мышей SCN1A при P100, так что по меньшей мере 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% мышей, задействованных в анализе, все еще живы при P100. Иллюстративный анализ выживаемости описан в настоящем документе в примере 7. Вкратце, пометам детенышей, полученным от самцов мышей Scn1a +/-, скрещенных с самками мышей C57Bl/6J, может быть введен вектор AAV9 посредством двустороннего ICV в точке P1. Мышам можно вводить дозу ~1,0E10-5,0E12 копий геномов/мышь. Определяют количество мышей, доживших до P100.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, может содержать DBD из белка типа цинковые пальцы, полученного из белка типа цинковые пальцы, или нуклеаза представляет собой инактивированный белок типа цинковые пальцы. Цинковый палец представляет собой небольшой структурный мотив белка, который характеризуется координацией одного или нескольких ионов цинка (Zn2+) для стабилизации складки. Домены типа цинковые пальцы (Znf) представляют собой относительно небольшие белковые мотивы, которые содержат несколько пальцевидных выступов, которые создают тандемные контакты с целевым участком ДНК. Модульная природа мотива цинкового пальца позволяет связывать большое количество комбинаций последовательностей ДНК с высокой степенью аффинности и специфичности, и поэтому
- 18 046157 идеально подходит для создания белка, который может быть нацелен на определенные последовательности ДНК и связывать их. Многие сконструированные наборы цинковых пальцев основаны на домене типа цинковые пальцы мышиного фактора транскрипции Zif268. Zif268 содержит три отдельных мотива цинковые пальцы, которые вместе связывают последовательность из 9 п.н. с высокой аффинностью. Было идентифицировано большое количество белков типа цинковые пальцы, и они были охарактеризованы на различные типы на основе структуры, которая дополнительно описана в настоящем документе. Любой такой белок типа цинковые пальцы применим в связи с описанными в настоящем документе DBD.
Доступны различные способы конструирования белков типа цинковые пальцы. Например, описаны способы создания белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, Liu Q, et al., Design of polydactyl zinc-finger proteins for unique addressing within complex genomes, Proc Natl Acad Sci USA. 94 (11): 5525-30 (1997); Wright DA et al., Standardized reagents and protocols for engineering zinc finger nucleases by modular assembly, Nat Protoc. Nat Protoc. 2006; 1(3): 1637-52 и CA Gersbach and T Gaj, Synthetic Zinc Finger Proteins: The Advent of Targeted Gene Regulation and Genome Modification Technologies, Am Chem Soc 47: 2309-2318 (2014). Кроме того, общедоступны различные веб-инструменты для создания белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, программные инструменты для разработки нуклеаз типа цинковые пальцы и веб-сайт анализа сконструированных данных генома от OmicX, доступный в Интернете по адресу omictools.com/zfns-category; и вебсайт дизайна Zinc Finger Tools от Scripps, доступный в Интернете по адресу scripps.edu/barbas/zfdesign/zfdesignhome.php. Кроме того, доступны различные коммерчески доступные услуги по разработке белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги или наборы, предлагаемые Creative Biolabs (в Интернете по адресу creative-biolabs.com/Design-and-Synthesis-of-ArtificialZinc-Finger-Proteins.html), Modular Assembly Kit Zinc Finger Consortium, доступный от Addgene (в Интернете по адресу addgene.org/kits/zfc-modular-assembly/), или the CompoZr Custom ZFN Service от Sigma Aldrich (в Интернете по адресу sigmaaldrich.com/life-science/zinc-finger-nuclease-technology/customzfn.html).
Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, содержат DBD, содержащий один или несколько цинковых пальцев, или получены из DBD белка типа цинковые пальцы. В некоторых случаях DBD содержит несколько цинковых пальцев, причем каждый цинковый палец связан с другим цинковым пальцем или другим доменом либо на своем N-конце, либо на C-конце, или на обоих через аминокислотный линкер. В некоторых случаях представленный в настоящем документе DBD содержит один или несколько цинковых пальцев из одного или нескольких типов цинковых пальцев, описанных в табл. 9. В некоторых случаях представленный в настоящем документе DBD содержит множество структур или мотивов цинковых пальцев или множество цинковых пальцев, имеющих одну или несколько из SEQ ID NO: 152-167 или любую их комбинацию. Согласно определенным вариантам осуществления DBD содержит X-[ZF-X]n и/или [X-ZF]n-X, причем ZF представляет собой домен типа цинковые пальцы, содержащий любой из мотивов, перечисленных в табл. 9 (например, любой из SEQ ID NO: 136-146), X представляет собой аминокислотный линкер, содержащий 1-50 аминокислот, и n представляет собой целое число от 1 до 15, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, причем каждый ZF может независимо иметь ту же последовательность или последовательность, отличную от других последовательностей ZF в DBD, и причем каждый линкер X может независимо иметь такую же последовательность или последовательность, отличную от других последовательностей X в DBD. Каждый цинковый палец может быть связан с другой последовательностью, цинковым пальцем или доменом на своем C-конце, N-конце или с обоими. В DBD каждый линкер X может быть идентичным по последовательности, длине и/или свойству (например, гибкости или заряду) или отличаться по последовательности, длине и/или свойству. В некоторых случаях два или более линкера могут быть идентичными, в то время как другие линкеры различны. Согласно иллюстративным вариантам осуществления линкер может быть получен или быть производным от последовательностей, соединяющих цинковые пальцы, обнаруженных в одном или нескольких встречающихся в природе белках типа цинковые пальцы, представленных в табл. 9. Согласно другим вариантам осуществления подходящие линкерные последовательности включают в себя, например, линкеры из 5 или более аминокислот в длину. См. также патент США № 6479626; 6903185 и 7153949 для иллюстративных линкерных последовательностей из 6 или более аминокислот в длину, каждая из которых полностью включена в настоящий документ. Предлагаемые в настоящем документе белки DBD могут включать в себя любую комбинацию подходящих линкеров между отдельными цинковыми пальцами белка. Описанные в настоящем документе белки DBD могут включать в себя любую комбинацию подходящих линкеров между отдельными цинковыми пальцами белка.
Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, содержат DBD, содержащий один или несколько классических цинковых пальцев. Классический цинковый палец C2H2 содержит два цистеина в одной цепи и два остатка гис
- 19 046157 тидина в другой цепи, координируемых ионом цинка. Классический домен типа цинковый палец содержит два β-листа и одну α-спираль, причем а-спираль взаимодействует с молекулой ДНК и формирует основу связывания DBD с целевым сайтом и может называться спиралью распознавания. Согласно иллюстративным вариантам осуществления спираль распознавания цинковых пальцев содержит по меньшей мере одну аминокислотную замену в положении -1, 2, 3 или 6, тем самым изменяя специфичность связывания домена типа цинковые пальцы. Согласно другим вариантам осуществления представленный в настоящем документе DBD содержит один или несколько неклассических цинковых пальцев, например, C2-H2, C2-CH и C2-C2.
Согласно другому варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, содержащий мотив типа цинковые пальцы, имеющий следующую структуру: LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147), где n представляет собой целое число от 1 до 15, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, и каждый X независимо представляет собой последовательность распознавания (например, спираль распознавания), способную связываться с 3 п.н. целевой последовательности. Согласно иллюстративным вариантам осуществления n равно 3, 6 или 9. Согласно особенно предпочтительному варианту осуществления n равно 6. Согласно различным вариантам осуществления каждый X может независимо иметь одинаковую аминокислотную последовательность или отличную аминокислотную последовательность по сравнению с другими последовательностями X в DBD. Согласно иллюстративному варианту осуществления каждый X представляет собой последовательность, содержащую 7 аминокислот, которая была разработана для взаимодействия с 3 п.н. представляющего интерес целевого сайта связывания с использованием Zinger Finger Design Tool от Scripps, расположенного в Интернете по адресу scripps.edu/barbas/ zfdesign/zfdesignhome.php.
Поскольку каждый цинковый палец в DBD распознает 3 п.н., количество цинковых пальцев, включенных в DBD, сообщает длину сайта связывания, распознаваемого DBD, например, DBD с 1 цинковым пальцем распознает целевой сайт связывания, имеющий 3 п.н., DBD с 2 цинковыми пальцами распознает целевой сайт связывания, имеющий 6 п.н., DBD с 3 цинковыми пальцами распознает целевой сайт связывания, имеющий 9 п.н., DBD с 4 цинковыми пальцами распознает целевой сайт связывания, имеющий 12 п.н., DBD с 5 цинковыми пальцами распознает целевой сайт связывания, имеющий 15 п.н., DBD с 6 цинковыми пальцами распознает целевой сайт связывания, имеющий 18 п.н., DBD с 9 цинковыми пальцами распознает целевой сайт связывания, имеющий 27 п.н., и т. д. В общем, DBD, которые распознают более длинные целевые сайты связывания, будут проявлять большую специфичность связывания (например, меньшее нецелевое связывание или неспецифическое связывание).
Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который происходит из встречающегося в природе белка типа цинковые пальцы путем выполнения одной или нескольких аминокислотных замен в одной или нескольких спиралях распознавания доменов типа цинковые пальцы для изменения специфичности связывания DBD (например, изменение целевого сайта, распознаваемого DBD). Представленный в настоящем документе DBD может быть получен из любого встречающегося в природе белка типа цинковые пальцы. Согласно различным вариантам осуществления такой DBD может быть получен из белка типа цинковые пальцы любого вида, например, мыши, крысы, человека и т.д. Согласно иллюстративному варианту осуществления представленный в настоящем документе DBD получен из белка типа цинковые пальцы человека. Согласно определенным вариантам осуществления представленный в настоящем документе DBD получен из встречающегося в природе белка, перечисленного в табл. 9. Согласно иллюстративному варианту осуществления представленный в настоящем документе белок DBD получен из белка типа цинковые пальцы EGR человека, например, EGR1, EGR2, EGR3 или EGR4.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который происходит из встречающегося в природе белка, путем модификации DBD для увеличения количества доменов типа цинковые пальцы в белке DBD путем повторения одного или нескольких цинковые пальцев в пределах DBD встречающегося в природе белка. Согласно определенным вариантам осуществления такие модификации включают в себя дупликацию, утроение, учетверение или дальнейшее умножение цинковых пальцев в пределах DBD встречающегося в природе белка. В некоторых случаях умножается один цинковый палец из DBD человеческого белка, например, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или более копий одного и того же мотива цинкового пальца повторяется в DBD eTF. В некоторых случаях набор цинковых пальцев из DBD встречающегося в природе белка умножается, например, набор из 3 цинковых пальцев из DBD встречающегося в природе белка дублируется, чтобы получить eTF, имеющий DBD с 6 цинковыми пальцами, троекратно повторяется для получения DBD eTF с 9 цинковыми пальцами или повторяется четыре раза для получения DBD eTF с 12 цинковыми пальцами и т.д. В некоторых случаях набор цинковых пальцев из DBD встречающегося в природе белка частично реплицируется для формирования DBD eTF, имеющего большее количество цинковых пальцев, например, DBD eTF содержит четыре цинковых пальца, причем цинковые пальцы представляют собой одну копию первого цинкового пальца, одну копию второго цинкового пальца и две копии третьего цинкового пальца из встречающегося в природе белка,
- 20 046157 всего четыре цинковых пальца в DBD eTF. Затем такие DBD дополнительно модифицируют, производя одну или несколько аминокислотных замен в одной или нескольких спиралях распознавания доменов типа цинковые пальцы, чтобы изменить специфичность связывания DBD (например, изменяя целевой сайт, распознаваемый DBD). Согласно иллюстративным вариантам осуществления DBD получают из встречающегося в природе человеческого белка, такого как белок типа цинковые пальцы EGR человека, например, EGR1, EGR2, EGR3 или EGR4.
EGR1 и EGR3 человека характеризуются трехпальцевым DBD типа цинковые пальцы C2H2. Общие правила связывания для цинковых пальцев предусматривают, что все три пальца взаимодействуют со своей родственной последовательностью ДНК с аналогичной геометрией, используя одни и те же аминокислоты в альфа-спирали каждого цинкового пальца для определения специфичности или распознавания последовательности целевого сайта связывания. Такие правила связывания позволяют изменять DBD EGR1 или EGR3 для создания DBD, который распознает желаемый целевой сайт связывания. В некоторых случаях спираль распознавания ДНК из 7 аминокислот в мотиве цинкового пальца EGR1 или EGR3 модифицируется в соответствии с опубликованными правилами разработки цинковых пальцев. Согласно определенным вариантам осуществления каждый цинковый палец в DBD с тремя пальцами EGR1 или EGR3 модифицируется, например, путем изменения последовательности одной или нескольких спиралей распознавания и/или путем увеличения количества цинковых пальцев в DBD. Согласно определенным вариантам осуществления EGR1 или EGR3 перепрограммированы для распознавания целевого сайта связывания по меньшей мере из 9, 12, 15, 18, 21, 24, 27, 30, 33, 36 или более пар оснований в желаемом целевом сайте. Согласно определенным вариантам осуществления такой DBD, полученный из ERG1 или EGR3, содержит по меньшей мере 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или более цинковых пальцев. Согласно иллюстративному варианту осуществления один или несколько цинковых пальцев в DBD содержат по меньшей мере одну аминокислотную замену в положении -1, 2, 3 или 6 спирали распознавания.
Согласно различным вариантам осуществления eTF, который активирует SCN1A, содержащий DBD, полученный из EGR1 или EGR3, характеризуется специфичностью связывания ДНК, которая отличается от специфичности связывания встречающихся в природе EGR1 или EGR3, например, DBD распознает целевой сайт связывания, имеющий последовательность, отличную от последовательности сайта связывания, распознаваемой Лмодифицированными EGR1 или EGR3: (GCG(T/G)GGGCG) (SEQ ID NO: 182).
Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который представляет собой комплекс gRNA/Cas. CRISPR (кластеризованные регулярные промежуточные короткие палиндромные повторы)/Cas9 представляет собой инструмент для редактирования генома, который позволяет направленно воздействовать на сайтспецифический геном. Система CRISPR/Cas типа II представляет собой прокариотическую систему адаптивного иммунного ответа, которая использует некодирующие РНК, чтобы направлять нуклеазу Cas9 для индукции сайт-специфического расщепления ДНК. Система CRISPR/Cas9 была использована для создания простого, программируемого с помощью РНК способа, обеспечивающего редактирование генома в клетках млекопитающих. Одна направляющая РНК (sgRNA) может быть создана для направления нуклеазы Cas9 в конкретное место генома, которое затем связывается комплексом gRNA/Cas9. gRNA может быть сконструирована для связывания с представляющим интерес целевым сайтом с использованием различных способов и инструментов. Например, способы создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК описаны в Aach, et al. Flexible algorithm for identifying specific Cas9 targets in genomes. BioRxiv, Cold Spring Harbor Labs, doi: http://dx.doi.org/10.1101/005074 (2014); Bae, et al. Cas-OFFinder: a fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics. 30(10): 1473-1475 (2014); Doench, J. G. et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPRCas9. Nat Biotech 34, 184-191 (2016); Gratz, et al. Highly specific and efficient CRISPR/Cas9-catalyzed homology-directed repair in Drosophila. Genetics. 196(4):961-971 (2014); Heigwer, et al. E-CRISP: fast CRISPR target site identification. Nat Methods. 11(2):122-123 (2014); Ma, et al. A guide RNA sequence design platform for the CRISPR/Cas9 system for model organism genomes. Biomed Res Int. doi:http://doi.org/10.1155/2013/270805 (2013); Montague, et al. CHOPCHOP: a CRISPR/Cas9 and TALEN web tool for genome editing. Nucleic Acids Res. 42(W1):W401-W407 (2014); Liu, et al. CRISPR-ERA: a comprehensive design tool for CRISPR-mediated gene editing, repression and activation. Bioinformatics. 31(22):3676-3678 (2015); Ran, et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature. 520(7546):186-191 (2015); Wu, et al. Target specificity of the CRISPR-Cas9 system. Quant Biol. 2(2):59-70 (2015); Xiao, et al. CasOT: a genome-wide Cas9/gRNA off-target searching tool. Bioinformatics. 30(8):11801182 (2014); Zetsche, et al. Cpf1 is a single RNA-guided endonuclease of a Class 2 CRISPR-Cas System. Cell. 163(3):759-771 (2105). Кроме того, общедоступны различные веб-инструменты для создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, инструмент разработки CRISPR gRNA, доступный от AUTM в Интернете по адресу atum.bio/eCommerce/cas9/input?multipleContacts=false; инструмент разработки CRISPRa/i gRNA, доступ
- 21 046157 ный от Broad Institute в Интернете по адресу portals.broadinstitute.org/gpp/public/analysis-tools/sgrnadesign-crisprai; инструмент разработки E-CRISP, доступный в Немецком онкологическом исследовательском центре DKFZ, доступный в Интернете по адресу e-crisp.org/E-CRISP/; и инструмент Knockout Guide Design, доступный от Synthego в Интернете по адресу design.synthego.com/#/. Кроме того, доступны различные коммерчески доступные сервисы для создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги, предлагаемые IDT (в Интернете по адресу idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE), ThermoFisher (в Интернете по адресу thermofisher.com/order/custom-oligo/crispr) и GenScript (в Интернете по адресу genscript. com/gRNA-design-tool. html).
Согласно иллюстративным вариантам осуществления DBD, который представляет собой комплекс gRNA/Cas, содержит дезактивированный нуклеазой белок Cas или dCas, такой как, например, dCas9, такой как дезактивированный нуклеазой Staphylococcus aureus (dSaCas9) или дезактивированный нуклеазой Streptococcus pyogenes Cas9 (dSpCas9). gRNA представлена в виде последовательности, содержащей нацеливающую область, которая нацеливает комплекс gRNA/Cas на желаемый целевой сайт, и каркасную область, которая облегчает взаимодействие с белком Cas. Любой подходящий каркас gRNA может использоваться в связи с представленными в настоящем документе gRNA. Согласно иллюстративному варианту осуществления gRNA представляет собой одиночную gRNA или sgRNA и содержит следующую каркасную последовательность: 5'-GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCA AAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGA-3' (SEQ ID NO: 183). Нацеливающая область направляющей РНК присоединяется к 5'-концу каркасной последовательности с образованием полной sgRNA. Согласно определенным вариантам осуществления gRNA и белок dCas могут экспрессироваться из одной и той же кассеты экспрессии. Согласно определенным вариантам осуществления промотор U6 используется для экспрессии gRNA. Согласно другим вариантам осуществления gRNA может быть экспрессирована в клетке, которая была сконструирована для стабильной экспрессии белка dCas-TAD, например, либо путем стабильной интеграции dCas в геном, либо на плазмиде, которая стабильно поддерживается вне хромосом.
Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, может содержать DBD из TALEN, полученный из TALEN, или который представляет собой инактивированную нуклеазой TALEN. Подобные активатору транскрипции эффекторные нуклеазы (TALEN) представляют собой рестрикционные ферменты, которые содержат DBD и домен нуклеазы, которые могут быть сконструированы для разрезания определенных последовательностей ДНК. TALEN создаются путем конъюгирования эффекторного ДНК-связывающего домена TAL с доменом расщепления ДНК (например, нуклеазой). Эффекторы, подобные активатору транскрипции (TALE), могут быть сконструированы так, чтобы связываться с желаемой целевой последовательностью ДНК, тем самым направляя домен нуклеазы в определенное место.
Эффекторы TAL представляют собой бактериальные белки из бактерий Xanthomonas. ДНКсвязывающий домен содержит повторяющуюся высококонсервативную последовательность из 33-34 аминокислот с расходящимися 12-ой и 13-ой аминокислотами. Эти два положения, называемые Repeat Variable Diresidue (RVD), сильно изменчивы и показывают сильную корреляцию со специфическим распознаванием нуклеотидов. Эта прямая взаимосвязь между аминокислотной последовательностью и распознаванием ДНК позволяет конструировать DBD, которые специфически нацелены на желаемую последовательность, путем выбора комбинации повторяющихся сегментов, содержащих соответствующие RVD.
Существуют разные способы разработки TALE. Например, способы разработки TALE для связывания с представляющей интерес целевой последовательностью ДНК описаны в T. Cermak et al., Nucleic Acids Research. 39 (12):e82 (2011); F. Zhang F et al., Nature Biotechnology. 29 (2):149-53 (2011); R. Morbitzer et al., Nucleic Acids Research. 39 (13):5790-9 (2011); T. Li et al., Nucleic Acids Research. 39 (14):631525 (2011); R. Geissler et al., PLOS One. 6(5): e19509 (2011) и E. Weber et al., PLOS One. 6(5): e19722 (2011). Кроме того, общедоступны различные веб-инструменты для разработки TALE для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, E-Talen, доступный в Интернете по адресу e-talen.org/E-TALEN/TAL и инструмент Effector Nucleotide Targeter 2.0, доступный в Интернете по адресу tall-nt.cac.cornell.edu/node/add/single-tale. Кроме того, доступны различные коммерчески доступные сервисы для создания TALE для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги, предлагаемые OmicX (в Интернете по адресу omictools.com/), Addgene (в Интернете по адресу addgene.org/talen/guide/ или ThermoFisher (в Интернете: thermofisher.com/us/en/home/life-science/genome-editing/geneart-tals/tal-designtool.html). Кроме того, общедоступная программа (DNAWorks) может использоваться для создания олигонуклеотидов, подходящих для сборки TALE, смотрите, например, D. Hoover D Methods in Molecular Biology. 852: 215-23 (2012).
Домены модуляции транскрипции.
Приведенные в настоящем документе eTF, которые активируют SCN1A, могут содержать любой подходящий домен, который способен рекрутировать один или несколько белковых факторов, которые
- 22 046157 могут модулировать транскрипцию (например, РНК-полимеразу II, CBP/p300, CREB или KRAB) или уровень экспрессии гена от представляющего интерес гена, когда eTF связан с целевым сайтом через DBD (например, DBD с цинковыми пальцами, gRNA/Cas DBD или TALE DBD). Согласно определенным вариантам осуществления такой домен рекрутирует белковые факторы, которые увеличивают уровень транскрипции или экспрессии представляющего интерес гена, и представляет собой домен активации транскрипции (TAD). Согласно другим вариантам осуществления такой домен рекрутирует белковые факторы, которые снижают уровень транскрипции или экспрессии представляющего интерес гена, и представляет собой домен репрессора транскрипции (TRD). Согласно определенным вариантам осуществления домен модуляции транскрипции (TAD или TRD) может представлять собой синтетически сконструированный домен. Согласно другим вариантам осуществления домен модуляции транскрипции (TAD или TRD) может происходить из встречающегося в природе белка, например, фактора транскрипции, коактиватора транскрипции, корепрессора транскрипции или белка-сайленсера. Согласно различным вариантам осуществления домен модуляции транскрипции (TAD или TRD) может происходить из белка любого вида, например, мыши, крысы, обезьяны, вируса или человека.
Согласно одному иллюстративному варианту осуществления TAD, подходящий для применения в представленных в настоящем документе eTF, которые активируют SNC1A, происходит из вирусного белка. Иллюстративные TAD, полученные из вирусных белков, включают в себя, например, TAD-домен VP64 (SEQ ID NO: 133), VPR (SEQ ID NO: 132), VP16, VP128, p65, p300 или любой его функциональный фрагмент или вариант, или последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к ней.
Согласно другому иллюстративному варианту осуществления TAD, подходящий для применения в представленных в настоящем документе eTF, которые активируют SCN1A, происходит из белка человека. Иллюстративные TAD, полученные из белков человека, включают в себя, например, TAD-домен взаимодействующего с CBP/p300 трансактиватора 2 (CITED2) (SEQ ID NO: 134), взаимодействующего с CBP/p300 трансактиватора 4 (CITED4) (SEQ ID NO: 135), EGR1 (SEQ ID NO: 176), CREB3 (SEQ ID NO: 224) или EGR3 (SEQ ID NO: 175), или любой их функциональный фрагмент или вариант, или последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к ней.
Согласно определенным вариантам осуществления eTF, который активирует SCN1A, содержит DBD типа цинковые пальцы, который конъюгирован с доменом активации транскрипции или TAD. Согласно различным вариантам осуществления DBD типа цинковые пальцы может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления DBD типа цинковые пальцы, полученный из человеческого белка, например, EGR1 или EGR3, конъюгирован с TAD, полученным из человеческого белка, например, CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления DBD типа цинковые пальцы, полученный из человеческого белка, например, EGR1 или EGR3, конъюгирован с VP64 или VPR TAD. Согласно определенным вариантам осуществления синтетический DBD типа цинковые пальцы или DBD типа цинковые пальцы, характеризующийся идентичностью последовательности, составляющей менее чем 75%, по отношению к человеческому белку, например, EGR1 или EGR3, конъюгирован с TAD, полученным из человеческого белка, например, CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления синтетический DBD типа цинковые пальцы или DBD типа цинковые пальцы, характеризующийся идентичностью последовательности, составляющей менее чем 75%, по отношению к человеческому белку, например, EGR1 или EGR3, конъюгирован с VP64 или VPR TAD.
Согласно определенным вариантам осуществления белок dCas конъюгирован с TAD. Согласно различным вариантам осуществления dCas9 может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно иллюстративным вариантам осуществления dCas9 конъюгирован с VP64 или VPR TAD.
Согласно определенным вариантам осуществления белок TALE конъюгирован с TAD. Согласно различным вариантам осуществления TALE может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно иллюстративным вариантам осуществления TALE конъюгирован с VP64 или VPR TAD.
eTF, которые активируют SCN1A и высокогомологичны человеческим белкам.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, характеризуется высоким процентом идентичности по отношению к одному или нескольким белкам человека (как дополнительно описано ниже). Согласно определенным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, имеющим более низкий общий процент идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно из
- 23 046157 мерить с использованием анализа elispot, иммуноанализа или способа in silico. Согласно определенным вариантам осуществления такие eTF могут содержать DBD, полученный из EGR1 или EGR3 человека, и TAD, полученный из EGR1, EGR3, CITED2, CITED4 или CREB3 человека. Такие eTF практически не обладают иммуногенностью при введении субъекту или обладают пониженной иммуногенностью по сравнению с eTF, характеризующимися более низким процентом идентичности по отношению к последовательностям белков человека.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SNC1A, характеризуется идентичностью последовательности, составляющей по меньшей мере 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Когда представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD и TAD, происходящие из одного и того же белка, процент идентичности с человеческим белком может быть определен путем расчета общего количества аминокислотных остатков в eTF, которые соответствуют человеческому белку, из которого он был получен (например, EGR1 или EGR3), разделенного на общее количество аминокислотных остатков в eTF. Когда eTF, обеспечивающий активную регуляцию SCN1A, содержит DBD из одного человеческого белка и TAD, полученный из другого человеческого белка, процент идентичности с человеком может быть определен путем отдельного расчета процента идентичности с человеческим для каждого домена и суммирования этих двух показателей вместе, например, (i) вычисление общего количества аминокислотных остатков в DBD, которые соответствуют человеческому белку, из которого он был получен (например, EGR1 или EGR3), деленного на общее количество аминокислотных остатков в eTF; (ii) вычисление общего количества аминокислотных остатков в TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; и (iii) суммирование суммы (i) и (ii). Согласно такому варианту осуществления домены делятся следующим образом: первый домен проходит от N-конца eTF до начала кодирующей последовательности для второго домена, а второй домен проходит от начала кодирующей последовательности для второго домена через C-конец eTF (например, для eTF, имеющего конфигурацию NLS-DBD-линкер-NLS-TAD, первый домен будет NLS-DBD-линкер, а второй домен будет NLS-TAD). Когда представленный в настоящем документе eTF, который активирует SNC1A, содержит DBD из одного человеческого белка и двух TAD, полученных из одного или нескольких различных человеческих белков, процент идентичности с человеком может быть определен путем отдельного расчета процента идентичности с человеческим для каждого домена и суммирования всех троих вместе, например, (i) вычисление общего количества аминокислотных остатков в DBD, которые соответствуют белку человека, из которого он был получен (например, EGR1 или EGR3), деленного на общее количество аминокислотных остатков в eTF; (ii) вычисление общего количества аминокислотных остатков в первом TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; (iii) вычисление общего количества аминокислотных остатков во втором TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; и (iv) суммирование суммы (i), (ii) и (iii). Согласно такому варианту осуществления домены делятся следующим образом: первый домен проходит от N-конца eTF до начала кодирующей последовательности для второго домена, второй домен проходит от начала кодирующей последовательности для второго домена через начало кодирующей последовательности для третьего домена, а третий домен проходит от начала кодирующей последовательности для третьего домена через C-конец eTF (например, для eTF, имеющего конфигурацию NLSTAD1-линкер-NLS-DBD-линкер-NLS-TAD2, первый домен будет ^S-TADI^uh^p, второй домен будет NLS-DBD-линкер, а третий домен будет NLS-TAD2). Процент идентичности по отношению к одному или нескольким человеческим белкам, как описано в этом разделе, может быть определен с использованием выходного процента идентичности, полученного с помощью стандартного инструмента BLAST для белков, доступного в NCBI (например, инструмента выравнивания набора blastp, используя алгоритм blastp (белок -> белок) с параметрами по умолчанию) доступен в Интернете на веб-сайте NCBI по адресу blast. ncbi. nlm. nih. gov/.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, имеет преимущество в том, что вызывает слабый, минимальный или нулевой неблагоприятный иммунный ответ у человека из-за высокой степени идентичности последовательностей с природными белками человека. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, вызывает пониженную иммуногенность, например, снижение иммуногенности по меньшей мере в 0,5, 1, 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 10, 15, 20, 25, 30, 35, 40, 45 или 50 или более раз по сравнению с иммуногенностью, наблюдаемой с eTF, имеющим более низкий процент идентичности по отношению к одному или нескольким белкам человека, например, eTF, характеризующимся идентичностью последовательности, составляющей менее чем 50%, 55%, 65% или 70%, по отношению к одному или нескольким белкам человека. В некоторых случаях снижение иммуногенности можно измерить с помощью анализа elispot, иммуноанализа или способа in
- 24 046157 silico. Генная терапия, обладающая низкой или минимальной иммуногенностью, имеет несколько преимуществ, включая в себя улучшенную переносимость пациентом, уменьшенную дозу, необходимую для достижения терапевтического эффекта, пролонгированные терапевтические эффекты после одного введения, возможность вводить несколько раз или в нескольких дозах, если необходимо, устойчивую терапевтическую эффективность в течение более длительного периода времени на одно введение, повышенную безопасность и/или повышенную эффективность генной терапии.
Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включают в себя DBD и TAD, полученные из одного или нескольких встречающихся в природе белков человека. Согласно определенным вариантам осуществления такие eTF могут содержать DBD, полученный из любого встречающегося в природе белка человека, содержащего DBD. Согласно иллюстративным вариантам осуществления, представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из встречающегося в природе белка типа цинковые пальцы, такого как, например, любая из конструкций 5-27, 36-41 или 44-53, перечисленные в табл. 1. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из белка EGR человека, такого как EGR1, EGR2, EGR3 или EGR4. Согласно иллюстративным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из EGR1 или EGR3 человека. Согласно различным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из белка типа цинковые пальцы человека, в котором минимальные аминокислотные изменения (например, 1, 2, 3, 4, 5, 6, 7 или 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 2-3, 2-4, 2-5, 2-6, 27, 3-4, 3-5, 36 или 3-7 аминокислотных замен) были сделаны в одном или нескольких доменах типа цинковые пальцы DBD, чтобы изменить специфичность связывания DBD для распознавания представляющего интерес целевого сайта связывания. Такие модификации последовательности предпочтительно выполняются в спиралях распознавания доменов типа цинковые пальцы DBD, в то время как остальная часть DBD или белка типа цинковые пальцы человека (включая в себя TAD) остается немодифицированной, чтобы сохранить как можно больше идентичности последовательности с природным человеческим белок по возможности.
Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержат один или несколько доменов модуляции транскрипции (например, TAD), полученных из человеческого белка, конъюгированного с DBD, полученным из белка человека. Согласно различным вариантам осуществления домен модуляции транскрипции может происходить из любого встречающегося в природе человеческого белка, имеющего домен, способный рекрутировать один или несколько белковых факторов, которые могут модулировать транскрипцию (например, РНК-полимераза II, коактиваторный белок или ко-репрессорный белок) или уровень экспрессии гена из представляющего интерес гена, когда eTF связывается с целевым сайтом через DBD. Согласно иллюстративным вариантам осуществления TAD получен из белка EGR человека, такого как, например, EGR1, EGR2, EGR3 или EGR4 человека, или из указанного белка человека, такого как, например, белок CITED2 или CITED4 человека. Согласно иллюстративному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя TAD из белка EGR1 или EGR3 человека. Согласно другому иллюстративному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя TAD из белка CITED2 или CITED4 человека.
Согласно одному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может содержать DBD человека (hDBD) и TAD человека (hTAD) (например, hTAD-hDBD или hDBD-hTAD), причем hDBD и hTAD могут происходить из одного и того же человеческого белка или из разных человеческих белков. Согласно другому варианту осуществления представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может содержать hDBD и два hTAD, причем hDBD и hTAD происходят из одного и того же человеческого белка, hDBD происходит из первого человеческого белка и оба hTAD происходят из второго человеческого белка, hDBD и один hTAD происходят из первого человеческого белка, а второй hTAD происходит из
- 25 046157 второго человеческого белка, или hDBD происходит из первого человеческого белка, один hTAD происходит из второго человеческого белка, а второй hTAD происходит из третьего человеческого белка (например, hTAD1-hDBD-hTAD1, hTAD1-hDBD-hTAD2, hTAD1-hTAD1-hDBD, hTAD1-hTAD2-hDBD, hDBD-hTAD1-hTAD1 или hDBD-hTAD1-hTAD2).
Согласно иллюстративным вариантам осуществления представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержит любую из следующих конфигураций: (i) hDBD и hTAD, оба получены из EGR1 человека; (ii) hDBD и hTAD, оба получены из EGR3 человека; (iii) hDBD, полученный из EGR1 человека, и hTAD, полученный из CITED2 (например, hEGR1 DBD-hCITED2 TAD или hCITED2 TAD-hEGR1 DBD); (iv) hDBD, полученный из EGR1 человека, и hTAD, полученный из CITED4 человека (например, hEGR1 DBD-hCITED4 TAD или hCITED4 TAD-hEGR1 DBD); (v) hDBD, полученный из EGR3 человека, и hTAD, полученный из CITED2 (например, hEGR3 DBD-hCITED2 TAD или hCITED2 TAD-hEGR3 DBD); (vi) hDBD, полученный из EGR3 человека, и hTAD, полученный из CITED4 человека (например, hEGR3 DBD-hCITED4 TAD или hCITED4 TAD-hEGR3 DBD); (vii) hDBD, полученный из EGR1 человека, и два hTAD, полученные из CITED2 (например, hCITED2 TAD-hEGR1 DBDhCITED2 TAD, hCITED2 TAD-hCITED2 TAD-hEGR1 DBD или hEGR1 DBD-hCITED2 TAD-hCITED2 TAD); (viii) hDBD, полученный из EGR1 человека, и два hTAD, полученные из CITED4 человека (например, hCITED4 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR1 DBD или hEGR1 DBD-hCITED4 TAD-hCITED4 TAD); (ix) hDBD, полученный из EGR3 человека, и два hTAD, полученные из CITED2 человека (например, hCITED2 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TADhCITED2 TAD-hEGR3 DBD или hEGR3 DBD-hCITED2 TAD-hCITED2 TAD); (x) hDBD, полученный из EGR3 человека, и два hTAD, полученные из CITED4 человека (например, hCITED4 TAD-hEGR3 DBDhCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR3 DBD или hEGR3 DBD-hCITED4 TAD-hCITED4 TAD); (xi) hDBD, полученный из EGR1 человека, первый hTAD, полученный из CITED2 человека, второй hTAD, полученный из CITED4 человека (например, hCITED2 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hEGR1 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR1 DBD, hCITED4 TADhCITED2 TAD-hEGR1 DBD, hEGR1 DBD-hCITED4 TAD-hCITED2 TAD или hEGR1 DBD-hCITED2 TADhCITED4 TAD); или (xii) hDBD, полученный из EGR3 человека, первый hTAD, полученный из CITED2 человека, второй hTAD, полученный из CITED4 человека (например, hCITED2 TAD-hEGR3 DBDhCITED4 TAD, hCITED4 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR3 DBD, hCITED4 TAD-hCITED2 TAD-hEGR3 DBD, hEGR3 DBD-hCITED4 TAD-hCITED2 TAD или hEGR3 DBDhCITED2 TAD-hCITED4 TAD).
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 92-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или больше по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или больше по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может дополнительно содержать одну или несколько аминокислотных последовательностей или доменов в дополнение к доменам DBD и TAD, например, сигнал ядерной локализации или линкер и т.д. Кроме того, полинуклеотид, кодирующий представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может дополнительно содержать одну или несколько последовательностей нуклеиновых кислот в дополнение к кодирующей последовательности для eTF, например, промотор, энхансер, полиА-хвост и т.д. Согласно таким вариантам осуществления одна или несколько дополнительных аминокислотных последовательностей и/или после
- 26 046157 довательностей нуклеиновых кислот предпочтительно представляют собой человеческие последовательности, происходящие из человеческих последовательностей, или характеризуются идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к белку человека.
Иллюстративные eTF SCN1A.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий один или несколько доменов типа цинковые пальцы, содержащих спираль распознавания, содержащую любую из SEQ ID NO: 152167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий по меньшей мере один, два, три, четыре, пять, шесть, семь, восемь, девять, десять, одиннадцать или двенадцать доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий шесть доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий девять доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно иллюстративным вариантам осуществления такие eTF содержат ДНК-связывающий домен, содержащий SEQ ID NO: 147, где каждый X независимо выбран из любой из SEQ ID NO: 152-167, а n равно 6 или 9.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RSDNLVR x REDNLHT x RSDELVR x QSGNLTE x TSGHLVR x QNSTLTE (SEQ ID NO: 148), где x может представлять собой линкер из 1-50 аминокислот, (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 148, или (ii) функциональный фрагмент из (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 18, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более раз по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (SEQ ID NO: 149), где x может представлять собой линкер из 1-50 аминокислот, (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 149, или (ii) функциональный фрагмент из (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 30, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более раз по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RRDELNV x RSDHLTN x RSDDLVR x RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (SEQ ID NO: 151), (ii) последовательность, характеризую
- 27 046157 щаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 151, или (ii) функциональный фрагмент (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с Nконцом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 32, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая DPGALVR x RSDNLVR x QSGDLRR x THLDLIR x TSGNLVR x RSDNLVR (SEQ ID NO: 150), (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 89%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 150, или (ii) функциональный фрагмент (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 31, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 77-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 99-102 или 125-127; (ii) последовательность, содержащая любую из SEQ ID NO: 77-91; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 92-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей
- 28 046157 мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 127; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 127; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 77 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 128; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к SEQ ID NO: 128; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 129; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 129; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 130; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 130; или (iii) функциональный фрагмент или вариант любой из
- 29 046157 последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 131; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 131; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.
Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит DBD, содержащий комплекс gRNA/Cas, причем gRNA содержит нацеливающую последовательность, содержащую любую из SEQ ID NO: 35-66. Целевая последовательность gRNA прикреплена к 5'-концу последовательности каркаса, содержащей последовательность: 5'GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACT TGTTGGCGAGA-3' (SEQ ID NO: 183). Согласно иллюстративным вариантам осуществления белок Cas представляет собой дезактивированный нуклеазой белок Cas9. Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, конъюгированных с белком Cas, причем TAD выбран из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен VPR TAD, конъюгированный с C-концом белка Cas. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с Nконцом, C-концом или N-концом и C-концом белка Cas. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и Cконцом белка Cas. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или больше по сравнению с контролем.
Полинуклеотиды.
Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, кодирующие любой из eTF, которые активируют SNC1A, раскрытые в настоящем документе. Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, содержащие селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие последовательность, кодирующую eTF, которая активирует SCN1A, как раскрыто в настоящем документе, и селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлен селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, кодирующим eTF, который активирует SCN1A, и селективный в отношении PV регуляторный элемент.
Полинуклеотиды, кодирующие eTF, которые активируют SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид,
- 30 046157 содержащий любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223, или их вариант или функциональный фрагмент; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223; или (iii) нуклеиновая кислота, кодирующая eTF, который активирует SCN1A, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223, или их вариант или функциональный фрагмент.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, содержащий любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 92-98, или ее вариант или функциональный фрагмент; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 92-98; или (iii) нуклеиновая кислота, кодирующая DBD, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 92-98, или ее вариант или функциональный фрагмент, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 92-98.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, который активирует эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая eTF, содержащий любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент eTF, содержащий любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к eTF, содержащему любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223, причем eTF способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий DBD, который связывается с целевым сайтом генома, способным повышать регуляцию эндогенного SCN1A при связывании с помощью раскрытого в настоящем документе eTF, причем полинуклеотид содержит любой из следующих элементов: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 77-98; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 77-98; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 77-98, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 77-98.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий DBD, который связывается с целевым сайтом генома, способным активировать эндогенный SCN1A при связывании раскрытым в настоящем документе eTF, причем полинуклеотид содержит любой из следующих элементов: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 148-151; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 148-151; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 148-151, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 92-98.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая любую из SEQ ID NO: 70-76 или 184; (ii) нуклеиновая кислота, содержащая функциональный фрагмент любой из последовательностей (i); или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii), причем полинуклеотид кодирует eTF, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 70; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 70; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отноше
- 31 046157 нию к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 71; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 71; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 72; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 72; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 130, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 73; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 73; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 131, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 74; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 74; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 75; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 75; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 76; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 76; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 106, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 184; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 184; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по мень
- 32 046157 шей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 106, или его функциональный фрагмент или вариант, который способен активировать SCN1A.
Полинуклеотиды, содержащие сайты связывания микроРНК для селективной экспрессии в PVсодержащих нейронах.
Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, содержащие сайты связывания микроРНК, которые приводят к селективной экспрессии представляющего интерес гена в парвальбумин-содержащих нейронах (PV). МикроРНК или миРНК представляют собой небольшие некодирующие РНК (~20 нуклеотидов), которые регулируют экспрессию генов посттранскрипционно путем гибридизации с комплементарными сайтами узнавания в молекуле мРНК и приводят к ингибированию экспрессии генов, способствуя деградации транскрипта мРНК или подавляя трансляцию белка, кодируемого мРНК. Предусмотренные в настоящем документе сайты связывания микроРНК ингибируют экспрессию представляющего интерес гена в возбуждающих нейронах, тем самым способствуя селективной экспрессии представляющего интерес гена в PV-содержащих нейронах (например, селективные к PV сайты связывания микроРНК). Согласно определенным вариантам осуществления возбуждающие нейроны представляют собой нейроны, которые экспрессируют один или несколько из STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA и/или DKK3. Согласно иллюстративному варианту осуществления возбуждающие нейроны представляют собой нейроны, экспрессирующие CamKII.
Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие один или несколько сайтов связывания микроРНК для одной или нескольких микроРНК, которые способствуют селективной экспрессии PV, например, способствуют деградации мРНК, содержащей сайт связывания микроРНК, в возбуждающих нейронах. Примеры микроРНК, которые способствуют селективной экспрессии PV, включают в себя, например, miR-128, miR-221 и miR-222. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более селективных в отношении PV сайтов связывания микроРНК. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-128 (SEQ ID NO: 9). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-222 (SEQ ID NO: 13). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1 сайт связывания miR-128, по меньшей мере один сайт связывания miR-221 и по меньшей мере один сайт связывания miR-222. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-128 и по меньшей мере один сайт связывания miR-222. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-221 и по меньшей мере один сайт связывания miR-222. Согласно иллюстративному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 2 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 2 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 3 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 3 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 4 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 4 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 5 сайтов связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 5 сайтов связывания miR-221 (SEQ ID NO: 11). Согласно таким вариантам осуществления сайты связывания могут быть расположены в любом порядке. Например, для конструкции, содержащей 2 сайта связывания miR-128 и 2 сайта связывания miR-221, сайты связывания могут быть расположены в любой из следующих конфигураций: miR-128 - miR-128 - miR-221 - miR221, miR-128 - miR-221 - miR-128 - miR-221, miR-128 - miR221 - miR221 - miR-128, miR-221 - miR128 - miR221 - miR128, miR-221 - miR128 - miR128 - miR221 или miR221 - miR221 - miR128 - miR128. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 4 сайта связывания miR-128 (SEQ ID NO: 9), за которыми следуют четыре сайта связывания miR-221 (SEQ ID NO: 11), например, miR-128 - miR-128 - miR128 - miR-128 - miR221 - miR221 - miR-221 - miR221. Согласно другому иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 1 последовательность miR-221 (SEQ ID NO: 11), 1 последовательность miR-222 (SEQ ID NO: 13) и 1 сайт связывания miR-128 (SEQ ID NO: 9), например, miR
- 33 046157
221 - miR222 - miR128. Согласно другому иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 2 последовательности miR-221 (SEQ ID NO: 11), 2 последовательности miR-222 (SEQ ID NO: 13) и 2 сайта связывания miR128 (SEQ ID NO: 9) расположены в следующем порядке: miR-221 - miR222 - miR128 - miR-221 - miR222 miR128.
В полинуклеотидах, содержащих более одного сайта связывания микроРНК, сайты связывания могут быть непосредственно примыкающими друг к другу в полинуклеотидной последовательности (например, без линкера или промежуточной последовательности между сайтами связывания) или могут быть отделены друг от друга по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами. Согласно иллюстративным вариантам осуществления сайты связывания микроРНК разделены приблизительно 5 нуклеотидами или 5 нуклеотидами. Согласно иллюстративным вариантам осуществления последовательности, разделяющие сайты связывания микроРНК (а также соединения, образованные между сайтами связывания микроРНК, или соединения, образованные между сайтами связывания микроРНК и последовательностями, разделяющими сайты связывания микроРНК), не комплементарны никаким другим микроРНК или любым другим нейрональным микроРНК.
Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 7. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 7.
Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 14. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 14.
Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 15. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 15.
Согласно определенным вариантам осуществления указанные в настоящем документе сайты связывания микроРНК расположены в 3'-нетранслируемой области транскрипта мРНК, например, после кодона терминации трансляции (т.е. TAA, TGA или TAG) и перед полиА-хвостом. Сайт связывания микроРНК может быть расположен непосредственно рядом с кодоном терминации трансляции или может быть отделен от кодона терминации трансляции по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами, и/или может быть расположен рядом с полиА-хвостом или может быть отделен от полиАхвоста по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами.
Согласно определенным вариантам осуществления представленный в настоящем документе сайт связывания микроРНК приводит к селективной экспрессии гена в PV-содержащей клетке по сравнению с нецелевыми типами клеток. В некоторых случаях нецелевые типы клеток включают в себя, без ограничения, возбуждающие нейроны, не содержащие PV типы клеток ЦНС и ненейрональные типы клеток ЦНС. Согласно определенным вариантам осуществления селективные в отношении PV сайты связывания микроРНК приводят к селективной экспрессии генов в PV-содержащих нейронах по меньшей мере для одного, двух, трех, четырех, пяти или более не-PV типов клеток ЦНС. В некоторых случаях не-PV клетка ЦНС представляет собой возбуждающий нейрон, дофаминергический нейрон, астроцит, микроглию, мотонейрон, сосудистую клетку или не-ГАМКергический нейрон (например, клетку, которая не экспрессирует один или более GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP), не-PV нейрон (например, ГАМКергический нейрон, который не экспрессирует парвальбумин) или другие клетки ЦНС (например, типы клеток ЦНС, которые никогда не экспрессируют любой из PV, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP). Согласно иллюстративному варианту осуществления представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК приводит к повышенной селективности экспрессии генов в PV-содержащих нейронах по сравнению с возбуждающими нейронами (например, нейронами, которые экспрессируют один или несколько из STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA и/или DKK3) за счет уменьшения экспрессии в возбуждающих нейронах. В некоторых случаях типы клеток различают по разным клеточным маркерам, морфологии, фенотипу, генотипу, функции и/или любым другим средствам классификации типов клеток.
Селективность экспрессии, управляемая селективным в отношении PV сайтом связывания микроРНК, может быть измерена несколькими способами. Согласно одному варианту осуществления селективность экспрессии гена в PV-клетке по сравнению с не содержащими PV клетками может быть изме
- 34 046157 рена путем сравнения количества PV-клеток, которые экспрессируют обнаруживаемый уровень транскрипта из гена, который содержит селективный в отношении PV сайт связывания микроРНК, с общим количеством клеток, которые экспрессируют ген (например, отношение PV-содержащих к общему количеству клеток (PV + не-PV клеток), экспрессирующих ген). Например, селективность в отношении PVсодержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием кассеты экспрессии, содержащей ген, кодирующий флуоресцентный белок (например, eGFP), и селективный в отношении PV сайт связывания микроРНК для измерения экспрессии гена и антитела, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком). Селективность экспрессии в PVсодержащих клетках можно рассчитать путем деления количества клеток, которые экспрессируют как PV, так и eGFP (например, PV-содержащие клетки), на общее количество клеток, экспрессирующих eGFP (например, PV-содержащие клетки и не содержащие PV клетки), и умножения на 100, чтобы преобразовать в проценты. В другом примере селективность в отношении PV-содержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием кассеты экспрессии, содержащей ген, кодирующий флуоресцентный белок (например, eGFP), и селективный в отношении PV сайт связывания микроРНК для измерения экспрессии гена, и первое антитело, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком) и вторым антителом, которое идентифицирует возбуждающие клетки (например, антитело к CamKII, которое специфически взаимодействует с возбуждающими нейронами). Селективность экспрессии в PV-содержащих клетках можно рассчитать путем деления количества клеток, экспрессирующих как PV, так и eGFP (например, PV-клетки), на количество клеток, экспрессирующих eGFP + PV и eGFP + CamKII (например, PV-содержащие клетки и возбуждающие клетки), и умножения на 100 для преобразования в процент. Чем выше процент PV-содержащих клеток, экспрессирующих трансген, тем более селективным является сайт связывания микроРНК в отношении PVсодержащих клеток. Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК может быть высокоселективным для экспрессии в PV-содержащих клетках. Например, представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК может характеризоваться селективностью, составляющей приблизительно 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более чем приблизительно 99%, для PV-содержащих нейронов (например, PVсодержащие нейроны/все клетки х 100 или PV-содержащие нейроны/PV + возбуждающие нейроны х 100).
В некоторых случаях представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК является коротким. В некоторых случаях размер селективного в отношении PV сайта связывания микроРНК совместим с клонирующей способностью вектора, например, вирусного вектора или rAAV, так что комбинированный размер трансгена, промотора (и необязательного энхансера) и сайта связывания микроРНК не превышает клонирующую способность вектора. В некоторых случаях селективный в отношении PV сайт связывания микроРНК составляет в длину до приблизительно 500 п.н., 400 п.н., 300 п.н., 250 п.н., 225 п.н., 215 п.н., 210 п.н., 200 п.н., 150 п.н., 140 п.н., 135 п.н., 130 п.н., 125 п.н., 120 п.н., 115 п.н., 110 п.н., 100 п.н., 90 п.н., 80 п.н., 75 п.н., 70 п.н., 65 п.н., 60 п.н. или 50 п.н.. В некоторых случаях селективный в отношении PV сайт связывания микроРНК составляет приблизительно 50-500 п.н., 50-400 п.н., 50-300 п.н., 50-250 п.н., 50-200 п.н., 50-100 п.н., 50-75 п.н., 50-70 п.н., 100-500 п.н., 100-400 п.н., 100-300 п.н., 100-250 п.н., 100-200 п.н., 100-150 п.н., 100-140 п.н., 100-135 п.н., 200-500 п.н., 200-400 п.н., 200-300 п.н. или 200-250 п.н..
Согласно иллюстративным вариантам осуществления представленный в настоящем документе полинуклеотид, который содержит один или несколько селективных в отношении PV сайтов связывания микроРНК не содержит SEQ ID NO: 67.
Кассеты экспрессии.
Согласно другому аспекту в настоящей заявке представлены кассеты экспрессии, содержащие представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCNIA и/или содержит селективный в отношении PV сайт связывания микроРНК) и один или несколько регуляторных элементов. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и селективный в отношении PV промотор.
Согласно определенным вариантам осуществления представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, который активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) представляет собой часть кассеты экспрессии, содержащей один или несколько регуляторных элементов в добавок к
- 35 046157 последовательности, кодирующей eTF. Согласно иллюстративным вариантам осуществления представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, который активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК), представляет собой часть кассеты экспрессии, содержащей промотор, расположенный выше против хода транскрипции от трансгенной последовательности, чтобы быть способным управлять экспрессией трансгена (например, eTF, который избирательно активирует SCN1A) в клетке.
Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует регуляцию SCNIA и/или содержит селективный в отношении PV сайт связывания микроРНК) и конститутивный промотор, расположенный выше против хода транскрипции от последовательности, кодирующей трансген, чтобы быть способным управлять экспрессией трансгена (например, eTF, который избирательно активирует SCN1A) в клетке. Примеры конститутивных промоторов включают в себя промотор GAD2, промотор синапсина человека, промотор CBA, промотор CMV, промотор minCMV, TATA-бокс, супер основной промотор или промотор EF1a, или их комбинацию. Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и короткий промотор, способный управлять экспрессией, трансгена (например, eTF, который избирательно активирует SCN1A) в клетке. Согласно определенным вариантам осуществления короткий промотор, подходящий для применения в соответствии с описанными в настоящем документе молекулами нуклеиновой кислоты, содержит менее чем 500 п.н., 450 п.н., 400 п.н., 350 п.н., 300 п.н., 250 п.н., 225 п.н., 200 п.н., 175 п.н., 150 п.н., 145 п.н., 140 п.н., 135 п.н., 130 п.н., 125 п.н., 120 п.н., 115 п.н., 110 п.н., 105 п.н., 100 п.н., 95 п.н., 90 п.н., 85 п.н., 80 п.н. или 75 п.н. или приблизительно 80-300 п.н., 80-275 п.н., 80-250 п.н., 80-200 п.н., 80-150 п.н., 80-125 п.н., 80-120 п.н., 80-115 п.н., 80-110 п.н., 80-105 п.н., 80-100 п.н., 85-300 п.н., 85-275 п.н., 85-250 п.н., 85-200 п.н., 85-150 п.н., 85-125 п.н., 85-120 п.н., 85-115 п.н., 85-110 п.н., 85-105 п.н., 85100 п.н., 90-300 п.н., 90-275 п.н., 90-250 п.н., 90-200 п.н., 90-150 п.н., 90-125 п.н., 90-120 п.н., 90-115 п.н., 90-110 п.н., 90-105 п.н., 90-100 п.н., 95-300 п.н., 95-275 п.н., 95-250 п.н., 95-200 п.н., 95-150 п.н., 95-125 п.н., 95-120 п.н., 95-115 п.н., 95-110 п.н., 95-105 п.н., 95-100 п.н., 100-300 п.н., 100-275 п.н., 100-250 п.н., 100-200 п.н., 100-150 п.н., 100-125 п.н., 100-120 п.н., 100-115 п.н., 100-110 п.н. или 100-105 п.н. Согласно иллюстративным вариантам осуществления короткий промотор, подходящий для применения в соответствии с описанными в настоящем документе кассетами экспрессии, содержит приблизительно 100-120 п.н., приблизительно 117 п.н. или приблизительно 100 п.н.
Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит короткий промотор, содержащий или состоящий из следующего: (i) SEQ ID NO: 1; (ii) его вариант или функциональный фрагмент или (iii) последовательность нуклеиновой кислоты, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), функционально связанная с полинуклеотидом, кодирующим любой из eTF, который избирательно активирует раскрытый в настоящем документе SCN1A и необязательно содержащая раскрытый в настоящем документе сайт связывания микроРНК. Другие примеры короткой промоторной последовательности можно найти в публикации PCT №WO 2018/213786.
Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и селективный промотор клеточного типа, расположенный выше против хода транскрипции от последовательности, кодирующей трансген (например, eTF, который избирательно активирует SCN1A), чтобы иметь возможность избирательно управлять экспрессией трансгена в представляющей интерес клетке. Согласно определенным вариантам осуществления селективный промотор клеточного типа может быть селективным (например, избирательно управлять экспрессией) в отношении любого представляющего интерес типа клеток, такого как, например, клетка сердца, клетка печени, мышечная клетка, костная клетка, нейрон или их субпопуляции. Согласно иллюстративному варианту осуществления раскрытая в настоящем документе кассета экспрессии содержит полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, и селективный в отношении PV регуляторный элемент (например, промотор, энхансер и/или промотор и энхансер), расположенный выше против хода транскрипции от последовательности, кодирующей eTF, так чтобы быть способным избирательно управлять экспрессией eTF в PV-клетке, и, необязательно, селективный в отношении PV сайт связывания микроРНК. Селективный в отношении PV регуляторный элемент относится к регуляторному элементу, который специфически модулирует экспрессию гена в PV-содержащем нейроне. Согласно определенным вариантам осуществления селективные в отношении PV регуляторные элементы усиливают экспрессию в PV-содержащем нейроне по сравнению с одним или несколькими другими типами клеток ЦНС. Согласно определенным вариантам осуществления селективный в отноше- 36 046157 нии PV регуляторный элемент подавляет процессы транскрипции и/или трансляции в нецелевых типах клеток.
Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент приводит к селективной экспрессии гена в PV-клетке по сравнению с нецелевыми типами клеток. В некоторых случаях нецелевые типы клеток включают в себя, без ограничения, возбуждающие нейроны, не-PV типы клеток ЦНС и ненейрональные типы клеток ЦНС. Согласно определенным вариантам осуществления селективные в отношении PV регуляторные элементы приводят к селективной экспрессии генов в PV-содержащих нейронах по меньшей мере одного, двух, трех, четырех, пяти или более не содержащих PV типов клеток ЦНС. В некоторых случаях не содержащая PV клетка ЦНС представляет собой возбуждающий нейрон, дофаминергический нейрон, астроцит, микроглию, мотонейрон, сосудистую клетку или не-ГАМКергический нейрон, (например, клетка, которая не экспрессирует один или несколько из GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP), не содержащий PV нейрон (например, ГАМКергический нейрон, который не экспрессирует парвальбумин) или другие клетки ЦНС (например, типы клеток ЦНС, которые никогда не экспрессируют любой из PV, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP). В некоторых случаях представленный в настоящем документе селективный в отношении PV регуляторный элемент приводит к повышенной селективности экспрессии генов в PV-содержащих нейронах по сравнению с не содержащими PV ГАМКергическими клетками. В некоторых случаях типы клеток различают по разным клеточным маркерам, морфологии, фенотипу, генотипу, функции и/или любым другим средствам классификации типов клеток.
Селективность экспрессии, управляемую селективным в отношении PV регуляторным элементом, можно измерить несколькими способами. Согласно одному варианту осуществления селективность экспрессии гена в PV-содержащей клетке по сравнению с не содержащими PV клетками может быть измерена путем сравнения количества PV-содержащих клеток, которые экспрессируют обнаруживаемый уровень транскрипта от гена, который функционально связан с селективным в отношении PV регуляторным элементом, с общим количеством клеток, которые экспрессируют ген (например, отношение PV к общему количеству клеток (PV + не-PV клеток), экспрессирующих ген). Например, селективность в отношении PV-содержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием гена, кодирующего флуоресцентный белок (например, eGFP), функционально связанный с селективным в отношении PV регуляторным элементом для измерения экспрессии гена и антитела, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком). Селективность экспрессии в PVсодержащих клетках можно рассчитать путем деления количества клеток, которые экспрессируют как PV, так и eGFP (например, PV-содержащие клетки), на общее количество клеток, экспрессирующих eGFP (например, PV-содержащие клетки и не содержащие PV клетки), и умножения на 100, чтобы преобразовать в проценты. Чем выше процент PV-содержащих клеток, экспрессирующих трансген, тем более селективным является регуляторный элемент для PV-содержащих клеток. Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент может быть высокоселективным в отношении экспрессии в PV-содержащих клетках. Например, представленный в настоящем документе селективный в отношении PV регуляторный элемент может характеризоваться селективностью, составляющей приблизительно 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более чем приблизительно 99%, в отношении PV-содержащих нейронов (например, PV-содержащие нейроны/все клетки х 100).
В некоторых случаях представленный в настоящем документе селективный в отношении PV регуляторный элемент является коротким. В некоторых случаях размер селективного в отношении PV регуляторного элемента совместим с клонирующей способностью вектора, например, вирусного вектора или rAAV, так что комбинированный размер трансгена и одного или нескольких селективных в отношении PV регуляторных элементов не превышает клонирующую способность вектора. В некоторых случаях селективный в отношении PV регуляторный элемент составляет в длину приблизительно до 2050 п.н., 2000 п.н., 1900 п.н., 1800 п.н., 1700 п.н., 1600 п.н., 1500 п.н., 1400 п.н., 1300 п.н., 1200 п.н., 1100 п.н., 1000 п.н., 900 п.н., 800 п.н., 700 п.н., 600 п.н., 500 п.н., 400 п.н., 300 п.н., 200 п.н. или 100 п.н. В некоторых случаях селективный в отношении PV регуляторный элемент составляет приблизительно 500-600 п.н., 500-700 п.н., 500-800 п.н., 500-900 п.н., 500-1000 п.н., 500-1500 п.н., 500-2000 п.н. или 500-2050 п.н.
Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент содержит или состоит из любого из следующего: (i) SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинация или (iii) последовательность нуклеиновой кислоты, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к любому из (i) или (ii). В некоторых случаях регуляторный элемент включает в себя любую из SEQ ID NO: 2-4. Другие примеры селективных в отношении PV регуляторных элементов можно найти в публикации PCT № WO 2018/187363.
Согласно иллюстративным вариантам осуществления в настоящей заявке представлены кассеты
- 37 046157 экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A под контролем селективного в отношении PV регуляторного элемента. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий DBD, содержащий любую из следующих последовательностей: SEQ ID NO: 77-98 под контролем селективного в отношении PV регуляторного элемента, содержащего любую одна из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий любую из следующих последовательностей: SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, содержащую любую из следующих последовательностей: SEQ ID NO: 67-73 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий DBD, содержащий любую из следующих последовательностей: SEQ ID NO: 148-151 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий любую из следующих последовательностей: SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, содержащую любую из следующих последовательностей: SEQ ID NO: 67-76 или 316 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2.
Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие селективный в отношении PV сайт связывания микроРНК и последовательность промотора и/или энхансера. Любой из описанных в настоящем документе промоторов может быть включен в кассету экспрессии. Согласно иллюстративному варианту осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и селективный в отношении PV регуляторный элемент. Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинацию или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) любую из SEQ ID NO: 7, 14 или 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 7, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2. Согласно определенным вариантам осуществления представленный в настоящем документе полинуклеотид, содержит (1) селективный в отношении PV сайт связывания микроРНК,
- 38 046157 содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 15, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2. Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 15, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2.
Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и последовательность, кодирующую eTF, который стимулирует экспрессию SCN1A, как предусмотрено в настоящем документе. Согласно иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая селективный в отношении PV регуляторный элемент, eTF, который активирует экспрессию SCN1A, как предусмотрено в настоящем документе, и селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) любую из SEQ ID NO: 7, 14 или 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, ха
- 39 046157 растеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбина
- 40 046157 цию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii).
Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии, содержащая селективный в отношении PV регуляторный элемент и селективный в отношении PV сайт связывания микроРНК, характеризующийся размером менее чем 5 т.п.н., 4,9 т.п.н., 4,8 т.п.н., 4,7 т.п.н., 4,6 т.п.н., 4,5 т.п.н., 4,4 т.п.н., 4,3 т.п.н., 4,2 т.п.н., 4,1 т.п.н., 4,0 т.п.н., 3,9 т.п.н., 3,8 т.п.н., 3,7 т.п.н., 3,6 т.п.н., 3,5 т.п.н., 3,4 т.п.н., 3,3 т.п.н., 3,2 т.п.н., 3,1 т.п.н., 3,0 т.п.н., 2,9 т.п.н., 2,8 т.п.н., 2,7 т.п.н., 2,6 т.п.н., 2,5 т.п.н., 2,4 т.п.н., 2,3 т.п.н., 2,2 т.п.н., 2,1 т.п.н., 2,0 т.п.н., 1,9 т.п.н., 1,8 т.п.н., 1,7 т.п.н., 1,6 т.п.н. или 1,5 т.п.н. или менее, или приблизительно 1,5-5 т.п.н., 1,5-4,7 т.п.н., 1,5-4,5 т.п.н., 1,5-4,0 т.п.н., 1,5-3,5 т.п.н., 1,5-3,0 т.п.н., 1,5-2,5 т.п.н., 1,5-2,0 т.п.н.
Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии может содержать еще один дополнительный регуляторный элемент в дополнение к промотору, такой как, например, последовательности, связанные с инициацией или окончанием транскрипции, энхансерные последовательности и эффективные сигналы процессинга РНК. Иллюстративные регуляторные элементы включают в себя, например, интрон, энхансер, UTR, элемент стабильности, последовательность WPRE, консенсусную последовательность Kozak, посттрансляционный элемент ответа, сайт связывания микроРНК или последовательность полиаденилирования (полиА) или их комбинацию. Регуляторные элементы могут функционировать, чтобы модулировать экспрессию генов на фазе транскрипции, посттранскрипционной фазе или на фазе трансляции экспрессии генов. На уровне РНК регуляция может происходить на уровне трансляции (например, элементы стабильности, которые стабилизируют мРНК для трансляции), расщепления РНК, сплайсинга РНК и/или терминации транскрипции. Согласно различным вариантам осуществления регуляторные элементы могут рекрутировать факторы транскрипции в кодирующую область, которые повышают избирательность экспрессии генов в представляющем интерес типе клеток, увеличивают скорость, с которой производятся транскрипты РНК, повышают стабильность производимой РНК и/или увеличивают скорость образования синтеза белка из транскриптов РНК. Согласно иллюстративному варианту осуществления представленная в настоящем документе кассета экспрессии содержит по меньшей мере один селективный в отношении PV сайт связывания микроРНК, как предусмотрено в настоящем документе.
Согласно определенным вариантам осуществления описанные в настоящем документе кассеты экспрессии дополнительно содержат последовательность полиА. Подходящие последовательности полиА включают в себя, например, искусственный полиА длиной приблизительно 75 п.н. (PA75) (см., например, WO 2018/126116), полиА бычьего гормона роста, ранний сигнал полиА SV40, поздний сигнал полиА SV40, полиА бета-глобина кролика, полиА тимидинкиназы HSV, полиА гена протамина, полиА аденовируса 5 EIb, полиА гормона роста или полиА PBGD. Согласно иллюстративным вариантам осуществления последовательность полиА, подходящая для применения в представленных в настоящем документе кассетах экспрессии, представляет собой полиА hGH (SEQ ID NO: 17) или синтетический полиА (SEQ ID NO: 16). Как правило, последовательность полиА расположена ниже по ходу транскрипции от полинуклеотида, кодирующего eTF, в описанных в настоящем документе кассетах экспрессии.
Согласно определенным вариантам осуществления представленные в настоящем документе кассеты экспрессии дополнительно содержат одну или несколько последовательностей нуклеиновых кислот, кодирующих один или несколько сигналов ядерной локализации (NLS). Может быть использован любой пептид NLS, который облегчает импорт белка, к которому прикреплен, в ядро клетки. Примеры NLS включают в себя, например, NLS большого T-антигена SV40, NLS нуклеоплазмина, NLS EGL-13, NLS cMyc и NLS TUS-белка. Смотрите, например, C. Dingwall et al., J. Cell Biol. 107: 841-9 (1988); J.P. Makkerh et al., Curr Biol. 6: 1025-7 (1996) и M. Ray et al., Bioconjug. Chem. 26: 1004-7 (2015). NLS может быть расположен в любом месте последовательности белка eTF, но согласно предпочтительным вариантам осуществления он конъюгирован с N-концом eTF или доменом eTF. Согласно иллюстративным вариантам осуществления представленные в настоящем документе кассеты нуклеиновых кислот кодируют eTF с NLS, слитым с N-концом eTF. Согласно другим вариантам осуществления представленные в настоящем документе кассеты нуклеиновых кислот кодируют eTF с первым NLS, слитым с N-концом eTF, и вторым NLS, расположенным между DBD и доменом TAD eTF.
Векторы экспрессии.
Согласно определенным вариантам осуществления описанные в настоящем документе кассеты экспрессии могут быть включены в вектор экспрессии. Векторы экспрессии можно использовать для доставки кассеты экспрессии в целевую клетку посредством трансфекции или трансдукции. Вектор может представлять собой интегрирующий или неинтегрирующий вектор, что относится к способности вектора
- 41 046157 интегрировать кассету экспрессии или трансген в геном клетки-хозяина. Примеры векторов экспрессии включают в себя, без ограничения, (a) невирусные векторы, такие как векторы нуклеиновых кислот, включая в себя линейные олигонуклеотиды и кольцевые плазмиды; искусственные хромосомы, такие как искусственные хромосомы человека (HAC), искусственные хромосомы дрожжей (YAC) и бактериальные искусственные хромосомы (BAC или PAC)); эписомальные векторы; транспозоны (например, PiggyBac); и (b) вирусные векторы, такие как ретровирусные векторы, лентивирусные векторы, аденовирусные векторы и аденоассоциированные вирусные векторы.
Векторы экспрессии могут представлять собой линейные олигонуклеотиды или кольцевые плазмиды и могут быть доставлены в клетку с помощью различных способов трансфекции, включая в себя физические и химические способы. Физические способы, как правило, относятся к способам доставки, использующим физическую силу для противодействия барьеру клеточной мембраны для облегчения внутриклеточной доставки генетического материала. Примеры физических способов включают в себя использование иглы, баллистической ДНК, электропорацию, сонопорацию, фотопорацию, магнитофекцию и гидропорацию. Химические способы, как правило, относятся к способам, при которых химические носители доставляют молекулу нуклеиновой кислоты в клетку, и могут включать в себя неорганические частицы, векторы на основе липидов, векторы на основе полимеров и векторы на основе пептидов.
Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием катионного липида (например, катионной липосомы). Для доставки генов были исследованы различные типы липидов, такие как, например, липидная наноэмульсия (например, которая представляет собой дисперсию одной несмешивающейся жидкости в другой, стабилизированной эмульгирующим средством) или твердые липидные наночастицы.
Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием носителя для доставки на основе пептидов. Носители на основе пептидов могут иметь преимущества, заключающиеся в защите доставляемого генетического материала, нацеливании на специфические клеточные рецепторы, разрушении эндосомных мембран и доставке генетического материала в ядро. Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием носителя для доставки на основе полимера. Носители на основе полимеров могут содержать природные белки, пептиды и/или полисахариды или синтетические полимеры. Согласно одному варианту осуществления средство доставки на основе полимера содержит полиэтиленимин (PEI). PEI может конденсировать ДНК в положительно заряженные частицы, которые связываются с остатками анионной поверхности клетки и попадают в клетку посредством эндоцитоза. Согласно другим вариантам осуществления носитель для доставки на основе полимера может содержать поли-Ь-лизин (PLL), поли(DL-молочную кислоту) (PLA), поли^Ь-лактид-ко-гликозид) (PLGA), полиорнитин, полиаргинин, гистоны, протамины, дендримеры, хитозаны, синтетические аминопроизводные декстрана и/или катионные акриловые полимеры. Согласно определенным вариантам осуществления носители для доставки на основе полимеров могут включать в себя смесь полимеров, такую как, например, PEG и PLL.
Согласно определенным вариантам осуществления вектор экспрессии может представлять собой вирусный вектор, подходящий для генной терапии. Предпочтительные характеристики векторов вирусной генной терапии или векторов доставки генов могут включать в себя способность воспроизводимо и стабильно размножаться и очищаться до высоких титров; для опосредования направленной доставки (например, для доставки трансгена конкретно в представляющую интерес ткань или орган без широкого распространения вектора в другом месте); и опосредовать доставку гена и экспрессию трансгена, не вызывая вредных побочных эффектов.
Несколько типов вирусов, например, непатогенный парвовирус, называемый аденоассоциированным вирусом, были сконструированы для целей генной терапии, используя путь вирусной инфекции, но избегая последующей экспрессии вирусных генов, которая может привести к репликация и токсичности. Такие вирусные векторы можно получить путем удаления всех или некоторых кодирующих областей из вирусного генома, но оставив нетронутыми те последовательности (например, концевые повторяющиеся последовательности), которые могут быть необходимы для таких функций, как упаковка векторного генома в вирусный капсид или интеграция векторной нуклеиновой кислоты (например, ДНК) в хроматин хозяина.
Согласно различным вариантам осуществления подходящие вирусные векторы включают в себя ретровирусы (например, вирусы A-типа, B-типа, C-типа и D-типа), аденовирус, парвовирус (например, аденоассоциированные вирусы или AAV), коронавирус, вирусы с отрицательно-полярной нитью РНК, такие как ортомиксовирус (например, вирус гриппа), рабдовирус (например, вирус бешенства и везикулярного стоматита), парамиксовирус (например, корь и Сендай), вирусы с положительно-полярной нитью РНК, такие как пикорнавирус и альфавирус, и двухцепочечные ДНК-вирусы, включая в себя аденовирус, вирус герпеса (например, вирус простого герпеса типов 1 и 2, вирус Эпштейна-Барра, цитомегаловирус) и поксвирус (например, коровьей оспы, оспы птиц и оспы канареек). Примеры ретровирусов включают в себя вирус лейкемии-саркомы птиц, человеческий T-лимфотрофный вирус типа 1 (HTLV-1), вирус лейкемии крупного рогатого скота (BLV), лентивирус и спумавирус. Другие вирусы включают в себя, например, вирус Норуолк, тогавирус, флавивирус, реовирусы, паповавирус, гепаднавирус и вирус
- 42 046157 гепатита. Вирусные векторы можно разделить на две группы в зависимости от их способности интегрироваться в геном хозяина - интегрирующиеся и неинтегрирующиеся. Онкоретровирусы и лентивирусы могут интегрироваться в хроматин клетки-хозяина, в то время как аденовирусы, аденоассоциированные вирусы и вирусы герпеса преимущественно сохраняются в ядре клетки в виде внехромосомных эписом.
Согласно определенным вариантам осуществления подходящий вирусный вектор представляет собой ретровирусный вектор. Ретровирусы относятся к вирусам семейства Retroviridae. Примеры ретровирусов включают в себя онкоретровирусы, такие как вирус лейкемии мышей (MLV), и лентивирусы, такие как вирус иммунодефицита человека 1 (HIV-1). Ретровирусные геномы представляют собой одноцепочечные (оц) РНК и содержат различные гены, которые могут быть в цис- или транс-форме. Например, ретровирусный геном может содержать цис-действующие последовательности, такие как два длинных концевых повтора (LTR), с элементами для экспрессии генов, обратной транскрипции и интеграции в хромосомы хозяина. Другие компоненты включают в себя сигнал упаковки (psi или Ψ) для специфической упаковки РНК во вновь образованные вирионы и полипуриновый тракт (PPT), место инициации синтеза положительно-полярной нити ДНК во время обратной транскрипции. Кроме того, ретровирусный геном может содержать гены gag, pol и env. Ген gag кодирует структурные белки, ген pol кодирует ферменты, которые сопровождают оцРНК и осуществляют обратную транскрипцию вирусной РНК в ДНК, а ген env кодирует вирусную оболочку. Как правило, gag, pol и env предоставляются в транс для вирусной репликации и упаковки.
Согласно определенным вариантам осуществления представленный в настоящем документе ретровирусный вектор может представлять собой лентивирусный вектор. Распознаются по меньшей мере пять серогрупп или серотипов лентивирусов. Вирусы разных серотипов могут по-разному инфицировать определенные типы клеток и/или хозяев. Лентивирусы, например, включают в себя ретровирусы приматов и ретровирусы неприматов. Ретровирусы приматов включают в себя HIV и вирус иммунодефицита обезьян (SIV). Ретровирусы неприматов включают в себя вирус иммунодефицита кошек (FIV), вирус иммунодефицита крупного рогатого скота (BIV), вирус артрита-энцефалита коз (CAEV), вирус инфекционной анемии лошадей (EIAV) и виснавирус. Лентивирусы или лентивекторы могут быть способны трансдуцировать покоящиеся клетки. Как и в случае онкоретровирусных векторов, конструкция лентивекторов может быть основана на разделении цис- и транс-действующих последовательностей.
Согласно определенным вариантам осуществления в настоящей заявке представлены векторы экспрессии, которые были разработаны для доставки с помощью оптимизированного терапевтического ретровирусного вектора. Ретровирусный вектор может представлять собой лентивирус, содержащий левый (5') LTR; последовательности, которые способствуют упаковке и/или ядерному импорту вируса; промотор; необязательно, один или несколько дополнительных регуляторных элементов (таких как, например, энхансер или последовательность полиА); необязательно лентивирусный элемент обратного ответа (RRE); конструкция, содержащая селективный регуляторный элемент PV, функционально связанный с последовательностью, кодирующей eTF; необязательно инсулятор и правый (3') ретровирусный LTR.
Согласно иллюстративным вариантам осуществления представленный в настоящем документе вирусный вектор представляет собой аденоассоциированный вирус (AAV). AAV представляет собой небольшой вирус животных без оболочки, дефектной репликации, который поражает людей и некоторые другие виды приматов. Известно, что AAV вызывает заболевание человека и вызывает умеренный иммунный ответ. Векторы AAV могут также инфицировать как делящиеся, так и покоящиеся клетки, не встраиваясь в геном клетки-хозяина.
Геном AAV состоит из линейной одноцепочечной ДНК длиной ~4,7 т.п.н. Геном состоит из двух открытых рамок считывания (ORF), фланкированных последовательностью инвертированного концевого повтора (ITR) длиной приблизительно 145 п.н. ITR состоит из нуклеотидной последовательности на 5'конце (5' ITR) и нуклеотидной последовательности, расположенной на 3'-конце (3' ITR), которые содержат палиндромные последовательности. ITR функционируют в цис-системе путем сворачивания с образованием T-образных шпилечных структур за счет комплементарного спаривания оснований, которые действуют как праймеры во время инициации репликации ДНК для синтеза второй цепи. Две открытые рамки считывания кодируют гены rep и cap, которые участвуют в репликации и упаковке вириона. Согласно иллюстративному варианту осуществления представленный в настоящем документе вектор AAV не содержит генов rep или cap. Такие гены могут быть представлены в транс для производства вирионов, как описано ниже.
Согласно определенным вариантам осуществления вектор AAV может включать в себя лишнюю нуклеиновую кислоту. Согласно определенным вариантам осуществления лишняя нуклеиновая кислота может кодировать зеленый флуоресцентный белок или ген устойчивости к антибиотикам, таким как канамицин или ампициллин. Согласно определенным вариантам осуществления лишняя нуклеиновая кислота может быть расположена вне последовательностей ITR (например, по сравнению с последовательностью трансгена eTF и регуляторными последовательностями, которые расположены между 5' и 3' ITR-последовательностями).
Существуют различные серотипы AAV, включая в себя AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12 и AAV13. Эти серотипы различаются по своему тропизму
- 43 046157 или по типам клеток, которые они заражают. AAV могут содержать геном и капсиды из множества серотипов (например, псевдотипов). Например, AAV может содержать геном серотипа 2 (например, ITR), упакованный в капсид серотипа 5 или серотипа 9. Псевдотипы могут повышать эффективность трансдукции, а также изменять тропизм.
В некоторых случаях предпочтителен серотип AAV, который может пересекать гематоэнцефалический барьер или инфицировать клетки ЦНС. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный регуляторный элемент PV, функционально связанный с трансгеном, кодирующим eTF, который избирательно активирует SCN1A. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный в отношении PV сайт связывания микроРНК. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, кодирующим eTF, который селективно активирует SCN1A, и селективный в отношении PV сайт связывания микроРНК.
Согласно иллюстративным вариантам осуществления в настоящей заявке представлены векторы экспрессии, которые были разработаны для доставки с помощью AAV. AAV может быть любого серотипа, например, AAV1, AAV2, AAV3, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, или химерным, гибридным или вариантом AAV. AAV также может представлять собой самокомплементарный AAV (scAAV). Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR и 3' ITR. Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR, промотор, трансген, кодирующий eTF, и 3' ITR. Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR, энхансер, промотор, трансген, кодирующий eTF, последовательность полиА и 3' ITR.
Клетки-хозяева.
Согласно другому аспекту настоящее изобретение относится к клетке-хозяину, содержащей кассету экспрессии или вектор экспрессии, как раскрыто в настоящем документе. Клетки-хозяева могут представлять собой бактериальную клетку, дрожжевую клетку, клетку насекомого или клетку млекопитающего. Согласно иллюстративному варианту осуществления под клеткой-хозяином понимается любая линия клеток, которая восприимчива к заражению представляющим интерес вирусом и поддается культивированию in vitro.
Согласно определенным вариантам осуществления предложенная в настоящем документе клеткахозяин может использоваться для целей генной терапии ex vivo. Согласно таким вариантам осуществления клетки трансфицируют молекулой нуклеиновой кислоты или вектором экспрессии, содержащим селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и затем трансплантируют пациенту или субъекту. Трансплантированные клетки могут иметь аутологичное, аллогенное или гетерологичное происхождение. Для клинического применения выделение клеток, как правило, проводят в условиях надлежащей производственной практики (GMP). Перед трансплантацией, как правило, проверяется качество клеток и отсутствие микробов или других загрязнителей, и может проводиться предварительное кондиционирование, такое как облучение и/или иммуносупрессивное лечение. Кроме того, клетки-хозяева можно трансплантировать вместе с факторами роста для стимуляции пролиферации и/или дифференцировки клеток.
Согласно определенным вариантам осуществления клетка-хозяин может использоваться для генной терапии ex vivo. Предпочтительно указанные клетки представляют собой эукариотические клетки, такие как клетки млекопитающих, они включают в себя, без ограничения, людей, отличных от людей приматов, таких как обезьяны; шимпанзе; мартышки и орангутаны, домашних животных, включая в себя собак и кошек, а также домашний скот, такой как лошади, крупный рогатый скот, свиньи, овцы и козы, или другие виды млекопитающих, включая в себя, без ограничения, мышей, крыс, морских свинок, кроликов, хомяков и т.п. Специалист в настоящей области техники выберет более подходящие клетки в соответствии с пациентом или объектом трансплантации.
Согласно определенным вариантам осуществления представленная в настоящем документе клеткахозяин может представлять собой клетку со свойствами самообновления и плюрипотентности, например, стволовые клетки или индуцированные плюрипотентные стволовые клетки. Стволовые клетки предпочтительно представляют собой мезенхимальные стволовые клетки. Мезенхимальные стволовые клетки (MSC) способны дифференцироваться по меньшей мере в один из остеобластов, хондроцитов, адипоцитов или миоцитов и могут быть выделены из любого типа ткани. Как правило, MSC выделяют из костного мозга, жировой ткани, пуповины или периферической крови. Способы их получения хорошо известны специалисту в настоящей области техники. Индуцированные плюрипотентные стволовые клетки (также известные как iPS-клетки или iPSC) представляют собой тип плюрипотентных стволовых клеток, которые могут быть получены непосредственно из взрослых клеток. Yamanaka с соавт. индуцировали iPSклетки путем переноса генов Oct3/4, Sox2, Klf4 и c-Myc в фибробласты мыши и человека и вынуждая
- 44 046157 клетки экспрессировать гены (WO 2007/069666). Thomson с соавт. впоследствии производили iPS-клетки человека с использованием Nanog и Lin28 вместо Klf4 и c-Myc (WO 2008/118820).
Согласно иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин представляет собой упаковывающую клетку. Указанные клетки могут представлять собой прикрепленные или суспензионные клетки. Упаковывающая клетка и вспомогательный вектор или вирус, или конструкция(и) ДНК обеспечивают вместе в транс все недостающие функции, которые требуются для полной репликации и упаковки вирусного вектора.
Предпочтительно указанные упаковывающие клетки представляют собой эукариотические клетки, такие как клетки млекопитающих, включая в себя клетки обезьян, человека, собак и грызунов. Примерами клеток человека являются клетки PER.C6 (WO01/38362), MRC-5 (ATCC CCL-171), WI-38 (ATCC CCL-75), клетки HEK-293 (ATCC CRL-1573), клетки HeLa (ATCC CCL2) и фетальные клетки легких резус (ATCC CL-160). Примерами клеток отличных от людей приматов являются клетки Vero (ATCC CCL81), клетки COS-1 (ATCC CRL-1650) или клетки COS-7 (ATCC CRL-1651). Примерами клеток собаки являются клетки MDCK (ATCC CCL-34). Примерами клеток грызунов являются клетки хомяка, такие как BHK21-F, клетки HKCC или клетки CHO.
В качестве альтернативы источникам млекопитающих клеточные линии для применения в настоящем изобретении могут быть получены из источников птиц, таких как курица, утка, гусь, перепел или фазан. Примеры птичьих клеточных линий включают в себя птичьи эмбриональные стволовые клетки (WO01/85938 и WO03/076601), иммортализованные клетки сетчатки утки (WO2005/042728) и клетки, полученные из птичьих эмбриональных стволовых клеток, включая в себя клетки курицы (WO2006/108846) или клетки утки, такие как клеточная линия EB66 (WO2008/129058 и WO2008/142124).
Согласно другому варианту осуществления указанные клетки-хозяева представляют собой клетки насекомых, такие как клетки SF9 (ATCC CRL-1711), клетки Sf21 (IPLB-Sf21), клетки MG1 (BTI-TNMG1) или клетки High Five™ (BTI-TN-5B1-4).
Согласно определенным вариантам осуществления представленные в настоящем документе клеткихозяева, содержащие рекомбинантный вектор/геном AAV по настоящему изобретению (например, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A), могут дополнительно содержать одну или несколько конструкций нуклеиновых кислот, такие как, например, (i) конструкция нуклеиновой кислоты (например, плазмида-помощник AAV), которая кодирует гены rep и cap, но не несет последовательностей ITR; и/или (ii) конструкция нуклеиновой кислоты (например, плазмида), обеспечивающая аденовирусные функции, необходимые для репликации AAV. Согласно иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин содержит: i) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, как предусмотрено в настоящем документе (т.е. рекомбинантный геном AAV); ii) конструкцию нуклеиновой кислоты, кодирующую гены rep и cap AAV, которая не несет последовательности ITR; и iii) конструкцию нуклеиновой кислоты, содержащую аденовирусные гены-помощники (как описано ниже).
Согласно определенным вариантам осуществления гены-помощники rep, cap и аденовируса могут быть объединены в одной плазмиде (Blouin V et al. J Gene Med. 2004; 6(suppl): S223-S228; Grimm D. et al. Hum. Gene Ther. 2003; 7: 839-850). Таким образом, согласно другому иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин содержит: i) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как раскрыто в настоящем документе (т.е. рекомбинантный геном AAV); и ii) плазмиду, кодирующую гены rep и cap AAV, которая не несет последовательности ITR и дополнительно содержит гены-помощники аденовирусов.
Согласно другому варианту осуществления представленная в настоящем документе клетка-хозяин содержит: a) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе (т.е. геном рекомбинантного AAV); b) плазмиду, кодирующую гены rep и cap AAV, которая не несет последовательности ITR; и c) плазмиду, содержащую аденовирусные РНК геновпомощников E2a, E4 и VA; причем котрансфекция выполняется в клетках, предпочтительно в клетках млекопитающих, которые конститутивно экспрессируют и характеризуются транскомплементацией к аденовирусному гену E1, как клетки HEK-293 (ATCC CRL-1573).
Согласно определенным вариантам осуществления клетка-хозяин, подходящая для крупномасштабного производства векторов AAV, представляет собой клетки насекомых, которые можно инфицировать комбинацией рекомбинантных бакуловирусов (Urabe et al. Hum. Gene Ther. 2002; 13: 1935-1943). Например, клетки SF9 могут быть совместно инфицированы тремя бакуловирусными векторами, соответственно экспрессирующими rep AAV, cap AAV и упаковываемый вектор AAV. Рекомбинантные бакуловирусные векторы будут обеспечивать функции вирусного гена-помощника, необходимые для репликации и/или упаковки вируса.
Дополнительное руководство по конструированию и производству вирионов для генной терапии
- 45 046157 согласно настоящему изобретению можно найти в: Viral Vectors for Gene Therapy, Methods and Protocols. Series: Methods in Molecular Biology, Vol. 737. Merten and Al-Rubeai (Eds.); 2011 Humana Press (Springer); Gene Therapy. M. Giacca. 2010 Springer-Verlag; Heilbronn R. and Weger S. Viral Vectors for Gene Transfer: Current Status of Gene Therapeutics. In: Drug Delivery, Handbook of Experimental Pharmacology 197; M. Schafer-Korting (Ed.). 2010 Springer-Verlag; pp. 143-170; Adeno-Associated Virus: Methods and Protocols. R. O. Snyder and P. Moulllier (Eds). 2011 Humana Press (Springer); Bunning H. et al. Recent developments in adeno-associated virus technology. J. Gene Med. 2008; 10:717-733 и Adenovirus: Methods and Protocols. M. Chillon and A. Bosch (Eds.); Third. Edition. 2014 Humana Press (Springer).
Вирионы и способы получения вирионов.
Согласно определенным вариантам осуществления в настоящей заявке представлены вирусные частицы, содержащие вирусный вектор, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе. Термины вирусная частица и вирион используются в настоящем документе взаимозаменяемо и относятся к инфекционной и, как правило, дефектной по репликации вирусной частице, содержащей вирусный геном (например, вектор вирусной экспрессии), упакованный внутри капсида, и, в зависимости от случая, например, для ретровирусов - липидную оболочку, окружающую капсид. Капсид относится к структуре, в которую упакован вирусный геном. Капсид состоит из нескольких олигомерных структурных субъединиц, состоящих из белков. Например, у AAV есть икосаэдрический капсид, образованный взаимодействием трех капсидных белков: VP1, VP2 и VP3. Согласно одному варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент и селективный в отношении PV сайт связывания микроРНК. Согласно другому варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент, функционально связанный с последовательностью, кодирующей eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, в белковой оболочке. Согласно другому варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент, функционально связанный с последовательностью, кодирующей eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и селективный в отношении PV сайт связывания микроРНК в белковой оболочке.
Согласно определенным вариантам осуществления представленный в настоящем документе рекомбинантный вирион AAV может быть получен путем инкапсидации генома AAV, полученного из определенного серотипа AAV, в вирусную частицу, образованную природными белками Cap, соответствующими AAV того же конкретного серотипа. Согласно другим вариантам осуществления представленная в настоящем документе вирусная частица AAV содержит вирусный вектор, содержащий ITR данного серотипа AAV, упакованный в белки из другого серотипа. Смотрите, например, Bunning H et al. J Gene Med 2008; 10: 717-733. Например, вирусный вектор, имеющий ITR из данного серотипа AAV, может быть упакован в: a) вирусную частицу, состоящую из капсидных белков, полученных из того же или другого серотипа AAV (например, ITR AAV2 и капсидных белков AAV9; ITR AAV2 и капсидных белков AAV8 и т.п.); b) мозаичную вирусную частицу, состоящую из смеси капсидных белков из различных серотипов или мутантов AAV (например, ITR AAV2 с капсидными белками AAV1 и AAV9); c) химерную вирусную частицу, состоящую из капсидных белков, которые были усечены перестановкой доменов между различными серотипами или вариантами AAV (например, ITR AAV2 с белками капсида AAV8 с доменами AAV9); или d) нацеленную вирусную частицу, сконструированную для отображения селективных связывающих доменов, обеспечивающих строгое взаимодействие со специфическими рецепторами целевой клетки (например, ITR AAV5 с капсидными белками AAV9, генетически усеченными путем вставки пептидного лиганда; или капсидные белки AAV9, не модифицированные генетически путем связывания пептидного лиганда на поверхности капсида).
Квалифицированному специалисту будет понятно, что представленный в настоящем документе вирион AAV может содержать капсидные белки любого серотипа AAV. Согласно одному варианту осуществления вирусная частица содержит капсидные белки из серотипа AAV, выбранного из группы, состоящей из AAV1, AAV2, AAV5, AAV8 и AAV9, которые более подходят для доставки в ЦНС (M. Hocquemiller et al., Hum Gene Ther 27(7): 478-496 (2016)). Согласно конкретному варианту осуществления вирусная частица содержит кассету экспрессии по настоящему изобретению, в которой последовательности 5'ITR и 3'ITR кассеты экспрессии относятся к серотипу AAV2, а белки капсида относятся к серотипу AAV9.
В настоящей области техники известны многочисленные способы получения вирионов rAAV, включая в себя трансфекцию, получение стабильных клеточных линий и системы производства инфекционных гибридных вирусов, которые включают в себя гибриды аденовирус-AAV, гибриды герпесвирус-AAV (Conway, J E et al., (1997) J. Virology 71(11):8780-8789) и гибриды бакуловирус-AAV. Все куль
- 46 046157 туры производства rAAV для производства вирусных частиц rAAV требуют: 1) подходящие клеткихозяева, включая в себя, например, клеточные линии человеческого происхождения, такие как клетки HeLa, A549 или 293, или клеточные линии, полученные из насекомых, такие как SF-9, в случае систем производства бакуловирусов; 2) подходящей функции вируса-помощника, обеспечиваемой аденовирусом дикого типа или мутантным аденовирусом (таким как чувствительный к температуре аденовирус), вирусом герпеса, бакуловирусом или плазмидной конструкцией, обеспечивающей вспомогательные функции; 3) гены rep и cap AAV и генные продукты; 4) трансген (например, содержащий один или несколько из: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированный последовательностями ITR AAV; и 5) подходящие носители и компоненты среды для поддержки производства rAAV.
Согласно различным вариантам осуществления описанные в настоящем документе клетки-хозяева содержат следующие три компонента: (1) ген rep и ген cap, (2) гены, обеспечивающие вспомогательные функции, и (3) трансген (например, содержащий один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированных ITR. Ген rep AAV, ген cap AAV и гены, обеспечивающие вспомогательные функции, могут быть введены в клетку путем включения указанных генов в вектор, такой как, например, плазмида, и введения указанного вектора в клетку-хозяина. Гены rep, cap и гены, обеспечивающие вспомогательные функции, могут быть включены в одну и ту же плазмиду или в разные плазмиды. Согласно предпочтительному варианту осуществления гены rep и cap AAV включены в одну плазмиду, а гены, обеспечивающие вспомогательные функции, включены в другую плазмиду. Различные плазмиды для создания клетки-хозяина для производства вирионов (например, содержащие гены rep и cap AAV, вспомогательных функций или трансген) могут быть введены в клетку с использованием любого подходящего способа, хорошо известного в настоящей области техники. Примеры способов трансфекции включают в себя, без ограничения, соосаждение с фосфатом кальция, DEAE-декстраном, полибреном, электропорацию, микроинъекцию, опосредованное липосомами слияние, липофекцию, ретровирусную инфекцию и биолистическую трансфекцию. Согласно определенным вариантам осуществления плазмиды, обеспечивающие гены rep и cap, вспомогательные функции и трансген, фланкированный ITR, могут быть введены в клетку одновременно. Согласно другому варианту осуществления плазмиды, обеспечивающие гены rep и cap и вспомогательные функции, могут быть введены в клетку до или после введения плазмиды, содержащей трансген. Согласно иллюстративному варианту осуществления клетки трансфицируют одновременно тремя плазмидами (например, способом тройной трансфекции): (1) плазмидой, содержащей трансген (например, содержащей один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированного ITR, (2) плазмидой, содержащей гены rep и cap AAV, и (3) плазмидой, содержащей гены, обеспечивающие вспомогательные функции. Иллюстративные клетки-хозяева могут представлять собой клетки 293, A549 или HeLa.
Согласно другим вариантам осуществления один или несколько из (1) генов rep и cap AAV, (2) генов, обеспечивающих вспомогательные функции, и (3) трансгена (например, содержащего один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированного ITR, может переноситься упаковывающей клеткой либо эписомально, либо интегрироваться в геном упаковывающей клетки. Согласно одному варианту осуществления клетки-хозяева могут представлять собой упаковывающие клетки, в которых гены rep и cap AAV и гены, обеспечивающие вспомогательные функции, стабильно поддерживаются в клеткехозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащей один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированный ITR. Согласно другому варианту осуществления клетки-хозяева представляют собой упаковывающие клетки, в которых гены rep и cap AAV стабильно поддерживаются в клетке-хозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащей один или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированный ITR и плазмидой, содержащей вспомогательные функции. Согласно другому варианту осуществления клетки-хозяева могут представлять собой упаковывающие клетки, в которых вспомогательные функции стабильно поддерживаются в клетке-хозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащий один или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный
- 47 046157 в отношении PV промотор), фланкированный ITR, и плазмидой, содержащей гены rep и cap. Согласно другому варианту осуществления клетки-хозяева могут представлять собой клеточные линиипродуценты, которые стабильно трансфицируются генами rep и cap, генами, обеспечивающими вспомогательные функции, и последовательностью трансгена (например, содержащего одно или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированного ITR. Иллюстративные упаковывающие клетки и клетки-продуценты могут происходить из клеток 293, A549 или HeLa.
Согласно другому варианту осуществления линия клеток-продуцентов представляет собой линию клеток насекомых (как правило, клетки Sf9), которые инфицированы векторами экспрессии бакуловируса, которые обеспечивают белки Rep и Cap. Для этой системы не требуются гены-помощники аденовируса (Ayuso E, et al., Curr. Gene Ther. 2010, 10:423-436).
Используемый в настоящем документе термин белок cap относится к полипептиду, обладающему по меньшей мере одной функциональной активностью нативного белка cap AAV (например, VP1, VP2, VP3). Примеры функциональной активности белков cap включают в себя способность индуцировать образование капсида, способствовать накоплению одноцепочечной ДНК, облегчать упаковку ДНК AAV в капсиды (т.е. инкапсидацию), связываться с клеточными рецепторами и облегчать проникновение вириона в клетки-хозяева. В принципе, в контексте настоящего изобретения можно использовать любой белок Cap.
Сообщалось, что белки cap влияют на тропизм хозяина, специфичность клеток, тканей или органов, использование рецепторов, эффективность заражения и иммуногенность вирусов AAV. Соответственно, cap AAV для применения в rAAV может быть выбран с учетом, например, вида субъекта (например, человека или не человека), иммунологического состояния субъекта, его пригодности для длительного или краткосрочного лечения или конкретного терапевтического применения (например, лечение конкретного заболевания или нарушения или доставка в определенные клетки, ткани или органы). Согласно определенным вариантам осуществления белок cap происходит из группы AAV, состоящей из серотипов AAV1, AAV2, AAV5, AAV8 и AAV9. Согласно иллюстративному варианту осуществления белок cap происходит из AAV9.
Согласно некоторым вариантам осуществления cap AAV для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых cap AAV или кодирующей его нуклеиновой кислоты. Согласно определенным вариантам осуществления cap AAV по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых cap AAV.
Согласно некоторым вариантам осуществления cap AAV является химерным и содержит домены из двух, трех, четырех или более из вышеупомянутых cap AAV. Согласно определенным вариантам осуществления cap AAV представляет собой мозаику мономеров VP1, VP2 и VP3, происходящих из двух или трех различных AAV или рекомбинантного AAV. Согласно определенным вариантам осуществления композиция rAAV содержит более одного из вышеупомянутых cap.
Согласно некоторым вариантам осуществления cap AAV для применения в вирионе rAAV сконструирован таким образом, чтобы он содержал гетерологичную последовательность или другую модификацию. Например, последовательность пептида или белка, обеспечивающая избирательное нацеливание или уклонение от иммунитета, может быть преобразована в белок cap. В качестве альтернативы или в дополнение, cap может быть химически модифицирован так, чтобы поверхность rAAV была полиэтиленгликолированной (т.е. пегилированной), что может способствовать уклонению от иммунитета. Белок cap также может быть мутагенизирован (например, для удаления его естественного связывания с рецептором или для маскировки иммуногенного эпитопа).
Используемый в настоящем документе термин белок rep относится к полипептиду, обладающему по меньшей мере одной функциональной активностью нативного белка rep AAV (например, rep 40, 52, 68, 78). Примеры функциональной активности белка rep включают в себя любую активность, связанную с физиологической функцией белка, включая в себя облегчение репликации ДНК посредством распознавания, связывания и отсечения ориджина AAV репликации ДНК, а также активности ДНК-геликазы. Дополнительные функции включают в себя модуляцию транскрипции с промоторов AAV (или других гетерологичных) и сайт-специфическую интеграцию ДНК AAV в хромосому хозяина. Согласно конкретному варианту осуществления гены rep AAV могут происходить из серотипов AAV1, AAV2, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 или AAVrh10; более предпочтительно из серотипа AAV, выбранного из группы, состоящей из AAV1, AAV2, AAV5, AAV8 и AAV9.
Согласно определенным вариантам осуществления белок rep AAV для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых rep AAV или его кодирующей нуклеиновой кислоты. Согласно определенным вариантам осуществления rep AAV по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых rep AAV.
Использованные в настоящем документе выражения вспомогательные функции или гены
- 48 046157 помощники относятся к вирусным белкам, репликация которых зависит от AAV. Вспомогательные функции включают в себя те белки, которые необходимы для репликации AAV, включая в себя, без ограничения, те белки, которые участвуют в активации транскрипции гена AAV, стадиеспецифическом сплайсинге мРНК AAV, репликации ДНК AAV, синтезе продуктов экспрессии cap и сборке капсида AAV. Вспомогательные функции на основе вирусов могут быть получены из любого из известных вспомогательных вирусов, таких как аденовирус, вирус герпеса (кроме вируса простого герпеса типа 1) и вирус осповакцины. Вспомогательные функции включают в себя, без ограничения, аденовирус E1, E2a, VA и E4 или герпесвирус UL5, ULB, UL52 и UL29 и герпесвирусную полимеразу. Согласно предпочтительному варианту осуществления белки, от которых зависит репликация AAV, происходят от аденовируса.
Согласно определенным вариантам осуществления вирусный белок, репликация которого зависит от AAV, для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых вирусных белков или кодирующей его нуклеиновой кислоты. Согласно определенным вариантам осуществления вирусный белок по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых вирусных белков.
Способы анализа функций белков cap, белков rep и вирусных белков, от которых зависит репликация AAV, хорошо известны в настоящей области техники.
Клетки-хозяева для экспрессии представляющего интерес трансгена (например, содержащие одно или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор) могут быть выращены в условиях, подходящих для сборки вирионов AAV. Согласно определенным вариантам осуществления клетки-хозяева выращивают в течение подходящего периода времени, чтобы способствовать сборке вирионов AAV и высвобождению вирионов в среду. Как правило, клетки можно выращивать в течение приблизительно 24 часов, приблизительно 36 часов, приблизительно 48 часов, приблизительно 72 часов, приблизительно 4 дней, приблизительно 5 дней, приблизительно 6 дней, приблизительно 7 дней, приблизительно 8 дней, приблизительно 9 дней или до приблизительно 10 дней. Приблизительно через 10 дней (или раньше, в зависимости от условий культивирования и конкретной используемой клетки-хозяина) уровень продукции, как правило, значительно снижается. Как правило, время культивирования измеряется с момента образования вируса. Например, в случае AAV производство вируса, как правило, начинается после обеспечения функции вируса-помощника в соответствующей клетке-хозяине, как описано в настоящем документе. Как правило, клетки собирают от приблизительно 48 до приблизительно 100, предпочтительно от приблизительно 48 до приблизительно 96, предпочтительно от приблизительно 72 до приблизительно 96, предпочтительно от приблизительно 68 до приблизительно 72 часов после заражения вирусом-помощником (или после начала производства вируса).
Культуры-продуценты rAAV можно выращивать в различных условиях (в широком диапазоне температур, в течение различных периодов времени и т.п.), подходящих для конкретной используемой клетки-хозяина. Культуры производства rAAV включают в себя культуры, зависящие от прикрепления, которые можно культивировать в подходящих емкостях, зависящих от прикрепления, таких как, например, вращающиеся флаконы, фильтры из полого волокна, микроносители и биореакторы с уплотненным слоем или с псевдоожиженным слоем. Культуры производства вектора rAAV могут также включать в себя адаптированные к суспензии клетки-хозяева, такие как клетки HeLa, 293 и SF-9, которые можно культивировать различными способами, включая в себя, например, вращающиеся колбы, биореакторы с мешалкой и одноразовые системы, такие как система одноразовых реакторов фирмы Wave.
Подходящие среды, известные в настоящей области техники, могут использоваться для производства вирионов rAAV. Эти среды включают в себя, без ограничения, среды, производимые Hyclone Laboratories и JRH, включая в себя модифицированную среду Игла (MEM), модифицированную Дульбекко среду Игла (DMEM), каждая из которых полностью включена в настоящий документ посредством ссылки. Согласно определенным вариантам осуществления культуральная среда для производства rAAV может быть дополнена сывороткой или полученными из сыворотки рекомбинантными белками на уровне 0,5-20% (в объемном отношении или массово-объемном отношении). Альтернативно, векторы rAAV могут быть получены в бессывороточных условиях, которые также могут называться средами без продуктов животного происхождения.
После культивирования клеток-хозяев, чтобы обеспечить производство вирионов AAV, полученные вирионы могут быть собраны и очищены. Согласно определенным вариантам осуществления вирионы AAV могут быть получены из (1) клеток-хозяев производственной культуры путем лизиса клеток-хозяев и/или (2) культуральной среды указанных клеток через период времени после трансфекции, предпочтительно 72 часа. Вирионы rAAV могут быть собраны из отработанной среды из производственной культуры при условии, что клетки культивируются в условиях, которые вызывают высвобождение вирионов rAAV в среду из интактных клеток (см., например, патент США № 6566118). Подходящие способы лизирования клеток также известны в настоящей области техники и включают в себя, например, несколько циклов замораживания/оттаивания, обработку ультразвуком, микрофлюидизацию и обработку химиче
- 49 046157 скими веществами, такими как детергенты и/или протеазы.
После сбора вирионы rAAV могут быть очищены. Используемый в настоящем документе термин очищенный включает в себя препарат вирионов rAAV, лишенный по меньшей мере некоторых других компонентов, которые также могут присутствовать там, где вирионы rAAV встречаются в природе или из которых изначально получены. Таким образом, например, очищенные вирионы rAAV могут быть получены с использованием способа выделения для обогащения их из исходной смеси, такой как лизат культуры или супернатант производственной культуры. Обогащение можно измерить множеством способов, например, по доле устойчивых к ДНКазам частиц (DRP) или копий генома (gc), присутствующих в растворе, или по инфекционности, или его можно измерить по отношению к второму, потенциально мешающему веществу, присутствующему в исходной смеси, такому как загрязняющие вещества, включая в себя загрязняющие вещества производственной культуры или технологические загрязняющие вещества, включая в себя вирус-помощник, компоненты среды и т.п.
Согласно определенным вариантам осуществления выход культуры производства rAAV можно осветлить для удаления остатков клеток-хозяев. Согласно некоторым вариантам осуществления выход культуры производства можно осветлить с использованием множества стандартных технологий, таких как центрифугирование или фильтрация через фильтр с размером пор 0,2 мкм или более (например, фильтр из ацетата целлюлозы или серия глубинных фильтров).
Согласно определенным вариантам осуществления выход культуры для производства rAAV дополнительно обрабатывают бензоназой™ для расщепления любой высокомолекулярной ДНК, присутствующей в производственной культуре. Согласно некоторым вариантам осуществления расщепление бензоназой™ проводят в стандартных условиях, например, при конечной концентрации 1-2,5 единиц/мл бензоназы™ при температуре от температуры окружающей среды до 37°C в течение периода от 30 минут до нескольких часов.
Согласно определенным вариантам осуществления вирионы rAAV могут быть выделены или очищены с использованием одной или нескольких из следующих стадий очистки: равновесное центрифугирование; проточная анионообменная фильтрация; тангенциальная проточная фильтрация (TFF) для концентрирования частиц rAAV; захват rAAV с помощью апатитовой хроматографии; тепловая инактивация вируса-помощника; захват rAAV с помощью хроматографии гидрофобного взаимодействия; замена буфера с помощью эксклюзионной хроматографии (SEC); нанофильтрация и захват rAAV с помощью анионообменной хроматографии, катионообменной хроматографии или аффинной хроматографии. Эти стадии можно использовать по отдельности, в различных комбинациях или в разном порядке. Способы очистки частиц rAAV можно найти, например, в Xiao et al., (1998) Journal of Virology 72:2224-2232; патентах США № 6989264 и 8137948 и WO 2010/148143.
Согласно определенным вариантам осуществления очищенные вирионы AAV можно подвергнуть диализу против PBS, отфильтровать и хранить при температуре -80°C. Титры вирусных геномов можно определить с помощью количественной ПЦР с использованием линеаризованной плазмидной ДНК в качестве стандартной кривой (см., например, Lock M, et al., Hum. Gene Ther. 2010; 21:1273-1285).
Фармацевтические композиции.
Согласно определенным вариантам осуществления в настоящей заявке представлены композиции, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, и фармацевтически приемлемый носитель. Согласно другим вариантам осуществления в настоящей заявке представлены вирионы, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, и фармацевтически приемлемый носитель. Согласно иллюстративным вариантам осуществления такие композиции подходят для применения в генной терапии. Фармацевтические композиции предпочтительно стерильны и стабильны в условиях производства и хранения. Стерильные растворы могут быть получены, например, путем фильтрации через стерильные фильтрующие мембраны.
Приемлемые носители и вспомогательные вещества в фармацевтических композициях предпочтительно нетоксичны для реципиентов в используемых дозировках и концентрациях. Приемлемые носители и вспомогательные вещества могут включать в себя такие буферы, как фосфатный, цитратный, HEPES и TAE, такие антиоксиданты, как аскорбиновая кислота и метионин, такие консерванты, как гексаметоний хлорид, октадецилдиметилбензиламмонийхлорид, резорцин и хлорид бензалкония, такие белки, как сывороточный альбумин человека, желатин, декстран и иммуноглобулины, такие гидрофильные полимеры, как поливинилпирролидон, такие аминокислоты, как глицин, глутамин, гистидин и лизин, и такие углеводы, как глюкоза, манноза, сахароза и сорбитол. Фармацевтические композиции по настоящему раскрытию можно вводить парентерально в форме инъекционной композиции. Фармацевтические композиции для инъекций могут быть составлены с использованием стерильного раствора или любой фармацевтически приемлемой жидкости в качестве носителя. Фармацевтически приемлемые носители включают в себя, без ограничения, стерильную воду и физиологический раствор.
Фармацевтические композиции по настоящему раскрытию могут быть приготовлены в микрокап
- 50 046157 сулах, таких как гидроксилметилцеллюлозные или желатиновые микрокапсулы и микрокапсулы из полиметилметакрилата. Фармацевтические композиции по настоящему раскрытию также могут быть приготовлены в других системах доставки лекарственных средств, таких как липосомы, микросферы альбумина, микроэмульсии, наночастицы и нанокапсулы. Фармацевтическая композиция для генной терапии может быть в приемлемом разбавителе или может содержать матрицу с медленным высвобождением, в которую встроен носитель для доставки гена.
Представленные в настоящем документе фармацевтические композиции могут быть составлены для парентерального введения, подкожного введения, внутривенного введения, внутримышечного введения, внутриартериального введения, интрапаренхимального введения, интратекального введения, введения в мостомозжечковую цистерну, интрацеребровентрикулярного введения или внутрибрюшинного введения. Фармацевтическая композиция также может быть приготовлена или вводиться путем назального введения, посредством спрея, перорального, аэрозольного, ректального или вагинального введения. Согласно одному варианту осуществления представленная в настоящем документе фармацевтическая композиция вводится в ЦНС или спинномозговую жидкость (CSF), т.е. путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Тканевая мишень может быть специфической, например, ЦНС, или может представлять собой комбинацию нескольких тканей, например, мышечных тканей и тканей ЦНС. Иллюстративная ткань или другие мишени могут включать в себя печень, скелетные мышцы, сердечную мышцу, жировые отложения, почки, легкие, эндотелий сосудов, эпителиальные клетки, кроветворные клетки, ЦНС и/или CSF. Согласно предпочтительному варианту осуществления представленная в настоящем документе фармацевтическая композиция, содержащая селективный в отношении PV сайт связывания микроРНК и/или eTF, который избирательно активирует SCN1A, вводится инъекцией в ЦНС или спинномозговую жидкость, т.е. путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Один или несколько из этих способов можно использовать для введения фармацевтической композиции по настоящему раскрытию.
Согласно определенным вариантам осуществления представленная в настоящем документе фармацевтическая композиция содержит эффективное количество или терапевтически эффективное количество. В контексте настоящего описания такие количества относятся к количеству, эффективному в дозировках и в течение периодов времени, необходимых для достижения желаемого терапевтического результата, такого как повышение уровня экспрессии SCN1A и/или уменьшение частоты и/или продолжительности припадков.
Дозировка фармацевтических композиций по настоящему раскрытию зависит от факторов, включающих в себя путь введения, заболевание, которое необходимо лечить, и физические характеристики (например, возраст, массу, общее состояние здоровья) субъекта. Дозировка может быть скорректирована для обеспечения оптимального терапевтического ответа. Как правило, дозировка может представлять собой количество, которое эффективно лечит заболевание, не вызывая значительной токсичности. Согласно одному варианту осуществления представленный в настоящем документе вектор AAV можно вводить пациенту для лечения дефицита SCNIA (включая в себя, например, синдром Драве) в количестве или дозе в диапазоне от 5х 1011 до 1 х 1014 гк/кг (количество геномных копий на килограмм массы тела пациента (гк/кг)). Согласно более конкретному варианту осуществления вектор AAV вводят в количестве, которое находится в диапазоне от приблизительно 5х 1011 гк/кг до приблизительно 3х1013 гк/кг или от приблизительно 1х1012до приблизительно 1 х 1014 гк/кг, или от приблизительно 1 х 1012 до приблизительно 1х1013 гк/кг, или приблизительно 5х1011 гк/кг, 1х1012 гк/кг, 1,5х1012 гк/кг, 2,0х1012 гк/кг, 2,5х1012 гк/кг, 3х1012 гк/кг, 3,5х1012 гк/кг, 4х1012 гк/кг, 4,5х1012 гк/кг, 5х1012 гк/кг, 5,5х1012 гк/кг, 6х1012 гк/кг, 6,5х1012 гк/кг, 7х1012 гк/кг, 7,5х1012 гк/кг, 8х1012 гк/кг, 8,5х1012 гк/кг, 9х1012 гк/кг или 9,5х1012 гк/кг. гк/кг можно определить, например, с помощью кПЦР или цифровой капельной ПЦР (ddPCR) (см., например, M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2): 115-25). Согласно другому варианту осуществления представленный в настоящем документе вектор AAV можно вводить пациенту для лечения дефицита SCNIA (включая в себя, например, синдром Драве) в количестве или дозе в диапазоне от 1х 109 до 1х 1011 iu/кг (инфекционные единицы вектора (ш)/масса тела субъекта или пациента (кг)). Согласно определенным вариантам осуществления фармацевтическая композиция может быть приготовлена в виде стандартной дозы по мере необходимости. Такие единичные дозированные единицы могут содержать от приблизительно 1х109 gc до приблизительно 1 х 1015 gc.
Фармацевтические композиции по настоящему раскрытию можно вводить нуждающемуся в этом субъекту, например, один или несколько раз (например, 1-10 раз или более) ежедневно, еженедельно, ежемесячно, два раза в год, ежегодно или по медицинским показаниям. Согласно иллюстративному варианту осуществления достаточно однократного введения. Согласно одному варианту осуществления фармацевтическая композиция, содержащая кассету экспрессии, кодирующую селективный в отношении PV сайт связывания микроРНК и/или eTF, который избирательно активирует SCN1A, подходит для применения у людей и вводится путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Согласно одному вари- 51 046157 анту осуществления фармацевтическая композиция доставляется через периферическую вену путем болюсной инъекции. Согласно другим вариантам осуществления фармацевтическая композиция доставляется через периферическую вену путем инфузии в течение приблизительно 10 минут (±5 минут), в течение приблизительно 20 минут (±5 минут), в течение приблизительно 30 минут (±5 минут), в течение приблизительно 60 минут (±5 минут) или в течение более чем 90 минут (±10 минут).
Согласно другому аспекту в настоящей заявке дополнительно представлен набор, содержащий молекулу нуклеиновой кислоты, вектор, клетку-хозяина, вирион или фармацевтическую композицию, как описано в настоящем документе, в одном или нескольких контейнерах. Набор может содержать инструкции или упаковочные материалы, которые описывают, как вводить пациенту молекулу нуклеиновой кислоты, вектор, клетку-хозяина или вирион, содержащиеся в наборе. Контейнеры набора могут быть из любого подходящего материала, например, стекла, пластика, металла и т.д., и быть любого подходящего размера, формы или конфигурации. Согласно определенным вариантам осуществления наборы могут содержать одну или несколько ампул или шприцев, которые содержат молекулу нуклеиновой кислоты, вектор, клетку-хозяина, вирион или фармацевтическую композицию в подходящей жидкости или форме раствора.
Способы лечения.
Согласно одному аспекту в настоящей заявке представлены способы применения eTF, которые избирательно активируют SCN1A, как раскрыто в настоящем документе. Согласно определенным вариантам осуществления в настоящей заявке представлены способы введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, для усиления экспрессии SCNIA в клетке. Согласно различным вариантам осуществления eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, можно использовать для модуляции экспрессии SCNIA в клетке in vitro, in vivo или ex vivo.
Согласно определенным вариантам осуществления в настоящей заявке представлены способы лечения заболевания или нарушения, связанного с SCN1A, путем введения субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, при необходимости. Согласно определенным вариантам осуществления нарушение представляет собой нарушение центральной нервной системы. Согласно иллюстративным вариантам осуществления заболевание или нарушение связано с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления гаплонедостаточность является результатом того, что субъект является гетерозиготным по мутации потери функции гена SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную со вставкой, делецией или заменой в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с точечной мутацией в гене SCN1A. Согласно определенным вариантам осуществления способ лечения заболевания или нарушения предусматривает введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, так что недостаточная экспрессия SCN1A корректируется, доводится до пределов уровня здорового человека или доводится до нормального диапазона, определенного стандартом медицинской помощи. Согласно определенным вариантам осуществления раскрытые в настоящем документе способы применяются для лечения заболевания или нарушения, связанного с эндогенным SCN1A, содержащим одну или несколько мутаций, которые приводят к аномальной экспрессии SCN1A.
Согласно определенным вариантам осуществления в настоящей заявке представлены способы облегчения симптома, связанного с заболеванием или нарушением, путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, нуждающемуся в этом субъекту.
Согласно иллюстративному варианту осуществления в настоящей заявке представлены способы лечения заболевания, нарушения или симптома, связанного с мутацией в SCN1A (например, точечной мутацией, заменой, делецией, инверсией и т.д.), дефицитом в Nav1.1 и/или снижением активности Nav1.1 путем введения нуждающемуся в этом субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно усиливает экспрессию гена SCN1A или его белкового продукта Nav1.1. Управляемые напряжением ионные натриевые каналы важны для генерации и распространения потенциалов действия в поперечнополосатых мышцах и нервных тканях. Управляемые напряжением ионные натриевые каналы представляют собой гетеромерные комплексы, состоящие из большой центральной порообразующей гликозилированной альфасубъединицы и двух меньших вспомогательных бета-субъединиц. Большая альфа-субъединица субъединица Nav1.1, кодируемая геном SCN1A, актуальна для различных заболеваний или нарушений, таких как синдром Драве. Nav1.1 экспрессируется в нейронах и может быть собрана с различными бета- 52 046157 субъединицами, включая в себя Νανβΐ, экспрессируемую геном SCN1B.
Согласно определенным вариантам осуществления в настоящей заявке представлены способы лечения заболеваний, связанных с мутацией в SCN1A (например, делецией, вставкой, инверсией, точечной мутацией (например, нонсенс-мутацией, миссенс-мутацией) и т.д.) или сниженной активностью Nav1.1 с использованием eTF, который избирательно повышает экспрессию эндогенного гена SCN1A. Заболевания и нарушения, связанные с мутациями SCN1A, включают в себя, без ограничения: синдром Драве, синдром Охтахара, эпилепсию, раннюю детскую эпилептическую энцефалопатию 6 (EIEE6), семейные фебрильные припадки 3A (FEB3A), трудноизлечимую детскую эпилепсию с генерализованными тоникоклоническими припадками (ICEGTC), мигрень, семейную гемиплегию 3 (FHM3), синдром Панайотопулоса, семейную фибрилляцию предсердий 13 (ATFB13), генерализованную эпилепсию с фебрильными судорогами плюс типа 1 (gefs + тип 1), синдром Бругада, неспецифический дефект сердечной проводимости, генерализованную эпилепсию плюс, доброкачественный ранний младенческий эпилептический синдром, раннюю детскую эпилептическую энцефалопатию (EIEE11), доброкачественную семейную детскую эпилепсию, нейродегенерацию, таупатии и болезнь Альцгеймера. В некоторых случаях неврологическим заболеванием является синдром Драве. Мутации или аномалии в SCN1A также были связаны с судорожными расстройствами, эпилепсией, аутизмом, семейной гемиплегической мигренью 3 типа (FHM3), генетической эпилепсией с фебрильными припадками плюс (GEFS+) и эффективностью некоторых противосудорожных лекарственных средств. Например, мутация ICS5N+5G>A в SCN1A связана с максимально безопасным количеством (дозой) противосудорожных лекарственных средств фенитоина и карбамазепина.
Согласно определенным вариантам осуществления в настоящей заявке представлен способ лечения субъекта с синдромом Драве или с риском его развития путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A. Синдром Драве характеризуется продолжительными фебрильными и нефебрильными припадками в течение первого года жизни ребенка. Это заболевание прогрессирует до других типов припадков, таких как миоклонические и парциальные припадки, задержка психомоторного развития и атаксия. Оно характеризуется когнитивными нарушениями, поведенческими нарушениями и двигательными нарушениями. Поведенческие нарушения часто включают в себя гиперактивность и импульсивность, а в более редких случаях - аутистическое поведение. Синдром Драве также связан с нарушениями сна, включая в себя сонливость и бессонницу. У многих пациентов синдром Драве вызван генетическими мутациями, которые приводят к выработке нефункциональных белков. При лечении заболеваний, связанных с генетическими причинами, существует множество проблем. Таким образом, большинство существующих способов лечения было направлено на профилактическое лечение припадков и других симптомов.
У 70-90% пациентов синдром Драве вызывается нонсенс-мутациями в гене SCN1A, что приводит к преждевременному стоп-кодону и, следовательно, к нефункциональному белку. Как правило, миссенсмутация в сегменте S5 или S6 поры натриевого канала приводит к потере функции канала и развитию синдрома Драве. Гетерозиготное наследование мутации SCN1A, например, нонсенс-мутация, миссенсмутация, делеция, вставка, инверсия и т.д. - это все, что необходимо для развития дефектного натриевого канала; у пациентов с синдромом Драве останется одна нормальная копия гена. Таким образом, заболевание характеризуется как гаплонедостаточность, и, таким образом, увеличение экспрессии функционирующей копии SCN1A может восстанавливать нормальные уровни продукции Nav1.1.
Симптомы, связанные с синдромом Драве, включают в себя судороги, дефекты памяти, задержку развития, низкий мышечный тонус и/или когнитивные проблемы. Лечение кассетой экспрессии, вектором экспрессии или вириальной частицей, описанными в настоящем документе, может привести к улучшению одного или нескольких симптомов, таких как уменьшение количества, продолжительности и/или интенсивности припадков. Введение генной терапии, как описано в настоящем документе, субъекту с риском развития синдрома Драве может предотвратить развитие или замедлить прогрессирование одного или нескольких симптомов Драве.
Согласно определенным вариантам осуществления лечение кассетой экспрессии, вектором экспрессии или вириальной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как описано в настоящем документе, снижает продолжительность и/или частоту припадков, например, припадков, связанных с синдромом Драве, по меньшей мере на 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 95% или более по сравнению с не подвергнутым лечению контролем или по сравнению с уровнем до лечения.
У некоторых пациентов с болезнью Альцгеймера выработка амилоида β (Ae) с участием многих пептидов и протеаз может влиять на возбудимость нейронов, вызывая припадки и подавляя регуляцию натриевого канала Nav1.1 в нейронах PV. Согласно другому варианту осуществления в настоящей заявке представлены способы лечения субъекта, страдающего болезнью Альцгеймера, путем введения описан
- 53 046157 ной в настоящем документе кассеты экспрессии, вектора экспрессии или вирусной частицы, которая содержит полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A. Симптомы, связанные с болезнью Альцгеймера, включают в себя кратковременную потерю памяти, когнитивные трудности, припадки и трудности с речью, исполнительными функциями, восприятием (агнозия) и выполнением движений (апраксия). Лечение кассетой экспрессии, вектором экспрессии или вирусной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, может привести к улучшению одного или нескольких симптомов болезни Альцгеймера, таких как снижение прогрессирования потери памяти или предотвращение одного или нескольких симптомов. В некоторых случаях лечение может привести к коррекции активности головного мозга с высокой мощностью гаммаизлучения. Лечение может привести к снижению частоты припадков и/или тяжести припадков или снижению активности высокой мощности гамма-излучения по меньшей мере на 10%, 20%, 30%, 40%, 50%, 60%, 70% или более, как по сравнению с отсутствием лечения. В некоторых случаях лечение может привести к улучшению когнитивных функций. Обучение и/или память могут быть улучшены по меньшей мере на 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% или более чем на 100% по сравнению с отсутствием лечения или перед лечением полинуклеотидом, кодирующим eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе.
В некоторых случаях лечение кассетой экспрессии, вектором экспрессии или вирусной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, снижает активность высокой мощности гамма-излучения (например, активность высокой мощности гаммаизлучения, связанную с болезнью Альцгеймера) по меньшей мере на 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% или 95% по сравнению с не подвергнутым лечению контролем или по сравнению с уровнем до лечения.
Паркинсонизм относится к совокупности признаков и симптомов, обнаруживаемых при болезни Паркинсона (PD), включая в себя медлительность (брадикинезию), тугоподвижность (ригидность), тремор и дисбаланс (постуральную нестабильность). В некоторых случаях введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как описано в настоящем документе, субъекту с риском развития или страдающим болезнью Паркинсона может предотвратить развитие одного или нескольких симптомов или замедлить прогрессирование болезни Паркинсона по меньшей мере на 10%, по меньшей мере на 20%, по меньшей мере на 30%, по меньшей мере на 40%, по меньшей мере на 50%, по меньшей мере на 60%, по меньшей мере на 70%, по меньшей мере на 80% или по меньшей мере на 90% по сравнению с отсутствием лечения.
Согласно определенным вариантам осуществления в настоящей заявке представлены способы, которые можно применять для лечения субъекта, который находится в группе риска развития заболевания. Может быть известно, что субъект предрасположен к заболеванию, например, неврологическому заболеванию или заболеванию, связанному с эпилепсией, припадками и/или энцефалопатией. Субъект может быть предрасположен к заболеванию из-за генетического события или из-за известных факторов риска. Например, субъект может нести мутацию в SCN1A, которая связана с эпилепсией (такой как, например, синдром Драве). Любая мутация в гене SCN1A, которая снижает его активность (за счет снижения уровней экспрессии, нарушения функции белка или комбинации обоих), может предрасполагать субъекта к заболеванию, включая в себя любое одно или несколько из вставок, делеций, инверсий, транслокаций или замен (например, точечные мутации, включая в себя нонсенс-мутации и/или миссенс-мутации) в гене SCN1A. В некоторых случаях субъект может быть предрасположен к такому заболеванию, как болезнь Альцгеймера, из-за возраста субъекта. В некоторых случаях у субъекта может быть недостаточное количество белка SCN1A, и лечение заболевания, связанного с SCN1A, предусматривает введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует эндогенный SCN1A, как описано в настоящем документе.
Согласно определенным вариантам осуществления лечение с использованием кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует эндогенный SCN1A, представленный в настоящем документе, может привести к уменьшению или прекращению симптомов, связанных с синдромом Драве или другим заболеванием, связанным с SCN1A, или нарушением, например, эпилепсией, связанной с гаплонедостаточностью SCN1A. Например, лечение может улучшить обучение, память, когнитивные и/или двигательные функции; уменьшить частоту и/или продолжительность припадков; и/или снизить температурную чувствительность (или увеличить температурный порог для запуска припадка).
Согласно другому аспекту в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах приматов путем введения кассеты экс
- 54 046157 прессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе.
Согласно определенным вариантам осуществления в настоящей заявке представлен способ генной терапии, предусматривающий введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в заявке представлены способы генной терапии, предусматривающие введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе.
Согласно определенным вариантам осуществления в настоящей заявке представлен способ лечения заболевания или нарушения, предусматривающий введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в заявке представлены способы лечения заболевания или нарушения, предусматривающие введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе. Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, необязательно, селективный в отношении PV регуляторный элемент, могут быть использованы для лечения заболевания или нарушения, в которое вовлечены PV-содержащие нейроны. Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК и, возможно, селективный в отношении PV регуляторный элемент, используются для лечения состояния нейронов. Нейрональные заболевания или нарушения, подходящие для лечения, включают в себя, без ограничения, синдром Драве, болезнь Альцгеймера, болезнь Паркинсона, болезнь Хантингтона, боковой амиотрофический склероз (ALS), спинальную мышечную атрофию (SMA), эпилепсию, нейродегенеративные нарушения, двигательные нарушения, нарушения настроения, болезни двигательных нейронов, прогрессирующую мышечную атрофию (PMA), прогрессирующий бульбарный паралич, псевдобульбарный паралич, первичный боковой склероз, неврологические последствия СПИДа, нарушения развития, рассеянный склероз, нейрогенетические нарушения, инсульт, травму спинного мозга, черепно-мозговую травму, таупатию, гиповозбудимость нейронов и/или припадки. Согласно некоторым вариантам осуществления вирусный вектор, вирусная частица или фармацевтическая композиция, содержащая трансген и селективный в отношении PV сайт связывания микроРНК и необязательно селективный в отношении PV регуляторный элемент, используются для лечения психического расстройства (например, шизофрении, обсессивно-компульсивного расстройства, наркомании, депрессии, тревоги, психоза); расстройства аутистического спектра (например, синдрома ломкой X-хромосомы, синдрома Ретта); эпилепсии (например, синдрома Драве, хронической травматической энцефалопатии, генерализованной эпилепсии с фебрильными припадками плюс (GEFS+), эпилептической энцефалопатии, височной эпилепсии, фокальной эпилепсии, туберозного склероза, эпилепсии, связанной с гаплонедостаточностью SCN1A); и/или нейродегенерации (например, болезни Альцгеймера, болезни Паркинсона). Заболевания, связанные с дисфункциональными нейронами PV, например, вызванные мутациями потери функции в SCN1A или Nav1.1, включают в себя: синдром Драве, синдром Охтахара, эпилепсию, раннюю детскую эпилептическую энцефалопатию 6 (EIEE6), семейные фебрильные припадки 3A (FEB3A), трудноизлечимую детскую эпилепсию с генерализованными тонико-клоническими припадками (ICEGTC), мигрень, семейную гемиплегию 3 (FHM3), синдром Панайотопулоса, семейную фибрилляцию предсердий 13 (ATFB13), генерализованную эпилепсию с фебрильными припадками плюс типа 1 (gefs + тип 1), неспецифический кардиальный синдром, неспецифический синдром Бругада дефект проводимости, генерализованную эпилепсию с фебрильными припадками плюс, доброкачественный ранний младенческий эпилептический синдром, раннюю детскую эпилептическую энцефалопатию 11 (EIEE11), доброкачественную семейную детскую эпилепсию, нейродегенерацию, таупатии и болезнь Альцгеймера.
Согласно определенным вариантам осуществления лечение с использованием кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и селективный в отношении PV сайт
- 55 046157 связывания микроРНК, и, возможно, селективный в отношении PV регуляторный элемент, описанный в настоящем документе, приводит к улучшению симптомов, связанных с заболеванием или нарушением нейронов. Например, за пациентом с болезнью Паркинсона можно наблюдать симптоматически на предмет улучшения двигательных функций, что указывает на положительный ответ на лечение. Введение терапии с использованием описанного в настоящем документе способа субъекту с риском развития нейронального нарушения может предотвратить развитие или замедлить прогрессирование одного или нескольких симптомов.
Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, необязательно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, могут быть использованы для лечения субъекта, у которого было диагностировано заболевание нейронов, например, эпилепсия, связанная с гаплонедостаточностью SCN1A, такая как, например, синдром Драве. Согласно различным вариантам осуществления любое из нейрональных заболеваний или нарушений, описанных в настоящем документе, вызвано известным генетическим событием (например, любой из мутаций SCN1A, известных в настоящей области техники) или имеет неизвестную причину.
Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, возможно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, могут быть использованы для лечения субъекта, который находится в группе риска развития заболевания или нарушения. Согласно определенным вариантам осуществления может быть известно, что субъект предрасположен к заболеванию, например, нейрональному заболеванию (например, эпилепсии, связанной с гаплонедостаточностью SCN1A, такой как, например, синдром Драве). Согласно определенным вариантам осуществления субъект может быть предрасположен к заболеванию из-за генетического события или из-за известных факторов риска. Например, субъект может нести мутацию в SCN1A, которая связана с эпилепсией или синдромом Драве, например, вставку, делецию, инверсию, транслокацию или замену (например, точечную мутацию, включая в себя нонсенс-мутацию и/или миссенс-мутацию).
Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, возможно, селективный регуляторный элемент PV, представленные в настоящем документе, могут быть использованы для уменьшения одного или нескольких симптомов, связанных с заболеванием или нарушением. Например, симптомы, связанные с синдромом Драве, включают в себя судороги, дефекты памяти, задержку развития, плохой мышечный тонус и/или когнитивные проблемы. Лечение вирусным вектором, вирусной частицей или фармацевтической композицией, содержащей трансген и селективный в отношении PV сайт связывания микроРНК и, необязательно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, может привести к улучшению одного или нескольких симптомов, таких как уменьшение количества, продолжительности и/или интенсивность припадков.
Согласно определенным вариантам осуществления описанные в настоящем документе способы используются для увеличения экспрессии трансгена в нейроне PV, генной терапии или лечения заболевания или нарушения у приматов. Согласно определенным вариантам осуществления примат представляет собой человека. Согласно определенным вариантам осуществления примат представляет собой отличного от человека примата. Согласно определенным вариантам осуществления отличный от человека примат представляет собой обезьяну старого мира, орангутана, гориллу, шимпанзе, яванского макака, макака-резус или свинохвостого макака.
Термины субъект и индивидуум используются в настоящем документе взаимозаменяемо для обозначения позвоночного животного, предпочтительно млекопитающего, более предпочтительно человека. Описанные в настоящем документе способы могут быть применимы в терапевтических целях для человека, в ветеринарии и/или в доклинических исследованиях на животных моделях заболевания или состояния. Согласно различным вариантам осуществления субъект, которого можно лечить в соответствии с описанными в настоящем документе способами, представляет собой млекопитающее, такое как, например, мышь, крыса, хомяк, морская свинка, песчанка, корова, овца, свинья, коза, осел, лошадь, собака, кошка, лама, обезьяна (например, обезьяна старого мира, мартышка или макак, такой как макак-резус, свинохвостый макак или яванский макак (например, макак-крабоед)), обезьяна (например, орангутан, горилла или шимпанзе) или человек. Согласно иллюстративному варианту осуществления субъект представляет собой человека.
В следующих таблицах представлены раскрытые в настоящем документе последовательности.
Таблица 1. Раскрытые в настоящем документе иллюстративные сконструированные факторы транскрипции. Последовательности регуляторных элементов (RE) раскрыты ниже в табл. 2 и 8. Для RE, когда указан m1, это означает, что сайт связывания микроРНК m1 (SEQ ID NO: 7, табл. 8) включен между кодирующей областью и полиА-хвостом. Последовательности ДНК-связывающих доменов (DBD) раскрыты ниже в табл. 3. Для DBD сконструированный цинковый палец (eZF) указывает на то, что конструкция имеет формулу, изложенную в SEQ ID NO: 147 (табл. 10); EGR1 указывает на то, что DBD происхо
- 56 046157 дит от человеческого EGR1 дикого типа (SEQ ID NO: 176; табл. 12); и EGR3 указывает на то, что DBD происходит от человеческого EGR3 дикого типа (SEQ ID NO: 175, табл. 12). Последовательности для целевых сайтов (например, последовательности, связанные с DBD) представлены в табл. 4 ниже. Последовательности для доменов активации транскрипции (TAD) раскрыты ниже в табл. 5. Для TAD (c) указывает на то, что TAD расположен на c-конце DBD, (n) указывает на то, что TAD расположен на n-конце DBD, (n/c) означает, что существует TAD, расположенный как на n-конце, так и на c-конце DBD, a 2x CITED4 (n) указывает на то, что есть 2 копии TAD CITED4, расположенные на n-конце DBD. Последовательности сконструированных факторов транскрипции полной длины (DBD + TAD) представлены в табл. 6 ниже.
Таблица 1
Конструкция | RE | DBD | Целевой сайт | TAD (положение) | SEQ ID NO (DBD) | SEQ ID NO (DBD + TAD) |
1 | RE 1 | eZF | Z13 | VPR (c) | 89 | 99 |
2 | RE 1 | eZF | Z1 | VPR (c) | 77 | 100 |
3 | RE 1 | eZF | Z13 | VP64 (c) | 89 | 101 |
4 | RE 1 | eZF | Z1 | VP64 (c) | 77 | 102 |
5 | RE 1 | EGR1 | Z13 | CITED4 (n/c) | 93 | 103 |
6 | RE 1 | EGR1 | Z13 | CITED4 (n) | 93 | 104 |
7 | RE 1 | EGR1 | Z1 | CITED4 (n/c) | 92 | 105 |
8 | RE 1 | EGR1 | Z1 | CITED4 (n) | 92 | 106 |
9 | RE 1 | EGR1 | Z1 | CITED4 (c) | 92 | 107 |
10 | RE 1 | EGR1 | Z1 | CITED2 (c) | 92 | 108 |
И | RE 1 | EGR1 | Z1 | CITED2 (n) | 92 | 109 |
12 | RE 1 | EGR3 | Z1 | CITED4 (n/c) | 96 | 110 |
13 | RE 1 | EGR3 | Z1 | CITED4 (c) | 96 | 111 |
14 | RE 1 | EGR3 | Z1 | CITED2 (c) | 96 | 112 |
15 | RE 1 | EGR3 | Z1 | CITED2 (n) | 96 | 113 |
16 | СВА | EGR3 | Z15 | N/A | 98 | 114 |
17 | RE 1 | EGR1 | Z13 | N/A | 93 | 115 |
18 | RE 1 | EGR1 | Z15 | N/A | 94 | 116 |
19 | RE 1 | EGR1 | Z13 | N/A | 93 | 117 |
20 | RE 1 | EGR1 | Z13 | N/A | 93 | 115 |
21 | RE 1 | EGR1 | Z1 | N/A | 92 | 118 |
22 | СВА | EGR3 | Z13 | N/A | 97 | 119 |
23 | RE 1 | EGR1 | Z17 | N/A | 95 | 120 |
24 | RE 1 | EGR1 | Z13 | N/A | 93 | 121 |
25 | СВА | EGR3 | Z1 | N/A | 96 | 122 |
26 | RE 1 | EGR1 | Z1 | N/A | 92 | 123 |
27 | RE 1 | EGR1 | Z1 | N/A | 92 | 124 |
28 | RE 1 | eZF | Z8 | VP64 (c) | 84 | 125 |
29 | RE 1 | eZF | Z14 | VP64 (c) | 90 | 126 |
30 | СВА | eZF | Z13 | VPR (c) | 89 | 99 |
31 | RE2(ml) | eZF | Z1 | VP64 (c) | 77 | 102 |
32 | RE2 | eZF | Z1 | VP64 (c) | 77 | 102 |
33 | RE2 | eZF | Z1 | VPR (c) | 77 | 100 |
34 | RE2 | eZF | Z1 | VP64 (c) | 77 | 127 |
35 | RE 2 (ml) | eZF | Z1 | VP64 (c) | 77 | 127 |
36 | RE2 | EGR1 | Z1 | CITED4 (n) | 92 | 128 |
37 | RE 2 (ml) | EGR1 | Z1 | CITED4 (n) | 92 | 106 |
38 | RE 2 (ml) | EGR1 | Z1 | CITED4 (n) | 92 | 129 |
39 | RE 2 (ml) | EGR1 | Z1 | CITED4 (n/c) | 92 | 105 |
40 | RE 2 (ml) | EGR1 | Z1 | 2x CITED4 (n) | 92 | 130 |
- 57 046157
41 | RE2(ml) | EGR1 | Z1 | 2x CITED4 (n) | 92 | 131 |
42 | RE 2 (m2) | eZF | Z1 | VP64 (c) | 77 | 102 |
43 | RE 2 (m3) | eZF | Z1 | VP64 (c) | 77 | 102 |
44 | RE 2 (m2) | EGR1 | Z1 | CITED4 (n) | 92 | 106 |
45 | RE 2 (m3) | EGR1 | Z1 | CITED4 (n) | 92 | 106 |
46 | RE 1 | EGR1 | Z1 | CITED4 (n) | 92 | 205 |
47 | RE 1 | EGR1 | Z1 | 2x CITED4 (n) | 92 | 207 |
48 | RE 1 | EGR1 | Z1 | 2x CITED4 (n) | 92 | 209 |
49 | CBA | eZF | Z1 | CREB3 (n) | 77 | 213 |
50 | CBA | EGR1 | Z1 | CREB3 (n) | 92 (без Сконц. Lys) | 217 |
51 | CBA | EGR1 | Z13 | CREB3 (n) | 93 (без Сконц. Lys) | 219 |
52 | CBA | eZF | Z1 | CREB3 (n); без домена TM на (с) | 77 | 221 |
53 | CBA | EGR1 | Z1 | CREB3 (п); без домена ТМ на (с) | 92 (без Сконц. Lys) | 223 |
Таблица 2 Последовательности нуклеиновых кислот для различных регуляторных элементов (RE), ____________________раскрытых в настоящем документе____________________
RE | Последовательность | SEQ ID NO |
RE 1 | GTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAG CGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATT GACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGG GACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACG CAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATA AGCAGAGCTGGTACCGTGTGTATGCTCAGGGGCTGGGAA AGGAGGGGAGGGAGCTCCGGCTCAG | 1 |
RE2 | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggtaacatatttt gaagttctgttgacataaagaatcatgatattaatgcccatggaaatgaaagggcgatcaacac tatggtttgaaaagggggaaattgtagagcacagatgtgttcgtgtggcagtgtgctgtctctag caatactcagagaagagagagaacaatgaaattctgattggccccagtgtgagcccagatga ggttcagctgccaactttctctttcacatcttatgaaagtcatttaagcacaactaactttttttttttttt tttttttttgagacagagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggct cactgcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagctgga attacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacgggggtttcaccat atcacccaggctggtctcgaactcctggcctcaagtgatccacctgcctcggcctcccaaagt gctgggattataggcgtcagccactatgcccaacccgaccaaccttttttaaaataaatatttaaa aaattggtatttcacatatatactagtatttacatttatccacacaaaacggacgggcctccgctg aaccagtgaggccccagacgtgcgcataaataacccctgcgtgctgcaccacctggggaga gggggaggaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttctc tgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccagggctggagc | 2 |
- 58 046157
tcaaggaagcgtcgcagggtcacagatctgggggaaccccggggaaaagcactgaggcaa aaccgccgctcgtctcctacaatatatgggagggggaggttgagtacgttctggattactcata agaccttttttttttccttccgggcgcaaaaccgtgagctggatttataatcgccctataaagctcc agaggcggtcaggcacctgcagaggagccccgccgctccgccgactagctgcccccgcga gcaacggcctcgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacc ccggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcgagaggga actagcgagaacgaggaagcagctggaggtgacgccgggcagattacgcctgtcagggcc gagccgagcggatcgctgggcgctgtgcagaggaaaggcgggagtgcccggctcgctgtc gcagagccgaggtgggtaagctagcgaccacctggacttcccagcgcccaaccgtggctttt cagccaggtcctctcctcccgcggcttctcaaccaaccccatcccagcgccggccacccaac ctcccgaaatgagtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgtta cttttccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcggggct agagtgcaaggtgactgtggttcttctctggccaagtccgagggagaacgtaaagatatgggc ctttttccccctctcaccttgtctcaccaaagtccctagtccccggagcagttagcctctttctttcc agggaattagccagacacaacaacgggaaccagacaccgaaccagacatgcccgccccgt gcgccctccccgctcgctgcctttcctccctcttgtctctccagagccggatcttcaaggggag cctccgtgcccccggctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcac agctctcgcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtagag gccccgggacgaccgagctg | ||
RE 3 | TCAACAGGGGGACACTTGGGAAAGAAGGATGGGGACAG AGCCGAGAGGACTGTTACACATTAGAGAAACATCAGTG ACTGTGCCAGCTTTGGGGTAGACTGCACAAAAGCCCTGA GGCAGCACAGGCAGGATCCAGTCTGCTGGTCCCAGGAA GCTAACCGTCTCAGACAGAGCACAAAGCACCGAGACAT GTGCCACAAGGCTTGTGTAGAGAGGTCAGAGGACAGCG TACAGGTCCCAGAGATCAAACTCAACCTCACCAGGCTTG GCAGCAAGCCTTTACCAACCCACCCCCACCCCACCCACC CTGCACGCGCCCCTCTCCCCTCCCCATGGTCTCCCATGGC TATCTCACTTGGCCCTAAAATGTTTAAGGATGACACTGG CTGCTGAGTGGAAATGAGACAGCAGAAGTCAACAGTAG ATTTTAGGAAAGCCAGAGAAAAAGGCTTGTGCTGTTTTT AGAAAGCCAAGGGACAAGCTAAGATAGGGCCCAAGTAA TGCTAGTATTTACATTTATCCACACAAAACGGACGGGCC TCCGCTGAACCAGTGAGGCCCCAGACGTGCGCATAAATA ACCCCTGCGTGCTGCACCACCTGGGGAGAGGGGGAGGA CCACGGTAAATGGAGCGAGCGCATAGCAAAAGGGACGC GGGGTCCTTTTCTCTGCCGGTGGCACTGGGTAGCTGTGG CCAGGTGTGGTACTTTGATGGGGCCCAGGGCTGGAGCTC AAGGAAGCGTCGCAGGGTCACAGATCTGGGGGAACCCC GGGGAAAAGCACTGAGGCAAAACCGCCGCTCGTCTCCT ACAATATATGGGAGGGGGAGGTTGAGTACGTTCTGGATT ACTCATAAGACCTTTTTTTTTTCCTTCCGGGCGCAAAACC GTGAGCTGGATTTATAATCGCCCTATAAAGCTCCAGAGG CGGTCAGGCACCTGCAGAGGAGCCCCGCCGCTCCGCCGA CTAGCTGCCCCCGCGAGCAACGGCCTCGTGATTTCCCCG CCGATCCGGTCCCCGCCTCCCCACTCTGCCCCCGCCTACC CCGGAGCCGTGCAGCCGCCTCTCCGAATCTCTCTCTTCTC CTGGCGCTCGCGTGCGAGAGGGAACTAGCGAGAACGAG GAAGCAGCTGGAGGTGACGCCGGGCAGATTACGCCTGT | 3 |
- 59 046157
CAGGGCCGAGCCGAGCGGATCGCTGGGCGCTGTGCAGA GGAAAGGCGGGAGTGCCCGGCTCGCTGTCGCAGAGCCG AGGTGGGTAAGCTAGCGACCACCTGGACTTCCCAGCGCC CAACCGTGGCTTTTCAGCCAGGTCCTCTCCTCCCGCGGCT TCTCAACCAACCCCATCCCAGCGCCGGCCACCCAACCTC CCGAAATGAGTGCTTCCTGCCCCAGCAGCCGAAGGCGCT ACTAGGAACGGTAACCTGTTACTTTTCCAGGGGCCGTAG TCGACCCGCTGCCCGAGTTGCTGTGCGACTGCGCGCGCG GGGCTAGAGTGCAAGGTGACTGTGGTTCTTCTCTGGCCA AGTCCGAGGGAGAACGTAAAGATATGGGCCTTTTTCCCC CTCTCACCTTGTCTCACCAAAGTCCCTAGTCCCCGGAGC AGTTAGCCTCTTTCTTTCCAGGGAATTAGCCAGACACAA CAACGGGAACCAGACACCGAACCAGACATGCCCGCCCC GTGCGCCCTCCCCGCTCGCTGCCTTTCCTCCCTCTTGTCT CTCCAGAGCCGGATCTTCAAGGGGAGCCTCCGTGCCCCC GGCTGCTCAGTCCCTCCGGTGTGCAGGACCCCGGAAGTC CTCCCCGCACAGCTCTCGCTTCTCTTTGCAGCCTGTTTCT GCGCCGGACCAGTCGAGGACTCTGGACAGTAGAGGCCC CGGGACGACCGAGCTG | ||
RE 4 | GCCCTCTAGGCCACCTGACCAGGTCCCCTCAGTCCCCCC CTTCCCACACTCCCACACTCAGCCCCCCTCCCCCCCCCCC GACCCCTGCAGGATTATCCTGTCTGTGTTCCTGACTCAGC CTGGGAGCCACCTGGGCAGCAGGGGCCAAGGGTGTCCT AGAAGGGACCTGGAGTCCACGCTGGGCCAAGCCTGCCCT TTCTCCCTCTGTCTTCCGTCCCTGCTTGCGGTTCTGCTGA ATGTGGTTATTTCTCTGGCTCCTTTTACAGAGAATGCTGC TGCTAATTTTATGTGGAGCTCTGAGGCAGTGTAATTGGA AGCCAGACACCCTGTCAGCAGTGGGCTCCCGTCCTGAGC TGCCATGCTTCCTGCTCTCCTCCCGTCCCGGCTCCTCATT TCATGCAGCCACCTGTCCCAGGGAGAGAGGAGTCACCCA GGCCCCTCAGTCCGCCCCTTAAATAAGAAAGCCTCCGTT GCTCGGCACACATACCAAGCAGCCGCTGGTGCAATCT | 4 |
СВА (энхансер CMV + промотор бетаактина кур) | CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACC GCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTA TGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACG TCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGC AGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTAT TGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGC CCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTA CATCTACGTATTAGTCATCGCTATTACCATGggtcgaggtgagc cccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttatttttt aattattttgtgcagcgatgggggcggggggggggggggcgcgcgccaggcggggcggg gcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagag cggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagc gaagcgcgcggcgggcgggagtcgctgcgttgccttcgccccgtgccccgctccgcgccg cctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcggga cggcccttctcctccgggctgtaattagcgcttggtttaatgacggctcgtttcttttctgtggctg cgtgaaagccttaaagggctccgggagggccctttgtgcgggggggagcggctcgggggg tgcgtgcgtgtgtgtgtgcgtggggagcgccgcgtgcggcccgcgctgcccggcggctgtg agcgctgcgggcgcggcgcggggctttgtgcgctccgcgtgtgcgcgaggggagcgcgg | 5 |
- 60 046157
ccgggggcggtgccccgcggtgcgggggggctgcgaggggaacaaaggctgcgtgcgg ggtgtgtgcgtgggggggtgagcagggggtgtgggcgcggcggtcgggctgtaacccccc cctgcacccccctccccgagttgctgagcacggcccggcttcgggtgcggggctccgtgcg gggcgtggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgccgg gcggggcggggccgcctcgggccggggagggctcgggggaggggcgcggcggccccg gagcgccggcggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgtgcg agagggcgcagggacttcctttgtcccaaatctggcggagccgaaatctgggaggcgccgc cgcaccccctctagcgggcgcgggcgaagcggtgcggcgccggcaggaaggaaatggg cggggagggccttcgtgcgtcgccgcgccgccgtccccttctccatctccagcctcggggct gccgcagggggacggctgccttcgggggggacggggcagggcggggttcggcttctggc gtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagctcct gggcaacgtgctggttgttgtgctgtctcatcattttggcaaagaatt | ||
EF1альфа | GAGTAATTCATACAAAAGGACTCGCCCCTGCCTTGGGGA ATCCCAGGGACCGTCGTTAAACTCCCACTAACGTAGAAC CCAGAGATCGCTGCGTTCCCGCCCCCTCACCCGCCCGCT CTCGTCATCACTGAGGTGGAGAAGAGCATGCGTGAGGCT CCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAG TCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACC GGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAG TGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGG GGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTT CTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGT GCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTT ATGGCCCTTGCGTGCCTTGAATTACTTCCACGCCCCTGGC TGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAA GTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCC CTTCGCCTCGTGCTTGAGTTGAGGCCTGGCTTGGGCGCT GGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCT GTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTT TTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGT CTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCG GTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCC CAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCG GCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCC GGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCG CCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAG TTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTG CAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAG CGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTT TCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTA CCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTT TTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTA TGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGA AGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGA ATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAG CCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGG TGTCGTGA | 6 |
Таблица 3. Аминокислотные последовательности для иллюстративных ДНК-связывающих доменов (DBD), представленных в настоящем документе. Для DBD сконструированный цинковый палец (eZF) указывает на то, что конструкция имеет формулу, изложенную в SEQ ID NO: 147 (табл. 10); EGR1 указывает на то, что DBD происходит от человеческого EGR1 дикого типа (SEQ ID NO: 176; табл. 12); и EGR3 указывает на то, что DBD происходит от человеческого EGR3 дикого типа (SEQ ID NO: 175, табл. 12). Целевые сайты представляют собой последовательности, связанные с DBD, и представлены в табл. 4 ниже.
- 61 046157
Таблица 3
DBD/целев ой сайт | Последовательность | SEQ ID NO |
eZF/zl | LEPGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPE CGKSFSREDNLHTHQRTHTGEKPYKCPECGKSFSRSDELV RHQRTHTGEKPYKCPECGKSFSQSGNLTEHQRTHTGEKPY KCPECGKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQN STLTEHQRTHTGKKTS | 77 |
eZF/z2 | LEPGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKP YKCPEC GKSF SRADNLTEHQRTHTGEKP YKCPEC GKSF SQL AHLR A HQRTHTGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKPYK CPECGKSFSQAGHLASHQRTHTGEKPYKCPECGKSFSTHL DLIRHQRTHTGKKTS | 78 |
eZF/z3 | LEPGEKPYKCPECGKSFSQAGHLASHQRTHTGEKPYKCPE CGKSFSREDNLHTHQRTHTGEKPYKCPECGKSFSTSGNLTE HQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYK CPECGKSFSQKSSLIAHQRTHTGEKPYKCPECGKSFSQAGH LASHQRTHTGKKTS | 79 |
eZF/z4 | LEPGEKPYKCPECGKSFSTTGNLTVHQRTHTGEKPYKCPE CGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSTSGNLTEHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SQRA NLRAHQRTHTGKKT S | 80 |
eZF/z5 | LEPGEKPYKCPECGKSF S SRRTCRAHQRTHTGEKP YKCPEC GKSFSTTGALTEHQRTHTGEKPYKCPECGKSFSRSDELVRH QRTHTGEKP YKCPEC GKSFSRNDALTEHQRTHTGEKPYKC PECGKSFSQSGDLRRHQRTHTGEKPYKCPECGKSFSTSHSL TEHQRTHTGKKTS | 81 |
eZF/z6 | LEPGEKPYKCPECGKSFSRKDNLKNHQRTHTGEKPYKCPE CGKSFSDPGALVRHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPY KCPECGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSRK DNLKNHQRTHTGKKTS | 82 |
eZF/z7 | LEPGEKPYKCPECGKSF S SKKALTEHQRTHTGEKP YKCPEC GKSF S SP ADLTRHQRTHTGEKP YKCPEC GKSF SRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGEKPYK CPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGN LTEHQRTHTGEKPYKCPECGKSFSTSGHLVRHQRTHTGEK PYKCPECGKSFSQNSTLTEHQRTHTGKKTS | 83 |
- 62 046157
eZF/z8 | LEPGEKPYKCPECGKSF S SPADLTRHQRTHTGEKPYKCPEC GKSF SRSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGEKPYK CPECGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTSGH LVRHQRTHTGKKTS | 84 |
eZF/z9 | LEPGEKPYKCPECGKSF S SKKALTEHQRTHTGEKPYKCPEC GKSF S SPADLTRHQRTHTGEKPYKCPEC GKSF SRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGEKPYK CPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGN LTEHQRTHTGKKTS | 85 |
eZF/zlO | LEPGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPE CGKSFSRNDALTEHQRTHTGEKPYKCPECGKSFSRNDALT EHQRTHTGEKPYKCPECGKSFSSPADLTRHQRTHTGEKPY KCPECGKSFSDPGNLVRHQRTHTGEKPYKCPECGKSFSQR AHLERHQRTHTGEKPYKCPECGKSFSQSSSLVRHQRTHTG EKPYKCPECGKSFSHRTTLTNHQRTHTGKKTS | 86 |
eZF/zll | LEPGEKPYKCPECGKSFSRNDALTEHQRTHTGEKPYKCPE CGKSFSSPADLTRHQRTHTGEKPYKCPECGKSFSDPGNLV RHQRTHTGEKPYKCPECGKSFSQRAHLERHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SHRT TLTNHQRTHTGKKTS | 87 |
eZF/zl2 | LEPGEKPYKCPECGKSFSRNDALTEHQRTHTGEKPYKCPE CGKSFSDPGHLVRHQRTHTGEKPYKCPECGKSFSTSGELV RHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPY KCPECGKSFS SKKALTEHQRTHTGEKPYKCPEC GKSF SQL AHLRAHQRTHTGEKPYKCPECGKSFSRSDHLTNHQRTHTG KKTS | 88 |
eZF/zl3 | LEPGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPE CGKSFSHRTTLTNHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSTSHSLTEHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SRED NLHTHQRTHTGKKTS | 89 |
eZF/zl4 | LEPGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPYKCPE CGKSFSRSDNLVRHQRTHTGEKPYKCPECGKSFSQSGDLR RHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPY KCPECGKSFSTSGNLVRHQRTHTGEKPYKCPECGKSFSRSD NLVRHQRTHTGKKTS | 90 |
eZF/zl5 | LEPGEKPYKCPECGKSFSRRDELNVHQRTHTGEKPYKCPE CGKSFSRSDHLTNHQRTHTGEKPYKCPECGKSFSRSDDLV RHQRTHTGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPY KCPECGKSFSHRTTLTNHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGEKPYKCPECGKSFSTSHSLTEHQRTHTGE KPYKCPECGKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFS REDNLHTHQRTHTGKKTS | 91 |
EGRl/zl | RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRN FSREDNLHTHIRTHTGEKPFACDICGRKFARSDELVRHTKI HLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPFQC RICMRNFSTSGHLVRHIRTHTGEKPFACDICGRKFAQNSTL TEHTKIHLRQKDK | 92 |
- 63 046157
EGR1/Z13 | RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRN FSHRTTLTNHIRTHTGEKPFACDICGRKFAREDNLHTHTKI HLRQKDRPYACPVESCDRRFSTSHSLTEHIRIHTGQKPFQC RICMRNFSQSSSLVRHIRTHTGEKPFACDICGRKFAREDNL HTHTKIHLRQKDK | 93 |
EGR1/Z15 | RPYACPVESCDRRFSRRDELNVHIRIHTGQKPFQCRICMRN FSRSDHLTNHIRTHTGEKPFACDICGRKFARSDDLVRHTKI HLRQKDRP YACPVESCDRRF SRSDNLVRHIRIHTGQKPFQC RICMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFAREDNL HTHTKIHLRQKDRPYACPVESCDRRFSTSHSLTEHIRIHTGQ KPFQCRICMRNFSQSSSLVRHIRTHTGEKPFACDICGRKFA REDNLHTHTKIHLRQKD | 94 |
EGrl/zl7 | RPYACPVESCDRRFSDPGALVRHIRIHTGQKPFQCRICMRN FSRSDNLVRHIRTHTGEKPFACDICGRKFAQSGDLRRHTKI HLRQKDRPYACPVESCDRRFSTHLDLIRHIRIHTGQKPFQC RICMRNFSTSGNLVRHIRTHTGEKPFACDICGRKFARSDNL VRHTKIHLRQKDRPYACPVESCDRRFSQSGHLTEHIRIHTG QKPFQCRICMRNFSERSHLREHIRTHTGEKPFACDICGRKF AQAGHLASHTKIHLRQKD | 95 |
EGR3/zl | RPHACPAEGCDRRFSRSDNLVRHLRIHTGHKPFQCRICMRS FSREDNLHTHIRTHTGEKPFACEFCGRKFARSDELVRHAKI HLKQKEHACPAEGCDRRFSQSGNLTEHLRIHTGHKPFQCRI CMRSFSTSGHLVRHIRTHTGEKPFACEFCGRKFAQNSTLTE HAKIHLKQKEK | 96 |
EGR3/zl3 | RPHACPAEGCDRRFSRSDNLVRHLRIHTGHKPFQCRICMRS FSHRTTLTNHIRTHTGEKPFACEFCGRKFAREDNLHTHAKI HLKQKEHACPAEGCDRRFSTSHSLTEHLRIHTGHKPFQCRI CMRSFSQSSSLVRHIRTHTGEKPFACEFCGRKFAREDNLHT HAKIHLKQKEK | 97 |
EGR3/zl5 | RPHACPAEGCDRRFSRRDELNVHLRIHTGHKPFQCRICMRS FSRSDHLTNHIRTHTGEKPFACEFCGRKFARSDDLVRHAKI HLKQKEHACPAEGCDRRF SRSDNLVRHLRIHTGHKPFQCR ICMRSFSHRTTLTNHIRTHTGEKPFACEFCGRKFAREDNLH THAKIHLKQKEHACPAEGCDRRFSTSHSLTEHLRIHTGHKP FQCRICMRSF SQS S SLVRHIRTHTGEKPF ACEFCGRKFARE DNLHTHAKIHLKQKEK | 98 |
Таблица 4 Последовательности целевых сайтов и хромосомная локализация иллюстративных целевых сайтов, связанных с раскрытыми в настоящем документе ДНК-связывающими доменами
Начальн. положени e хром. 2 | Последовательность целевого сайта | Целевой сайт | SEQ ID NO для последовательное ти целевого сайта |
166149168 | CTAGGTCAAGTGTAGGAG | zl | 18 |
166149158 | ACTTGACCTAGACAGCCT | z2 | 19 |
166073978 | TGAATAACTCATTAGTGA | z3 | 20 |
- 64 046157
166073933 | AAAGTACATTAGGCTAAT | z4 | 21 |
166149199 | CCAGCACTGGTGCTTCGT | z5 | 22 |
166149176 | AAGGCTGTCTAGGTCAAG | z6 | 23 |
166149168 | CTAGGTCAAGTGTAGGAGACACAC | z7 | 24 |
166149165 | GGTCAAGTGTAGGAGACA | z8 | 25 |
166149162 | CAAGTGTAGGAGACACAC | z9 | 26 |
166149160 | AGTGTAGGAGACACACTGCTGGCC | zlO | 27 |
166149160 | AGTGTAGGAGACACACTG | zll | 28 |
166149155 | AGGAGACACACTGCTGGCCTG | zl2 | 29 |
166128025 | TAGGTACCATAGAGTGAG | zl3 | 30 |
166127991 | GAGGATACTGCAGAGGTC | zl4 | 31 |
166127999 | TAGGTACCATAGAGTGAGGCGAGGA TG | zl5 | 32 |
166127991 | ATAGAGTGAGGCGAGGATGAAGCCG AG | zl6 | 33 |
166127974 | TGAAGCCGAGAGGATACTGCAGAGG ТС | zl7 | 34 |
Таблица 5 Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных доменов ______________________активации транскрипции (TAD)______________________
TAD | Последовательность | SEQ ID NO |
VPR | DALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDA LDDFDLDMLINSRSSGSPKKKRKVGSQYLPDTDDRHRIEEKRK RTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPY PFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPA PAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLS EALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQ GIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLP NGLLSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPKPEAGS AISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVH EPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALR EMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDL NLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF | 132 |
VP64 | DALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDA LDDFDLDML | 133 |
CITED 2 | MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRMGMGQFP S PHHHQQQQPQHAFNALMGEHIHYGAGNMNATSGIRHAMGPG TVNGGHPPSALAPAARFNNSQFMGPPVASQGGSLPASMQLQKL NNQYFNHHPYPHNHYMPDLHPAAGHQMNGTNQHFRDCNPKH SGGSSTPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNMPAS VAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGLDRIKELPELWL GQNEFDFMTDFVCKQQPSRVSC | 134 |
CITED 4 | ADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGPGLDSG LRPRGAPLGPPPPRQPGALAYGAFGPPSSFQPFPAVPPPAAGIAH LQPVATPYPGRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGG MDAELIDEEALTSLELELGLHRVRELPELFLGQSEFDCFSDLGS APPAGSVSC | 135 |
CREB3 | MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWALPLSE VPSDWEVDDLLCSLLSPPASLNILSSSNPCLVHHDHTYSLPRET VSMDLESESCRKEGTQMTPQHMEELAEQEIARLVLTDEEKSLL EKEGLILPETLPLTKTEEQILKRVR | 224 |
- 65 046157
Таблица 6
Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных сконст____________руированных факторов транскрипции (DBD + TAD) __________
Конструкция | Последовательность | SEQ ID NO |
1 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF | 99 |
2 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG | 100 |
- 66 046157
NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF | ||
3 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEDALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLGSDALDDFDLDML | 101 |
4 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML | 102 |
5 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFARE DNLHTHTKIHLRQKDRPYACPVESCDRRFSTSHSLT EHIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGE KPFACDICGRKFAREDNLHTHTKIHLRQKDKLEMA DHLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAG PGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQ PFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGP PGPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLE LELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVS C | 103 |
6 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFARE DNLHTHTKIHLRQKDRPYACPVESCDRRFSTSHSLT | 104 |
- 67 046157
EHIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGE KPF ACDICGRKF AREDNLHTHTKIHLRQKDK | ||
7 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPF ACDICGRKF ARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC | 105 |
8 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK | 106 |
9 | MQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCD RRFSRSDNLVRHIRIHTGQKPFQCRICMRNFSREDNL HTHIRTHTGEKPFACDICGRKFARSDELVRHTKIHLR QKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPF QCRICMRNF STSGHLVRHIRTHTGEKPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMADHLMLAEGYRLV QRPPSAAAAHGPHALRTLPPYAGPGLDSGLRPRGAP LGPPPPRQPGALAYGAFGPPSSFQPFPAVPPPAAGIA HLQPVATPYPGRAAAPPNAPGGPPGPQPAPSAAAPP PPAHALGGMDAELIDEEALTSLELELGLHRVRELPE LFLGQSEFDCFSDLGSAPPAGSVSC | 107 |
10 | MQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCD RRFSRSDNLVRHIRIHTGQKPFQCRICMRNFSREDNL HTHIRTHTGEKPF ACDICGRKF ARSDELVRHTKIHLR QKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPF QCRICMRNF STSGHLVRHIRTHTGEKPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMSGLEMADHMMAM NHGRFPDGTNGLHHHPAHRMGMGQFPSPHHHQQQ QPQHAFNALMGEHIHYGAGNMNATSGIRHAMGPG TVNGGHPPSALAPAARFNNSQFMGPPVASQGGSLP ASMQLQKLNNQYFNHHPYPHNHYMPDLHPAAGHQ MNGTNQHFRDCNPKHSGGS STPGGSGGS STPGGSG | 108 |
- 68 046157
S S SGGGAGS SNSGGGSGSGNMP AS VAHVP AAMLPP NVIDTDFIDEEVLMSLVIEMGLDRIKELPELWLGQN EFDFMTDFVCKQQPSRVSC | ||
И | MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRM GMGQFPSPHHHQQQQPQHAFNALMGEHIHYGAGN MNATSGVRHAMGPGTVNGGHPPSALAPAARFNNS QFMGPPVASQGGSLPASMQLQKLNNQYFNHHPYPH NHYMPDLHP AAGHQMNGTNQHFRDCNPKHSGGS S TPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNM PASVAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGL DRIKELPELWLGQNEFDFMTDFVCKQQPSRVSCQSQ LII<PSRMRI<YPNRPSI<TPPHERPYACPVESCDRRFSR SDNLVRHIRIHTGQKPFQCRICMRNFSREDNLHTHIR THTGEKPFACDICGRKFARSDELVRHTKIHLRQKDR PYACPVESCDRRFSQSGNLTEHIRIHTGQKPFQCRIC MRNFSTSGHLVRHIRTHTGEKPFACDICGRKFAQNS TLTEHTKIHLRQKDK | 109 |
12 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGRPHACPAEGCDRRFSRSDNLVRH LRIHTGHKPFQCRICMRSFSREDNLHTHIRTHTGEKP FACEFCGRKFARSDELVRHAKIHLKQKEHACPAEG CDRRFSQSGNLTEHLRIHTGHKPFQCRICMRSFSTSG HLVRHIRTHTGEKPFACEFCGRKFAQNSTLTEHAKI HLKQKEKLEMADHLMLAEGYRLVQRPPSAAAAHG PHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPGA LAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYPG RAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGMD AELIDEEALTSLELELGLHRVRELPELFLGQSEFDCF SDLGSAPPAGSVSC | 110 |
13 | MRPHACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQC RICMRSFSREDNLHTHIRTHTGEKPFACEFCGRKFAR SDELVRHAKIHLKQKEHACPAEGCDRRFSQSGNLTE HLRIHTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEK PFACEFCGRKFAQNSTLTEHAKIHLKQKEKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC | 111 |
14 | MRPHACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQC RICMRSFSREDNLHTHIRTHTGEKPFACEFCGRKFAR SDELVRHAKIHLKQKEHACPAEGCDRRFSQSGNLTE HLRIHTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEK PFACEFCGRKFAQNSTLTEHAKIHLKQKEKKAEKG GAPSASSAPPVSLAPVVTTCALEMSGLEMADHMMA MNHGRFPDGTNGLHHHPAHRMGMGQFPSPHHHQQ QQPQHAFNALMGEHIHYGAGNMNATSGIRHAMGP | 112 |
- 69 046157
GTVNGGHPPSALAPAARFNNSQFMGPPVASQGGSL PASMQLQKLNNQYFNHHPYPHNHYMPDLHPAAGH QMNGTNQHFRDCNPKHSGGS STPGGSGGS STPGGS GS S SGGGAGS SNSGGGSGSGNMP AS VAHVP AAMLP PNVIDTDFIDEEVLMSLVIEMGLDRIKELPELWLGQN EFDFMTDFVCKQQPSRVSC | ||
15 | MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRM GMGQFPSPHHHQQQQPQHAFNALMGEHIHYGAGN MNATSGVRHAMGPGTVNGGHPPSALAPAARFNNS QFMGPPVASQGGSLPASMQLQKLNNQYFNHHPYPH NHYMPDLHP AAGHQMNGTNQHFRDCNPKHSGGS S TPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNM PASVAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGL DRIKELPELWLGQNEFDFMTDFVCKQQPSRVSCRPH ACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQCRICM RSFSREDNLHTHIRTHTGEKPFACEFCGRKFARSDEL VRHAKIHLKQKEHACPAEGCDRRFSQSGNLTEHLRI HTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEKPFA CEFCGRKFAQNSTLTEHAKIHLKQKEKKAEKGGAP SAS S APP VSL AP VVTTC A | 113 |
16 | MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRR DELNVHLRIHTGHKPFQCRICMRSFSRSDHLTNHIRT HTGEKPFACEFCGRKFARSDDLVRHAKIHLKQKEH ACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQCRICM RSF SHRTTLTNHIRTHTGEKPF ACEFCGRKF AREDNL HTHAKIHLKQKEHACP AEGCDRRF STSHSLTEHLRI HTGHKPFQCRICMRSFSQSSSLVRHIRTHTGEKPFAC EFCGRKFAREDNLHTHAKIHLKQKEKKAEKGGAPS AS SAPP VSLAP VVTTC A | 114 |
17 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S S SGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK FAREDNLHTHTKIHLRQKDRP YACPVESCDRRF STS HSLTEHIRIHTGQKPFQCRICMRNF SQS S SLVRHIRTH TGEKPFACDICGRKFAREDNLHTHTKIHLRQKDKKA DKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATT | 115 |
- 70 046157
SYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSV PP AFP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTI EIC | ||
18 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRRDELN VH IRIHTGQKP FQCRICMRNF SRSDHLTNHIRTHTGEKPF ACDICGRK FARSDDLVRHTKIHLRQKDRPYACPVESCDRRFSRS DNLVRHIRIHTGQKPFQCRICMRNFSHRTTLTNHIRT HTGEKPF ACDICGRKF AREDNLHTHTKIHLRQKDRP YACPVESCDRRFSTSHSLTEHIRIHTGQKPFQCRICM RNF SQ S S SL VRHIRTHTGEKPF ACDICGRKF AREDNL HTHTKIHLRQKDKK ADKS WAS SATS SLS S YP SP VA TSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTYPSPV HSGFP SP S VATT YS S VPP AFP AQ VS SFP S S AVTNSF SA STGLSDMTATFSPRTIEIC | 116 |
19 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK FAREDNLHTHIRTHTGEKPFACDICGRKFSTSHSLTE HIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGEK PF ACDICGRKF AREDNLHTHTKIHLRQKDKKADKS VVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYP SPVPTSF S SPGS STYPSPVHSGFPSPS VATTYS S VPP A FP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTIEIC | 117 |
20 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK | 115 |
- 71 046157
FAREDNLHTHTKIHLRQKDRP YACPVESCDRRF STS HSLTEHIRIHTGQKPFQCRICMRNF SQS S SLVRHIRTH TGEKPFACDICGRKFAREDNLHTHTKIHLRQKDKKA DKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATT SYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSV PP AFP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTI EIC | ||
21 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SREDNLHTHIRTHTGEKPF ACDICGR KFARSDELVRHTKIHLRQKDRPYACPVESCDRRFSQ SGNLTEHIRIHTGQKPFQCRICMRNF STSGHLVRHIR THTGEKPFACDICGRKFAQNSTLTEHTKIHLRQKDK KADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSP ATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTY SSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFS PRTIEIC | 118 |
22 | MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRS DNLVRHLRIHTGHKPFQCRICMRSF SHRTTLTNHIRT HTGEKPFACEFCGRKFAREDNLHTHAKIHLKQKEH ACPAEGCDRRFSTSHSLTEHLRIHTGHKPFQCRICMR SFSQSSSLVRHIRTHTGEKPFACEFCGRKFAREDNLH THAKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTT CA | 119 |
23 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SDPG ALVRHIRIHTGQKP FQCRICMRNF SRSDNLVRHIRTHTGEKPF ACDICGR | 120 |
- 72 046157
KF AQSGDLRRHTKIHLRQKDRP YACPVESCDRRF ST HLDLIRHIRIHTGQKPFQC RIC MRNF STSGNLVRHIR THTGEKPFACDICGRKFARSDNLVRHTKIHLRQKDR PYACPVESCDRRFSQSGHLTEHIRIHTGQKPFQCRIC MRNFSERSHLREHIRTHTGEKPFACDICGRKFAQAG HL ASHTKH4LRQKDKK ADKS WAS S AT S SLS S YP SP VATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTYP SPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNS FSASTGLSDMTATFSPRTIEIC | ||
24 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLTRHIRIHTGQKP FQCRICMRNFSHSTTLTNHIRTHTGEKPFACDICGRK FARSDNRKTHIRTHTGEKPFACDICGRKFSTSHSLTE HIRIHTGQKPFQCRICMRNFSQSSSLTRHIRTHTGEKP FACDICGRKFARSDNRKTHTKIHLRQKDKKADKSV VASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPS PVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAF PAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTIEIC | 121 |
25 | MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRS DNLVRHLRIHTGHKPFQCRICMRSF SREDNLHTHIRT HTGEKPFACEFCGRKFARSDELVRHAKIHLKQKEH ACPAEGCDRRFSQSGNLTEHLRIHTGHKPFQCRICM RSFSTSGHLVRHIRTHTGEKPFACEFCGRKFAQNSTL TEHAKIHLKQKEKKAEKGGAPSASSAPPVSLAPWT TCA | 122 |
26 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLTRHIRIHTGQKP FQCRICMRNFSRSDNLTTHIRTHTGEKPFACDICGRK | 123 |
- 73 046157
FARSDERKRHIRTHTGEKPFACDICGRKFSQSGNLTE HIRIHTGQKPFQCRICMRNFSTSGHLTRHIRTHTGEK PFACDICGRKFAQSSTRKEHTKIHLRQKDKKADKSV VASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPS PVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAF PAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTIEIC | ||
27 | MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SREDNLHTHIRTHTGEKPF ACDICGR KFARSDELVRHIRTHTGEKPFACDICGRKFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDKKADKS VVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYP SPVPTSF S SPGS STYPSPVHSGFPSPS VATTYS S VPP A FP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTIEIC | 124 |
28 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFSS P ADLTRHQRTHTGEKPYKCPECGKSF SRSDNLVRH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPEC GKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTSG HLVRHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEDALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLGSDALDDFDLDML | 125 |
29 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS DPGALVRHQRTHTGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSQSGDLRRHQRTHTG EKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYKCPE CGKSF STSGNLVRHQRTHTGEKPYKCPECGKSF SRS DNLVRHQRTHTGKKTSKRPAATKKAGQAKKKKGS YPYDVPDYALEDALDDFDLDMLGSDALDDFDLDM LGSDALDDFDLDMLGSDALDDFDLDML | 126 |
30 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ | 99 |
- 74 046157
AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF | ||
31 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML | 102 |
32 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML | 102 |
33 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF | 100 |
34 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS | 127 |
- 75 046157
TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSD ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLD MLGSDALDDFDLDML | ||
35 | MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSD ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLD MLGSDALDDFDLDML | 127 |
36 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACPVES CDRRF SRSDNL VRHIRIHTGQK P FQC R IC MRNF SRED NLHTHIRTHTGEKPFACDICGRKFARSDELVRHTKIH LRQKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQK PFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDICGR KFAQNSTLTEHTKIHLRQKDK | 128 |
37 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRF SRSDNL VRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK | 106 |
38 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGGGSGGGSGQSQLIKPSRMRKYPN RPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRIHT GQKPFQCRICMRNFSREDNLHTHIRTHTGEKPFACDI CGRKFARSDELVRHTKIHLRQKDRPYACPVESCDRR FSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGHLVR HIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHLRQK DK | 129 |
39 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE | 105 |
- 76 046157
RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC | ||
40 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCADHLMLAEGYRLVQRPPSAAAAHGPHALRTL PPYAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFG PPSSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPN APGGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEA LTSLELELGLHRVRELPELFLGQSEFDCFSDLGSAPP AGSVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACP VESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRNFS REDNLHTHIRTHTGEKPFACDICGRKFARSDELVRH TKIHLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHT GQKPFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDI CGRKFAQNSTLTEHTKIHLRQKDK | 130 |
41 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGADHLMLAEGYRLVQRPPSAAAAH GPHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPG ALAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYP GRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGM DAELIDEEALTSLELELGLHRVRELPELFLGQSEFDC FSDLGSAPPAGSVSCGGSGGGSGQSQLIKPSRMRKY PNRPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDK | 131 |
42 | MAPI<I<I<RI<VGIHGVPAALEPGEI<P YKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML | 102 |
- 77 046157
43 | MAPKKKRKVGIHGVPAALEPGEKP YKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML | 102 |
44 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK | 106 |
45 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK | 106 |
46 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGGGSGGGSGQSQLIKPSRMRKYPN RPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRIHT GQKPFQCRICMRNFSREDNLHTHIRTHTGEKPFACDI CGRKFARSDELVRHTKIHLRQKDRPYACPVESCDRR FSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGHLVR HIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHLRQK DK | 205 |
47 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCADHLMLAEGYRLVQRPPSAAAAHGPHALRTL PPYAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFG PPSSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPN APGGPPGPQPAPSAAAPPPP AHALGGMD AELIDEEA | 207 |
- 78 046157
LTSLELELGLHRVRELPELFLGQSEFDCFSDLGSAPP AGSVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACP VESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRNFS REDNLHTHIRTHTGEKPFACDICGRKFARSDELVRH TKIHLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHT GQKPFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDI CGRKFAQNSTLTEHTKIHLRQKDK | ||
48 | MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGADHLMLAEGYRLVQRPPSAAAAH GPHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPG ALAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYP GRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGM DAELIDEEALTSLELELGLHRVRELPELFLGQSEFDC FSDLGSAPPAGSVSCGGSGGGSGQSQLIKPSRMRKY PNRPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDK | 209 |
49 | MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRLEPGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTG EKPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPE CGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTS GHLVRHQRTHTGEKPYKCPECGKSFSQNSTLTEHQ RTHTGKKTSVYVGGLESRVLKYTAQNMELQNKVQ LLEEQNLSLLDQLRKLQAMVIEISNKTS S S STCILVLL VSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALPS EDPYQLELPALQSEVPKDSTHQWLDGSDCVLQAPG NT SCLLHYMPQ AP S AEPPLEWPFPDLF SEPLCRGPIL PLQANLTRKGGWLPTGSPSVILQDRYSG | 213 |
50 | MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEISNKT S S S STCILVLL VSFCL LLVP AM YS SDTRGSLP AEHGVLSRQLRALP SEDP YQ | 217 |
- 79 046157
LELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCL LHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQAN LTRKGGWLPTGSPSVILQDRYSG | ||
51 | MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SHRTTLTNHIRTHTGEKPF A CDICGRKFAREDNLHTHTKIHLRQKDRPYACPVESC DRRFSTSHSLTEHIRIHTGQKPFQCRICMRNFSQSSSL VRHIRTHTGEKPFACDICGRKFAREDNLHTHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEISNKT S S S STCIL VLL VSFCL LLVP AM YS SDTRGSLP AEHGVLSRQLRALP SEDP YQ LELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCL LHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQAN LTRKGGWLPTGSPSVILQDRYSG | 219 |
52 | MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRLEPGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTG EKPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPE CGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTS GHLVRHQRTHTGEKPYKCPECGKSFSQNSTLTEHQ RTHTGKKTSVYVGGLESRVLKYTAQNMELQNKVQ LLEEQNLSLLDQLRKLQAMVIEIS | 221 |
53 | MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEIS | 223 |
- 80 046157
Таблица 7
Последовательности нуклеиновой кислоты, кодирующие раскрытые в настоящем документе иллюстративные сконструированные факторы транскрипции
Конструкция | Последовательность | SEQ ID NO |
31 (RE + кодирующая) | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt | 67 |
gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA |
- 81 046157
ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA T AT GTT AT A A AC T AGT aaagagaccggttcactgtgacagtaaaa gagaccggttcactgtgagaatgaaagagaccggttcactgtgatcggaaaaga gaccggttcactgtgagcggccttgaaacccagcagacaatgtagctcagtaga aacccagcagacaatgtagctgaatggaaacccagcagacaatgtagcttcgg agaaacccagcagacaatgtagctAAGCTTGGGTGGCATCCC TGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGG AAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCT AATAAAATTAAGTTGCATCATTTTGTCTGACTAG GTGTCCTTCTATAATATTATGGGGTGGAGGGGGG TGGTATGGAGCAAGGGGCAAGTTGGGAAGACAA CCTGTAGGGCCTGCGGGGTCTATTGGGAACCAA GCTGGAGTGCAGTGGCACAATCTTGGCTCACTGC AATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTG CCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCAT GCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGG TAGAGACGGGGTTTCACCATATTGGCCAGGCTGG TCTCCAACTCCTAATCTCAGGTGATCTACCCACC TTGGCCTCCCAAATTGCTGGGATTACAGGCGTGA ACCACTGCTCCCTTCCCTGTCCTT | ||
32 (RE + кодирующая) | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc | 68 |
- 82 046157
ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTAAGCTTGGGTGGCATCCC TGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGG AAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCT AATAAAATTAAGTTGCATCATTTTGTCTGACTAG GTGTCCTTCTATAATATTATGGGGTGGAGGGGGG TGGTATGGAGCAAGGGGCAAGTTGGGAAGACAA CCTGTAGGGCCTGCGGGGTCTATTGGGAACCAA GCTGGAGTGCAGTGGCACAATCTTGGCTCACTGC AATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTG CCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCAT |
- 83 046157
GCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGG TAGAGACGGGGTTTCACCATATTGGCCAGGCTGG TCTCCAACTCCTAATCTCAGGTGATCTACCCACC TTGGCCTCCCAAATTGCTGGGATTACAGGCGTGA ACCACTGCTCCCTTCCCTGTCCTT | ||
33 (RE + кодирующая) | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA | 69 |
- 84 046157
TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGAGGCC AGCGGTTCCGGACGGGCTGACGCATTGGACGAT TTTGATCTGGATATGCTGGGAAGTGACGCCCTCG ATGATTTTGACCTTGACATGCTTGGTTCGGATGC CCTTGATGACTTTGACCTCGACATGCTCGGCAGT GACGCCCTTGATGATTTCGACCTGGACATGCTGA TTAACTCTAGAAGTTCCGGATCTCCGAAAAAGAA ACGCAAAGTTGGTAGCCAGTACCTGCCCGACAC CGACGACCGGCACCGGATCGAGGAAAAGCGGAA GCGGACCTACGAGACATTCAAGAGCATCATGAA GAAGTCCCCCTTCAGCGGCCCCACCGACCCTAGA CCTCCACCTAGAAGAATCGCCGTGCCCAGCAGAT CCAGCGCCAGCGTGCCAAAACCTGCCCCCCAGC CTTACCCCTTCACCAGCAGCCTGAGCACCATCAA CTACGACGAGTTCCCTACCATGGTGTTCCCCAGC GGCCAGATCTCTCAGGCCTCTGCTCTGGCTCCAG CCCCTCCTCAGGTGCTGCCTCAGGCTCCTGCTCC TGCACCAGCTCCAGCCATGGTGTCTGCACTGGCT CAGGCACCAGCACCCGTGCCTGTGCTGGCTCCTG GACCTCCACAGGCTGTGGCTCCACCAGCCCCTAA ACCTACACAGGCCGGCGAGGGCACACTGTCTGA AGCTCTGCTGCAGCTGCAGTTCGACGACGAGGAT CTGGGAGCCCTGCTGGGAAACAGCACCGATCCT GCCGTGTTCACCGACCTGGCCAGCGTGGACAAC AGCGAGTTCCAGCAGCTGCTGAACCAGGGCATC CCTGTGGCCCCTCACACCACCGAGCCCATGCTGA TGGAATACCCCGAGGCCATCACCCGGCTCGTGAC AGGCGCTCAGAGGCCTCCTGATCCAGCTCCTGCC CCTCTGGGAGCACCAGGCCTGCCTAATGGACTGC TGTCTGGCGACGAGGACTTCAGCTCTATCGCCGA TATGGATTTCTCAGCCTTGCTGGGCTCTGGCAGC GGCAGCCGGGATTCCAGGGAAGGGATGTTTTTG CCGAAGCCTGAGGCCGGCTCCGCTATTAGTGACG TGTTTGAGGGCCGCGAGGTGTGCCAGCCAAAAC GAATCCGGCCATTTCATCCTCCAGGAAGTCCATG GGCCAACCGCCCACTCCCCGCCAGCCTCGCACCA ACACCAACCGGTCCAGTACATGAGCCAGTCGGG TCACTGACCCCGGCACCAGTCCCTCAGCCACTGG |
- 85 046157
ATCCAGCGCCCGCAGTGACTCCCGAGGCCAGTC ACCTGTTGGAGGATCCCGATGAAGAGACGAGCC AGGCTGTCAAAGCCCTTCGGGAGATGGCCGATA CTGTGATTCCCCAGAAGGAAGAGGCTGCAATCT GTGGCCAAATGGACCTTTCCCATCCGCCCCCAAG GGGCCATCTGGATGAGCTGACAACCACACTTGA GTCCATGACCGAGGATCTGAACCTGGACTCACCC CTGACCCCGGAATTGAACGAGATTCTGGATACCT TCCTGAACGACGAGTGCCTCTTGCATGCCATGCA TATCAGCACAGGACTGTCCATCTTCGACACATCT CTGTTTTAAACTAGTaataaaagatctttattttcattagatctgtgtgt tggttttttgtgtg | ||
34 (RE + кодирующая) | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC | 70 |
- 86 046157
AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCGACGC GCTGGACGATTTCGATCTCGACATGCTGGGTTCT GATGCCCTCGATGACTTTGACCTGGATATGTTGG GAAGCGACGCATTGGATGACTTTGATCTGGACAT GCTCGGCTCCGATGCTCTGGACGATTTCGATCTC GATATGTTATAAAAGCTTGGGTGGCATCCCTGTG ACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGT TGCCACTCCAGTGCCCACCAGCCTTGTCCTAATA AAATTAAGTTGCATCATTTTGTCTGACTAGGTGT CCTTCTATAATATTATGGGGTGGAGGGGGGTGGT ATGGAGCAAGGGGCAAGTTGGGAAGACAACCTG TAGGGCCTGCGGGGTCTATTGGGAACCAAGCTG GAGTGCAGTGGCACAATCTTGGCTCACTGCAATC TCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTC AGCCTCCCGAGTTGTTGGGATTCCAGGCATGCAT GACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAG AGACGGGGTTTCACCATATTGGCCAGGCTGGTCT CCAACTCCTAATCTCAGGTGATCTACCCACCTTG GCCTCCCAAATTGCTGGGATTACAGGCGTGAACC ACTGCTCCCTTCCCTGTCCTT | ||
26 (RE + кодирующая) | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta | 71 |
- 87 046157
tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCGACGC GCTGGACGATTTCGATCTCGACATGCTGGGTTCT GATGCCCTCGATGACTTTGACCTGGATATGTTGG GAAGCGACGCATTGGATGACTTTGATCTGGACAT GCTCGGCTCCGATGCTCTGGACGATTTCGATCTC GATATGTTATAAaaagagaccggttcactgtgacagtaaaagagac |
- 88 046157
cggttcactgtgagaatgaaagagaccggttcactgtgatcggaaaagagaccg gttcactgtgagcggccttgaaacccagcagacaatgtagctcagtagaaaccc agcagacaatgtagctgaatggaaacccagcagacaatgtagcttcggagaaa cccagcagacaatgtagctAAGCTTGGGTGGCATCCCTGTG ACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGT TGCCACTCCAGTGCCCACCAGCCTTGTCCTAATA AAATTAAGTTGCATCATTTTGTCTGACTAGGTGT CCTTCTATAATATTATGGGGTGGAGGGGGGTGGT ATGGAGCAAGGGGCAAGTTGGGAAGACAACCTG TAGGGCCTGCGGGGTCTATTGGGAACCAAGCTG GAGTGCAGTGGCACAATCTTGGCTCACTGCAATC TCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTC AGCCTCCCGAGTTGTTGGGATTCCAGGCATGCAT GACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAG AGACGGGGTTTCACCATATTGGCCAGGCTGGTCT CCAACTCCTAATCTCAGGTGATCTACCCACCTTG GCCTCCCAAATTGCTGGGATTACAGGCGTGAACC ACTGCTCCCTTCCCTGTCCTT | ||
40 (кодирующая) | ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCcGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCgccgaccacctgatgctcgccgagggctaccgcct ggtgcagaggccgccgtccgccgccgccgcccatggccctcatgcgctccgg actctgccgccgtacgcgggcccgggcctggacagtgggctgaggccgcgg ggggctccgctggggccgccgccgccccgccaacccggggccctggcgtac ggggccttcgggccgccgtcctccttccagccctttccggccgtgcctccgccg gccgcgggcatcgcgcacctgcagcctgtggcgacgccgtaccccggccgc gcCgccgcgccccccaacgctccgggaggccccccgggcccgcagccggc cccaagcgccgcagccccgccgccgcccgcgcacgccctgggcggcatgga cgccgaactcatcgacgaggaggcgctgacgtcgctggagctggagctgggg ctgcaccgcgtgcgcgagctgcccgagctgttcctgggccagagcgagttcga ctgcttctcggacttggggtccgcgccgcccgccggctccgtgagctgccagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaag acgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgc ttctccCGCAGCGACAACCTGGTGAGAcacatccgcatccac acaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCG AGAGGAT AACTT GC AC ACTcacatccgcacccacacaggcg | 72 |
- 89 046157
aaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGA TGAACTTGTCCGAcataccaagatccacttgcggcagaaggaccgc ccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGG GAATCTGACTGAGcacatccgcatccacacaggccagaagcccttc cagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATCT GGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgac atctgtggaagaaagtttgccC AGA AT AGT AC CC T GAC CGA A cataccaagatccacttgcggcagaaggacaag | ||
41 (кодирующая) | ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCTGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCGGCGGCAGCGGCGGCGGAAGC GGCgccgaccacctgatgctcgccgagggctaccgcctggtgcagaggcc gccgtccgccgccgccgcccatggccctcatgcgctccggactctgccgccgt acgcgggcccgggcctggacagtgggctgaggccgcggggggctccgctgg ggccgccgccgccccgccaacccggggccctggcgtacggggccttcgggc cgccgtcctccttccagccctttccggccgtgcctccgccggccgcgggcatcg cgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcgcccc ccaacgctccgggaggccccccgggcccgcagccggccccaagcgccgca gccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactcatc gacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcgtgc gcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcggactt ggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtggtt ctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccgg cccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcctgt gatcgccgcttctccCGCAGCGACAACCTGGTGAGAcacatc cgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAaact tcagcCGAGAGGATAACTTGCACACTcacatccgcacccac acaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGG AGCGATGAACTTGTCCGAcataccaagatccacttgcggcaga aggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAA TCAGGGAATCTGACTGAGcacatccgcatccacacaggccag aagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTGG ACATCTGGTACGCcacatccgcacccacacaggcgaaaagcccttc gcctgcgacatctgtggaagaaagtttgccC AGA AT AGT ACC C TG ACCGAAcataccaagatccacttgcggcagaaggacaag | 73 |
- 90 046157 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC
- 91 046157
CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTGAAACCCAGCAGACAAT GTAGCTAGACCCAGTAGCCAGATGTAGCTAAAG AGACCGGTTCACTGTGAAAGCTTGGGTGGCATCC CTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTG GAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCC TAATAAAATTAAGTTGCATCATTTTGTCTGACTA GGTGTCCTTCTATAATATTATGGGGTGGAGGGGG GTGGTATGGAGCAAGGGGCAAGTTGGGAAGACA ACCTGTAGGGCCTGCGGGGTCTATTGGGAACCA AGCTGGAGTGCAGTGGCACAATCTTGGCTCACTG CAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCT GCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCA TGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTG GTAGAGACGGGGTTTCACCATATTGGCCAGGCTG GTCTCCAACTCCTAATCTCAGGTGATCTACCCAC CTTGGCCTCCCAAATTGCTGGGATTACAGGCGTG AACCACTGCTCCCTTCCCTGTCCTT | ||
43 (RE + кодирующая) | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct | 75 |
- 92 046157
cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTGAAACCCAGCAGACAAT GTAGCTAGACCCAGTAGCCAGATGTAGCTAAAG AGACCGGTTCACTGTGAGAAACCCAGCAGACAA TGTAGCTAGACCCAGTAGCCAGATGTAGCTAAA GAGACCGGTTCACTGTGAAAGCTTGGGTGGCATC CCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCT GGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTC CTAATAAAATTAAGTTGCATCATTTTGTCTGACT AGGTGTCCTTCTATAATATTATGGGGTGGAGGGG |
- 93 046157
GGTGGTATGGAGCAAGGGGCAAGTTGGGAAGAC AACCTGTAGGGCCTGCGGGGTCTATTGGGAACC AAGCTGGAGTGCAGTGGCACAATCTTGGCTCACT GCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCC TGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGC ATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTT GGTAGAGACGGGGTTTCACCATATTGGCCAGGCT GGTCTCCAACTCCTAATCTCAGGTGATCTACCCA CCTTGGCCTCCCAAATTGCTGGGATTACAGGCGT GAACCACTGCTCCCTTCCCTGTCCTT | ||
44 (RE + кодирующая) | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCgc cgaccacctgatgctcgccgagggctaccgcctggtgcagaggccgccgtcc gccgccgccgcccatggccctcatgcgctccggactctgccgccgtacgcggg | 76 |
- 94 046157
cccgggcctggacagtgggctgaggccgcggggggctccgctggggccgcc gccgccccgccaacccggggccctggcgtacggggccttcgggccgccgtc ctccttccagccctttccggccgtgcctccgccggccgcgggcatcgcgcacct gcagcctgtggcgacgccgtaccccggccgcgcggccgcgccccccaacgc tccgggaggccccccgggcccgcagccggccccaagcgccgcagccccgc cgccgcccgcgcacgccctgggcggcatggacgccgaactcatcgacgagg aggcgctgacgtcgctggagctggagctggggctgcaccgcgtgcgcgagct gcccgagctgttcctgggccagagcgagttcgactgcttctcggacttggggtc cgcgccgcccgccggctccgtgagctgcggtggttctggtggtggttctggtca gtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagca agacgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgcc gcttctccCGCAGCGACAACCTGGTGAGAcacatccgcatcc acacaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcC GAGAGGATAACTTGCACACTcacatccgcacccacacaggc gaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCG ATGAACTTGTCCGAcataccaagatccacttgcggcagaaggacc gcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAG GGAATCTGACTGAGcacatccgcatccacacaggccagaagccct tccagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATC TGGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcg acatctgtggaagaaagtttgccCAGAATAGTACCCTGACCG AAcataccaagatccacttgcggcagaaggacaagtaaCTCGAGGA AACCCAGCAGACAATGTAGCTAGACCCAGTAGC CAGATGTAGCTAAAGAGACCGGTTCACTGTGAA AGCTTGGGTGGCATCCCTGTGACCCCTCCCCAGT GCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTG CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCA TCATTTTGTCTGACTAGGTGTCCTTCTATAATATT ATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGG CAAGTTGGGAAGACAACCTGTAGGGCCTGCGGG GTCTATTGGGAACCAAGCTGGAGTGCAGTGGCA CAATCTTGGCTCACTGCAATCTCCGCCTCCTGGG TTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTT GTTGGGATTCCAGGCATGCATGACCAGGCTCAGC TAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCAC CATATTGGCCAGGCTGGTCTCCAACTCCTAATCT CAGGTGATCTACCCACCTTGGCCTCCCAAATTGC TGGGATTACAGGCGTGAACCACTGCTCCCTTCCC TGTCCTT | ||
45 (RE + кодирующая) | ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac | 184 |
- 95 046157
ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCgc cgaccacctgatgctcgccgagggctaccgcctggtgcagaggccgccgtcc gccgccgccgcccatggccctcatgcgctccggactctgccgccgtacgcggg cccgggcctggacagtgggctgaggccgcggggggctccgctggggccgcc gccgccccgccaacccggggccctggcgtacggggccttcgggccgccgtc ctccttccagccctttccggccgtgcctccgccggccgcgggcatcgcgcacct gcagcctgtggcgacgccgtaccccggccgcgcggccgcgccccccaacgc tccgggaggccccccgggcccgcagccggccccaagcgccgcagccccgc cgccgcccgcgcacgccctgggcggcatggacgccgaactcatcgacgagg aggcgctgacgtcgctggagctggagctggggctgcaccgcgtgcgcgagct gcccgagctgttcctgggccagagcgagttcgactgcttctcggacttggggtc cgcgccgcccgccggctccgtgagctgcggtggttctggtggtggttctggtca gtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagca agacgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgcc gcttctccCGCAGCGACAACCTGGTGAGAcacatccgcatcc acacaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcC GAGAGGATAACTTGCACACTcacatccgcacccacacaggc gaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCG ATGAACTTGTCCGAcataccaagatccacttgcggcagaaggacc gcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAG GGAATCTGACTGAGcacatccgcatccacacaggccagaagccct tccagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATC TGGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcg acatctgtggaagaaagtttgccCAGAATAGTACCCTGACCG |
- 96 046157
AAcataccaagatccacttgcggcagaaggacaagtaaCTCGAGGA AACCCAGCAGACAATGTAGCTAGACCCAGTAGC CAGATGTAGCTAAAGAGACCGGTTCACTGTGAG AAACCCAGCAGACAATGTAGCTAGACCCAGTAG CCAGATGTAGCTAAAGAGACCGGTTCACTGTGA AAGCTTGGGTGGCATCCCTGTGACCCCTCCCCAG TGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGT GCCCACCAGCCTTGTCCTAATAAAATTAAGTTGC ATCATTTTGTCTGACTAGGTGTCCTTCTATAATAT TATGGGGTGGAGGGGGGTGGTATGGAGCAAGGG GCAAGTTGGGAAGACAACCTGTAGGGCCTGCGG GGTCTATTGGGAACCAAGCTGGAGTGCAGTGGC ACAATCTTGGCTCACTGCAATCTCCGCCTCCTGG GTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGT TGTTGGGATTCCAGGCATGCATGACCAGGCTCAG CTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCA CCATATTGGCCAGGCTGGTCTCCAACTCCTAATC TCAGGTGATCTACCCACCTTGGCCTCCCAAATTG CTGGGATTACAGGCGTGAACCACTGCTCCCTTCC CTGTCCTT | ||
8 (кодирующая) | ATGGCCgccgaccacctgatgctcgccgagggctaccgcctggtgcaga ggccgccgtccgccgccgccgcccatggccctcatgcgctccggactctgccg ccgtacgcgggcccgggcctggacagtgggctgaggccgcggggggctccg ctggggccgccgccgccccgccaacccggggccctggcgtacggggccttc gggccgccgtcctccttccagccctttccggccgtgcctccgccggccgcggg catcgcgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcg ccccccaacgctccgggaggccccccgggcccgcagccggccccaagcgcc gcagccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactc atcgacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcg tgcgcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcgg acttggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtg gttctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaacc ggcccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcc tgtgatcgccgcttctccCGCAGCGACAACCTGGTGAGAcac atccgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAa acttcagcCGAGAGGATAACTTGCACACTcacatccgcacc cacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCG GAGCGATGAACTTGTCCGAcataccaagatccacttgcggca gaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCA AT C AGGGA ATCTGACTGAGcacatccgcatccacacaggcca gaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTG GACATCTGGTACGCcacatccgcacccacacaggcgaaaagccct tcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCCT GACCGAAcataccaagatccacttgcggcagaaggacaag | 203 |
46 (кодирующая) | ATGGCCgccgaccacctgatgctcgccgagggctaccgcctggtgcaga ggccgccgtccgccgccgccgcccatggccctcatgcgctccggactctgccg ccgtacgcgggcccgggcctggacagtgggctgaggccgcggggggctccg ctggggccgccgccgccccgccaacccggggccctggcgtacggggccttc gggccgccgtcctccttccagccctttccggccgtgcctccgccggccgcggg catcgcgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcg | 204 |
- 97 046157
ccccccaacgctccgggaggccccccgggcccgcagccggccccaagcgcc gcagccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactc atcgacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcg tgcgcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcgg acttggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtg gttctggtGGTGGCAGCGGGGGAGGTTCTGGTcagtccca gctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaagacg cccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgcttct ccCGCAGCGACAACCTGGTGAGAcacatccgcatccacaca ggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCGAG AGGAT AACTTGC AC ACT cacatccgcacccacacaggcgaaaa gcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGATGA ACTTGTCCGAcataccaagatccacttgcggcagaaggaccgccctta cgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGGGAA TCTGACTGAGcacatccgcatccacacaggccagaagcccttccagtg ccgcatctgcatg AGAaacttcagc AC A AGT GGAC AT С T GGT ACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgacatctg tggaagaaagtttgccC AGAAT AGT ACCCTGACCGAAcatac caagatccacttgcggcagaaggacaag | ||
47 (кодирующая) | ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCcGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCgccgaccacctgatgctcgccgagggctaccgcct ggtgcagaggccgccgtccgccgccgccgcccatggccctcatgcgctccgg actctgccgccgtacgcgggcccgggcctggacagtgggctgaggccgcgg ggggctccgctggggccgccgccgccccgccaacccggggccctggcgtac ggggccttcgggccgccgtcctccttccagccctttccggccgtgcctccgccg gccgcgggcatcgcgcacctgcagcctgtggcgacgccgtaccccggccgc gcCgccgcgccccccaacgctccgggaggccccccgggcccgcagccggc cccaagcgccgcagccccgccgccgcccgcgcacgccctgggcggcatgga cgccgaactcatcgacgaggaggcgctgacgtcgctggagctggagctgggg ctgcaccgcgtgcgcgagctgcccgagctgttcctgggccagagcgagttcga ctgcttctcggacttggggtccgcgccgcccgccggctccgtgagctgccagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaag acgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgc ttctccCGCAGCGACAACCTGGTGAGAcacatccgcatccac acaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCG | 206 |
- 98 046157
AGAGGAT AACTT GC AC ACTcacatccgcacccacacaggcg aaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGA TGAACTTGTCCGAcataccaagatccacttgcggcagaaggaccgc ccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGG GAATCTGACTGAGcacatccgcatccacacaggccagaagcccttc cagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATCT GGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgac atctgtggaagaaagtttgccC AGA AT AGT AC CC T GAC CGA A cataccaagatccacttgcggcagaaggacaag | ||
48 (кодирующая) | ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCTGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCGGCGGCAGCGGCGGCGGAAGC GGCgccgaccacctgatgctcgccgagggctaccgcctggtgcagaggcc gccgtccgccgccgccgcccatggccctcatgcgctccggactctgccgccgt acgcgggcccgggcctggacagtgggctgaggccgcggggggctccgctgg ggccgccgccgccccgccaacccggggccctggcgtacggggccttcgggc cgccgtcctccttccagccctttccggccgtgcctccgccggccgcgggcatcg cgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcgcccc ccaacgctccgggaggccccccgggcccgcagccggccccaagcgccgca gccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactcatc gacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcgtgc gcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcggactt ggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtggtt ctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccgg cccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcctgt gatcgccgcttctccCGCAGCGACAACCTGGTGAGAcacatc cgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAaact tcagcCGAGAGGATAACTTGCACACTcacatccgcacccac acaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGG AGCGATGAACTTGTCCGAcataccaagatccacttgcggcaga aggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAA TCAGGGAATCTGACTGAGcacatccgcatccacacaggccag aagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTGG ACATCTGGTACGCcacatccgcacccacacaggcgaaaagcccttc gcctgcgacatctgtggaagaaagtttgccC AGA AT AGT ACC C TG ACCGAAcataccaagatccacttgcggcagaaggacaag | 208 |
- 99 046157
49 (кодирующая) | atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggCTCGAACCAGGTGA AAAACCTTACAAATGTCCTGAATGTGGGAAATC ATTCAGTCGCAGCGACAACCTGGTGAGACATCA ACGCACCCATACAGGAGAAAAACCTTATAAATG TCCAGAATGTGGAAAGTCCTTCTCACGAGAGGAT AACTTGCACACTCATCAACGAACACATACTGGTG AAAAACCATACAAGTGTCCCGAATGTGGTAAAA GTTTTAGCCGGAGCGATGAACTTGTCCGACACCA ACGAACCCATACAGGCGAGAAGCCTTACAAATG TCCCGAGTGTGGCAAGAGCTTCTCACAATCAGGG AATCTGACTGAGCATCAACGAACTCATACCGGG GAAAAACCTTACAAGTGTCCAGAGTGTGGGAAG AGCTTTTCCACAAGTGGACATCTGGTACGCCACC AGAGGACACATACAGGGGAGAAGCCCTACAAAT GCCCCGAATGCGGTAAAAGTTTCTCTCAGAATAG TACCCTGACCGAACACCAGCGAACACACACTGG GAAAAAAACGAGTgtgtaCgttgggggtttagagagcCgggtctt gaaatacacagcccagaatatggagcttcagaacaaagtacagcttctggagga acagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgaga tCtcaaacaaaaccagcagcagcagcacctgcatcttggtcctGctagtctcctt ctgcctcctccttgtacctgctatgtactcctctgacacaagggggagcctgccag ctgagcatggagtgttgtcccgccagcttcgtgccctccccagtgaggaccctta ccagctggagctgcctgccctgcagtcagaagtgccgaaagacagcacacacc agtggttggacggctcagactgtgtactccaggcccctggcaacacttcctgcct gctgcattacatgcctcaggctcccagtgcagagcctcccctggagtggccCtt ccctgacctcttctcagagcctctctgccgaggtcccatcctccccctgcaggca aatctcacaaggaagggaggatggcttcctactggtagcccctctgtcattttgca ggacagatactcaggc | 212 |
50 (кодирующая) | atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCAGCGACAACCTGGTGAG AcacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCGAGAGGATAACTTGCACACTcacatccg cacccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgc cCGGAGCGATGAACTTGTCCGAcataccaagatccacttgcg | 216 |
- 100 046157
gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc С А АТ С AGGGA АТ С Т GACTGAGcacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGT GGACATCTGGTACGCcacatccgcacccacacaggcgaaaagcc cttcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCC TGACCGAAcataccaagatccacttgcggcagaaggacgtgtaCgttg ggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttcag aacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagga aactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcacc tgcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcctc tgacacaagggggagcctgccagctgagcatggagtgttgtcccgccagcttc gtgccctccccagtgaggacccttaccagctggagctgcctgccctgcagtcag aagtgccgaaagacagcacacaccagtggttggacggctcagactgtgtactcc aggcccctggcaacacttcctgcctgctgcattacatgcctcaggctcccagtgc agagcctcccctggagtggccCttccctgacctcttctcagagcctctctgccga ggtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttcct actggtagcccctctgtcattttgcaggacagatactcaggc | ||
51 (кодирующая) | atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCTCAGACAACCTCGTTCGA cacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgAG AaacttcagcCACCGGACTACACTCACGAACcacatccgca cccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgcc AGAGAAGAC AATCTCC AT ACT cataccaagatccacttgcg gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc AC C AGC С АТТС ТС T С AC T GA Acacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCAGTCT AGC T C ACTGGT GAGGcacatccgcacccacacaggcgaaaagc ccttcgcctgcgacatctgtggaagaaagtttgccAGGGAGGATAAC CTGCATACGcataccaagatccacttgcggcagaaggacgtgtaCgtt gggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttca gaacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagg aaactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcac ctgcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcct ctgacacaagggggagcctgccagctgagcatggagtgttgtcccgccagctt cgtgccctccccagtgaggacccttaccagctggagctgcctgccctgcagtca gaagtgccgaaagacagcacacaccagtggttggacggctcagactgtgtact ccaggcccctggcaacacttcctgcctgctgcattacatgcctcaggctcccagt gcagagcctcccctggagtggccCttccctgacctcttctcagagcctctctgcc gaggtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttc ctactggtagcccctctgtcattttgcaggacagatactcaggc | 218 |
52 (кодирующая) | atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg | 220 |
- 101 046157
actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggCTCGAACCAGGTGA AAAACCTTACAAATGTCCTGAATGTGGGAAATC ATTCAGTCGCAGCGACAACCTGGTGAGACATCA ACGCACCCATACAGGAGAAAAACCTTATAAATG TCCAGAATGTGGAAAGTCCTTCTCACGAGAGGAT AACTTGCACACTCATCAACGAACACATACTGGTG AAAAACCATACAAGTGTCCCGAATGTGGTAAAA GTTTTAGCCGGAGCGATGAACTTGTCCGACACCA ACGAACCCATACAGGCGAGAAGCCTTACAAATG TCCCGAGTGTGGCAAGAGCTTCTCACAATCAGGG AATCTGACTGAGCATCAACGAACTCATACCGGG GAAAAACCTTACAAGTGTCCAGAGTGTGGGAAG AGCTTTTCCACAAGTGGACATCTGGTACGCCACC AGAGGACACATACAGGGGAGAAGCCCTACAAAT GCCCCGAATGCGGTAAAAGTTTCTCTCAGAATAG TACCCTGACCGAACACCAGCGAACACACACTGG GAAAAAAACGAGTgtgtaCgttgggggtttagagagcCgggtctt gaaatacacagcccagaatatggagcttcagaacaaagtacagcttctggagga acagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgaga tatca | ||
53 (кодирующая) | atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCAGCGACAACCTGGTGAG AcacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCGAGAGGATAACTTGCACACTcacatccg cacccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgc cCGGAGCGATGAACTTGTCCGAcataccaagatccacttgcg gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc C A AT C AGGGA AT С T GACTGAGcacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGT GGACATCTGGTACGCcacatccgcacccacacaggcgaaaagcc cttcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCC TGACCGAAcataccaagatccacttgcggcagaaggacgtgtaCgttg ggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttcag aacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagga aactccaggccatggtgattgagatCtca | 222 |
- 102 046157
Таблица 8
Последовательности нуклеиновых кислот для иллюстративных сайтов связывания микроРНК и микроРНК
Описание | Последовательность | SEQ ID NO |
Сайт связывания Ml | aaagagaccggttcactgtgacagtaaaagagaccggttcactgtgagaatgaaagag accggttcactgtgatcggaaaagagaccggttcactgtgagcggccttgaaacccagc agacaatgtagctcagtagaaacccagcagacaatgtagctgaatggaaacccagcag acaatgtagcttcggagaaacccagcagacaatgtagct | 7 |
Последователь ность miR128 | UCACAGUGAACCGGUCUCUUU | 8 |
Сайт связывания miR128 | AAAGAGACCGGTTCACTGTGA | 9 |
Последователь ность miR221 | AGCUACAUUGUCUGCUGGGUUUC | 10 |
Сайт связывания miR221 | GAAACCCAGCAGACAATGTAGCT | 11 |
Последователь ность miR222 | AGCUACAUCUGGCUACUGGGUCU | 12 |
Сайт связывания miR222 | AGACCCAGTAGCCAGATGTAGCT | 13 |
Сайт связывания М2 | GAAACCCAGCAGACAATGTAGCTAGACCCAGTAGCC AGATGTAGCTAAAGAGACCGGTTCACTGTGA | 14 |
Сайт связывания М3 | GAAACCCAGCAGACAATGTAGCTAGACCCAGTAGCC AGATGTAGCTAAAGAGACCGGTTCACTGTGAGAAAC CCAGCAGACAATGTAGCTAGACCCAGTAGCCAGATG TAGCTAAAGAGACCGGTTCACTGTGA | 15 |
Таблица 9
Различные типы структур с цинковыми пальцами и иллюстративные белки типа цинковые пальцы для производства eTF
Название типа ZF | SEQ ID NO | Структура ZF (причем каждый х может независимо быть любым остатком) | Иллюстративные белки, которые могут служить в качестве белковой платформы для eTF или ДНК-связывающего домена eTF, раскрытых в настоящем документе |
«Цинковые пальцы» C2H2типа (ZNF) | 136 | С-х-С-х-Н-х-Н | KLF4, KLF5, EGR3, ZFP637, SLUG, ZNF750, ZNF281, ΖΠ.Η.89, GLIS1, GLIS3 |
Белки типа «пальцы Ring» (RNF) | 137 | С-х-С-х-С-х-Н-ххх-С-хС-х-С-х-С | MDM2, BRCA1, ZNF 179 |
Белки типа «пальцы PHD» (PHF) | 138 | С-х-С-х-С-х-С-ххх-Н-хС-х-С-х-С | KDM2A, PHF1, ING1 |
- 103 046157
Содержащие домен LIM | 139 | С-х-С-х-Н-х-С-х-С-х-С-х- C-x-(C,H,D) | ZNF185, LIMK1, PXN |
Ядерные гормональные рецепторы (NR) | 140 | С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С | VDR, ESRI, NR4A1 |
«Цинковые пальцы» СССНтипа (ZC3H) | 141 | С-х-С-х-С-х-Н | RC3H1, HELZ, MBNL1, ZFP36, ZFP36L1 |
«Цинковые пальцы» FYVEтипа (ZFYVE) | 140 | С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С | ЕЕА1, HGS, PIKFYVE |
«Цинковые пальцы» ССНСтипа (ZCCHC) | 142 | С-х-С-х-Н-х-С | CNH.H., SF1,LIN28A |
«Цинковые пальцы» DHHCтипа (ZDHHC) | 143 | С-х-С-х-Н-х-С-ххх-С-хС-х-Н-х-С | ZDHHC2, ZDHHC8, ZDHHC9 |
«Цинковые пальцы» MYNDTHna(ZMYND) | 144 | С-х-С-х-С-х-С-ххх-С-х-Сх-Н-х-С | PDCD2, RUNX1T1, SMYD2, SMYD1 |
«Цинковые пальцы» RANBP2THna(ZRANB) | 145 | С-х-С-х-С-х-С | YAF2, SHARPIN, EWSR1 |
«Цинковые пальцы» ZZтипа (ZZZ) | 145 | С-х-С-х-С-х-С | HERC2, NBR1, CREBH.H. |
«Цинковые пальцы» С2НСтипа (ZC2HC) | 142 | С-х-С-х-Н-х-С | IKBKG, L3MBTL1, ZNF746 |
Содержащ. домен «цинковые пальцы» GATA (GATAD) | 145 | С-х-С-х-С-х-С | GATA4, GATA6, MT Al |
ZF класс гомеобоксы и псевдогены | 136 | С-х-С-х-Н-х-Н | ADNP, ZEB1, ZHX1 |
Содержащ. домен ТНАР (ТНАР) | 141 | С-х-С-х-С-х-Н | THAP1, THAP4, THAP11 |
- 104 046157
«Цинковые пальцы» СХХСтипа (СХХС) | 140 | С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С | СХХС1, СХХС5, MBD1, DNMT1 |
«Цинковые пальцы» SWIMтипа (ZSWIM) | 141 | С-х-С-х-С-х-Н | МАРЗК1, ZSWIM5, ZSWIM6 |
«Цинковые пальцы» AN1типа (ZFAND) | 146 | С-х-С-х-С-х-С-ххх-С-хН-х-Н-х-С | ZFAND3, ZFAND6, IGHMH.H.2 |
«Цинковые пальцы» ЗСххСтипа (Z3CXXC) | 142 | С-х-С-х-Н-х-С | ZAR1, RTP1, RTP4 |
«Цинковые пальцы» CWтипа (ZCW) | 145 | С-х-С-х-С-х-С | MORC1, ZCWPW1, KDM1B |
«Цинковые пальцы» GRFтипа (ZGRF) | 145 | С-х-С-х-С-х-С | TTF2, NEIL3, ТОРЗ А |
«Цинковые пальцы» MIZтипа (ZMIZ) | 142 | С-х-С-х-Н-х-С | PIAS1, PIAS3, PIAS4 |
«Цинковые пальцы» BEDтипа (ZBED) | 136 | С-х-С-х-Н-х-Н | ZBED1, ZBED4, ZBED6 |
«Цинковые пальцы» HITтипа (ZNHIT) | 144 | С-х-С-х-С-х-С-ххх-С-х-Сх-Н-х-С | ZNHIT3, DDX59, INO80B |
«Цинковые пальцы» MYMтипа (ZMYM) | 145 | С-х-С-х-С-х-С | ZMYM2, ZMYM3, ZMYM4 |
«Цинковые пальцы» matrinтипа (ZMAT) | 136 | С-х-С-х-Н-х-Н | ZNF638, ZMAT1, ZMAT3, ZMAT5 |
«Цинковые пальцы» С2Н2С-типа | 136 | С-х-С-х-Н-х-Н | MYT1,MYT1L, ST18 |
«Цинковые пальцы» DBFтипа (ZDBF) | 136 | С-х-С-х-Н-х-Н | DBF4, DBF4B, ZDBF2 |
«Цинковые пальцы» PARPтипа | 142 | С-х-С-х-Н-х-С | LIG3, PARP1 |
- 105 046157
Таблица 10 Аминокислотные последовательности иллюстративных ДНК-связывающих доменов типа цинковые пальцы
DBD/целево й сайт | Последовательность | SEQID NO |
eZF | LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n YKCPECGKSFS X HQRTH - TGKKTS, где η - целое число от 1 до 15 и каждый X - это последовательность распознавания, способная связываться с 3 п.н. целевой последовательности | 147 |
Целевой сайт Z1 | RSDNLVR х REDNLHT х RSDELVR х QSGNLTE х TSGHLVR х QNSTLTE, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков | 148 |
Целевой сайт Z13 | RSDNLVR х HRTTLTN х REDNLHT х TSHSLTE х QSSSLVR х REDNLHT, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков | 149 |
Целевой сайт Z14 | DPGALVR х RSDNLVR х QSGDLRR х THLDLIR х TSGNLVR х RSDNLVR, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков | 150 |
Целевой сайт Z15 | RRDELNV х RSDHLTN х RSDDLVR х RSDNLVR х HRTTLTN х REDNLHT х TSHSLTE х QSSSLVR х REDNLHT, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков | 151 |
Таблица 11
Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных последовательностей распознавания типа цинковые пальцы
Последовательность | SEQ ID NO |
RSDNLVR | 152 |
REDNLHT | 153 |
RSDELVR | 154 |
QSGNLTE | 155 |
TSGHLVR | 156 |
QNSTLTE | 157 |
DPGALVR | 158 |
HRTTLTN | 159 |
QSGDLRR | 160 |
TSHSLTE | 161 |
THLDLIR | 162 |
QSSSLVR | 163 |
TSGNLVR | 164 |
RRDELNV | 165 |
RSDDLVR | 166 |
RSDHLTN | 167 |
- 106 046157
Таблица 12
Другие раскрытые в настоящем документе нуклеотидные и аминокислотные последовательности
Описание | Последовательность | SEQ ID NO |
Домен EGR1 NLS | LH<PSRMRI<YPNRPSI< | 168 |
SV40 NLS | PKKKRKV | 169 |
Нуклеоплазми hNLS | KRPAATKKAGQAKKKK | 170 |
Тэг НА | YPYDVPDYA | 171 |
spA (синтетич. полиА) | AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGG TTTTTTGTGTGCGGACCGCACGTG | 16 |
hGH (полиА гормона роста человека) | GGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCT GGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTT GTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTA GGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTG GTATGGAGCAAGGGGCAAGTTGGGAAGACAACCTGT AGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTG CAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCC TGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTT GTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAA TTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATT GGCCAGGCTGGTCTCCAACTCCTAATCTCAGGTGATCT ACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGC GTGAACCACTGCTCCCTTCCCTGTCCTT | 17 |
Белок SCN1A | MEQTVLVPPGPDSFNFFTRESLAAIERRIAEEKAKNPKPD I<I<DDDENGPKPNSDLEAGI<NLPFIYGDIPPEMVSEPLED LDPYYINKKTFIVLNKGKAIFRFSATSALYILTPFNPLRKI AIKILVHSLFSMLIMCTILTNCVFMTMSNPPDWTKNVEY TFTGIYTFESLIKIIARGFCLEDFTFLRDPWNWLDFTVITF AYVTEFVDLGNVSALRTFRVLRALKTISVIPGLKTIVGAL IQSVKKLSDVMILTVFCLSVFALIGLQLFMGNLRNKCIQ WPPTNASLEEHSIEKNITVNYNGTLINETVFEFDWKSYIQ DSRYHYFLEGFLDALLCGNSSDAGQCPEGYMCVKAGRN PNYGYTSFDTFSWAFLSLFRLMTQDFWENLYQLTLRAA GKTYMIFFVLVIFLGSFYLINLILAVVAMAYEEQNQATLE EAEQKEAEFQQMIEQLKKQQEAAQQAATATASEHSREP S AAGRLSDS S SEASKLS SKS AKERRNRRKKRKQKEQSGG EEKDEDEFQKSESEDSIRRKGFRF SIEGNRLTYEKRYS SP HQSLLSIRGSLFSPRRNSRTSLFSFRGRAKDVGSENDFAD DEHSTFEDNESRRDSLFVPRRHGERRNSNLSQTSRSSRM LAVFPANGKMHSTVDCNGVVSLVGGPSVPTSPVGQLLP EVIIDKPATDDNGTTTETEMRKRRSSSFHVSMDFLEDPSQ RQRAMSIASILTNTVEELEESRQKCPPCWYKFSNIFLIWD CSPYWLKVKHVVNLVVMDPFVDLAITICIVLNTLFMAM EHYPMTDHFNNVLTVGNLVFTGIFTAEMFLKIIAMDPYY YFQEGWNIFDGFIVTLSLVELGLANVEGLSVLRSFRLLRV FKLAKSWPTLNMLIKIIGNSVGALGNLTLVLAIIVFIFAVV GMQLFGKSYKDCVCKIASDCQLPRWHMNDFFHSFLIVF RVLCGEWIETMWDCMEVAGQAMCLTVFMMVMVIGNL VVLNLFLALLLSSFSADNLAATDDDNEMNNLQIAVDRM HKGVAYVKRKIYEFIQQSFIRKQKILDEIKPLDDLNNKKD SCMSNHTAEIGKDLDYLKDVNGTTSGIGTGSSVEKYIIDE SDYMSFINNPSLTVTVPIAVGESDFENLNTEDFSSESDLEE | 172 |
- 107 046157
SKEKLNES S S S SEGSTVDIGAPVEEQP VVEPEETLEPEACF TEGCVQRFKCCQINVEEGRGKQWWNLRRTCFRIVEHNW FETFIVFMILLSSGALAFEDIYIDQRI<TH<TMLEYADI<VFT YIFILEMLLKWVAYGYQTYFTNAWCWLDFLIVDVSLVS LTANALGYSELGAIKSLRTLRALRPLRALSRFEGMRVVV NALLGAIPSIMNVLLVCLIFWLIFSIMGVNLFAGKFYHCI NTTTGDRFDIEDVNNHTDCLI<LIERNETARWI<NVI<VNF DNVGFGYLSLLQVATFKGWMDIMYAAVDSRNVELQPK YEESLYMYLYFVIFIIFGSFFTLNLFIGVIIDNFNQQKKKFG GQDIFMTEEQKKYYNAMKKLGSKKPQKPIPRPGNKFQG MVFDFVTRQVFDISIMILICLNMVTMMVETDDQSEYVTT ILSRINLVFIVLFTGECVLKLISLRHYYFTIGWNIFDFVVVI LSIVGMFLAELIEKYFVSPTLFRVIRLARIGRILRLIKGAK GIRTLLFALMMSLPALFNIGLLLFLVMFIYAIFGMSNFAY VKREVGIDDMFNFETFGNSMICLFQITTSAGWDGLLAPIL NSKPPDCDPNKVNPGSSVKGDCGNPSVGIFFFVSYIIISFL VVVNMYIAVILENF S VATEES AEPLSEDDFEMF YEVWEK FDPDATQFMEFEKLSQFAAALEPPLNLPQPNKLQLIAMD LPMVSGDRIHCLDILFAFTKRVLGESGEMDALRIQMEER FMASNPSKVSYQPITTTLKRKQEEVSAVIIQRAYRRHLLK RTVKQASFTYNKNKIKGGANLLIKEDMIIDRINENSITEK TDLTMSTAACPPSYDRVTKPIVEKHEQEGKDEKAKGK | ||
Белок dCAS | KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANV ENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTD HSELSGINPYEARVKGLSQKLSEEEF S A ALLHLAKRRG V HNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLER LKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQ SFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLM GHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDEN EKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKG YRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIA KILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTH NLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQ KEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIE LAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKEN AKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEV DHIIPRS VSFDNSFNNK VLVKQEE ASKKGNRTPFQ YLS S S DSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRF SVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKV KSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANAD FIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEY KEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYS TRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLL MYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYL TKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNK VVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYE VNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRV IGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIAS KTQSIKKYSTDILGNLYEVKSKKHPQIIKKG | 173 |
- 108 046157
Конструкция dCAS9-VP64 | MAPKKKRKVGIHGVPAAKRNYILGLAIGITSVGYGIIDYE TRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRH RIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSE EEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRN SKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEA KQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGS PFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLY NALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPT LKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDI TARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQ EEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIF NRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIK VINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNR QTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLE AIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEE ASKKGNRTPFQ YLS S SD SKIS YETFKKHILNL AKGKGRIS I<TI<I<EYLLEERDINRF S VQKDFINRNLVDTRYATRGLMN LLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNK GYKHHAEDALIIANADFIFKEWKKLDKAKK VMENQMFE EKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHR VDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKD NDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDE KNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLN AHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFV TVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIAS FYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYL ENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKK HPQIIKKGKRPAATKKAGQAKKKKGSYPYDVPDYALED ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDML | 174 |
Белок WT EGR3 (человека) | MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSS DSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQPAP GNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPAS GALSTQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYS EPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDY NLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAF KDKQIHPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPH ACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFS RSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI HLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA | 175 |
Белок WT EGR1 (человека) | maaakaemqlmsplqisdpfgsfphsptmdnypkleemmllsngapqflgaagap egsgsnssssssgggggggggsnsssssstfnpqadtgeqpyehltaesfpdislnnek vlvetsypsqttrlppitytgrfslepapnsgntlwpeplfslvsglvsmtnppassssap spaassasasqspplscavpsndsspiysaaptfptpntdifpepqsqafpgsagtalqy pppaypaakggfqvpmipdylfpqqqgdlglgtpdqkpfqglesrtqqpsltplstik afatqsgsqdlkalntsyqsqlikpsrmrkypnrpsktppherpyacpvescdrrfsrs deltrhirihtgqkpfqcricmrnfsrsdhltthirthtgekpfacdicgrkfarsderkrht kihlrqkdkkadksvvas sats si s syp spvatsyp spvttsyp sp attsyp spvptsfs spgsstypspvhsgfpspsvattyssvppafpaqvssfpssavtnsfsastglsdmtatf sprtieic | 176 |
- 109 046157
Линкер | GGSGGGSG | 177 |
Линкер | GGSGGGSGGGSGGGSG | 178 |
Линкер | [GGGS]n | 179 |
Линкер | [GGGGS]n | 180 |
Линкер | [GGSG]n | 181 |
Сайт распознавания для WT EGR1 или EGR3 | GCG(T/G)GGGCG | 182 |
Каркас sgRNA | GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAG GCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAG A | 183 |
Кодирующая последователь ность CREB3 человека | atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagaggaaagt ggagatttggggacggcacccgatgaggccgtgagggccccactggactgggcgctg ccgctttctgaggtGccgagcgactgggaagtagatgatttgctgtgctccctgctgagtc ccccagcgtcgttgaacattctcagctcctccaacccctgccttgtccaccatgaccacac ctactccctcccacgggaaactgtctctatggatctagagagtgagagctgtagaaaaga ggggacccagatgactccacagcatatggaggagctggcagagcaggagattgctagg ctagtactgacagatgaggagaagagtctattggagaaggaggggcttattctgcctgag acacttcctctcactaagacagaggaacaaattctgaaacgtgtgcggaggaagattcga aataaaagatctgctcaagagagccgcaggaaaaagaaggtgtaCgttgggggtttaga gagcCgggtcttgaaatacacagcccagaatatggagcttcagaacaaagtacagcttct ggaggaacagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgag atCtcaaacaaaaccagcagcagcagcacctgcatcttggtcctGctagtctccttctgc ctcctccttgtacctgctatgtactcctctgacacaagggggagcctgccagctgagcatg gagtgttgtcccgccagcttcgtgccctccccagtgaggacccttaccagctggagctgc ctgccctgcagtcagaagtgccgaaagacagcacacaccagtggttggacggctcaga ctgtgtactccaggcccctggcaacacttcctgcctgctgcattacatgcctcaggctccca gtgcagagcctcccctggagtggccCttccctgacctcttctcagagcctctctgccgag gtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttcctactggta gcccctctgtcattttgcaggacagatactcaggc | 210 |
Последователь ность АА CREB3 человека | MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWA LPLSEVP SDWE VDDLLC SLLSPP ASLNILS S SNPCLVHHD HTYSLPRETVSMDLESESCRKEGTQMTPQHMEELAEQEI ARLVLTDEEKSLLEKEGLILPETLPLTKTEEQILKRVRRKI RNKRSAQESRRKKKVYVGGLESRVLKYTAQNMELQNK VQLLEEQNLSLLDQLRKLQAMVIEISNKTS S S STCILVLL VSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALPSEDP YQLELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCLL HYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQANLTRK GGWLPTGSPSVILQDRYSG | 211 |
Человеческий С-концевой домен CREB3 с трансмембран ной областью | VYVGGLESRVLKYTAQNMELQNKVQLLEEQNLSLLDQL RKLQAMVIEISNKTS S S STCILVLLVSFCLLLVP AMYS SD TRGSLPAEHGVLSRQLRALPSEDPYQLELPALQSEVPKD STHQWLDGSDCVLQAPGNTSCLLHYMPQAPSAEPPLEW PFPDLFSEPLCRGPILPLQANLTRKGGWLPTGSPSVILQD RYSG | 225 |
Человеческий С-концевой | VYVGGLESRVLKYTAQNMELQNKVQLLEEQNLSLLDQL RKLQAMVIEIS | 226 |
- 110 046157
домен CREB3 без трансмембран ной области | ||
Кодирующая последователь ность CREB3TRE | atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagaggaaagt ggagatttggggacggcacccgatgaggccgtgagggccccactggactgggcgctg ccgctttctgaggtGccgagcgactgggaagtagatgatttgctgtgctccctgctgagtc ccccagcgtcgttgaacattctcagctcctccaacccctgccttgtccaccatgaccacac ctactccctcccacgggaaactgtctctatggatctagagagtgagagctgtagaaaaga ggggacccagatgactccacagcatatggaggagctggcagagcaggagattgctagg ctagtactgacagatgaggagaagagtctattggagaaggaggggcttattctgcctgag acacttcctctcactaagacagaggaacaaattctgaaacgtgtgcggCTTGAGCC CGGAGAGAAGCCGTACAAGTGCCCTGAGTGCGGCAA GTCTTTTAGCAGAAGAGACGAACTTAATGTCCACCAG CGAACGCATACTGGTGAAAAGCCCTATAAATGTCCTG AATGTGGGAAATCATTCTCCAGCCGCAGAACCTGTAG GGCTCACCAGCGAACACACACCGGCGAAAAACCATA CAAATGTCCAGAATGCGGGAAATCCTTTTCTCAGTCAT CCAACTTGGTGAGACATCAACGCACGCACACTGGAGA AAAGCCTTACAAATGCCCGGAATGTGGAAAGTCTTTT TCCCAATTGGCCCATTTGCGAGCCCATCAGAGGACTC ACACGGGCGAGAAACCTTACAAATGCCCGGAATGCGG GAAATCTTTTTCAACGAGTGGCAACCTCGTAAGACAC CAAAGAACGCATACAGGCGAAAAGCCATATAAGTGTC CTGAGTGTGGTAAATCATTCTCACACAGGACCACCCT GACAAATCACCAGCGCACGCACACCGGCAAGAAGAC AAGCgtgtaCgttgggggtttagagagcCgggtcttgaaatacacagcccagaatat ggagcttcagaacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactg aggaaactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcacct gcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcctctgacac aagggggagcctgccagctgagcatggagtgttgtcccgccagcttcgtgccctcccca gtgaggacccttaccagctggagctgcctgccctgcagtcagaagtgccgaaagacagc acacaccagtggttggacggctcagactgtgtactccaggcccctggcaacacttcctgc ctgctgcattacatgcctcaggctcccagtgcagagcctcccctggagtggccCttccct gacctcttctcagagcctctctgccgaggtcccatcctccccctgcaggcaaatctcacaa ggaagggaggatggcttcctactggtagcccctctgtcattttgcaggacagatactcagg c | 214 |
CREB3-TRE | MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWA LPLSEVP SDWEVDDLLC SLLSPP ASLNILS S SNPCLVHHD HTYSLPRETVSMDLESESCRKEGTQMTPQHMEELAEQEI ARLVLTDEEKSLLEKEGLILPETLPLTKTEEQILKRVRLEP GEKPYKCPECGKSFSRRDELNVHQRTHTGEKPYKCPEC GKSFS SRRTCRAHQRTHTGEKPYKCPECGKSF SQS SNLV RHQRTHTGEKPYKCPECGKSFSQLAHLRAHQRTHTGEK PYKCPECGKSFSTSGNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNHQRTHTGKKTSVYVGGLESRVLKYTAQNME LQNK VQLLEEQNLSLLDQLRKLQ AM VIEISNKT S S S STCI LVLLVSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALP SEDPYQLELPALQSEVPKDSTHQWLDGSDCVLQAPGNTS | 215 |
CLLHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQANL TRKGGWLPTGSPSVILQDRYSG |
Примеры
Следующие ниже примеры включены для дальнейшего описания некоторых аспектов настоящего раскрытия и не должны использоваться для ограничения объема настоящего изобретения.
Пример 1.
Идентификация целевых областей, способных активировать SCN1A, с использованием SCN1Aспецифических активаторов транскрипции.
Чтобы идентифицировать области генома, способные повышать экспрессию эндогенного SCN1A, разрабатывали различные сконструированные факторы транскрипции (либо нуклеазы типа цинковые пальцы, либо конструкции gRNA/daCas9), которые нацелены на различные области генома, как указано в табл. 4 и 13 выше. Для конструкций gRNA/daCas9 эта gRNA имела ту же последовательность, что и целевая область, потому что gRNA разрабатывали для нацеливания на комплементарную геномную цепь. Белок dCas9 представлял собой конструкцию dCAS9-VP64 (SEQ ID NO: 174). Клетки HEK293 культиви
- 111 046157 ровали стандартными способами и трансфицировали (FugeneHD, Promega) 3 мкг плазмиды, несущей сконструированный фактор транскрипции или контрольную конструкцию, на лунку 6-луночного планшета. Клетки трансфицировали плазмидами, экспрессирующими конструкции, указанные в табл. 13 ниже. Через 48 часов после трансфекции клетки собирали, выделяли РНК (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'-3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)). Данные представлены в виде кратных изменений относительно контрольного условия.
Результаты показаны на фиг. 1 и в табл. 13 ниже в виде кратного изменения транскрипции SCN1A относительно контрольных условий (например, репортерная конструкция EGFP-KASH). В табл. 13 приведены значения для конструкций, которые привели по меньшей мере к 1,5-кратному увеличению транскрипции по сравнению с контрольными условиями.
Таблица 13. Влияние различных целевых сайтов генома и соответствующих eTF на транскрипцию. CON указывает на конструкцию типа цинковые пальцы, которая использовалась в эксперименте (смотрите табл. 1). Для конструкций gRNA целевой сайт и последовательность gRNA являются одинаковыми, поскольку gRNA разрабатывали для нацеливания на комплементарную цепь ДНК.
Таблица13
СО N | Начальн. положени е в хромосоме 2 | Целевая последовательность | Целево й сайт с фиг. 1 | SEQ ID NO для целевое о сайта | Среднее | тзначение |
4 | 166149168 | ctaggtcaagtgtaggag | zl | 18 | 5,12090848 | 0,0096628 |
28 | 166149165 | GGTCAAGTGTAGGAGACA | z8 | 25 | 1,52068773 | 0,62403349 |
3 | 166128025 | taggtaccatagagtgag | zl3 | 30 | 25,4730028 | 0,14942042 |
29 | 166127991 | gaggatactgcagaggtc | zl4 | 31 | 8,6766618 | 0,16432794 |
166149176 | aaggctgtctaggtcaagtgt | g9 | 35 | 1,36378425 | 0,18753821 | |
166149118 | tgttcctccagattaacactt | gio | 36 | 1,63040825 | 0,46710683 | |
166128002 | gatgaagccgagaggatactg | gH | 37 | 18,7579211 | 0,13148732 | |
166128037 | gctgatttgtattaggtacca | gl2 | 38 | 22,4892633 | 0,09291316 | |
166177299 | AGAAAGCTGATACAGATACA A | gl5 | 39 | 1,7542842 | 0,34519408 | |
166178880 | ggtacgggcaaagatttcttg | gl7 | 40 | 1,36801947 | 0,48762102 | |
166177299 | AGAAAGCTGATACAGATACA A | gl9 | 41 | 1,45636874 | 0,44464045 | |
166177369 | ACACAATGAGCCACCTACAAG | g20 | 42 | 1,31187425 | 0,42605224 | |
166177362 | GTGGCTCATTGTGTGTGTGCC | g22 | 43 | 1,25217773 | 0,26572657 | |
166155264 | CATATCCCTGCAGGTTCAGAA | g24 | 44 | 1,75688991 | 0,28984533 | |
166155099 | agagagagagagagagagaga | g25 | 45 | 2,05701745 | 0,42409102 | |
166155393 | TTCTCAGTTTTGAAATTAAAA | g26 | 46 | 1,64498972 | 0,21705582 | |
166155255 | TGGATTCTCTTCTGAACCTGC | g27 | 47 | 2,27026665 | 0,43195546 | |
166148361 | TGCTGAGGCAGGACACAGTGT | g29 | 48 | 2,4290169 | 0,30364553 | |
166148843 | ATCATCTGTAACCATCAAGGA | g30 | 49 | 2,58328006 | 0,0748197 | |
166148565 | TCCTGCCTACTTAGTTTCAAG | g31 | 50 | 1,97097781 | 0,25980859 | |
166148953 | ATTACAGTTCTGTCAGCATGC | g32 | 51 | 1,34500323 | 0,32186367 | |
166149373 | TGGTCTCATTCTTTTTGTGGG | g33 | 52 | 1,71471378 | 0,32104302 | |
166142239 | CGATATTTTCATGGATTCCTT | g34 | 53 | 1,7735976 | 0,21954265 |
- 112 046157
166142391 | CTGACACTTACTTTGTCTAAA | g35 | 54 | 1,95513108 | 0,02069095 | |
166142219 | AAAACTGGAACCGCATTCCCA | g36 | 55 | 2,08698135 | 0,0454403 | |
166142396 | ACAAAGTAAGTGTCAGTGTGG | g37 | 56 | 1,30739959 | 0,72725347 | |
166142344 | ATAATAGTTGTGTCTTTATAA | g38 | 57 | 1,55783618 | 0,29846459 | |
166141162 | TGTACAAGCAGGGCTGCAAA G | g39 | 58 | 1,4663605 | 0,02946062 | |
166140590 | GTTAACAAATACACTAAACAC | g40 | 59 | 1,37399196 | 0,33638238 | |
166140928 | ttcaacaagctcccaagaagt | g42 | 60 | 1,46929899 | 0,24465271 | |
166141090 | ATGTTCAAGGTGCAGAAGGA A | g43 | 61 | 2,04547409 | 0,09880194 | |
165990246 | TGTTTGCTCAAACGTGCACCA | g44 | 62 | 2,13402102 | 0,25583999 | |
165989684 | AAATAAGACATGAAAACAAG A | g45 | 63 | 1,27016182 | 0,32368695 | |
165990193 | AAATATGTACCACAAGAAATG | g46 | 64 | 2,29522738 | 0,41829497 | |
165990076 | TATCTGGTTTCTCTCACTGCT | g47 | 65 | 1,44542116 | 0,0947106 | |
165989571 | ATTGCAAAGCATAATTTGGAT | g48 | 66 | 1,42246971 | 0,18117243 |
Пример 2.
Активация эндогенного SCN1A в клетках HEK293 с использованием специфических для SCN1A факторов транскрипции.
Клетки HEK293 культивировали стандартными способами и высевали в 6-луночные планшеты. Клетки в каждой лунке трансфицировали (FugeneHD, Promega) 3 мкг плазмиды, несущей либо единственную сконструированную конструкцию фактора транскрипции, CREB3 WT человека (SEQ ID NO: 211), либо контрольную конструкцию EGFP. Исследуемые сконструированные конструкции фактора транскрипции включали в себя: конструкции 1-27 и 46-53 (табл. 1) и плазмиду, экспрессирующую CREB3-TRE (SEQ ID NO: 215; CREB3 с ДНК-связывающим доменом bZIP, замененным синтетическим доменом ZF, нацеленным на промотор TET) (каждый исследовали отдельно). Через 48 часов после трансфекции клетки собирали и выделяли РНК (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, и относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA3' (SEQ ID NO: 188)). Данные представлены в виде кратных изменений относительно контрольного условия (смотрите фиг. 2A, фиг. 2B и фиг. 2C). Контрольная конструкция состояла из EGFP, экспрессированного под контролем RE 1 (SEQ ID NO: 1). Доставка сконструированных факторов транскрипции индуцировала различную степень активации эндогенного транскрипта SCNIA по отношению к состоянию EGFP.
Пример 3.
Активация эндогенного SCN1A в ГАМК-нейронах с использованием специфических для SCN1A факторов транскрипции.
ГАМК-нейроны iCell (Cellular Dynamics) помещали в 6-луночный планшет (~1E6 клеток/лунку) и поддерживали в соответствии с протоколом, рекомендованным производителем. Через 72 часа после посева рекомбинантный AAV (серотип AAV-DJ), экспрессирующий EGFP, или конструкцию активатора 30 на фиг. 3A, или конструкцию 25, или конструкцию 16 на фиг. 3B под контролем универсального промотора (промотор CBA) добавляли в культуральную среду приблизительно в количестве 2E11 копий генома на лунку. Через одну неделю (фиг. 3A) или две недели (фиг. 3B) после инфицирования РНК выделяли из культивированных клеток (набор Qiagen RNeasy Mini) и обрабатывали ДЦКазой. Восстановленную РНК подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве контрольного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)). Данные представлены в виде кратных изменений
- 113 046157 относительно контрольного условия (смотрите фиг. 3A и 3B). Управляемая AAV экспрессия сконструированных факторов транскрипции вызывала значительную активацию эндогенного транскрипта SCNIA в культивируемых полученных из iPS ГАМК-нейронах.
Пример 4.
Специфическая активация эндогенного SCN1A в ГАМК-нейронах с использованием специфического для SCN1A фактора транскрипции.
ГАМК-нейроны iCell (Cellular Dynamics) помещали в 6-луночный планшет (~1E6 клеток/лунку) и поддерживали в соответствии с протоколом, рекомендованным производителем. Через 72 часа после посева в культуральную среду добавляли рекомбинантный AAV (серотип AAV-DJ), экспрессирующий EGFP или активатор (конструкция 30), который содержит DBD типа цинковые пальцы, слитый с VPR TAD, управляемый промотором CBA под контролем промотора CBA приблизительно в количестве 2E11 копиях генома на лунку.
Через неделю после инфицирования РНК выделяли из культивированных клеток (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. Библиотеки RNAseq получали из восстановленной РНК с использованием набора библиотек TruSeq Stranded mRNA (Illumina) и секвенировали на Illumina NextSeq (секвенирование парных концов 2x75 циклов). Считанные данные секвенирования сопоставляли с геномом человека (RNASTAR), и анализ дифференциальной экспрессии выполняли с помощью DESeq2. Данные представлены в виде кратного изменения относительно контрольных (AAVDJ-CBA-EGFP) образцов (смотрите фиг. 4). Результаты показаны в табл. 14, а на фиг. 4 показана относительная экспрессия эндогенного SCN1A и транскриптов 40 ближайших соседних генов, представленная в виде кратных изменений относительно контрольного условия. Конструкция 30, как описано в табл. 1, была способна специфически увеличивать экспрессию гена SCN1A или белка Nav1.1 по сравнению с другими исследованными генами. Это указывает на то, что целевой сайт, распознаваемый активатором транскрипции конструкции 30, специфичен для гена SCN1A, что приводит к увеличению экспрессии гена SCNIA в нейронах ГАМК.
Таблица 14
Влияние на транскрипцию эндогенного SCN1A и 40 ближайших соседних генов в ГАМК-нейронах, обработанных специфическим для SCN1A фактором транскрипции (конструкция 30)
Название гена | Начало хром. 2 | Конец хром. 2 | Нить хромое. | Кратность изменения против контроля |
PLA2R1 | 160788518 | 160919121 | - | 0,16367458 |
ITGB6 | 160956176 | 161128399 | - | 0,20679884 |
RBMS1 | 161128661 | 161350305 | - | 1,63514667 |
TANK | 161993418 | 162092732 | + | 0,90946407 |
PSMD14 | 162164548 | 162268228 | + | 0,92699237 |
TBR1 | 162272604 | 162282381 | + | 0,53199642 |
SLC4A10 | 162280842 | 162841792 | + | 1,89407328 |
DPP4 | 162848750 | 162931052 | - | 2,82345284 |
FAP | 163027193 | 163101661 | - | 2,26977379 |
IFIHI | 163123588 | 163175213 | - | 1,46146481 |
GCA | 163175349 | 163228105 | + | 2,58702426 |
FIGN | 164449905 | 164592522 | - | 0,46785861 |
GRB14 | 165349321 | 165478358 | - | 0,5631965 |
COBLL1 | 165510133 | 165700189 | - | 0,43199257 |
SLC38A11 | 165752695 | 165812035 | - | 4,06730119 |
SCN3A | 165944031 | 166060577 | - | 1,0807866 |
SCN2A | 166095911 | 166248818 | + | 1,24475196 |
CSRNP3 | 166326156 | 166545917 | + | 0,82971233 |
GALNT3 | 166604100 | 166651192 | - | 0,33804418 |
- 114 046157
ТТС21В | 166713984 | 166810353 | - | 1,58661143 |
SCN1A | 166845669 | 166984523 | - | 62,9552975 |
SCN9A | 167051694 | 167232503 | - | 1,71659087 |
SCN7A | 167260082 | 167350757 | - | 0,29331967 |
B3GALT1 | 168675181 | 168730551 | + | 0,64436013 |
STK39 | 168810529 | 169104651 | - | 1,19821739 |
CERS6 | 169312371 | 169631644 | + | 0,86828378 |
NOSTRIN | 169643048 | 169722024 | + | 1,82142718 |
SPC25 | 169690641 | 169769881 | - | 0,86880697 |
АВСВ11 | 169779447 | 169887832 | - | 3,1441368 |
DHRS9 | 169921298 | 169952677 | + | 1,10381777 |
BBS5 | 170335687 | 170382432 | + | 0,65476347 |
KLHL41 | 170366211 | 170382772 | + | 0,87373377 |
FASTKD1 | 170386258 | 170430385 | - | 1,02786927 |
PPIG | 170440849 | 170497916 | + | 1,09866236 |
CCDC173 | 170501934 | 170550943 | - | 0,67290779 |
PHOSPHO2 | 170550974 | 170558218 | + | 0,91339152 |
KLHL23 | 170550997 | 170633499 | + | 0,73926347 |
SSB | 170648442 | 170668574 | + | 1,00631994 |
METTL5 | 170666590 | 170681441 | - | 1,21271497 |
UBR3 | 170683967 | 170940641 | + | 1,21350908 |
MYO3B | 171034654 | 171511681 | + | 0,52839217 |
Пример 5.
Экспрессия SCN1A из кассеты экспрессии in vivo.
Чтобы проверить экспрессию активаторов транскрипции SCN1A in vivo, создавали рекомбинантные векторы AAV9 компанией VectorBiolabs (Malvern, PA). Самцам мышей C57Bl/6 (N=5 на группу, возраст 7-8 недель) проводили двустороннюю инфузию 1,5 мкл очищенного вектора AAV в дорсальный гиппокамп (AP -2,0 мм, латерально ±1,5, DV -1,4 мм от твердой мозговой оболочки) и вентральный гиппокамп (AP -3,1 мм, латерально ± 2,8, DV -3,8 мм от твердой мозговой оболочки), всего 4 места инъекции. AAV доставляли со скоростью 0,3 мкл/мин с периодом отдыха 4 мин после каждой инъекции. Через четыре недели после воздействия мышей умерщвляли и иссекали ткань гиппокампа. Для каждой группы ткань левого и правого гиппокампа собирали вместе для гомогенизации у большинства животных (N=4), за исключением одного животного, у которого собирали и гомогенизировали только левый гиппокамп. РНК выделяли из гомогената (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР на экспрессию мышиного SCN1A с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: 30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 64°C, 15 секунд при температуре 72°C]. Праймеры против SCN1A мыши (5'-CAAAAAAGCCACAAAAGCCT-3' (SEQ ID NO: 189); 5'TTAGCTCCGCAAGAAACATC-3' (SEQ ID NO: 190)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A in vivo определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)).
На фиг. 5A и фиг. 5B показаны средние результаты для пяти животных, каждому из которых вводили конструкцию AAV9. Контрольная конструкция eGFP содержала репортерный трансген eGFP. Конструкция 4 (смотрите табл. 1) содержала активатор транскрипции, который распознавал целевую последовательность, содержащую SEQ ID NO: 18, как описано в табл. 1 выше. На фиг. 5A показана относительная экспрессия SCN1A in vivo. На фиг. 5B показано изменение экспрессии SCN1A in vivo в процентах от средней экспрессии eGFP. Эти результаты показали, что активатор транскрипции SCN1A экспрессионной кассеты A приводил к усилению экспрессии SCNIA приблизительно на 20-30% in vivo.
Такие кассеты экспрессии могут быть адаптированы для применения на людях для лечения синдрома Драве, эпилепсии, судорог, болезни Альцгеймера, болезни Паркинсона и/или любых других заболеваний или состояний, связанных с дефицитом и/или нарушением активности SCN1A.
- 115 046157
Пример 6.
Анализ гипертермических припадков (HTS) на мышах с синдромом Драве.
A. Гетерозиготная модель мыши с нокаутом Scn1a.
Лечение синдрома Драве и/или его симптомов с использованием кассет экспрессии исследовали на линии мышей Scn1atm1Kea Эта линия мышей представляет собой признанную мышиную модель для синдрома Драве. Линии мыши Scn1atm1Kea не требуют рекомбиназы CRE. Мышь Scn1atm1Kea (доступная из лаборатории the Jackson Laboratory; описанная в Hawkins et al., Scientific Reports, vol. 7: 15327 (2017)) содержит делецию первого кодирующего экзона SCN1A. Мыши, гомозиготные по аллелю нокаута SCN1A, характеризуются тремором, атаксией, припадками и умирают к 16-му дню после рождения. У гетерозиготных мышей на фоне C57BL/6 развиваются спонтанные припадки, и большая часть их умирает в течение нескольких недель. Такая линия мышей может быть использована для изучения безопасности и эффективности лечения эпилепсии и синдрома Драве. См. Miller et al., Genes Brain Behav. 2014 Feb;13(2):163-72 для дополнительной информации.
Чтобы исследовать эффективность активаторов транскрипции в линии мышей Scn1atm1Kea, в пометы детенышей, полученных от самцов Scn1a +/-, скрещенных с самками C57Bl/6J, вводили вектор AAV посредством двусторонней ICV в точке P1. Мышам вводили дозы конструкций 31-34 (табл. 1). Мышей оставляли без воздействий вместе с их матерью до отлучения в P18, а затем снова не трогали до P26-P28, когда начинали анализ гипертермического припадка (HTS). Отдельные пометы мышей, которым вводили дозу в P1, отсеивали на P18 и ежедневно наблюдали за смертностью. Индукцию гипертермического припадка проводили у гетерозиготных (HET) мышей и мышей WT Scn1a на смешанном фоне 129Stac X C57BL/6 в P26-P28. Перед исследованием мышам вставляли смазанный ректальный датчик температуры (Ret-4) и подсоединяли к модулю контроля температуры (TCAT 2DF, Physitemp), который был последовательно соединен с нагревательной лампой (HL-1). Затем мышей помещали в большой стеклянный стакан и на короткое время давали уравновеситься с окружающей средой. После этого температура тела повышалась на ~0,5°C каждые 2 минуты до начала первого тонико-клонического припадка, сопровождающегося потерей положения стоя или до достижения температуры 43°C. Если у мыши случался припадок с потерей положения тела, эксперимент заканчивали и регистрировали внутреннюю температуру тела мыши. Если в течение всего эксперимента не было обнаружено приступов с потерей положения тела, эта мышь считалась без припадков, и анализ завершали. Образцы тканей получали от мышей в точке P1, a генотипирование мышей выполняли в ходе эксперимента с использованием ПЦР в реальном времени. После завершения анализа генотипирование было не слепым, и статус мышей как HET или WT коррелировал с полученными данными. Данные наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью теста Мантеля-Кокса. Результаты показаны в табл. 15 и 16 и на фиг. 6A-E.
Таблица 15
Обобщение условий, использованных в примере 6
Конструкция | Дозировка (копии генов/мышь) |
Конструкция 31 (фиг. 6А и 6Е)) | 6,0Е+10 |
Конструкция 32 (фиг. 6В, 6D, 6Е) | 3,1Е+11 |
Конструкция 33 (фиг. 6С) | 5,8Е+10 |
Конструкция 34 (фиг. 6D) | 4,9Е+13 |
Таблица 16
Обобщение результатов анализа на гипертермические припадки
Конструкция eTF (FIG.) | Кол-во контрольных животных (обработ. PBS) | Кол-во обработанных животных | % без припадков при темп. 42,6°С | Рзначение |
Репортер EGFP | 16 | N/A | 44% | |
Конструкция 31 (фиг. 6А и 6Е)) | 16 | 18 | 95 | Р<0,0001 |
Конструкция 32 (фиг. 6В, 6D, 6Е) | 16 | 21 | 76 | Р<0,05 |
Конструкция 33 (фиг. 6С) | 16 | 14 | 93 | Р<0,001 |
Конструкция 34 (фиг. 6D) | 16 | 12 | 83 | Р<0,05 |
Дополнительные эксперименты проводили на мышах Scn1atm1Kea, как описано выше, чтобы проверить влияние конструкций 42 и 43 на припадки в анализе HTS. В этих экспериментах конструкцию 42 вводили в дозе 9x1010 копий генома/мышь посредством двусторонней ICV в P1, а конструкцию 43 вводили в дозе 6x1010 копий генома/мышь посредством двусторонней ICV в P1 или P5. Результаты показаны на фиг. 6F (конструкция 42) и фиг. 6G (конструкция 43). Обе конструкции показали значительное снижение припадков по сравнению с контрольными EGFP (P<0,0001 как для конструкции 42, так и для конструкции 43).
- 116 046157
B. Гетерозиготная мутантная модель мыши ScnlaRX.
Лечение синдрома Драве и/или его симптомов с использованием кассеты экспрессии по настоящему раскрытию исследовали на линии мышей Scn1aRX. Эта линия мышей представляет собой признанную модель мышей для синдрома Драве. Линии мыши Scn1aRX не требуют рекомбиназы CRE. Мышь Scn1aRX (доступная из лаборатории Jackson Laboratory; описанная в Ogiwara et al., J. Neuroscience, vol. 27: 59035914 (2007)), содержит нонсенс-мутацию с потерей функции в экзоне 21 гена SCN1A (CgG на TgA; R1407X). У гетерозиготных мышей на фоне C57BL/6 развиваются спонтанные припадки, и большой процент мышей умирает в течение нескольких недель.
Для проверки эффективности активаторов транскрипции в линии мышей Scn1aRX в пометы детенышей, полученных от скрещивания посредством ЭКО сперматозоидов самцов Scn1aRX/+ с яйцеклеткой C57Bl/6J с эмбрионами, имплантированными самкам CD-1, вводили вектор AAV (конструкция 31) в дозе 5,1х1010 копий генома ^сУмышь или контроль PBS посредством двусторонней ICV в P1. Мышей оставляли без воздействий вместе с их матерью до отлучения в P18, а затем снова оставляли без воздействий до P26-P28, когда начинали анализ HTS. Отдельные пометы мышей, которым вводили дозу в P1, осматривали в P18 и ежедневно наблюдали за смертностью. Индукцию гипертермического припадка проводили у гетерозиготных (HET) мышей P26-P28 и мышей WT Scn1a на фоне C57BL/6. Перед исследованием мышам вставляли смазанный ректальный датчик температуры (Ret-4) и подсоединяли к модулю контроля температуры (TCAT 2DF, Physitemp), который был последовательно соединен с нагревательной лампой (HL-1). Затем мышей помещали в большой стеклянный стакан и на короткое время давали уравновеситься с окружающей средой. После этого температура тела повышалась на ~0,5°C каждые 2 минуты до начала первого тонико-клонического припадка, сопровождающегося потерей положения тела, или до достижения температуры 43°C. Если у мыши случался припадок с потерей положения тела, эксперимент заканчивали и регистрировали внутреннюю температуру тела мыши. Если в течение всего эксперимента не было обнаружено припадков с потерей положения тела, эта мышь считалась без припадков, и анализ завершался. Образцы тканей получали от мышей в точке P1, и генотипирование мышей выполняли в ходе эксперимента с использованием ПЦР в реальном времени. После завершения анализа генотипирование было не слепым, и статус мышей как HET или WT коррелировал с полученными данными. Ни у одной из исследованных мышей WT Scna1 не было припадка. Данные для мышей HET, обработанных конструкцией 31 (n=13) и обработанных PBS контролем (n=14), наносили на кривую выживаемости Каплана-Мейера, и значимость определяли с помощью критерия Кокса-Мантеля. Как показано на фиг. 6H, мыши HET, обработанные конструкцией 31, показывают значительное снижение индукции гипертермического припадка по сравнению с мышами HET, получавшими контрольный PBS (P<0,01).
Пример 7.
Анализ выживаемости на мышиной модели синдрома Драве.
A. Гетерозиготная модель мыши с нокаутом Scn1a.
Для проверки эффективности активаторов транскрипции в линии мышей Scn1atmlKea в пометы детенышей, полученных от самцов Scn1a +/-, скрещенных с самками C57Bl/6J, вводили вектор AAV посредством двусторонней ICV в точке P1. Мышей не оставляли без воздействия с их матерью до отлучения. Наблюдение за состоянием здоровья мышей Scn1a +/- проводили ежедневно после отлучения в P18. Мышам, которые были найдены мертвыми в своей домашней клетке по любой причине, была записана дата. Данные наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью критерия Кокса-Мантеля.
Результаты показаны в табл. 17 и на фиг. 7A-D.
Таблица 17
Обобщение условий и результатов анализа выживаемости
SEQ ID | Дозировка (gc/мышь) | Кол-во контрольных животных (обработ. PBS) | Кол-во обработанных животных | % выживших в Р100 (*в Р83) | Рзначение |
PBS | N/A | 53 | N/A | 49% | |
Конструкция 33 (фиг. 7С и 7D) | 5,8Е+10 | 53 | 29 | 76% | Р<0,05 |
Конструкция 31 (фиг. 7В и 7D) | 6,0Е+10 | 53 | 34 | 97% | Р<0,0001 |
_~ .RX
B. Гетерозиготная модель мутантной мыши Scn1a .
Чтобы проверить эффективность активаторов транскрипции в линии мышей Scn1aRX, в пометы детенышей, полученных от самцов и скрещивания ЭКО сперматозоидов Scn1aRX/+ с яйцеклетками C57Bl/6J, в эмбрионы, имплантированных самками CD-1, вводили вектор AAV (конструкция 31) при 5,1х1010 копий генома ^сУмышь или контроль PBS посредством двусторонней ICV в P1. Мышей оставляли без воздействия с их матерью до отлучения. Наблюдение за состоянием здоровья мышей Scn1a
- 117 046157
RX/+ проводили ежедневно после отлучения в P18. Мышам, которые были найдены мертвыми в своей домашней клетке по любой причине, была записана дата. Данные для обработанных конструкцией 31 (n=27) и обработанных контролем (n=18) наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью критерия Кокса-Мантеля.
Как показано на фиг. 7E, мыши Scn1aRX/+, получившие конструкцию 31, характеризовались повышенной выживаемостью по сравнению с мышами Scn1aRX/+, получавшими контрольный PBS (P<0,0001).
Пример 8.
Уровни транскрипции SCN1A у отличных от человека приматов после лечения AAV, кодирующим специфический фактор транскрипции SCN1A.
В исследовании использовали самцов яванского макака (macaca fascicularis) в возрасте от 2 до 3 лет. Животных перед включением в исследование предварительно проверяли на наличие перекрестнореактивных антител к AAV9 с помощью клеточного анализа нейтрализующих антител. AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (конструкция 33), или контроль разводили в PBS и вводили интрапаренхимально в концентрации 1,2E12 gc/животное. Для инъекций определяли три различных стереотаксических координаты в каждом полушарии, шесть участков инъекции на животное. В каждую точку вводили объем 10 мкл. Инъекции в правое полушарие были симметричны левым. Два необработанных животных использовали в качестве контроля.
Для оценки экспрессии мРНК Scn1A проводили обратную транскрипцию с последующим способом кПЦР. При вскрытии трупа через 28 дней после введения дозы срезы тканей из различных областей головного мозга (лобная кора, теменная кора, височная кора, затылочная кора, гиппокамп, продолговатый мозг, мозжечок; по 200 мг каждого) от контрольных и обработанных животных собирали в RNAlater, а затем замораживали. Вкратце, иссекали 30 мг ткани, экстрагировали РНК (с помощью мини-набора для ткани Qiagen Rneasy Lipid, номер по каталогу 1023539), преобразовывали в кДНК путем обратной транскрипции (с использованием набора для обратной транскрипции кДНК высокой емкости Applied Biosystems, номер по каталогу 4368814) и проводили кПЦР с использованием набора праймеров/зондов для Scn1A и гена домашнего хозяйства GAPDH (Applied Biosystems, номер по каталогу Rh02621745-gI FAM).
Наборы праймеров/зондов для SCNIA приведены ниже.
Таблица 18
Последовательности праймеров, использованные в примере 8
Ген | SEQ ID NO | Последовательность (5’-3’) | Примечание |
ScnlA | 191 | CCATGGAACTGGCTCGATTTCAC | F-праймер |
192 | ATTGGTGGGAGGCCACTGTAT | R-праймер | |
193 | AGGCCTGAAAACCATTGTGGGAGCCCT | Зонд (FAM) |
Экспрессию гена Scn1A в каждом исследуемом образце определяли относительным количественным анализом (RQ) с использованием способа сравнительного Ct (ΔΟ). Этот способ измеряет разность Ct (ΔΟ0 между целевым геном и геном домашнего хозяйства, а затем сравнивает значения ΔΟ образцов для лечения с контрольными образцами.
ACt = среднее Ct целевого гена - среднее Ct гена домашнего хозяйства.
ΔΔ(ΐ = Δ(ΐ образца лечения - Δ(ΐ контрольного образца.
Относительная экспрессия (образец лечения) = 2 - ΔΔ(ΐ
Данные представлены в виде нормализованной экспрессии целевой мРНК в различных тканях головного мозга (см. фиг. 8). Как показано на фиг. 8, участки головного мозга, проксимальные к участкам интрапаренхиматозных инъекций, показали самые высокие уровни экспрессии транскрипта SCN1A.
Пример 9.
Селективная экспрессия трансгена в PV-содержащих нейронах у отличных от человека приматов после лечения AAV, имеющего селективный в отношении PV промотор и сайт связывания микроРНК.
В исследовании использовали шесть мартышек (Callithrix jacchus), которых предварительно проверяли на перекрестно-реактивные антитела к AAV9 перед включением в исследование. Двум обезьянам вводили AAV9, содержащий трансген EGFP под контролем промотора EF1alpha, двум обезьянам вводили AAV9, содержащий трансген EGFP, под контролем RE 2 (SEQ ID NO: 2), и двум обезьянам вводили AAV9, содержащий трансген EGFP под контролем RE 2 (SEQ ID NO: 2), а также содержащий сайт связывания микроРНК (SEQ ID NO: 7), расположенный между кодирующей областью EGFP и полиАхвостом. Векторы AAV9 разводили в PBS и животным вводили три внутримозговые инъекции (2 мкл каждая) в гиппокамп/энторинальную кору каждого полушария, всего 6 участков инъекции на животное. Два животных получали вектор AAV9, содержащий EF1alpha-EGFP, каждое получило общую дозу 5,8E+11 копий генома/животное, два животных получали вектор AAV9, содержащий RE 2-EGFP, каждое получило общую дозу 3,0E+11 копий генома/животное, и два животных получали вектор AAV9, содержащий RE 2 + m1-EGFP, каждое получило общую дозу 2,3E+11 копий генома/животное.
- 118 046157
Иммуногистохимию использовали для оценки селективной экспрессии парвальбумина (PV). При вскрытии трупа, через 28 дней после введения дозы, собирали срезы тканей из различных областей головного мозга. Плавающие срезы головного мозга мартышек (35 мкм) фиксировали в 4% параформальдегиде, блокировали буфером (PBS, 3% BSA, 3% ослиная сыворотка, 0,3% Triton-X 100, 0,2% Tween-20), а затем окрашивали анти-GFP (Abcam ab290) ,а затем вторичным антителом, конъюгированным с Alexa488 (Thermo A21206). За этим последовали антитело к PV (Swant) и вторичное антитело, конъюгированное с Alexa-647 (Thermo A31571) и 4',6-диамидино-2-фенилиндолом (DAPI). Срезы монтировали и визуализировали с помощью PerkinElmer Vectra3.
Результаты показаны на фиг. 9A-F и 10A-L.
Пример 10.
Биораспространение eTFSCN1A
Целью этого исследования было сравнить биораспределение eTFSCN1A в центральной нервной системе (ЦНС) молодых обезьян яванского макака при введении в дозе 4,8E+13 посредством односторонней интрацеребровентрикулярной (ICV) инъекции. Каждому животному инъецировали AAV9, содержащий кассету экспрессии, кодирующую eTFSCN1A, под контролем селективного регуляторного элемента ГАМК (GABA) (REGABA-eTFSCN1A). Частицы AAV9 составляли в PBS + 0,001% плюроновой кислоты и вводили в дозе 4,8E+13 или 8E+13 vg/животное. Каждому животному вводили 2 мл приготовленных вирусных частиц. Дизайн исследования представлен в табл. 19.
Яванских макаков в возрасте двадцать четыре месяца группировали, как указано в табл. 19. Перед началом исследования образцы крови животных исследовали на уровни титра нейтрализующих антител к AAV9 с использованием анализа титра NAb, описанного выше. Для исследования выбирали животных с низкими или отрицательными результатами на антитела. Образцы вводили посредством инъекции ICV с использованием стандартных хирургических процедур. Размороженный дозируемый материал ненадолго хранили на влажном льду и нагревали до комнатной температуры непосредственно перед дозированием. Животных анестезировали, готовили к операции и помещали в стереотаксическую рамку, совместимую с MPT (Kopf). Для определения координат цели выполняли базовую МРТ. Делали разрез и просверливали одно отверстие в черепе над целевым участком. Шприц BD объемом 3 мл, прикрепленный к набору удлинителей с микроканальным отверстием длиной 36 дюймов, подготавливали с образцом и помещали в инфузионный насос. Линию экстензии примировали. Твердую мозговую оболочку открывали, и дозирующую иглу продвигали на глубину от 13,0 до 18,1 мм от мягкой мозговой оболочки. Инъекцию контрастного вещества и рентгеноскопию использовали для подтверждения введения спинномозговой иглы в правый боковой желудочек. В иглу Quinke BD размером 3,0 дюйма 22 г для спинномозговой хирургии добавляли контраст, чтобы определить ее расположение, перед тем, как прикрепить заправленную линию экстензии и шприц. Настройки насоса составляли 0,1 мл/мин в течение 19-20 минут. Буфер вводили вручную после введения дозы, чтобы очистить линию экстензии. Иглу оставляли на месте в течение 1-2 минут после завершения инфузии, а затем иглу извлекали. Носитель и исследуемое вещество вводили один раз в день 1, и субъектов поддерживали в течение 27- или 29-дневного периода восстановления.
Таблица 19
Дизайн исследования биораспределения
Группа | Пол | ID | Доза (VG/животное) |
Группа 1 (контроль-буфер) | М | 21001 | |
Ж | 11501 | ||
Группа 2 (REGABA-eTFSCN1A) | м | 2001 | 4,8Е+13 |
ж | 2501 | 4,8Е+13 | |
м | 3001 | 4,8Е+13 | |
м | 3002 | 8Е+13 |
После введения дозы за животными регулярно наблюдали на протяжении всего исследования, и периодически отбирали образцы крови. Введение eTFSCN1A не было связано с неожиданной смертностью, клиническими данными или макроскопическими наблюдениями. Животные, получившие AAV9-REgabaeTFSCN1A, выживали до запланированного вскрытия трупа на 28 ± 2 дня. Никаких клинических или поведенческих признаков, повышения температуры тела или снижения массы тела во время ежедневных или еженедельных медицинских осмотров не наблюдалось. Временное повышение печеночных трансаминаз (АЛТ и ACT) у животных, получавших AAV9-REGABA-eTFSCN1A, наблюдалось, но полностью исчезало к концу исследования без иммуномодуляции, и не было отмечено сопутствующего повышения сывороточного билирубина или щелочной фосфатазы. Ни один из других измеренных результатов клинической химии не был выдающимся. В гистопатологических исследованиях печени не сообщалось о микроскопических наблюдениях. Лейкоциты CSF были повышены при окончательном сборе по сравнению со значениями до воздействия, но сравнимы между контрольными животными и животными, получившими AAV9-REGABA-eTFSCN1A Плеоцитоза, связанного с AAV9-REGABA-eTFSCN1A, не наблюдалось. Макрообследование и подробное микрогистопатологическое исследование ненейрональных тканей у всех животных не было примечательным. Ткани включали в себя основные периферические органы (например,
- 119 046157 сердце, легкие, селезенку, печень и гонады). Макрообследования и подробная микрогистопатология нейрональных тканей не показали каких-либо заметных результатов. Ткани включали в себя головной, спинной мозг и связанные с ним межпозвонковые узлы (из шейного, грудного и поясничного отделов).
Исследования проводились тремя независимыми патологами, в том числе одним в специализированном центре невропатологии.
ICV введение AAV9 не предотвращало постдозовый иммунный ответ в сыворотке, поскольку через четыре недели после введения дозы наблюдались нейтрализующие антитела к капсиду AAV9. Однако уровни нейтрализующих антител к AAV9 в CSF оставались неизменными и сравнимыми с уровнями до введения дозы (табл. 20).
Таблица 20
Титр сывороточных NAb к AAV9
Номер субъекта | Титр сывороточных NAb к AAV9 | Титр NAb CSF к AAV9 | |||
До скрининга | При инъециров. | Через 4 недели после инъециров. | При инъециров. | Через 4 недели после инъециров. | |
21001 | 1:5 | < 1:5 | < 1:5 | < 1:5 | < 1:5 |
11501 | < 1:5 | < 1:5 | < 1:5 | < 1:5 | < 1:5 |
2001 | < 1:5 | < 1:5 | 1:405 | < 1:5 | 1:5 |
2501 | < 1:5 | < 1:5 | 1:135 | < 1:5 | 1:5 |
3001 | < 1:5 | < 1:5 | 1:1215 | < 1:5 | < 1:5 |
3002 | < 1:5 | < 1:5 | 1:135 | < 1:5 | < 1:5 |
Образцы собирали через 27-29 дней после введения дозы из основных органов (желудочков сердца, долей печени, долей сердца легких, почек, селезенки, поджелудочной железы и шейных лимфатических узлов) во время плановой некроскопии. Прицельную биопсию собирали с помощью восьмимиллиметровых биопсийных щипцов и обрабатывали, как описано ниже.
Пример 11.
Биораспределение eTFSCN1A в головном мозге.
ddPCR использовали для измерения биораспределения eTFSCN1A в головном мозге. Образцы из различных областей ткани головного мозга яванского макака (FC: лобная кора; PC: теменная кора; TC: височная кора; Hip: гиппокамп; Med: продолговатый мозг; OC: затылочная кора) измеряли на количество копий вектора для оценки биораспределения eTFSCN1A под контролем селективного регуляторного элемента ГАМК (REGABA-eTFSCN1A) при введении AAV9 посредством односторонней ICV. Тканевую ДНК выделяли с помощью наборов DNeasy Blood & Tissues (Qiagen). Количество ДНК определяли и нормализовали с помощью УФ-спектрофотометра. 20 нанограмм тканевой ДНК добавляли к реакционной смеси объемом 20 микролитров вместе с ddPCR Super Mix for Probes (без dUTP) (Bio-Rad) и праймерами TaqMan и зондами, направленными против областей последовательности eTFSCN1A. Создавали капли и амплифицировали шаблоны с использованием автоматического генератора капель и термоциклера (BioRad). После этапа ПЦР планшет загружали и считывали с помощью QX2000 Droplet Reader для определения числа копий вектора в тканях. Ген обезьяньего альбумина (MfAlb) служил внутренним контролем для нормализации содержания геномной ДНК и был амплифицирован в той же реакции. Праймеры и зонды для eTFSCN1A и MfAlb представлены в табл. 21.
Таблица 21
Праймеры и зонды для eTFSCN1A и MfAlb
Название праймеров/зонда gTpSCNIA MfAlbumin | Прямой праймер eypSCNlA Обратный праймер eTFSCNlA Зонд eTFSCN1A Прямой праймер MfAlb Обратный праймер MfAlb Зонд MfAlb | Последовательность (5’-3') GAATGTGGGAAATCATTCAGTCGC (SEQ ID NO: 194) GC AAGTTATCCTCTCGTGAGAAGG (SEQ ID NO: 195) GCGACAACCTGGTGAGACATCAACGCACC (SEQ ID NO: 196) GCTGTTATCTCTTGTGGGCTGT (SEQ ID NO: 197) AAACTCATGGGAGCTGCCGGTT (SEQ ID NO: 198) CCACACAAATCTCTCCCTGGCATTG (SEQ ID NO: 199) |
eTFSCN1A широко распределялся по всему головному мозгу при дозировке 4,8E+13 вирусных геномов на животное со средним значением 1,3-3,5 вирусных геномов/диплоидный геном (фиг. 11). Кроме того, при сравнении переноса гена по всему головному мозгу REGABA-eTFSCN1A, после дозированного вве- 120 046157 дения 4,8E+13 вирусных геномов на животное, с переносом гена через головной мозг eGFP, веденного посредством ICV в различных дозах, увеличение вирусного генома/диплоидного генома наблюдалось с увеличением дозы. Это указывает на то, что перенос гена в головном мозге происходит дозозависимым образом при введении в AAV9 через ICV.
Пример 12.
Транскрипция eTFSCN1A в головном мозге.
Транскрипцию eTFSCN1A под контролем селективного регуляторного элемента ГАМК, REGABA (REGABA-eTFSCN1A), оценивали путем измерения мРНК eTFSCN1A с использованием анализа экспрессии генов на основе ddPCR. Тканевую РНК выделяли с помощью наборов RNeasy Plus Mini (Qiagen) или RNeasy Lipid Tissue Mini (Qiagen) для тканей головного мозга. Количество РНК определяли и нормализовали с помощью УФ-спектрофотометра, а качество РНК (RIN) проверяли с помощью Bioanalyzer RNA Chip. Один микрограмм тканевой РНК использовали для обработки ДНКазой и синтеза кДНК с помощью набора для синтеза кДНК SuperScript VILO с наборами ферментов ezDNase™ (Thermo Fisher). 50 микрограммов РНК преобразовывали в кДНК. кДНК добавляли в реакционную смесь объемом 20 микролитров вместе с ddPCR Super Mix for Probes (без dUTP) (Bio-Rad) и праймерами и зондами TaqMan, направленными против областей последовательности eTFSCN1A (табл. 22). Создавали капли и амплифицировали шаблоны с использованием автоматического генератора капель и термоциклера (Bio-Rad). После ПЦР-амплификации планшет загружали и считывали с помощью QX2000 Droplet Reader, чтобы получить уровни экспрессии генов в тканях. Ген обезьяны ARFGAP2 (MfARFGAP2) (Thermo Fisher Scientific) служил эндогенным контролем для нормализации уровней экспрессии гена и был амплифицирован в той же реакции. Среднее количество транскриптов для ARFGAP2 составляло 1,85E+6 мкг РНК (фиг. 12, верхняя граница). Предел обнаружения обозначен нижней границей.
мРНК eTFSCN1A наблюдалась по всему головному мозгу у всех животных, что указывает на то, что ГАМК-селективный промотор, REGABA, был транскрипционно активен в ткани головного мозга для всех макак, получивших AAV9-REGABA-eTFSCN1A (фиг. 12). FC: лобная кора; PC: теменная кора; TC: височная кора; Hip: гиппокамп; Med: продолговатый мозг; OC: затылочная кора.
Таблица 22 и зонды областей последовательности eTFSCN1A
Название праймеров/зонда | Описание | Последовательность (5'-3') |
eypSCNlA | Прямой праймер eTFSCNlA | GAATGTGGGAAATCATTCAGTCGC (SEQ Ш NO: 200) |
Обратный праймер eTFSCNlA | GCAAGTTATCCTCTCGTGAGAAGG (SEQ Ш NO: 201) | |
Зонд eTFSCN1A | GCGACAACCTGGTGAGACATCAACGCACC (SEQIDNO: 202) | |
MSARFGAP2 | Прямой, обратный праймеры, зонд | Thermo Fisher (номер в каталоге: 4448491) |
Пример 13.
Биораспределение и транскрипция eTFSCN1A в периферических тканях.
Число копий вектора дополнительно измеряли в различных органах для оценки трансдукции REGABA-eTFSCN1A в тканях по всему организму при введении AAV9 посредством односторонней ICV. Уровни транскрипции eTFSCN1A также измеряли с помощью ddPCR для оценки транскрипционной активности eTFSCN1A под контролем GABA-селективного регуляторного элемента REGABA в тканях по всему организму при введении в AAV9 посредством односторонней ICV. Оба способа выполняли, как в общем описано выше. Трансдукция REGABA-eTFSCN1A и транскрипция eTFSCN1A в спинном мозге (SC) и межпозвонковом узле (DRG) были сопоставимы с уровнями, наблюдаемыми в головном мозге. За исключением печени, трансдукция REGABA-eTFSCN1A была ниже в периферических тканях за пределами головного мозга (фиг. 13). Трансдукция REGABA-eTFSCN1A в печени была выше, чем в головном мозге. Транскрипция eTFSCN1A не была обнаружена в периферических тканях, включая в себя сердце, легкие и гонады. Однако уровни транскрипта eTFSCN1A в печени были сопоставимы с уровнями eTFSCN1A, измеренными в головном мозге. Кроме того, транскрипция eTFSCN1A в печени является чрезвычайно низкой, если ее нормализовать по количеству присутствующих копий вектора (приблизительно в 1000 раз ниже по сравнению с транскрипцией eTFSCN1A в головном мозге). В целом это продемонстрировало, что транскрипция eTFSCN1A под контролем ГАМК-селективного регуляторного элемента REGABA ограничена ЦНС.
- 121 046157
Перечень последовательностей <110> ИНКОУДИД ТЕРАПЬЮТИКС, ИНК.
<120> КОМПОЗИЦИИ И СПОСОБЫ СЕЛЕКТИВНОЙ РЕГУЛЯЦИИ ЭКСПРЕССИИ ГЕНОВ <130> 46482-724.601 <140>
<141>
<150> 63/008,569 <151> 2020-04-10 <150> 62/857,727 <151> 2019-06-05 <150> 62/854,238 <151> 2019-05-29 <160> 226 <170> PatentIn version 3.5 <210> 1 <211> 259 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 1 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg180 tgggaggtct atataagcag agctggtacc gtgtgtatgc tcaggggctg ggaaaggagg240 ggagggagct ccggctcag259 <210> 2 <211> 2051 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 2 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240
- 122 046157
gtgtgagccc | agatgaggtt | cagctgccaa | ctttctcttt | cacatcttat | gaaagtcatt | 300 |
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
cccagctaat | ttttgtattt | ttaatagata | cgggggtttc | accatatcac | ccaggctggt | 540 |
ctcgaactcc | tggcctcaag | tgatccacct | gcctcggcct | cccaaagtgc | tgggattata | 600 |
ggcgtcagcc | actatgccca | acccgaccaa | ccttttttaa | aataaatatt | taaaaaattg | 660 |
gtatttcaca | tatatactag | tatttacatt | tatccacaca | aaacggacgg | gcctccgctg | 720 |
aaccagtgag | gccccagacg | tgcgcataaa | taacccctgc | gtgctgcacc | acctggggag | 780 |
agggggagga | ccacggtaaa | tggagcgagc | gcatagcaaa | agggacgcgg | ggtccttttc | 840 |
tctgccggtg | gcactgggta | gctgtggcca | ggtgtggtac | tttgatgggg | cccagggctg | 900 |
gagctcaagg | aagcgtcgca | gggtcacaga | tctgggggaa | ccccggggaa | aagcactgag | 960 |
gcaaaaccgc | cgctcgtctc | ctacaatata | tgggaggggg | aggttgagta | cgttctggat | 1020 |
tactcataag | accttttttt | tttccttccg | ggcgcaaaac | cgtgagctgg | atttataatc | 1080 |
gccctataaa | gctccagagg | cggtcaggca | cctgcagagg | agccccgccg | ctccgccgac | 1140 |
tagctgcccc | cgcgagcaac | ggcctcgtga | tttccccgcc | gatccggtcc | ccgcctcccc | 1200 |
actctgcccc | cgcctacccc | ggagccgtgc | agccgcctct | ccgaatctct | ctcttctcct | 1260 |
ggcgctcgcg | tgcgagaggg | aactagcgag | aacgaggaag | cagctggagg | tgacgccggg | 1320 |
cagattacgc | ctgtcagggc | cgagccgagc | ggatcgctgg | gcgctgtgca | gaggaaaggc | 1380 |
gggagtgccc | ggctcgctgt | cgcagagccg | aggtgggtaa | gctagcgacc | acctggactt | 1440 |
cccagcgccc | aaccgtggct | tttcagccag | gtcctctcct | cccgcggctt | ctcaaccaac | 1500 |
cccatcccag | cgccggccac | ccaacctccc | gaaatgagtg | cttcctgccc | cagcagccga | 1560 |
aggcgctact | aggaacggta | acctgttact | tttccagggg | ccgtagtcga | cccgctgccc | 1620 |
gagttgctgt | gcgactgcgc | gcgcggggct | agagtgcaag | gtgactgtgg | ttcttctctg | 1680 |
gccaagtccg | agggagaacg | taaagatatg | ggcctttttc | cccctctcac | cttgtctcac | 1740 |
caaagtccct | agtccccgga | gcagttagcc | tctttctttc | cagggaatta | gccagacaca | 1800 |
acaacgggaa | ccagacaccg | aaccagacat | gcccgccccg | tgcgccctcc | ccgctcgctg | 1860 |
cctttcctcc | ctcttgtctc | tccagagccg | gatcttcaag | gggagcctcc | gtgcccccgg | 1920 |
ctgctcagtc | cctccggtgt | gcaggacccc | ggaagtcctc | cccgcacagc | tctcgcttct | 1980 |
ctttgcagcc | tgtttctgcg | ccggaccagt | cgaggactct | ggacagtaga | ggccccggga | 2040 |
cgaccgagct g 2051
- 123 046157 <210> 3 <211> 1878 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 3 tcaacagggg | gacacttggg | aaagaaggat | ggggacagag | ccgagaggac | tgttacacat | 60 |
tagagaaaca | tcagtgactg | tgccagcttt | ggggtagact | gcacaaaagc | cctgaggcag | 120 |
cacaggcagg | atccagtctg | ctggtcccag | gaagctaacc | gtctcagaca | gagcacaaag | 180 |
caccgagaca | tgtgccacaa | ggcttgtgta | gagaggtcag | aggacagcgt | acaggtccca | 240 |
gagatcaaac | tcaacctcac | caggcttggc | agcaagcctt | taccaaccca | cccccacccc | 300 |
acccaccctg | cacgcgcccc | tctcccctcc | ccatggtctc | ccatggctat | ctcacttggc | 360 |
cctaaaatgt | ttaaggatga | cactggctgc | tgagtggaaa | tgagacagca | gaagtcaaca | 420 |
gtagatttta | ggaaagccag | agaaaaaggc | ttgtgctgtt | tttagaaagc | caagggacaa | 480 |
gctaagatag | ggcccaagta | atgctagtat | ttacatttat | ccacacaaaa | cggacgggcc | 540 |
tccgctgaac | cagtgaggcc | ccagacgtgc | gcataaataa | cccctgcgtg | ctgcaccacc | 600 |
tggggagagg | gggaggacca | cggtaaatgg | agcgagcgca | tagcaaaagg | gacgcggggt | 660 |
ccttttctct | gccggtggca | ctgggtagct | gtggccaggt | gtggtacttt | gatggggccc | 720 |
agggctggag | ctcaaggaag | cgtcgcaggg | tcacagatct | gggggaaccc | cggggaaaag | 780 |
cactgaggca | aaaccgccgc | tcgtctccta | caatatatgg | gagggggagg | ttgagtacgt | 840 |
tctggattac | tcataagacc | tttttttttt | ccttccgggc | gcaaaaccgt | gagctggatt | 900 |
tataatcgcc | ctataaagct | ccagaggcgg | tcaggcacct | gcagaggagc | cccgccgctc | 960 |
cgccgactag | ctgcccccgc | gagcaacggc | ctcgtgattt | ccccgccgat | ccggtccccg | 1020 |
cctccccact | ctgcccccgc | ctaccccgga | gccgtgcagc | cgcctctccg | aatctctctc | 1080 |
ttctcctggc | gctcgcgtgc | gagagggaac | tagcgagaac | gaggaagcag | ctggaggtga | 1140 |
cgccgggcag | attacgcctg | tcagggccga | gccgagcgga | tcgctgggcg | ctgtgcagag | 1200 |
gaaaggcggg | agtgcccggc | tcgctgtcgc | agagccgagg | tgggtaagct | agcgaccacc | 1260 |
tggacttccc | agcgcccaac | cgtggctttt | cagccaggtc | ctctcctccc | gcggcttctc | 1320 |
aaccaacccc | atcccagcgc | cggccaccca | acctcccgaa | atgagtgctt | cctgccccag | 1380 |
cagccgaagg | cgctactagg | aacggtaacc | tgttactttt | ccaggggccg | tagtcgaccc | 1440 |
gctgcccgag | ttgctgtgcg | actgcgcgcg | cggggctaga | gtgcaaggtg | actgtggttc | 1500 |
ttctctggcc | aagtccgagg | gagaacgtaa | agatatgggc | ctttttcccc | ctctcacctt | 1560 |
gtctcaccaa | agtccctagt | ccccggagca | gttagcctct | ttctttccag | ggaattagcc | 1620 |
- 124 046157
agacacaaca | acgggaacca | gacaccgaac | cagacatgcc | cgccccgtgc | gccctccccg | 1680 |
ctcgctgcct | ttcctccctc | ttgtctctcc | agagccggat | cttcaagggg | agcctccgtg | 1740 |
cccccggctg | ctcagtccct | ccggtgtgca | ggaccccgga | agtcctcccc | gcacagctct | 1800 |
cgcttctctt | tgcagcctgt | ttctgcgccg | gaccagtcga | ggactctgga | cagtagaggc | 1860 |
cccgggacga | ccgagctg | 1878 |
<210> 4 <211> 509 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 4 gccctctagg ccacctgacc aggtcccctc agtccccccc ttcccacact cccacactca60 gcccccctcc cccccccccg acccctgcag gattatcctg tctgtgttcc tgactcagcc120 tgggagccac ctgggcagca ggggccaagg gtgtcctaga agggacctgg agtccacgct180 gggccaagcc tgccctttct ccctctgtct tccgtccctg cttgcggttc tgctgaatgt240 ggttatttct ctggctcctt ttacagagaa tgctgctgct aattttatgt ggagctctga300 ggcagtgtaa ttggaagcca gacaccctgt cagcagtggg ctcccgtcct gagctgccat360 gcttcctgct ctcctcccgt cccggctcct catttcatgc agccacctgt cccagggaga420 gaggagtcac ccaggcccct cagtccgccc cttaaataag aaagcctccg ttgctcggca480 cacataccaa gcagccgctg gtgcaatct509 <210> 5 <211> 1644 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 5 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt60 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca120 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc180 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta240 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac300 catgggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac360
- 125 046157
ccccaatttt | gtatttattt | attttttaat | tattttgtgc | agcgatgggg | gcgggggggg | 420 |
ggggggcgcg | cgccaggcgg | ggcggggcgg | ggcgaggggc | ggggcggggc | gaggcggaga | 480 |
ggtgcggcgg | cagccaatca | gagcggcgcg | ctccgaaagt | ttccttttat | ggcgaggcgg | 540 |
cggcggcggc | ggccctataa | aaagcgaagc | gcgcggcggg | cgggagtcgc | tgcgttgcct | 600 |
tcgccccgtg | ccccgctccg | cgccgcctcg | cgccgcccgc | cccggctctg | actgaccgcg | 660 |
ttactcccac | aggtgagcgg | gcgggacggc | ccttctcctc | cgggctgtaa | ttagcgcttg | 720 |
gtttaatgac | ggctcgtttc | ttttctgtgg | ctgcgtgaaa | gccttaaagg | gctccgggag | 780 |
ggccctttgt | gcggggggga | gcggctcggg | gggtgcgtgc | gtgtgtgtgt | gcgtggggag | 840 |
cgccgcgtgc | ggcccgcgct | gcccggcggc | tgtgagcgct | gcgggcgcgg | cgcggggctt | 900 |
tgtgcgctcc | gcgtgtgcgc | gaggggagcg | cggccggggg | cggtgccccg | cggtgcgggg | 960 |
gggctgcgag | gggaacaaag | gctgcgtgcg | gggtgtgtgc | gtgggggggt | gagcaggggg | 1020 |
tgtgggcgcg | gcggtcgggc | tgtaaccccc | ccctgcaccc | ccctccccga | gttgctgagc | 1080 |
acggcccggc | ttcgggtgcg | gggctccgtg | cggggcgtgg | cgcggggctc | gccgtgccgg | 1140 |
gcggggggtg | gcggcaggtg | ggggtgccgg | gcggggcggg | gccgcctcgg | gccggggagg | 1200 |
gctcggggga | ggggcgcggc | ggccccggag | cgccggcggc | tgtcgaggcg | cggcgagccg | 1260 |
cagccattgc | cttttatggt | aatcgtgcga | gagggcgcag | ggacttcctt | tgtcccaaat | 1320 |
ctggcggagc | cgaaatctgg | gaggcgccgc | cgcaccccct | ctagcgggcg | cgggcgaagc | 1380 |
ggtgcggcgc | cggcaggaag | gaaatgggcg | gggagggcct | tcgtgcgtcg | ccgcgccgcc | 1440 |
gtccccttct | ccatctccag | cctcggggct | gccgcagggg | gacggctgcc | ttcggggggg | 1500 |
acggggcagg | gcggggttcg | gcttctggcg | tgtgaccggc | ggctctagag | cctctgctaa | 1560 |
ccatgttcat | gccttcttct | ttttcctaca | gctcctgggc | aacgtgctgg | ttgttgtgct | 1620 |
gtctcatcat | tttggcaaag | aatt | 1644 |
<210> 6 <211> 1335 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 6
gagtaattca | tacaaaagga | ctcgcccctg | ccttggggaa | tcccagggac | cgtcgttaaa | 60 |
ctcccactaa | cgtagaaccc | agagatcgct | gcgttcccgc | cccctcaccc | gcccgctctc | 120 |
gtcatcactg | aggtggagaa | gagcatgcgt | gaggctccgg | tgcccgtcag | tgggcagagc | 180 |
gcacatcgcc | cacagtcccc | gagaagttgg | ggggaggggt | cggcaattga | accggtgcct | 240 |
- 126 046157
agagaaggtg | gcgcggggta | aactgggaaa | gtgatgtcgt | gtactggctc | cgcctttttc | 300 |
ccgagggtgg | gggagaaccg | tatataagtg | cagtagtcgc | cgtgaacgtt | ctttttcgca | 360 |
acgggtttgc | cgccagaaca | caggtaagtg | ccgtgtgtgg | ttcccgcggg | cctggcctct | 420 |
ttacgggtta | tggcccttgc | gtgccttgaa | ttacttccac | gcccctggct | gcagtacgtg | 480 |
attcttgatc | ccgagcttcg | ggttggaagt | gggtgggaga | gttcgaggcc | ttgcgcttaa | 540 |
ggagcccctt | cgcctcgtgc | ttgagttgag | gcctggcttg | ggcgctgggg | ccgccgcgtg | 600 |
cgaatctggt | ggcaccttcg | cgcctgtctc | gctgctttcg | ataagtctct | agccatttaa | 660 |
aatttttgat | gacctgctgc | gacgcttttt | ttctggcaag | atagtcttgt | aaatgcgggc | 720 |
caagatctgc | acactggtat | ttcggttttt | ggggccgcgg | gcggcgacgg | ggcccgtgcg | 780 |
tcccagcgca | catgttcggc | gaggcggggc | ctgcgagcgc | ggccaccgag | aatcggacgg | 840 |
gggtagtctc | aagctggccg | gcctgctctg | gtgcctggcc | tcgcgccgcc | gtgtatcgcc | 900 |
ccgccctggg | cggcaaggct | ggcccggtcg | gcaccagttg | cgtgagcgga | aagatggccg | 960 |
cttcccggcc | ctgctgcagg | gagctcaaaa | tggaggacgc | ggcgctcggg | agagcgggcg | 1020 |
ggtgagtcac | ccacacaaag | gaaaagggcc | tttccgtcct | cagccgtcgc | ttcatgtgac | 1080 |
tccacggagt | accgggcgcc | gtccaggcac | ctcgattagt | tctcgagctt | ttggagtacg | 1140 |
tcgtctttag | gttgggggga | ggggttttat | gcgatggagt | ttccccacac | tgagtgggtg | 1200 |
gagactgaag | ttaggccagc | ttggcacttg | atgtaattct | ccttggaatt | tgcccttttt | 1260 |
gagtttggat tttcaggtgt | cttggttcat cgtga | tctcaagcct | cagacagtgg | ttcaaagttt | ttttcttcca | 1320 1335 |
<210> 7 <211> 214 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 7 aaagagaccg gttcactgtg acagtaaaag agaccggttc actgtgagaa tgaaagagac60 cggttcactg tgatcggaaa agagaccggt tcactgtgag cggccttgaa acccagcaga120 caatgtagct cagtagaaac ccagcagaca atgtagctga atggaaaccc agcagacaat180 gtagcttcgg agaaacccag cagacaatgt agct214 <210> 8 <211> 21 <212> РНК <213> Homo sapiens
- 127 046157 <400> 8 ucacagugaa ccggucucuu u <210> 9 <211> 21 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 9 aaagagaccg gttcactgtg a 21 <210> 10 <211> 23 <212> РНК <213> Homo sapiens <400> 10 agcuacauug ucugcugggu uuc 23 <210> 11 <211> 23 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 11 gaaacccagc agacaatgta gct 23 <210> 12 <211> 23 <212> РНК <213> Homo sapiens <400> 12 agcuacaucu ggcuacuggg ucu <210> 13 <211> 23 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 13 agacccagta gccagatgta gct 23 <210> 14 <211> 67
- 128 046157 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 14 gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc 60 actgtga 67 <210> 15 <211> 134 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 15 gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc60 actgtgagaa acccagcaga caatgtagct agacccagta gccagatgta gctaaagaga120 ccggttcact gtga134 <210> 16 <211> 62 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 16 aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtgc ggaccgcacg 60 tg 62 <210> 17 <211> 477 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 17 gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca60 gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc120 ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca180 acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg240
- 129 046157
ctcactgcaa | tctccgcctc | ctgggttcaa | gcgattctcc | tgcctcagcc | tcccgagttg | 300 |
ttgggattcc | aggcatgcat | gaccaggctc | agctaatttt | tgtttttttg | gtagagacgg | 360 |
ggtttcacca | tattggccag | gctggtctcc | aactcctaat | ctcaggtgat | ctacccacct | 420 |
tggcctccca | aattgctggg | attacaggcg | tgaaccactg | ctcccttccc | tgtcctt | 477 |
<210> 18 <211> 18 <212> ДНК <213> Homo sapiens <400> 18 ctaggtcaag tgtaggag <210> 19 <211> 18 <212> ДНК <213> Homo sapiens <400> 19 acttgaccta gacagcct <210> 20 <211> 18 <212> ДНК <213> Homo sapiens <400> 20 tgaataactc attagtga <210> 21 <211> 18 <212> ДНК <213> Homo sapiens <400> 21 aaagtacatt aggctaat <210> 22 <211> 18 <212> ДНК <213> Homo sapiens <400> 22 ccagcactgg tgcttcgt <210> 23 <211> 18 <212> ДНК <213> Homo sapiens <400> 23 aaggctgtct aggtcaag
- 130 046157 <210> 24 <211> 24 <212> ДНК <213> Homo sapiens <400> 24 ctaggtcaag tgtaggagac acac <210> 25 <211> 18 <212> ДНК <213> Homo sapiens <400> 25 ggtcaagtgt aggagaca <210> 26 <211> 18 <212> ДНК <213> Homo sapiens <400> 26 caagtgtagg agacacac <210> 27 <211> 24 <212> ДНК <213> Homo sapiens <400> 27 agtgtaggag acacactgct ggcc <210> 28 <211> 18 <212> ДНК <213> Homo sapiens <400> 28 agtgtaggag acacactg <210> 29 <211> 21 <212> ДНК <213> Homo sapiens <400> 29 aggagacaca ctgctggcct g
<210> | 30 |
<211> | 18 |
<212> | ДНК |
<213> | Homo |
sapiens <400> 30 taggtaccat agagtgag
- 131 046157
<210> | 31 |
<211> | 18 |
<212> | ДНК |
<213> | Homo sapiens |
<400> | 31 |
gaggatactg cagaggtc <210> 32 <211> 27 <212> ДНК <213> Homo sapiens <400> 32 taggtaccat agagtgaggc gaggatg <210> 33 <211> 27 <212> ДНК <213> Homo sapiens <400> 33 atagagtgag gcgaggatga agccgag <210> 34 <211> 27 <212> ДНК <213> Homo sapiens <400> 34 tgaagccgag aggatactgc agaggtc <210> 35 <211> 21 <212> ДНК <213> Homo sapiens <400> 35 aaggctgtct aggtcaagtg t <210> 36 <211> 21 <212> ДНК <213> Homo sapiens <400> 36 tgttcctcca gattaacact t <210> 37 <211> 21 <212> ДНК <213> Homo sapiens <400> 37 gatgaagccg agaggatact g
- 132 046157 <210> 38 <211> 21 <212> ДНК <213> Homo sapiens <400> 38 gctgatttgt attaggtacc a <210> 39 <211> 21 <212> ДНК <213> Homo sapiens <400> 39 agaaagctga tacagataca a <210> 40 <211> 21 <212> ДНК <213> Homo sapiens <400> 40 ggtacgggca aagatttctt g <210> 41 <211> 21 <212> ДНК <213> Homo sapiens <400> 41 agaaagctga tacagataca a <210> 42 <211> 21 <212> ДНК <213> Homo sapiens <400> 42 acacaatgag ccacctacaa g <210> 43 <211> 21 <212> ДНК <213> Homo sapiens <400> 43 gtggctcatt gtgtgtgtgc c <210> 44 <211> 21 <212> ДНК <213> Homo sapiens <400> 44 catatccctg caggttcaga a
- 133 046157 <210> 45 <211> 21 <212> ДНК <213> Homo sapiens <400> 45 agagagagag agagagagag a <210> 46 <211> 21 <212> ДНК <213> Homo sapiens <400> 46 ttctcagttt tgaaattaaa a <210> 47 <211> 21 <212> ДНК <213> Homo sapiens <400> 47 tggattctct tctgaacctg c <210> 48 <211> 21 <212> ДНК <213> Homo sapiens <400> 48 tgctgaggca ggacacagtg t <210> 49 <211> 21 <212> ДНК <213> Homo sapiens <400> 49 atcatctgta accatcaagg a <210> 50 <211> 21 <212> ДНК <213> Homo sapiens <400> 50 tcctgcctac ttagtttcaa g <210> 51 <211> 21 <212> ДНК <213> Homo sapiens <400> 51 attacagttc tgtcagcatg c
- 134 046157 <210> 52 <211> 21 <212> ДНК <213> Homo sapiens <400> 52 tggtctcatt ctttttgtgg g <210> 53 <211> 21 <212> ДНК <213> Homo sapiens <400> 53 cgatattttc atggattcct t <210> 54 <211> 21 <212> ДНК <213> Homo sapiens <400> 54 ctgacactta ctttgtctaa a <210> 55 <211> 21 <212> ДНК <213> Homo sapiens <400> 55 aaaactggaa ccgcattccc a <210> 56 <211> 21 <212> ДНК <213> Homo sapiens <400> 56 acaaagtaag tgtcagtgtg g <210> 57 <211> 21 <212> ДНК <213> Homo sapiens <400> 57 ataatagttg tgtctttata a <210> 58 <211> 21 <212> ДНК <213> Homo sapiens <400> 58 tgtacaagca gggctgcaaa g
- 135 046157 <210> 59 <211> 21 <212> ДНК <213> Homo sapiens <400> 59 gttaacaaat acactaaaca c <210> 60 <211> 21 <212> ДНК <213> Homo sapiens <400> 60 ttcaacaagc tcccaagaag t <210> 61 <211> 21 <212> ДНК <213> Homo sapiens <400> 61 atgttcaagg tgcagaagga a <210> 62 <211> 21 <212> ДНК <213> Homo sapiens <400> 62 tgtttgctca aacgtgcacc a <210> 63 <211> 21 <212> ДНК <213> Homo sapiens <400> 63 aaataagaca tgaaaacaag a <210> 64 <211> 21 <212> ДНК <213> Homo sapiens <400> 64 aaatatgtac cacaagaaat g <210> 65 <211> 21 <212> ДНК <213> Homo sapiens <400> 65 tatctggttt ctctcactgc t
- 136 046157 <210> 66 <211> 21 <212> ДНК <213> Homo sapiens <400> 66 attgcaaagc ataatttgga t <210> 67 <211> 3585 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 67 ggaggaagcc | atcaactaaa | ctacaatgac | tgtaagatac | aaaattggga | atggtaacat | 60 |
attttgaagt | tctgttgaca | taaagaatca | tgatattaat | gcccatggaa | atgaaagggc | 120 |
gatcaacact | atggtttgaa | aagggggaaa | ttgtagagca | cagatgtgtt | cgtgtggcag | 180 |
tgtgctgtct | ctagcaatac | tcagagaaga | gagagaacaa | tgaaattctg | attggcccca | 240 |
gtgtgagccc | agatgaggtt | cagctgccaa | ctttctcttt | cacatcttat | gaaagtcatt | 300 |
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
cccagctaat | ttttgtattt | ttaatagata | cgggggtttc | accatatcac | ccaggctggt | 540 |
ctcgaactcc | tggcctcaag | tgatccacct | gcctcggcct | cccaaagtgc | tgggattata | 600 |
ggcgtcagcc | actatgccca | acccgaccaa | ccttttttaa | aataaatatt | taaaaaattg | 660 |
gtatttcaca | tatatactag | tatttacatt | tatccacaca | aaacggacgg | gcctccgctg | 720 |
aaccagtgag | gccccagacg | tgcgcataaa | taacccctgc | gtgctgcacc | acctggggag | 780 |
agggggagga | ccacggtaaa | tggagcgagc | gcatagcaaa | agggacgcgg | ggtccttttc | 840 |
tctgccggtg | gcactgggta | gctgtggcca | ggtgtggtac | tttgatgggg | cccagggctg | 900 |
gagctcaagg | aagcgtcgca | gggtcacaga | tctgggggaa | ccccggggaa | aagcactgag | 960 |
gcaaaaccgc | cgctcgtctc | ctacaatata | tgggaggggg | aggttgagta | cgttctggat | 1020 |
tactcataag | accttttttt | tttccttccg | ggcgcaaaac | cgtgagctgg | atttataatc | 1080 |
gccctataaa | gctccagagg | cggtcaggca | cctgcagagg | agccccgccg | ctccgccgac | 1140 |
tagctgcccc | cgcgagcaac | ggcctcgtga | tttccccgcc | gatccggtcc | ccgcctcccc | 1200 |
actctgcccc | cgcctacccc | ggagccgtgc | agccgcctct | ccgaatctct | ctcttctcct | 1260 |
ggcgctcgcg | tgcgagaggg | aactagcgag | aacgaggaag | cagctggagg | tgacgccggg | 1320 |
- 137 046157
cagattacgc | ctgtcagggc | cgagccgagc | ggatcgctgg | gcgctgtgca | gaggaaaggc | 1380 |
gggagtgccc | ggctcgctgt | cgcagagccg | aggtgggtaa | gctagcgacc | acctggactt | 1440 |
cccagcgccc | aaccgtggct | tttcagccag | gtcctctcct | cccgcggctt | ctcaaccaac | 1500 |
cccatcccag | cgccggccac | ccaacctccc | gaaatgagtg | cttcctgccc | cagcagccga | 1560 |
aggcgctact | aggaacggta | acctgttact | tttccagggg | ccgtagtcga | cccgctgccc | 1620 |
gagttgctgt | gcgactgcgc | gcgcggggct | agagtgcaag | gtgactgtgg | ttcttctctg | 1680 |
gccaagtccg | agggagaacg | taaagatatg | ggcctttttc | cccctctcac | cttgtctcac | 1740 |
caaagtccct | agtccccgga | gcagttagcc | tctttctttc | cagggaatta | gccagacaca | 1800 |
acaacgggaa | ccagacaccg | aaccagacat | gcccgccccg | tgcgccctcc | ccgctcgctg | 1860 |
cctttcctcc | ctcttgtctc | tccagagccg | gatcttcaag | gggagcctcc | gtgcccccgg | 1920 |
ctgctcagtc | cctccggtgt | gcaggacccc | ggaagtcctc | cccgcacagc | tctcgcttct | 1980 |
ctttgcagcc | tgtttctgcg | ccggaccagt | cgaggactct | ggacagtaga | ggccccggga | 2040 |
cgaccgagct | ggaattcgcc | accatggccc | caaagaagaa | gcggaaggtc | ggtatccacg | 2100 |
gagtcccagc | agccctcgaa | ccaggtgaaa | aaccttacaa | atgtcctgaa | tgtgggaaat | 2160 |
cattcagtcg | cagcgacaac | ctggtgagac | atcaacgcac | ccatacagga | gaaaaacctt | 2220 |
ataaatgtcc | agaatgtgga | aagtccttct | cacgagagga | taacttgcac | actcatcaac | 2280 |
gaacacatac | tggtgaaaaa | ccatacaagt | gtcccgaatg | tggtaaaagt | tttagccgga | 2340 |
gcgatgaact | tgtccgacac | caacgaaccc | atacaggcga | gaagccttac | aaatgtcccg | 2400 |
agtgtggcaa | gagcttctca | caatcaggga | atctgactga | gcatcaacga | actcataccg | 2460 |
gggaaaaacc | ttacaagtgt | ccagagtgtg | ggaagagctt | ttccacaagt | ggacatctgg | 2520 |
tacgccacca | gaggacacat | acaggggaga | agccctacaa | atgccccgaa | tgcggtaaaa | 2580 |
gtttctctca | gaatagtacc | ctgaccgaac | accagcgaac | acacactggg | aaaaaaacga | 2640 |
gtaaaaggcc | ggcggccacg | aaaaaggccg | gccaggcaaa | aaagaaaaag | ggatcctacc | 2700 |
catacgacgt | accagattac | gctctcgagg | acgcgctgga | cgatttcgat | ctcgacatgc | 2760 |
tgggttctga | tgccctcgat | gactttgacc | tggatatgtt | gggaagcgac | gcattggatg | 2820 |
actttgatct | ggacatgctc | ggctccgatg | ctctggacga | tttcgatctc | gatatgttat | 2880 |
aaactagtaa | agagaccggt | tcactgtgac | agtaaaagag | accggttcac | tgtgagaatg | 2940 |
aaagagaccg | gttcactgtg | atcggaaaag | agaccggttc | actgtgagcg | gccttgaaac | 3000 |
ccagcagaca | atgtagctca | gtagaaaccc | agcagacaat | gtagctgaat | ggaaacccag | 3060 |
cagacaatgt | agcttcggag | aaacccagca | gacaatgtag | ctaagcttgg | gtggcatccc | 3120 |
tgtgacccct | ccccagtgcc | tctcctggcc | ctggaagttg | ccactccagt | gcccaccagc | 3180 |
cttgtcctaa | taaaattaag | ttgcatcatt | ttgtctgact | aggtgtcctt | ctataatatt | 3240 |
- 138 046157
atggggtgga | ggggggtggt | atggagcaag | gggcaagttg | ggaagacaac | ctgtagggcc | 3300 |
tgcggggtct | attgggaacc | aagctggagt | gcagtggcac | aatcttggct | cactgcaatc | 3360 |
tccgcctcct | gggttcaagc | gattctcctg | cctcagcctc | ccgagttgtt | gggattccag | 3420 |
gcatgcatga | ccaggctcag | ctaatttttg | tttttttggt | agagacgggg | tttcaccata | 3480 |
ttggccaggc | tggtctccaa | ctcctaatct | caggtgatct | acccaccttg | gcctcccaaa | 3540 |
ttgctgggat | tacaggcgtg | aaccactgct | cccttccctg | tcctt | 3585 |
<210> 68 <211> 3371 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 68 ggaggaagcc | atcaactaaa | ctacaatgac | tgtaagatac | aaaattggga | atggtaacat | 60 |
attttgaagt | tctgttgaca | taaagaatca | tgatattaat | gcccatggaa | atgaaagggc | 120 |
gatcaacact | atggtttgaa | aagggggaaa | ttgtagagca | cagatgtgtt | cgtgtggcag | 180 |
tgtgctgtct | ctagcaatac | tcagagaaga | gagagaacaa | tgaaattctg | attggcccca | 240 |
gtgtgagccc | agatgaggtt | cagctgccaa | ctttctcttt | cacatcttat | gaaagtcatt | 300 |
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
cccagctaat | ttttgtattt | ttaatagata | cgggggtttc | accatatcac | ccaggctggt | 540 |
ctcgaactcc | tggcctcaag | tgatccacct | gcctcggcct | cccaaagtgc | tgggattata | 600 |
ggcgtcagcc | actatgccca | acccgaccaa | ccttttttaa | aataaatatt | taaaaaattg | 660 |
gtatttcaca | tatatactag | tatttacatt | tatccacaca | aaacggacgg | gcctccgctg | 720 |
aaccagtgag | gccccagacg | tgcgcataaa | taacccctgc | gtgctgcacc | acctggggag | 780 |
agggggagga | ccacggtaaa | tggagcgagc | gcatagcaaa | agggacgcgg | ggtccttttc | 840 |
tctgccggtg | gcactgggta | gctgtggcca | ggtgtggtac | tttgatgggg | cccagggctg | 900 |
gagctcaagg | aagcgtcgca | gggtcacaga | tctgggggaa | ccccggggaa | aagcactgag | 960 |
gcaaaaccgc | cgctcgtctc | ctacaatata | tgggaggggg | aggttgagta | cgttctggat | 1020 |
tactcataag | accttttttt | tttccttccg | ggcgcaaaac | cgtgagctgg | atttataatc | 1080 |
gccctataaa | gctccagagg | cggtcaggca | cctgcagagg | agccccgccg | ctccgccgac | 1140 |
tagctgcccc | cgcgagcaac | ggcctcgtga | tttccccgcc | gatccggtcc | ccgcctcccc | 1200 |
- 139 046157 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtaa gcttgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg2940 aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt3000 ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc3060
- 140 046157
aagttgggaa | gacaacctgt | agggcctgcg | gggtctattg | ggaaccaagc | tggagtgcag | 3120 |
tggcacaatc | ttggctcact | gcaatctccg | cctcctgggt | tcaagcgatt | ctcctgcctc | 3180 |
agcctcccga | gttgttggga | ttccaggcat | gcatgaccag | gctcagctaa | tttttgtttt | 3240 |
tttggtagag | acggggtttc | accatattgg | ccaggctggt | ctccaactcc | taatctcagg | 3300 |
tgatctaccc | accttggcct | cccaaattgc | tgggattaca | ggcgtgaacc | actgctccct | 3360 |
tccctgtcct | t | 3371 |
<210> 69 <211> 4380 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 69 ggaggaagcc | atcaactaaa | ctacaatgac | tgtaagatac | aaaattggga | atggtaacat | 60 |
attttgaagt | tctgttgaca | taaagaatca | tgatattaat | gcccatggaa | atgaaagggc | 120 |
gatcaacact | atggtttgaa | aagggggaaa | ttgtagagca | cagatgtgtt | cgtgtggcag | 180 |
tgtgctgtct | ctagcaatac | tcagagaaga | gagagaacaa | tgaaattctg | attggcccca | 240 |
gtgtgagccc | agatgaggtt | cagctgccaa | ctttctcttt | cacatcttat | gaaagtcatt | 300 |
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
cccagctaat | ttttgtattt | ttaatagata | cgggggtttc | accatatcac | ccaggctggt | 540 |
ctcgaactcc | tggcctcaag | tgatccacct | gcctcggcct | cccaaagtgc | tgggattata | 600 |
ggcgtcagcc | actatgccca | acccgaccaa | ccttttttaa | aataaatatt | taaaaaattg | 660 |
gtatttcaca | tatatactag | tatttacatt | tatccacaca | aaacggacgg | gcctccgctg | 720 |
aaccagtgag | gccccagacg | tgcgcataaa | taacccctgc | gtgctgcacc | acctggggag | 780 |
agggggagga | ccacggtaaa | tggagcgagc | gcatagcaaa | agggacgcgg | ggtccttttc | 840 |
tctgccggtg | gcactgggta | gctgtggcca | ggtgtggtac | tttgatgggg | cccagggctg | 900 |
gagctcaagg | aagcgtcgca | gggtcacaga | tctgggggaa | ccccggggaa | aagcactgag | 960 |
gcaaaaccgc | cgctcgtctc | ctacaatata | tgggaggggg | aggttgagta | cgttctggat | 1020 |
tactcataag | accttttttt | tttccttccg | ggcgcaaaac | cgtgagctgg | atttataatc | 1080 |
gccctataaa | gctccagagg | cggtcaggca | cctgcagagg | agccccgccg | ctccgccgac | 1140 |
tagctgcccc | cgcgagcaac | ggcctcgtga | tttccccgcc | gatccggtcc | ccgcctcccc | 1200 |
- 141 046157
actctgcccc | cgcctacccc | ggagccgtgc | agccgcctct | ccgaatctct | ctcttctcct | 1260 |
ggcgctcgcg | tgcgagaggg | aactagcgag | aacgaggaag | cagctggagg | tgacgccggg | 1320 |
cagattacgc | ctgtcagggc | cgagccgagc | ggatcgctgg | gcgctgtgca | gaggaaaggc | 1380 |
gggagtgccc | ggctcgctgt | cgcagagccg | aggtgggtaa | gctagcgacc | acctggactt | 1440 |
cccagcgccc | aaccgtggct | tttcagccag | gtcctctcct | cccgcggctt | ctcaaccaac | 1500 |
cccatcccag | cgccggccac | ccaacctccc | gaaatgagtg | cttcctgccc | cagcagccga | 1560 |
aggcgctact | aggaacggta | acctgttact | tttccagggg | ccgtagtcga | cccgctgccc | 1620 |
gagttgctgt | gcgactgcgc | gcgcggggct | agagtgcaag | gtgactgtgg | ttcttctctg | 1680 |
gccaagtccg | agggagaacg | taaagatatg | ggcctttttc | cccctctcac | cttgtctcac | 1740 |
caaagtccct | agtccccgga | gcagttagcc | tctttctttc | cagggaatta | gccagacaca | 1800 |
acaacgggaa | ccagacaccg | aaccagacat | gcccgccccg | tgcgccctcc | ccgctcgctg | 1860 |
cctttcctcc | ctcttgtctc | tccagagccg | gatcttcaag | gggagcctcc | gtgcccccgg | 1920 |
ctgctcagtc | cctccggtgt | gcaggacccc | ggaagtcctc | cccgcacagc | tctcgcttct | 1980 |
ctttgcagcc | tgtttctgcg | ccggaccagt | cgaggactct | ggacagtaga | ggccccggga | 2040 |
cgaccgagct | ggaattcgcc | accatggccc | caaagaagaa | gcggaaggtc | ggtatccacg | 2100 |
gagtcccagc | agccctcgaa | ccaggtgaaa | aaccttacaa | atgtcctgaa | tgtgggaaat | 2160 |
cattcagtcg | cagcgacaac | ctggtgagac | atcaacgcac | ccatacagga | gaaaaacctt | 2220 |
ataaatgtcc | agaatgtgga | aagtccttct | cacgagagga | taacttgcac | actcatcaac | 2280 |
gaacacatac | tggtgaaaaa | ccatacaagt | gtcccgaatg | tggtaaaagt | tttagccgga | 2340 |
gcgatgaact | tgtccgacac | caacgaaccc | atacaggcga | gaagccttac | aaatgtcccg | 2400 |
agtgtggcaa | gagcttctca | caatcaggga | atctgactga | gcatcaacga | actcataccg | 2460 |
gggaaaaacc | ttacaagtgt | ccagagtgtg | ggaagagctt | ttccacaagt | ggacatctgg | 2520 |
tacgccacca | gaggacacat | acaggggaga | agccctacaa | atgccccgaa | tgcggtaaaa | 2580 |
gtttctctca | gaatagtacc | ctgaccgaac | accagcgaac | acacactggg | aaaaaaacga | 2640 |
gtaaaaggcc | ggcggccacg | aaaaaggccg | gccaggcaaa | aaagaaaaag | ggatcctacc | 2700 |
catacgacgt | accagattac | gctctcgagg | aggccagcgg | ttccggacgg | gctgacgcat | 2760 |
tggacgattt | tgatctggat | atgctgggaa | gtgacgccct | cgatgatttt | gaccttgaca | 2820 |
tgcttggttc | ggatgccctt | gatgactttg | acctcgacat | gctcggcagt | gacgcccttg | 2880 |
atgatttcga | cctggacatg | ctgattaact | ctagaagttc | cggatctccg | aaaaagaaac | 2940 |
gcaaagttgg | tagccagtac | ctgcccgaca | ccgacgaccg | gcaccggatc | gaggaaaagc | 3000 |
ggaagcggac | ctacgagaca | ttcaagagca | tcatgaagaa | gtcccccttc | agcggcccca | 3060 |
ccgaccctag | acctccacct | agaagaatcg | ccgtgcccag | cagatccagc | gccagcgtgc | 3120 |
- 142 046157
caaaacctgc | cccccagcct | taccccttca | ccagcagcct | gagcaccatc | aactacgacg | 3180 |
agttccctac | catggtgttc | cccagcggcc | agatctctca | ggcctctgct | ctggctccag | 3240 |
cccctcctca | ggtgctgcct | caggctcctg | ctcctgcacc | agctccagcc | atggtgtctg | 3300 |
cactggctca | ggcaccagca | cccgtgcctg | tgctggctcc | tggacctcca | caggctgtgg | 3360 |
ctccaccagc | ccctaaacct | acacaggccg | gcgagggcac | actgtctgaa | gctctgctgc | 3420 |
agctgcagtt | cgacgacgag | gatctgggag | ccctgctggg | aaacagcacc | gatcctgccg | 3480 |
tgttcaccga | cctggccagc | gtggacaaca | gcgagttcca | gcagctgctg | aaccagggca | 3540 |
tccctgtggc | ccctcacacc | accgagccca | tgctgatgga | ataccccgag | gccatcaccc | 3600 |
ggctcgtgac | aggcgctcag | aggcctcctg | atccagctcc | tgcccctctg | ggagcaccag | 3660 |
gcctgcctaa | tggactgctg | tctggcgacg | aggacttcag | ctctatcgcc | gatatggatt | 3720 |
tctcagcctt | gctgggctct | ggcagcggca | gccgggattc | cagggaaggg | atgtttttgc | 3780 |
cgaagcctga | ggccggctcc | gctattagtg | acgtgtttga | gggccgcgag | gtgtgccagc | 3840 |
caaaacgaat | ccggccattt | catcctccag | gaagtccatg | ggccaaccgc | ccactccccg | 3900 |
ccagcctcgc | accaacacca | accggtccag | tacatgagcc | agtcgggtca | ctgaccccgg | 3960 |
caccagtccc | tcagccactg | gatccagcgc | ccgcagtgac | tcccgaggcc | agtcacctgt | 4020 |
tggaggatcc | cgatgaagag | acgagccagg | ctgtcaaagc | ccttcgggag | atggccgata | 4080 |
ctgtgattcc | ccagaaggaa | gaggctgcaa | tctgtggcca | aatggacctt | tcccatccgc | 4140 |
ccccaagggg | ccatctggat | gagctgacaa | ccacacttga | gtccatgacc | gaggatctga | 4200 |
acctggactc | acccctgacc | ccggaattga | acgagattct | ggataccttc | ctgaacgacg | 4260 |
agtgcctctt | gcatgccatg | catatcagca | caggactgtc | catcttcgac | acatctctgt | 4320 |
tttaaactag | taataaaaga | tctttatttt | cattagatct | gtgtgttggt | tttttgtgtg | 4380 |
<210> 70 <211> 3332 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 70 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240 gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt300
- 143 046157
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
cccagctaat | ttttgtattt | ttaatagata | cgggggtttc | accatatcac | ccaggctggt | 540 |
ctcgaactcc | tggcctcaag | tgatccacct | gcctcggcct | cccaaagtgc | tgggattata | 600 |
ggcgtcagcc | actatgccca | acccgaccaa | ccttttttaa | aataaatatt | taaaaaattg | 660 |
gtatttcaca | tatatactag | tatttacatt | tatccacaca | aaacggacgg | gcctccgctg | 720 |
aaccagtgag | gccccagacg | tgcgcataaa | taacccctgc | gtgctgcacc | acctggggag | 780 |
agggggagga | ccacggtaaa | tggagcgagc | gcatagcaaa | agggacgcgg | ggtccttttc | 840 |
tctgccggtg | gcactgggta | gctgtggcca | ggtgtggtac | tttgatgggg | cccagggctg | 900 |
gagctcaagg | aagcgtcgca | gggtcacaga | tctgggggaa | ccccggggaa | aagcactgag | 960 |
gcaaaaccgc | cgctcgtctc | ctacaatata | tgggaggggg | aggttgagta | cgttctggat | 1020 |
tactcataag | accttttttt | tttccttccg | ggcgcaaaac | cgtgagctgg | atttataatc | 1080 |
gccctataaa | gctccagagg | cggtcaggca | cctgcagagg | agccccgccg | ctccgccgac | 1140 |
tagctgcccc | cgcgagcaac | ggcctcgtga | tttccccgcc | gatccggtcc | ccgcctcccc | 1200 |
actctgcccc | cgcctacccc | ggagccgtgc | agccgcctct | ccgaatctct | ctcttctcct | 1260 |
ggcgctcgcg | tgcgagaggg | aactagcgag | aacgaggaag | cagctggagg | tgacgccggg | 1320 |
cagattacgc | ctgtcagggc | cgagccgagc | ggatcgctgg | gcgctgtgca | gaggaaaggc | 1380 |
gggagtgccc | ggctcgctgt | cgcagagccg | aggtgggtaa | gctagcgacc | acctggactt | 1440 |
cccagcgccc | aaccgtggct | tttcagccag | gtcctctcct | cccgcggctt | ctcaaccaac | 1500 |
cccatcccag | cgccggccac | ccaacctccc | gaaatgagtg | cttcctgccc | cagcagccga | 1560 |
aggcgctact | aggaacggta | acctgttact | tttccagggg | ccgtagtcga | cccgctgccc | 1620 |
gagttgctgt | gcgactgcgc | gcgcggggct | agagtgcaag | gtgactgtgg | ttcttctctg | 1680 |
gccaagtccg | agggagaacg | taaagatatg | ggcctttttc | cccctctcac | cttgtctcac | 1740 |
caaagtccct | agtccccgga | gcagttagcc | tctttctttc | cagggaatta | gccagacaca | 1800 |
acaacgggaa | ccagacaccg | aaccagacat | gcccgccccg | tgcgccctcc | ccgctcgctg | 1860 |
cctttcctcc | ctcttgtctc | tccagagccg | gatcttcaag | gggagcctcc | gtgcccccgg | 1920 |
ctgctcagtc | cctccggtgt | gcaggacccc | ggaagtcctc | cccgcacagc | tctcgcttct | 1980 |
ctttgcagcc | tgtttctgcg | ccggaccagt | cgaggactct | ggacagtaga | ggccccggga | 2040 |
cgaccgagct | ggaattcgcc | accatggccc | caaagaagaa | gcggaaggtc | ggtatccacg | 2100 |
gagtcccagc | agccctcgaa | ccaggtgaaa | aaccttacaa | atgtcctgaa | tgtgggaaat | 2160 |
- 144 046157
cattcagtcg | cagcgacaac | ctggtgagac | atcaacgcac | ccatacagga | gaaaaacctt | 2220 |
ataaatgtcc | agaatgtgga | aagtccttct | cacgagagga | taacttgcac | actcatcaac | 2280 |
gaacacatac | tggtgaaaaa | ccatacaagt | gtcccgaatg | tggtaaaagt | tttagccgga | 2340 |
gcgatgaact | tgtccgacac | caacgaaccc | atacaggcga | gaagccttac | aaatgtcccg | 2400 |
agtgtggcaa | gagcttctca | caatcaggga | atctgactga | gcatcaacga | actcataccg | 2460 |
gggaaaaacc | ttacaagtgt | ccagagtgtg | ggaagagctt | ttccacaagt | ggacatctgg | 2520 |
tacgccacca | gaggacacat | acaggggaga | agccctacaa | atgccccgaa | tgcggtaaaa | 2580 |
gtttctctca | gaatagtacc | ctgaccgaac | accagcgaac | acacactggg | aaaaaaacga | 2640 |
gtaaaaggcc | ggcggccacg | aaaaaggccg | gccaggcaaa | aaagaaaaag | ggatccgacg | 2700 |
cgctggacga | tttcgatctc | gacatgctgg | gttctgatgc | cctcgatgac | tttgacctgg | 2760 |
atatgttggg | aagcgacgca | ttggatgact | ttgatctgga | catgctcggc | tccgatgctc | 2820 |
tggacgattt | cgatctcgat | atgttataaa | agcttgggtg | gcatccctgt | gacccctccc | 2880 |
cagtgcctct | cctggccctg | gaagttgcca | ctccagtgcc | caccagcctt | gtcctaataa | 2940 |
aattaagttg | catcattttg | tctgactagg | tgtccttcta | taatattatg | gggtggaggg | 3000 |
gggtggtatg | gagcaagggg | caagttggga | agacaacctg | tagggcctgc | ggggtctatt | 3060 |
gggaaccaag | ctggagtgca | gtggcacaat | cttggctcac | tgcaatctcc | gcctcctggg | 3120 |
ttcaagcgat | tctcctgcct | cagcctcccg | agttgttggg | attccaggca | tgcatgacca | 3180 |
ggctcagcta | atttttgttt | ttttggtaga | gacggggttt | caccatattg | gccaggctgg | 3240 |
tctccaactc | ctaatctcag | gtgatctacc | caccttggcc | tcccaaattg | ctgggattac | 3300 |
aggcgtgaac | cactgctccc | ttccctgtcc | tt | 3332 |
<210> 71 <211> 3546 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 71 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240 gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt300 taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc360
- 145 046157 ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420 caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg480 cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt540 ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata600 ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg660 gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg720 aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag780 agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc840 tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg900 gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag960 gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat1020 tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc1080 gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac1140 tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc1200 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280
- 146 046157
gaacacatac | tggtgaaaaa | ccatacaagt | gtcccgaatg | tggtaaaagt | tttagccgga | 2340 |
gcgatgaact | tgtccgacac | caacgaaccc | atacaggcga | gaagccttac | aaatgtcccg | 2400 |
agtgtggcaa | gagcttctca | caatcaggga | atctgactga | gcatcaacga | actcataccg | 2460 |
gggaaaaacc | ttacaagtgt | ccagagtgtg | ggaagagctt | ttccacaagt | ggacatctgg | 2520 |
tacgccacca | gaggacacat | acaggggaga | agccctacaa | atgccccgaa | tgcggtaaaa | 2580 |
gtttctctca | gaatagtacc | ctgaccgaac | accagcgaac | acacactggg | aaaaaaacga | 2640 |
gtaaaaggcc | ggcggccacg | aaaaaggccg | gccaggcaaa | aaagaaaaag | ggatccgacg | 2700 |
cgctggacga | tttcgatctc | gacatgctgg | gttctgatgc | cctcgatgac | tttgacctgg | 2760 |
atatgttggg | aagcgacgca | ttggatgact | ttgatctgga | catgctcggc | tccgatgctc | 2820 |
tggacgattt | cgatctcgat | atgttataaa | aagagaccgg | ttcactgtga | cagtaaaaga | 2880 |
gaccggttca | ctgtgagaat | gaaagagacc | ggttcactgt | gatcggaaaa | gagaccggtt | 2940 |
cactgtgagc | ggccttgaaa | cccagcagac | aatgtagctc | agtagaaacc | cagcagacaa | 3000 |
tgtagctgaa | tggaaaccca | gcagacaatg | tagcttcgga | gaaacccagc | agacaatgta | 3060 |
gctaagcttg | ggtggcatcc | ctgtgacccc | tccccagtgc | ctctcctggc | cctggaagtt | 3120 |
gccactccag | tgcccaccag | ccttgtccta | ataaaattaa | gttgcatcat | tttgtctgac | 3180 |
taggtgtcct | tctataatat | tatggggtgg | aggggggtgg | tatggagcaa | ggggcaagtt | 3240 |
gggaagacaa | cctgtagggc | ctgcggggtc | tattgggaac | caagctggag | tgcagtggca | 3300 |
caatcttggc | tcactgcaat | ctccgcctcc | tgggttcaag | cgattctcct | gcctcagcct | 3360 |
cccgagttgt | tgggattcca | ggcatgcatg | accaggctca | gctaattttt | gtttttttgg | 3420 |
tagagacggg | gtttcaccat | attggccagg | ctggtctcca | actcctaatc | tcaggtgatc | 3480 |
tacccacctt | ggcctcccaa | attgctggga | ttacaggcgt | gaaccactgc | tcccttccct | 3540 |
gtcctt | 3546 |
<210> 72 <211> 1707 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 72 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct60 gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt120 cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct180 ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg240
- 147 046157
cctcctccag | ccgctggcat | cgcccacctg | cagcctgtgg | ccacccctta | ccccggaaga | 300 |
gccgccgccc | ctccaaacgc | ccctggcgga | cctcctggcc | cccagcctgc | tccaagcgcc | 360 |
gctgcccctc | cacctcctgc | tcatgccctg | ggcggcatgg | acgccgagct | gatcgacgag | 420 |
gaagccctga | ccagcctgga | actggaactg | ggcctgcaca | gagtgcggga | actgcctgag | 480 |
ctgttcctgg | gacagagcga | gttcgactgc | ttcagcgacc | tgggcagcgc | ccctcctgcc | 540 |
ggctctgtgt | cctgcgccga | ccacctgatg | ctcgccgagg | gctaccgcct | ggtgcagagg | 600 |
ccgccgtccg | ccgccgccgc | ccatggccct | catgcgctcc | ggactctgcc | gccgtacgcg | 660 |
ggcccgggcc | tggacagtgg | gctgaggccg | cggggggctc | cgctggggcc | gccgccgccc | 720 |
cgccaacccg | gggccctggc | gtacggggcc | ttcgggccgc | cgtcctcctt | ccagcccttt | 780 |
ccggccgtgc | ctccgccggc | cgcgggcatc | gcgcacctgc | agcctgtggc | gacgccgtac | 840 |
cccggccgcg | ccgccgcgcc | ccccaacgct | ccgggaggcc | ccccgggccc | gcagccggcc | 900 |
ccaagcgccg | cagccccgcc | gccgcccgcg | cacgccctgg | gcggcatgga | cgccgaactc | 960 |
atcgacgagg | aggcgctgac | gtcgctggag | ctggagctgg | ggctgcaccg | cgtgcgcgag | 1020 |
ctgcccgagc | tgttcctggg | ccagagcgag | ttcgactgct | tctcggactt | ggggtccgcg | 1080 |
ccgcccgccg | gctccgtgag | ctgccagtcc | cagctcatca | aacccagccg | catgcgcaag | 1140 |
taccccaacc | ggcccagcaa | gacgcccccc | cacgaacgcc | cttacgcttg | cccagtggag | 1200 |
tcctgtgatc | gccgcttctc | ccgcagcgac | aacctggtga | gacacatccg | catccacaca | 1260 |
ggccagaagc | ccttccagtg | ccgcatctgc | atgagaaact | tcagccgaga | ggataacttg | 1320 |
cacactcaca | tccgcaccca | cacaggcgaa | aagcccttcg | cctgcgacat | ctgtggaaga | 1380 |
aagtttgccc | ggagcgatga | acttgtccga | cataccaaga | tccacttgcg | gcagaaggac | 1440 |
cgcccttacg | cttgcccagt | ggagtcctgt | gatcgccgct | tctcccaatc | agggaatctg | 1500 |
actgagcaca | tccgcatcca | cacaggccag | aagcccttcc | agtgccgcat | ctgcatgaga | 1560 |
aacttcagca | caagtggaca | tctggtacgc | cacatccgca | cccacacagg | cgaaaagccc | 1620 |
ttcgcctgcg | acatctgtgg | aagaaagttt | gcccagaata | gtaccctgac | cgaacatacc | 1680 |
aagatccact | tgcggcagaa | ggacaag | 1707 |
<210> 73 <211> 1755 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 73 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60
- 148 046157 gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120 cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180 ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg 240 cctcctccag ctgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300 gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360 gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420 gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480 ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540 ggctctgtgt cctgcggcgg cagcggcggc ggaagcggcg ccgaccacct gatgctcgcc 600 gagggctacc gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg 660 ctccggactc tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg 720 gctccgctgg ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg 780 ccgccgtcct ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac 840 ctgcagcctg tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga 900 ggccccccgg gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc 960 ctgggcggca tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag 1020 ctggggctgc accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac 1080 tgcttctcgg acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt 1140 ggtggttctg gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg 1200 cccagcaaga cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc 1260 cgcttctccc gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc 1320 ttccagtgcc gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc 1380 cgcacccaca caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg 1440 agcgatgaac ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct 1500 tgcccagtgg agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc 1560 cgcatccaca caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca 1620 agtggacatc tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac 1680 atctgtggaa gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg 1740 cggcagaagg acaag 1755 <210> 74 <211> 3438 <212> ДНК
- 149 046157 <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 74 ggaggaagcc | atcaactaaa | ctacaatgac | tgtaagatac | aaaattggga | atggtaacat | 60 |
attttgaagt | tctgttgaca | taaagaatca | tgatattaat | gcccatggaa | atgaaagggc | 120 |
gatcaacact | atggtttgaa | aagggggaaa | ttgtagagca | cagatgtgtt | cgtgtggcag | 180 |
tgtgctgtct | ctagcaatac | tcagagaaga | gagagaacaa | tgaaattctg | attggcccca | 240 |
gtgtgagccc | agatgaggtt | cagctgccaa | ctttctcttt | cacatcttat | gaaagtcatt | 300 |
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
cccagctaat | ttttgtattt | ttaatagata | cgggggtttc | accatatcac | ccaggctggt | 540 |
ctcgaactcc | tggcctcaag | tgatccacct | gcctcggcct | cccaaagtgc | tgggattata | 600 |
ggcgtcagcc | actatgccca | acccgaccaa | ccttttttaa | aataaatatt | taaaaaattg | 660 |
gtatttcaca | tatatactag | tatttacatt | tatccacaca | aaacggacgg | gcctccgctg | 720 |
aaccagtgag | gccccagacg | tgcgcataaa | taacccctgc | gtgctgcacc | acctggggag | 780 |
agggggagga | ccacggtaaa | tggagcgagc | gcatagcaaa | agggacgcgg | ggtccttttc | 840 |
tctgccggtg | gcactgggta | gctgtggcca | ggtgtggtac | tttgatgggg | cccagggctg | 900 |
gagctcaagg | aagcgtcgca | gggtcacaga | tctgggggaa | ccccggggaa | aagcactgag | 960 |
gcaaaaccgc | cgctcgtctc | ctacaatata | tgggaggggg | aggttgagta | cgttctggat | 1020 |
tactcataag | accttttttt | tttccttccg | ggcgcaaaac | cgtgagctgg | atttataatc | 1080 |
gccctataaa | gctccagagg | cggtcaggca | cctgcagagg | agccccgccg | ctccgccgac | 1140 |
tagctgcccc | cgcgagcaac | ggcctcgtga | tttccccgcc | gatccggtcc | ccgcctcccc | 1200 |
actctgcccc | cgcctacccc | ggagccgtgc | agccgcctct | ccgaatctct | ctcttctcct | 1260 |
ggcgctcgcg | tgcgagaggg | aactagcgag | aacgaggaag | cagctggagg | tgacgccggg | 1320 |
cagattacgc | ctgtcagggc | cgagccgagc | ggatcgctgg | gcgctgtgca | gaggaaaggc | 1380 |
gggagtgccc | ggctcgctgt | cgcagagccg | aggtgggtaa | gctagcgacc | acctggactt | 1440 |
cccagcgccc | aaccgtggct | tttcagccag | gtcctctcct | cccgcggctt | ctcaaccaac | 1500 |
cccatcccag | cgccggccac | ccaacctccc | gaaatgagtg | cttcctgccc | cagcagccga | 1560 |
aggcgctact | aggaacggta | acctgttact | tttccagggg | ccgtagtcga | cccgctgccc | 1620 |
gagttgctgt | gcgactgcgc | gcgcggggct | agagtgcaag | gtgactgtgg | ttcttctctg | 1680 |
- 150 046157 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag2940 accggttcac tgtgaaagct tgggtggcat ccctgtgacc cctccccagt gcctctcctg3000 gccctggaag ttgccactcc agtgcccacc agccttgtcc taataaaatt aagttgcatc3060 attttgtctg actaggtgtc cttctataat attatggggt ggaggggggt ggtatggagc3120 aaggggcaag ttgggaagac aacctgtagg gcctgcgggg tctattggga accaagctgg3180 agtgcagtgg cacaatcttg gctcactgca atctccgcct cctgggttca agcgattctc3240 ctgcctcagc ctcccgagtt gttgggattc caggcatgca tgaccaggct cagctaattt3300 ttgttttttt ggtagagacg gggtttcacc atattggcca ggctggtctc caactcctaa3360 tctcaggtga tctacccacc ttggcctccc aaattgctgg gattacaggc gtgaaccact 3420 gctcccttcc ctgtcctt3438 <210> 75 <211> 3505
- 151 046157 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 75 ggaggaagcc | atcaactaaa | ctacaatgac | tgtaagatac | aaaattggga | atggtaacat | 60 |
attttgaagt | tctgttgaca | taaagaatca | tgatattaat | gcccatggaa | atgaaagggc | 120 |
gatcaacact | atggtttgaa | aagggggaaa | ttgtagagca | cagatgtgtt | cgtgtggcag | 180 |
tgtgctgtct | ctagcaatac | tcagagaaga | gagagaacaa | tgaaattctg | attggcccca | 240 |
gtgtgagccc | agatgaggtt | cagctgccaa | ctttctcttt | cacatcttat | gaaagtcatt | 300 |
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
cccagctaat | ttttgtattt | ttaatagata | cgggggtttc | accatatcac | ccaggctggt | 540 |
ctcgaactcc | tggcctcaag | tgatccacct | gcctcggcct | cccaaagtgc | tgggattata | 600 |
ggcgtcagcc | actatgccca | acccgaccaa | ccttttttaa | aataaatatt | taaaaaattg | 660 |
gtatttcaca | tatatactag | tatttacatt | tatccacaca | aaacggacgg | gcctccgctg | 720 |
aaccagtgag | gccccagacg | tgcgcataaa | taacccctgc | gtgctgcacc | acctggggag | 780 |
agggggagga | ccacggtaaa | tggagcgagc | gcatagcaaa | agggacgcgg | ggtccttttc | 840 |
tctgccggtg | gcactgggta | gctgtggcca | ggtgtggtac | tttgatgggg | cccagggctg | 900 |
gagctcaagg | aagcgtcgca | gggtcacaga | tctgggggaa | ccccggggaa | aagcactgag | 960 |
gcaaaaccgc | cgctcgtctc | ctacaatata | tgggaggggg | aggttgagta | cgttctggat | 1020 |
tactcataag | accttttttt | tttccttccg | ggcgcaaaac | cgtgagctgg | atttataatc | 1080 |
gccctataaa | gctccagagg | cggtcaggca | cctgcagagg | agccccgccg | ctccgccgac | 1140 |
tagctgcccc | cgcgagcaac | ggcctcgtga | tttccccgcc | gatccggtcc | ccgcctcccc | 1200 |
actctgcccc | cgcctacccc | ggagccgtgc | agccgcctct | ccgaatctct | ctcttctcct | 1260 |
ggcgctcgcg | tgcgagaggg | aactagcgag | aacgaggaag | cagctggagg | tgacgccggg | 1320 |
cagattacgc | ctgtcagggc | cgagccgagc | ggatcgctgg | gcgctgtgca | gaggaaaggc | 1380 |
gggagtgccc | ggctcgctgt | cgcagagccg | aggtgggtaa | gctagcgacc | acctggactt | 1440 |
cccagcgccc | aaccgtggct | tttcagccag | gtcctctcct | cccgcggctt | ctcaaccaac | 1500 |
cccatcccag | cgccggccac | ccaacctccc | gaaatgagtg | cttcctgccc | cagcagccga | 1560 |
aggcgctact | aggaacggta | acctgttact | tttccagggg | ccgtagtcga | cccgctgccc | 1620 |
gagttgctgt | gcgactgcgc | gcgcggggct | agagtgcaag | gtgactgtgg | ttcttctctg | 1680 |
- 152 046157 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag2940 accggttcac tgtgagaaac ccagcagaca atgtagctag acccagtagc cagatgtagc3000 taaagagacc ggttcactgt gaaagcttgg gtggcatccc tgtgacccct ccccagtgcc3060 tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa taaaattaag3120 ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga ggggggtggt3180 atggagcaag gggcaagttg ggaagacaac ctgtagggcc tgcggggtct attgggaacc3240 aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct gggttcaagc3300 gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga ccaggctcag3360 ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc tggtctccaa3420 ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat tacaggcgtg3480 aaccactgct cccttccctg tcctt3505
- 153 046157 <210> 76 <211> 3804 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 76 ggaggaagcc | atcaactaaa | ctacaatgac | tgtaagatac | aaaattggga | atggtaacat | 60 |
attttgaagt | tctgttgaca | taaagaatca | tgatattaat | gcccatggaa | atgaaagggc | 120 |
gatcaacact | atggtttgaa | aagggggaaa | ttgtagagca | cagatgtgtt | cgtgtggcag | 180 |
tgtgctgtct | ctagcaatac | tcagagaaga | gagagaacaa | tgaaattctg | attggcccca | 240 |
gtgtgagccc | agatgaggtt | cagctgccaa | ctttctcttt | cacatcttat | gaaagtcatt | 300 |
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
cccagctaat | ttttgtattt | ttaatagata | cgggggtttc | accatatcac | ccaggctggt | 540 |
ctcgaactcc | tggcctcaag | tgatccacct | gcctcggcct | cccaaagtgc | tgggattata | 600 |
ggcgtcagcc | actatgccca | acccgaccaa | ccttttttaa | aataaatatt | taaaaaattg | 660 |
gtatttcaca | tatatactag | tatttacatt | tatccacaca | aaacggacgg | gcctccgctg | 720 |
aaccagtgag | gccccagacg | tgcgcataaa | taacccctgc | gtgctgcacc | acctggggag | 780 |
agggggagga | ccacggtaaa | tggagcgagc | gcatagcaaa | agggacgcgg | ggtccttttc | 840 |
tctgccggtg | gcactgggta | gctgtggcca | ggtgtggtac | tttgatgggg | cccagggctg | 900 |
gagctcaagg | aagcgtcgca | gggtcacaga | tctgggggaa | ccccggggaa | aagcactgag | 960 |
gcaaaaccgc | cgctcgtctc | ctacaatata | tgggaggggg | aggttgagta | cgttctggat | 1020 |
tactcataag | accttttttt | tttccttccg | ggcgcaaaac | cgtgagctgg | atttataatc | 1080 |
gccctataaa | gctccagagg | cggtcaggca | cctgcagagg | agccccgccg | ctccgccgac | 1140 |
tagctgcccc | cgcgagcaac | ggcctcgtga | tttccccgcc | gatccggtcc | ccgcctcccc | 1200 |
actctgcccc | cgcctacccc | ggagccgtgc | agccgcctct | ccgaatctct | ctcttctcct | 1260 |
ggcgctcgcg | tgcgagaggg | aactagcgag | aacgaggaag | cagctggagg | tgacgccggg | 1320 |
cagattacgc | ctgtcagggc | cgagccgagc | ggatcgctgg | gcgctgtgca | gaggaaaggc | 1380 |
gggagtgccc | ggctcgctgt | cgcagagccg | aggtgggtaa | gctagcgacc | acctggactt | 1440 |
cccagcgccc | aaccgtggct | tttcagccag | gtcctctcct | cccgcggctt | ctcaaccaac | 1500 |
cccatcccag | cgccggccac | ccaacctccc | gaaatgagtg | cttcctgccc | cagcagccga | 1560 |
- 154 046157
aggcgctact | aggaacggta | acctgttact | tttccagggg | ccgtagtcga | cccgctgccc | 1620 |
gagttgctgt | gcgactgcgc | gcgcggggct | agagtgcaag | gtgactgtgg | ttcttctctg | 1680 |
gccaagtccg | agggagaacg | taaagatatg | ggcctttttc | cccctctcac | cttgtctcac | 1740 |
caaagtccct | agtccccgga | gcagttagcc | tctttctttc | cagggaatta | gccagacaca | 1800 |
acaacgggaa | ccagacaccg | aaccagacat | gcccgccccg | tgcgccctcc | ccgctcgctg | 1860 |
cctttcctcc | ctcttgtctc | tccagagccg | gatcttcaag | gggagcctcc | gtgcccccgg | 1920 |
ctgctcagtc | cctccggtgt | gcaggacccc | ggaagtcctc | cccgcacagc | tctcgcttct | 1980 |
ctttgcagcc | tgtttctgcg | ccggaccagt | cgaggactct | ggacagtaga | ggccccggga | 2040 |
cgaccgagct | ggaattcgcc | accatggccg | ccgaccacct | gatgctcgcc | gagggctacc | 2100 |
gcctggtgca | gaggccgccg | tccgccgccg | ccgcccatgg | ccctcatgcg | ctccggactc | 2160 |
tgccgccgta | cgcgggcccg | ggcctggaca | gtgggctgag | gccgcggggg | gctccgctgg | 2220 |
ggccgccgcc | gccccgccaa | cccggggccc | tggcgtacgg | ggccttcggg | ccgccgtcct | 2280 |
ccttccagcc | ctttccggcc | gtgcctccgc | cggccgcggg | catcgcgcac | ctgcagcctg | 2340 |
tggcgacgcc | gtaccccggc | cgcgcggccg | cgccccccaa | cgctccggga | ggccccccgg | 2400 |
gcccgcagcc | ggccccaagc | gccgcagccc | cgccgccgcc | cgcgcacgcc | ctgggcggca | 2460 |
tggacgccga | actcatcgac | gaggaggcgc | tgacgtcgct | ggagctggag | ctggggctgc | 2520 |
accgcgtgcg | cgagctgccc | gagctgttcc | tgggccagag | cgagttcgac | tgcttctcgg | 2580 |
acttggggtc | cgcgccgccc | gccggctccg | tgagctgcgg | tggttctggt | ggtggttctg | 2640 |
gtcagtccca | gctcatcaaa | cccagccgca | tgcgcaagta | ccccaaccgg | cccagcaaga | 2700 |
cgccccccca | cgaacgccct | tacgcttgcc | cagtggagtc | ctgtgatcgc | cgcttctccc | 2760 |
gcagcgacaa | cctggtgaga | cacatccgca | tccacacagg | ccagaagccc | ttccagtgcc | 2820 |
gcatctgcat | gagaaacttc | agccgagagg | ataacttgca | cactcacatc | cgcacccaca | 2880 |
caggcgaaaa | gcccttcgcc | tgcgacatct | gtggaagaaa | gtttgcccgg | agcgatgaac | 2940 |
ttgtccgaca | taccaagatc | cacttgcggc | agaaggaccg | cccttacgct | tgcccagtgg | 3000 |
agtcctgtga | tcgccgcttc | tcccaatcag | ggaatctgac | tgagcacatc | cgcatccaca | 3060 |
caggccagaa | gcccttccag | tgccgcatct | gcatgagaaa | cttcagcaca | agtggacatc | 3120 |
tggtacgcca | catccgcacc | cacacaggcg | aaaagccctt | cgcctgcgac | atctgtggaa | 3180 |
gaaagtttgc | ccagaatagt | accctgaccg | aacataccaa | gatccacttg | cggcagaagg | 3240 |
acaagtaact | cgaggaaacc | cagcagacaa | tgtagctaga | cccagtagcc | agatgtagct | 3300 |
aaagagaccg | gttcactgtg | aaagcttggg | tggcatccct | gtgacccctc | cccagtgcct | 3360 |
ctcctggccc | tggaagttgc | cactccagtg | cccaccagcc | ttgtcctaat | aaaattaagt | 3420 |
tgcatcattt | tgtctgacta | ggtgtccttc | tataatatta | tggggtggag | gggggtggta | 3480 |
- 155 046157
tggagcaagg | ggcaagttgg | gaagacaacc | tgtagggcct | gcggggtcta | ttgggaacca | 3540 |
agctggagtg | cagtggcaca | atcttggctc | actgcaatct | ccgcctcctg | ggttcaagcg | 3600 |
attctcctgc | ctcagcctcc | cgagttgttg | ggattccagg | catgcatgac | caggctcagc | 3660 |
taatttttgt | ttttttggta | gagacggggt | ttcaccatat | tggccaggct | ggtctccaac | 3720 |
tcctaatctc | aggtgatcta | cccaccttgg | cctcccaaat | tgctgggatt | acaggcgtga | 3780 |
accactgctc | ccttccctgt | cctt | 3804 |
<210> 77 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 77
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 1015
Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly 20 2530
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 35 4045
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val 65 70 7580
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 9095
Cys Gly Lys Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg
100 105110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120125
Phe Ser Thr Ser Gly His Leu Val Arg His Gln Arg Thr His Thr Gly
130 135140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Asn
145 150 155160
- 156 046157
Ser Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175 <210> 78 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 78
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
5 1015
Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His ThrGly
2530
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala 35 4045
Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His LeuArg
70 7580
Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu
9095
Cys Gly Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg 100 105110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120125
Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly 130 135140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser ThrHis
145 150 155160
Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Lys Lys ThrSer
165 170175 <210> 79 <211> 176 <212> Белок <213> Искусственная последовательность
- 157 046157 <220>
<223> Описание искусственной последовательности полипептид <400> 79
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Arg Glu 45
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser 65 70 75
Gly Asn Leu Thr
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Gln Ala
160
Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser 175 <210> 80 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 80
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
- 158 046157
Phe Ser Thr Thr Gly Asn Leu Thr
Val His Gln Arg
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Thr Ser 45
Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 65 70 75
Asp Asn Leu His 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr
100 105
Glu His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Gln Arg
160
Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175 <210> 81 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 81
Leu Glu Pro Gly Glu Lys
5
Phe Ser Ser Arg Arg Thr
Glu Lys Pro Tyr Lys Cys 35
Pro Tyr Lys Cys Pro Glu 10
Cys Arg Ala His Gln Arg 25
Pro Glu Cys Gly Lys Ser 40
Cys Gly Lys Ser 15
Thr His Thr Gly 30
Phe Ser Thr Thr 45
- 159 046157
Gly Ala Leu Thr Glu His Gln Arg
55
Thr His Thr Gly
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 65 70 75
Asp Glu Leu Val 80
Arg His Gln Arg Thr His 85
Thr Gly Glu Lys Pro Tyr
Lys Cys Pro Glu
Cys Gly Lys
Ser Phe
100
Ser Arg Asn Asp Ala Leu Thr
105
Glu His Gln Arg 110
Thr His
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Thr Ser
160
His Ser Leu Thr Glu His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser 175 <210> 82 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 82
Leu Glu Pro Gly 1
Glu Lys Pro Tyr 5
Lys Cys Pro Glu 10
Cys Gly Lys Ser 15
Phe Ser Arg Lys
Asp Asn Leu Lys
Asn His Gln Arg 25
Thr His Thr Gly 30
Glu Lys Pro Tyr 35
Lys Cys Pro Glu 40
Cys Gly Lys Ser
Phe Ser Asp Pro 45
Gly Ala Leu Val 50
Arg His Gln Arg 55
Thr His Thr Gly
Glu Lys Pro Tyr
Lys Cys Pro Glu 65
Cys Gly Lys Ser 70
Phe Ser Arg Glu 75
Asp Asn Leu His 80
Thr His Gln Arg
Thr His Thr Gly
Glu Lys Pro Tyr
Lys Cys Pro Glu
- 160 046157
90
Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Arg Lys
160
Asp Asn Leu Lys Asn His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175 <210> 83 <211> 232 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 83
Leu Glu Pro Gly 1
Glu Lys Pro Tyr 5
Lys Cys Pro Glu 10
Cys Gly Lys Ser 15
Phe Ser Ser Lys 20
Lys Ala Leu Thr
Glu His Gln Arg 25
Thr His Thr Gly 30
Glu Lys Pro Tyr 35
Lys Cys Pro Glu 40
Cys Gly Lys Ser
Phe Ser Ser Pro 45
Ala Asp Leu Thr 50
Arg His Gln Arg 55
Thr His Thr Gly
Glu Lys Pro Tyr
Lys Cys Pro Glu 65
Cys Gly Lys Ser 70
Phe Ser Arg Ser 75
Asp Asn Leu Val 80
Arg His Gln Arg
Thr His Thr Gly 85
Glu Lys Pro Tyr 90
Lys Cys Pro Glu
Cys Gly Lys Ser
100
Phe Ser Arg Glu
Asp Asn Leu His 105
Thr His Gln Arg
110
Thr His Thr Gly 115
Glu Lys Pro Tyr
120
Lys Cys Pro Glu
Cys Gly Lys Ser
125
- 161 046157
Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His Thr Gly
130 135140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
145 150 155160
Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly His Leu Val
180 185190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
195 200205
Cys Gly Lys Ser Phe Ser Gln Asn Ser Thr Leu Thr Glu His Gln Arg
210 215220
Thr His Thr Gly Lys Lys Thr Ser
225230 <210> 84 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 84
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
5 1015
Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His ThrGly
2530
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 35 4045
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn LeuHis
70 7580
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu
9095
- 162 046157
Cys Gly Lys Ser Phe Ser Arg Ser
100
Asp Glu Leu Val
105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Thr Ser
160
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175 <210> 85 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 85
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Ser Pro 45
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 65 70 75
Asp Asn Leu Val 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
100 105
Thr His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser
125
- 163 046157
Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Gln Ser
160
Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175 <210> 86 <211> 232 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 86
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Arg Asn 45
Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn 65 70 75
Asp Ala Leu Thr
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Asp Pro Gly Asn Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Gln Arg
160
Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly
Glu Lys Pro Tyr
- 164 046157
165
170
175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
180 185
Ser Ser Leu Val
190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
195 200
Lys Cys Pro Glu 205
Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr
210 215 220
Asn His Gln Arg
Thr His Thr Gly Lys Lys Thr Ser
225 230 <210> 87 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 87
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Ser Pro 45
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 65 70 75
Gly Asn Leu Val
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
- 165 046157
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Arg
145 150 155 160
Thr Thr Leu Thr Asn His Gln Arg Thr His
165 170
Thr Gly Lys Lys Thr Ser
175 <210> 88 <211> 204 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 88
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
5 1015
Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His ThrGly
2530
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 35 4045
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu LeuVal
70 7580
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu
9095
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile Arg His Gln Arg 100 105110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120125
Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly 130 135140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser GlnLeu
145 150 155160
Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys ProTyr
165 170175
- 166 046157
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
180 185
Asp His Leu Thr 190
Asn His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
195 200 <210> 89 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 89
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Синтетический
Cys Gly Lys Ser 15
Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg 20 25
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser His Arg 45
Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 65 70 75
Asp Asn Leu His 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr
100 105
Glu His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Arg Glu
160
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser
175
- 167 046157 <210> 90 <211> 176 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 90
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu
5 10
Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln Arg
25
Синтетический
Cys Gly Lys Ser 15
Thr His Thr Gly 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40
Phe Ser Arg Ser 45
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly
55 60
Glu Lys Pro Tyr
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser 65 70 75
Gly Asp Leu Arg 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
90
Lys Cys Pro Glu
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile
100 105
Arg His Gln Arg 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
115 120
Cys Gly Lys Ser 125
Phe Ser Thr Ser Gly Asn Leu Val Arg His Gln Arg
130 135 140
Thr His Thr Gly
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
145 150 155
Phe Ser Arg Ser
160
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly
165 170
Lys Lys Thr Ser 175 <210> 91 <211> 260 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический
- 168 046157 <400> 91
Leu Glu Pro Gly Glu Lys Pro Tyr Lys
5
Phe Ser Arg Arg Asp Glu Leu Asn Val
25
Glu Lys Pro Tyr Lys Cys Pro Glu Cys
40
Asp His Leu Thr Asn His Gln Arg Thr
55
Lys Cys Pro Glu Cys Gly Lys Ser Phe 65 70
Arg His Gln Arg Thr His Thr Gly Glu 85
Cys Gly Lys Ser Phe Ser Arg Ser Asp
100 105
Thr His Thr Gly Glu Lys Pro Tyr Lys
115 120
Phe Ser His Arg Thr Thr Leu Thr Asn
130 135
Glu Lys Pro Tyr Lys Cys Pro Glu Cys 145 150
Asp Asn Leu His Thr His Gln Arg Thr
165
Lys Cys Pro Glu Cys Gly Lys Ser Phe
180 185
Glu His Gln Arg Thr His Thr Gly Glu
195 200
Cys Gly Lys Ser Phe Ser Gln Ser Ser
210 215
Thr His Thr Gly Glu Lys Pro Tyr Lys
225 230
Phe Ser Arg Glu Asp Asn Leu His Thr
245
Pro Glu Cys Gly Lys Ser 15
Gln Arg Thr His Thr Gly 30
Lys Ser Phe Ser Arg Ser 45
Thr Gly Glu Lys Pro Tyr 60
Arg Ser Asp Asp Leu Val 75 80
Pro Tyr Lys Cys Pro Glu 95
Leu Val Arg His Gln Arg
110
Pro Glu Cys Gly Lys Ser
125
Gln Arg Thr His Thr Gly 140
Lys Ser Phe Ser Arg Glu
155 160
Thr Gly Glu Lys Pro Tyr
175
Thr Ser His Ser Leu Thr
190
Pro Tyr Lys Cys Pro Glu
205
Leu Val Arg His Gln Arg
220
Pro Glu Cys Gly Lys Ser
235 240
Gln Arg Thr His Thr Gly
255
- 169 046157
Lys Lys Thr Ser
260 <210> 92 <211> 177 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 92
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr 20 25
Gly Gln Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg 35 40
Glu Asp Asn Leu 45
His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Asp
Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu
70 75
Val Arg His Thr
Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala
90
Cys Pro Val Glu
Ser Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu
100 105
Thr Glu His Ile
110
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg
115 120
Ile Cys Met Arg 125
Asn Phe Ser Thr Ser Gly His Leu Val Arg His Ile
130 135 140
Arg Thr His Thr
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
145 150 155
Lys Phe Ala Gln
160
Asn Ser Thr Leu Thr Glu His Thr Lys Ile His Leu
165 170
Arg Gln Lys Asp
175
Lys
- 170 046157 <210> 93 <211> 177 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 93
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr 20 25
Gly Gln Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His 35 40
Arg Thr Thr Leu 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Asp
Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu 65 70 75
His Thr His Thr
Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala 85 90
Cys Pro Val Glu
Ser Cys Asp Arg Arg Phe Ser Thr Ser His Ser Leu
100 105
Thr Glu His Ile
110
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg
115 120
Ile Cys Met Arg 125
Asn Phe Ser Gln Ser Ser Ser Leu Val Arg His Ile
130 135 140
Arg Thr His Thr
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
145 150 155
Lys Phe Ala Arg
160
Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu
165 170
Arg Gln Lys Asp
175
Lys <210> 94 <211> 264 <212> Белок <213> Искусственная последовательность
- 171 046157 <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 94
Arg Pro Tyr Ala 1
Cys Pro Val Glu Ser 5
Arg Asp Glu Leu
Asn Val His Ile Arg
Phe Gln Cys Arg
Ile Cys Met Arg Asn
Thr Asn His Ile
Arg Thr His Thr Gly 55
Cys Asp Arg 10
Ile His Thr
Phe Ser Arg
Glu Lys Pro 60
Arg Phe Ser Arg 15
Gly Gln Lys Pro 30
Ser Asp His Leu 45
Phe Ala Cys Asp
Ile Cys 65
Lys Ile
Ser Cys
Arg Ile
Asn Phe
130
Gly Glu 145
Glu Asp
Arg Pro
Ser His
Phe Gln
210
Val Arg
Gly Arg
His Leu
Asp Arg
100
His Thr 115
Ser His
Lys Pro
Asn Leu
Tyr Ala
180
Ser Leu
195
Cys Arg
His Ile
Lys Phe
Arg Gln 85
Arg Phe
Gly Gln
Arg Thr
Phe Ala
150
His Thr 165
Cys Pro
Thr Glu
Ile Cys
Arg Thr
Ala Arg
Lys Asp
Ser Arg
Lys Pro
120
Thr Leu 135
Cys Asp
His Thr
Val Glu
His Ile
200
Met Arg 215
His Thr
Ser Asp
Arg Pro
Ser Asp 105
Phe Gln
Thr Asn
Ile Cys
Lys Ile
170
Ser Cys 185
Arg Ile
Asn Phe
Gly Glu
Asp Leu 75
Tyr Ala
Asn Leu
Cys Arg
His Ile
140
Gly Arg 155
His Leu
Asp Arg
His Thr
Ser Gln
220
Lys Pro
Val Arg His Thr
Cys Pro Val Glu
Val Arg His Ile
110
Ile Cys Met Arg 125
Arg Thr His Thr
Lys Phe Ala Arg
160
Arg Gln Lys Asp
175
Arg Phe Ser Thr 190
Gly Gln Lys Pro 205
Ser Ser Ser Leu
Phe Ala Cys Asp
- 172 046157
225 230 235
240
Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu
245 250
His Thr His Thr
255
Lys Ile His Leu Arg Gln Lys Asp
260 <210> 95 <211> 264 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 95
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Asp
Pro Gly Ala Leu Val Arg
His Ile Arg Ile His Thr 25
Gly Gln Lys Pro 30
Phe Gln Cys Arg Ile Cys 35
Met Arg Asn Phe Ser Arg 40
Ser Asp Asn Leu 45
Val Arg His Ile Arg Thr 50
His Thr Gly Glu Lys Pro 55 60
Phe Ala Cys Asp
Ile Cys Gly Arg Lys Phe 65 70
Ala Gln Ser Gly Asp Leu 75
Arg Arg His Thr
Lys Ile His Leu Arg Gln 85
Lys Asp Arg Pro Tyr Ala 90
Cys Pro Val Glu
Ser Cys Asp Arg Arg Phe
100
Ser Thr His Leu Asp Leu
105
Ile Arg His Ile 110
Arg Ile His Thr Gly Gln 115
Lys Pro Phe Gln Cys Arg
120
Ile Cys Met Arg 125
Asn Phe Ser Thr Ser Gly
130
Asn Leu Val Arg His Ile
135 140
Arg Thr His Thr
Gly Glu Lys Pro Phe Ala
145 150
Cys Asp Ile Cys Gly Arg
155
Lys Phe Ala Arg
160
Ser Asp Asn Leu Val Arg
165
His Thr Lys Ile His Leu 170
Arg Gln Lys Asp
175
- 173 046157
Arg Pro Tyr Ala Cys Pro
180
Val Glu Ser Cys Asp Arg
185
Arg Phe Ser Gln
190
Ser Gly His Leu Thr Glu
195
His Ile Arg Ile His Thr
200
Gly Gln Lys Pro 205
Phe Gln Cys Arg Ile Cys
210
Met Arg Asn Phe Ser Glu
215 220
Arg Ser His Leu
Arg Glu His Ile Arg Thr
225 230
His Thr Gly Glu Lys Pro
235
Phe Ala Cys Asp
240
Ile Cys Gly Arg Lys Phe
245
Ala Gln Ala Gly His Leu
250
Ala Ser His Thr
255
Lys Ile His Leu Arg Gln
260
Lys Asp <210> 96 <211> 175 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 96
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr 20 25
Gly His Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg 35 40
Glu Asp Asn Leu 45
His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Glu
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu 65 70 75
Val Arg His Ala
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro
90
Ala Glu Gly Cys
Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu
100 105
His Leu Arg Ile 110
- 174 046157
His Thr Gly His Lys Pro 115
Phe Gln Cys Arg Ile Cys
120
Met Arg Ser Phe 125
Ser Thr Ser Gly His Leu
130
Val Arg His Ile Arg Thr
135 140
His Thr Gly Glu
Lys Pro Phe Ala Cys Glu
145 150
Phe Cys Gly Arg Lys Phe
155
Ala Gln Asn Ser
160
Thr Leu Thr Glu His Ala
165
Lys Ile His Leu Lys Gln
170
Lys Glu Lys
175 <210> 97 <211> 175 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 97
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr 20 25
Gly His Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser His 35 40
Arg Thr Thr Leu 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Glu
Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu 65 70 75
His Thr His Ala
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro
90
Ala Glu Gly Cys
Asp Arg Arg Phe Ser Thr Ser His Ser Leu Thr Glu
100 105
His Leu Arg Ile 110
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys
115 120
Met Arg Ser Phe 125
Ser Gln Ser Ser Ser Leu Val Arg His Ile Arg Thr
130 135 140
His Thr Gly Glu
- 175 046157
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe
145 150 155
Ala Arg Glu Asp
160
Asn Leu His Thr His Ala Lys Ile His Leu Lys Gln
165 170
Lys Glu Lys
175 <210> 98 <211> 261 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 98
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg
5 10
Синтетический
Arg Phe Ser Arg 15
Arg Asp Glu Leu Asn Val His Leu Arg Ile His Thr 20 25
Gly His Lys Pro 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg 35 40
Ser Asp His Leu 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro
55 60
Phe Ala Cys Glu
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Asp Leu 65 70 75
Val Arg His Ala
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro
90
Ala Glu Gly Cys
Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg
100 105
His Leu Arg Ile 110
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys
115 120
Met Arg Ser Phe 125
Ser His Arg Thr Thr Leu Thr Asn His Ile Arg Thr
130 135 140
His Thr Gly Glu
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe
145 150 155
Ala Arg Glu Asp
160
Asn Leu His Thr His Ala Lys Ile His Leu Lys Gln
165 170
Lys Glu His Ala 175
Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Thr
Ser His Ser Leu
- 176 046157
180 185
190
Thr Glu His Leu Arg Ile His Thr Gly His Lys Pro
195 200
Phe Gln Cys Arg 205
Ile Cys Met Arg Ser Phe Ser Gln Ser Ser Ser Leu
210 215 220
Val Arg His Ile
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
225 230 235
Phe Cys Gly Arg
240
Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Ala
245 250
Lys Ile His Leu
255
Lys Gln Lys Glu Lys
260 <210> 99 <211> 753 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 99
Met Ala Pro Lys 1
Lys Lys Arg Lys 5
Val Gly Ile His 10
Gly Val Pro Ala 15
Ala Leu Glu Pro
Gly Glu Lys Pro
Tyr Lys Cys Pro 25
Glu Cys Gly Lys 30
Ser Phe Ser Arg
Ser Asp Asn Leu 40
Val Arg His Gln
Arg Thr His Thr 45
Gly Glu Lys Pro 50
Tyr Lys Cys Pro 55
Glu Cys Gly Lys 60
Ser Phe Ser His
Arg Thr Thr Leu 65
Thr Asn His Gln
Arg Thr His Thr 75
Gly Glu Lys Pro 80
Tyr Lys Cys Pro
Glu Cys Gly Lys 85
Ser Phe Ser Arg 90
Glu Asp Asn Leu
His Thr His Gln
100
Arg Thr His Thr
Gly Glu Lys Pro 105
Tyr Lys Cys Pro 110
Glu Cys Gly Lys
115
Ser Phe Ser Thr
120
Ser His Ser Leu
Thr Glu His Gln 125
- 177 046157
Arg Thr His Thr Gly Glu Lys Pro
130 135
Tyr Lys Cys Pro Glu Cys Gly
140
Ser Phe Ser Gln
145
Ser Ser Ser Leu Val Arg His Gln Arg Thr His
150 155
Gly Glu Lys Pro
Tyr Lys Cys Pro Glu Cys Gly Lys
165 170
Ser Phe Ser
175
Glu Asp Asn Leu His
180
Thr His Gln Arg Thr His Thr Gly Lys Lys
185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Glu
210 215 220
Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp
225 230 235
Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
245 250 255
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
260 265 270
Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly
275 280 285
Pro Lys Lys Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp Thr
290 295 300
Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr
305 310 315
Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro
325 330 335
Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser
340 345 350
Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser
355 360 365
Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln
Lys
Thr 160
Arg
Thr
Lys
Ala
Met 240
Ser
Leu
Ser
Asp
Phe 320
Arg
Val
Thr
Ile
- 178 046157
370
375
380
Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro
385 390 395
Ala Pro Ala Pro Ala
405
Pro Ala Pro Ala Met
410
Val Ser Ala Leu Ala
415
Ala Pro Ala Pro Val
420
Pro Val Leu Ala Pro
425
Gly Pro Pro Gln Ala
430
Ala Pro Pro Ala Pro
435
Lys Pro Thr Gln Ala
440
Gly Glu Gly Thr Leu 445
Glu Ala Leu Leu Gln
450
Leu Gln Phe Asp Asp
455
Glu Asp Leu Gly Ala
460
Leu Gly Asn Ser Thr 465
Asp Pro Ala Val Phe 470
Thr Asp Leu Ala Ser 475
Asp Asn Ser Glu Phe
485
Gln Gln Leu Leu Asn
490
Gln Gly Ile Pro Val
495
Pro His Thr Thr Glu
500
Pro Met Leu Met Glu
505
Tyr Pro Glu Ala Ile
510
Arg Leu Val Thr Gly 515
Ala Gln Arg Pro Pro 520
Asp Pro Ala Pro Ala 525
Leu Gly Ala Pro Gly
530
Leu Pro Asn Gly Leu
535
Leu Ser Gly Asp Glu
540
Phe Ser Ser Ile Ala 545
Asp Met Asp Phe Ser 550
Ala Leu Leu Gly Ser 555
Ser Gly Ser Arg Asp
565
Ser Arg Glu Gly Met
570
Phe Leu Pro Lys Pro
575
Ala Gly Ser Ala Ile
580
Ser Asp Val Phe Glu
585
Gly Arg Glu Val Cys
590
Pro Lys Arg Ile Arg 595
Pro Phe His Pro Pro
600
Gly Ser Pro Trp Ala 605
Arg Pro Leu Pro Ala
610
Ser Leu Ala Pro Thr
615
Pro Thr Gly Pro Val
620
Gln 400
Gln
Val
Ser
Leu
Val 480
Ala
Thr
Pro
Asp
Gly 560
Glu
Gln
Asn
His
- 179 046157
Glu Pro Val 625
Pro Ala Pro
Asp Glu Glu
Thr Val Ile 675
Leu Ser His 690
Leu Glu Ser 705
Glu Leu Asn
His Ala Met
Phe
Gly Ser Leu
630
Ala Val Thr
645
Thr Ser Gln 660
Pro Gln Lys
Pro Pro Pro
Met Thr Glu
710
Glu Ile Leu
725
His Ile Ser 740
Thr Pro Ala
Pro Glu Ala
Ala Val Lys 665
Glu Glu Ala 680
Arg Gly His 695
Asp Leu Asn
Asp Thr Phe
Thr Gly Leu
745
Pro Val Pro
635
Ser His Leu 650
Ala Leu Arg
Ala Ile Cys
Leu Asp Glu
700
Leu Asp Ser
715
Leu Asn Asp 730
Ser Ile Phe
Gln Pro Leu Asp
640
Leu Glu Asp Pro
655
Glu Met Ala Asp
670
Gly Gln Met Asp 685
Leu Thr Thr Thr
Pro Leu Thr Pro
720
Glu Cys Leu Leu
735
Asp Thr Ser Leu 750 <210> 100 <211> 753 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 100
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His
510
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 2025
Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln 3540
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys 50 5560
Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr
Синтетический
Gly Val Pro Ala 15
Glu Cys Gly Lys 30
Arg Thr His Thr 45
Ser Phe Ser Arg
Gly Glu Lys Pro
- 180 046157
70 75
Tyr Lys Cys Pro Glu 85
Cys Gly Lys Ser Phe
Ser Arg Ser Asp Glu
Val Arg His Gln Arg
100
Thr His Thr Gly Glu
105
Lys Pro Tyr Lys Cys
110
Glu Cys Gly Lys Ser 115
Phe Ser Gln Ser Gly 120
Asn Leu Thr Glu His
125
Arg Thr His Thr Gly 130
Glu Lys Pro Tyr Lys 135
Cys Pro Glu Cys Gly
140
Ser Phe Ser Thr Ser 145
Gly His Leu Val Arg 150
His Gln Arg Thr His 155
Gly Glu Lys Pro Tyr
165
Lys Cys Pro Glu Cys
170
Gly Lys Ser Phe Ser
175
Asn Ser Thr Leu Thr
180
Glu His Gln Arg Thr
185
His Thr Gly Lys Lys
190
Ser Lys Arg Pro Ala
195
Ala Thr Lys Lys Ala 200
Gly Gln Ala Lys Lys 205
Lys Gly Ser Tyr Pro
210
Tyr Asp Val Pro Asp
215
Tyr Ala Leu Glu Glu
220
Ser Gly Ser Gly Arg 225
Ala Asp Ala Leu Asp 230
Asp Phe Asp Leu Asp 235
Leu Gly Ser Asp Ala
245
Leu Asp Asp Phe Asp
250
Leu Asp Met Leu Gly
255
Asp Ala Leu Asp Asp
260
Phe Asp Leu Asp Met
265
Leu Gly Ser Asp Ala
270
Asp Asp Phe Asp Leu 275
Asp Met Leu Ile Asn 280
Ser Arg Ser Ser Gly
285
Pro Lys Lys Lys Arg 290
Lys Val Gly Ser Gln
295
Tyr Leu Pro Asp Thr
300
Asp Arg His Arg Ile 305
Glu Glu Lys Arg Lys 310
Arg Thr Tyr Glu Thr 315
Leu
Pro
Gln
Lys
Thr 160
Gln
Thr
Lys
Ala
Met 240
Ser
Leu
Ser
Asp
Phe 320
- 181 046157
Lys
Ser Ile Met Lys Lys Ser Pro
325
Phe Ser Gly Pro Thr Asp Pro
330 335
Pro Pro Pro Arg Arg Ile Ala Val Pro
340 345
Ser Arg Ser
Ser Ala Ser
350
Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser
355 360 365
Ile Asn Tyr Asp Glu
370
Phe Pro Thr Met Val
375
Phe Pro Ser Gly Gln 380
Ser Gln Ala Ser Ala 385
Leu Ala Pro Ala Pro 390
Pro Gln Val Leu Pro 395
Ala Pro Ala Pro Ala
405
Pro Ala Pro Ala Met
410
Val Ser Ala Leu Ala
415
Ala Pro Ala Pro Val
420
Pro Val Leu Ala Pro
425
Gly Pro Pro Gln Ala
430
Ala Pro Pro Ala Pro
435
Lys Pro Thr Gln Ala
440
Gly Glu Gly Thr Leu 445
Glu Ala Leu Leu Gln
450
Leu Gln Phe Asp Asp 455
Glu Asp Leu Gly Ala
460
Leu Gly Asn Ser Thr 465
Asp Pro Ala Val Phe 470
Thr Asp Leu Ala Ser 475
Asp Asn Ser Glu Phe
485
Gln Gln Leu Leu Asn
490
Gln Gly Ile Pro Val
495
Pro His Thr Thr Glu
500
Pro Met Leu Met Glu
505
Tyr Pro Glu Ala Ile
510
Arg Leu Val Thr Gly 515
Ala Gln Arg Pro Pro 520
Asp Pro Ala Pro Ala 525
Leu Gly Ala Pro Gly
530
Leu Pro Asn Gly Leu
535
Leu Ser Gly Asp Glu 540
Phe Ser Ser Ile Ala 545
Asp Met Asp Phe Ser 550
Ala Leu Leu Gly Ser 555
Ser Gly Ser Arg Asp
565
Ser Arg Glu Gly Met
570
Phe Leu Pro Lys Pro
575
Arg
Val
Thr
Ile
Gln 400
Gln
Val
Ser
Leu
Val 480
Ala
Thr
Pro
Asp
Gly 560
Glu
- 182 046157
Ala Gly Ser
Ala Ile Ser 580
Asp Val Phe
585
Glu Gly Arg
Glu Val Cys Gln 590
Pro Lys Arg 595
Arg Pro Leu 610
Ile Arg Pro
Phe His Pro
600
Pro Gly Ser
Pro Trp Ala Asn 605
Pro Ala Ser
Leu Ala Pro 615
Thr Pro Thr
620
Gly Pro Val His
Glu Pro Val 625
Gly Ser Leu
630
Thr Pro Ala
Pro Val Pro
635
Gln Pro Leu Asp
640
Pro Ala Pro
Asp Glu Glu
Thr Val Ile 675
Leu Ser His 690
Leu Glu Ser 705
Glu Leu Asn
Ala Val Thr
645
Pro Glu Ala
Ser His Leu 650
Leu Glu Asp Pro
655
His Ala Met
Phe
Thr Ser Gln 660
Pro Gln Lys
Pro Pro Pro
Met Thr Glu
710
Glu Ile Leu
725
His Ile Ser 740
Ala Val Lys
665
Ala Leu Arg
Glu Met Ala Asp
670
Glu Glu Ala
680
Ala Ile Cys
Gly Gln Met Asp 685
Arg Gly His 695
Asp Leu Asn
Asp Thr Phe
Thr Gly Leu
745
Leu Asp Glu
700
Leu Asp Ser
715
Leu Asn Asp 730
Ser Ile Phe <210> 101 <211> 272 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 101
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His
5 10
Leu Thr Thr Thr
Pro Leu Thr Pro
720
Glu Cys Leu Leu
735
Asp Thr Ser Leu 750
Синтетический
Gly Val Pro Ala 15
- 183 046157
Ala Leu Glu Pro Gly
Glu Lys Pro Tyr Lys 25
Cys Pro Glu Cys Gly 30
Ser Phe Ser Arg Ser 35
Asp Asn Leu Val Arg 40
His Gln Arg Thr His 45
Gly Glu Lys Pro Tyr 50
Lys Cys Pro Glu Cys 55
Gly Lys Ser Phe Ser 60
Arg Thr Thr Leu Thr 65
Asn His Gln Arg Thr 70
His Thr Gly Glu Lys 75
Tyr Lys Cys Pro Glu 85
Cys Gly Lys Ser Phe
Ser Arg Glu Asp Asn
His Thr His Gln Arg
100
Thr His Thr Gly Glu
105
Lys Pro Tyr Lys Cys
110
Glu Cys Gly Lys Ser 115
Phe Ser Thr Ser His
120
Ser Leu Thr Glu His
125
Arg Thr His Thr Gly 130
Glu Lys Pro Tyr Lys 135
Cys Pro Glu Cys Gly
140
Ser Phe Ser Gln Ser 145
Ser Ser Leu Val Arg 150
His Gln Arg Thr His 155
Gly Glu Lys Pro Tyr
165
Lys Cys Pro Glu Cys
170
Gly Lys Ser Phe Ser
175
Glu Asp Asn Leu His
180
Thr His Gln Arg Thr
185
His Thr Gly Lys Lys
190
Ser Lys Arg Pro Ala
195
Ala Thr Lys Lys Ala
200
Gly Gln Ala Lys Lys 205
Lys Gly Ser Tyr Pro
210
Tyr Asp Val Pro Asp
215
Tyr Ala Leu Glu Asp
220
Leu Asp Asp Phe Asp 225
Leu Asp Met Leu Gly 230
Ser Asp Ala Leu Asp 235
Phe Asp Leu Asp Met
245
Leu Gly Ser Asp Ala
250
Leu Asp Asp Phe Asp
255
Asp Met Leu Gly Ser
260
Asp Ala Leu Asp Asp
265
Phe Asp Leu Asp Met
270
Lys
Thr
His
Pro 80
Leu
Pro
Gln
Lys
Thr 160
Arg
Thr
Lys
Ala
Asp 240
Leu
Leu
- 184 046157 <210> 102 <211> 272 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 102
Met Ala Pro Lys Lys Lys Arg Lys 1 5
Val Gly Ile His Gly Val Pro Ala
15
Ala Leu Glu Pro Gly Glu Lys Pro 20
Tyr Lys Cys Pro Glu Cys Gly Lys 25 30
Ser Phe Ser Arg Ser Asp Asn Leu
40
Val Arg His Gln Arg Thr His Thr 45
Gly Glu Lys Pro Tyr Lys Cys Pro
55
Glu Cys Gly Lys Ser Phe Ser Arg 60
Glu Asp Asn Leu His Thr His Gln 65 70
Arg Thr His Thr Gly Glu Lys Pro
80
Tyr Lys Cys Pro Glu Cys Gly Lys 85
Ser Phe Ser Arg Ser Asp Glu Leu
95
Val Arg His Gln Arg Thr His Thr
100
Gly Glu Lys Pro Tyr Lys Cys Pro
105 110
Glu Cys Gly Lys Ser Phe Ser Gln
115 120
Ser Gly Asn Leu Thr Glu His Gln
125
Arg Thr His Thr Gly Glu Lys Pro
130 135
Tyr Lys Cys Pro Glu Cys Gly Lys
140
Ser Phe Ser Thr Ser Gly His Leu
145 150
Val Arg His Gln Arg Thr His Thr
155 160
Gly Glu Lys Pro Tyr Lys Cys Pro
165
Glu Cys Gly Lys Ser Phe Ser Gln
170 175
Asn Ser Thr Leu Thr Glu His Gln
180
Arg Thr His Thr Gly Lys Lys Thr 185 190
Ser Lys Arg Pro Ala Ala Thr Lys
195 200
Lys Ala Gly Gln Ala Lys Lys Lys
205
- 185 046157
Lys Gly Ser Tyr Pro Tyr
210
Asp Val Pro Asp Tyr Ala
215 220
Leu Glu Asp Ala
Leu Asp Asp Phe Asp Leu
225 230
Asp Met Leu Gly Ser Asp
235
Ala Leu Asp Asp
240
Phe Asp Leu Asp Met Leu
245
Gly Ser Asp Ala Leu Asp
250
Asp Phe Asp Leu
255
Asp Met Leu Gly Ser Asp
260
Ala Leu Asp Asp Phe Asp
265
Leu Asp Met Leu 270 <210>
<211>
<212>
103
580 Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 103
Синтетический
Met Ala Ala 1
Arg Pro Pro
Leu Pro Pro
Gly Ala Pro 50
Tyr Gly Ala 65
Pro Pro Pro
Tyr Pro Gly
Gly Pro Gln
115
Ala Leu Gly
130
Ser Leu Glu
Asp His Leu 5
Ser Ala Ala 20
Tyr Ala Gly
Leu Gly Pro
Phe Gly Pro 70
Ala Ala Gly 85
Arg Ala Ala 100
Pro Ala Pro
Gly Met Asp
Leu Glu Leu
Met Leu Ala
Ala Ala His
Pro Gly Leu 40
Pro Pro Pro 55
Pro Ser Ser
Ile Ala His
Ala Pro Pro
105
Ser Ala Ala
120
Ala Glu Leu 135
Gly Leu His
Glu Gly Tyr 10
Gly Pro His
Asp Ser Gly
Arg Gln Pro 60
Phe Gln Pro 75
Leu Gln Pro 90
Asn Ala Pro
Ala Pro Pro
Ile Asp Glu
140
Arg Val Arg
Arg Leu Val Gln 15
Ala Leu Arg Thr 30
Leu Arg Pro Arg 45
Gly Ala Leu Ala
Phe Pro Ala Val
Val Ala Thr Pro
Gly Gly Pro Pro 110
Pro Pro Ala His 125
Glu Ala Leu Thr
Glu Leu Pro Glu
- 186 046157
145
150
155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Gln Ser Gln Leu
195
Ile Lys Pro Ser Arg 200
Met Arg Lys Tyr Pro 205
Arg Pro Ser Lys Thr 210
Pro Pro His Glu Arg 215
Pro Tyr Ala Cys Pro 220
Glu Ser Cys Asp Arg 225
Arg Phe Ser Arg Ser 230
Asp Asn Leu Val Arg 235
Ile Arg Ile His Thr
245
Gly Gln Lys Pro Phe
250
Gln Cys Arg Ile Cys
255
Arg Asn Phe Ser His
260
Arg Thr Thr Leu Thr
265
Asn His Ile Arg Thr
270
Thr Gly Glu Lys Pro
275
Phe Ala Cys Asp Ile 280
Cys Gly Arg Lys Phe
285
Arg Glu Asp Asn Leu
290
His Thr His Thr Lys
295
Ile His Leu Arg Gln
300
Asp Arg Pro Tyr Ala 305
Cys Pro Val Glu Ser 310
Cys Asp Arg Arg Phe 315
Thr Ser His Ser Leu
325
Thr Glu His Ile Arg
330
Ile His Thr Gly Gln
335
Pro Phe Gln Cys Arg
340
Ile Cys Met Arg Asn
345
Phe Ser Gln Ser Ser
350
Leu Val Arg His Ile 355
Arg Thr His Thr Gly 360
Glu Lys Pro Phe Ala 365
Asp Ile Cys Gly Arg
370
Lys Phe Ala Arg Glu
375
Asp Asn Leu His Thr 380
Thr Lys Ile His Leu 385
Arg Gln Lys Asp Lys 390
Leu Glu Met Ala Asp 395
160
Ser
Ser
Asn
Val
His 240
Met
His
Ala
Lys
Ser 320
Lys
Ser
Cys
His
His 400
- 187 046157
Leu Met Leu
Ala Glu Gly
405
Tyr Arg Leu
Val Gln Arg 410
Pro Pro Ser Ala
415
Ala Ala Ala
His Gly Pro 420
His Ala Leu
425
Arg Thr Leu
Pro Pro Tyr Ala
430
Gly Pro Gly
435
Leu Asp Ser
Gly Leu Arg
440
Pro Arg Gly
Ala Pro Leu Gly 445
Pro Pro Pro
450
Pro Arg Gln
Pro Gly Ala 455
Leu Ala Tyr
460
Gly Ala Phe Gly
Pro Pro Ser 465
Ser Phe Gln
470
Pro Phe Pro
Ala Val Pro
475
Pro Pro Ala Ala
480
Gly Ile Ala
His Leu Gln
485
Pro Val Ala
Thr Pro Tyr 490
Pro Gly Arg Ala
495
Ala Ala Pro
Pro Asn Ala 500
Pro Gly Gly
505
Pro Pro Gly
Pro Gln Pro Ala
510
Pro Ser Ala
515
Ala Ala Pro
Pro Pro Pro
520
Ala His Ala
Leu Gly Gly Met 525
Asp Ala Glu
530
Leu Ile Asp
Glu Glu Ala 535
Leu Thr Ser
540
Leu Glu Leu Glu
Leu Gly Leu 545
His Arg Val
550
Arg Glu Leu
Pro Glu Leu
555
Phe Leu Gly Gln
560
Ser Glu Phe
Asp Cys Phe
565
Ser Asp Leu
Gly Ser Ala 570
Pro Pro Ala Gly
575
Ser Val Ser Cys
580 <210> 104 <211> 394 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 104
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr 1 5 10
Arg Leu Val Gln 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His
Ala Leu Arg Thr
- 188 046157
Leu Pro Pro Tyr Ala 35
Gly Pro Gly Leu Asp 40
Ser Gly Leu Arg Pro 45
Gly Ala Pro Leu Gly 50
Pro Pro Pro Pro Arg 55
Gln Pro Gly Ala Leu 60
Tyr Gly Ala Phe Gly 65
Pro Pro Ser Ser Phe 70
Gln Pro Phe Pro Ala 75
Pro Pro Pro Ala Ala
Gly Ile Ala His Leu
Gln Pro Val Ala Thr
Tyr Pro Gly Arg Ala
100
Ala Ala Pro Pro Asn
105
Ala Pro Gly Gly Pro
110
Gly Pro Gln Pro Ala
115
Pro Ser Ala Ala Ala
120
Pro Pro Pro Pro Ala
125
Ala Leu Gly Gly Met
130
Asp Ala Glu Leu Ile 135
Asp Glu Glu Ala Leu 140
Ser Leu Glu Leu Glu 145
Leu Gly Leu His Arg 150
Val Arg Glu Leu Pro 155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Gln Ser Gln Leu 195
Ile Lys Pro Ser Arg 200
Met Arg Lys Tyr Pro 205
Arg Pro Ser Lys Thr 210
Pro Pro His Glu Arg 215
Pro Tyr Ala Cys Pro 220
Glu Ser Cys Asp Arg 225
Arg Phe Ser Arg Ser 230
Asp Asn Leu Val Arg 235
Ile Arg Ile His Thr
245
Gly Gln Lys Pro Phe
250
Gln Cys Arg Ile Cys
255
Arg Asn Phe Ser His
260
Arg Thr Thr Leu Thr
265
Asn His Ile Arg Thr
270
Arg
Ala
Val 80
Pro
Pro
His
Thr
Glu 160
Ser
Ser
Asn
Val
His 240
Met
His
- 189 046157
Thr Gly Glu
275
Lys Pro Phe
Ala Cys Asp
280
Arg Glu Asp
290
Asn Leu His
Thr His Thr 295
Asp Arg Pro 305
Thr Ser His
Pro Phe Gln
Leu Val Arg
355
Asp Ile Cys
370
Thr Lys Ile 385
Tyr Ala Cys 310
Ser Leu Thr 325
Cys Arg Ile 340
His Ile Arg
Gly Arg Lys
His Leu Arg 390
Pro Val Glu
Glu His Ile
Cys Met Arg
345
Thr His Thr
360
Phe Ala Arg 375
Gln Lys Asp
Ile Cys Gly
Lys Ile His 300
Ser Cys Asp 315
Arg Ile His 330
Asn Phe Ser
Gly Glu Lys
Glu Asp Asn
380
Lys
Arg Lys Phe Ala 285
Leu Arg Gln Lys
Arg Arg Phe Ser
320
Thr Gly Gln Lys
335
Gln Ser Ser Ser
350
Pro Phe Ala Cys 365
Leu His Thr His <210> 105 <211> 580 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 105
Met Ala Ala Asp 1
His Leu Met Leu 5
Ala Glu Gly Tyr 10
Arg Leu Val Gln 15
Arg Pro Pro Ser
Ala Ala Ala Ala
His Gly Pro His 25
Ala Leu Arg Thr 30
Leu Pro Pro Tyr 35
Ala Gly Pro Gly 40
Leu Asp Ser Gly
Leu Arg Pro Arg 45
Gly Ala Pro Leu 50
Gly Pro Pro Pro 55
Pro Arg Gln Pro
Gly Ala Leu Ala
Tyr Gly Ala Phe 65
Gly Pro Pro Ser 70
Ser Phe Gln Pro
Phe Pro Ala Val
Pro Pro Pro Ala
Ala Gly Ile Ala
His Leu Gln Pro
Val Ala Thr Pro
- 190 046157
Tyr Pro Gly Arg Ala
100
Ala Ala Pro Pro Asn
105
Ala Pro Gly Gly Pro
110
Gly Pro Gln Pro Ala
115
Pro Ser Ala Ala Ala
120
Pro Pro Pro Pro Ala
125
Ala Leu Gly Gly Met
130
Asp Ala Glu Leu Ile 135
Asp Glu Glu Ala Leu 140
Ser Leu Glu Leu Glu 145
Leu Gly Leu His Arg 150
Val Arg Glu Leu Pro 155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Gln Ser Gln Leu 195
Ile Lys Pro Ser Arg 200
Met Arg Lys Tyr Pro 205
Arg Pro Ser Lys Thr
210
Pro Pro His Glu Arg 215
Pro Tyr Ala Cys Pro 220
Glu Ser Cys Asp Arg 225
Arg Phe Ser Arg Ser 230
Asp Asn Leu Val Arg 235
Ile Arg Ile His Thr
245
Gly Gln Lys Pro Phe
250
Gln Cys Arg Ile Cys
255
Arg Asn Phe Ser Arg
260
Glu Asp Asn Leu His
265
Thr His Ile Arg Thr
270
Thr Gly Glu Lys Pro
275
Phe Ala Cys Asp Ile 280
Cys Gly Arg Lys Phe
285
Arg Ser Asp Glu Leu
290
Val Arg His Thr Lys
295
Ile His Leu Arg Gln
300
Asp Arg Pro Tyr Ala 305
Cys Pro Val Glu Ser 310
Cys Asp Arg Arg Phe 315
Gln Ser Gly Asn Leu
325
Thr Glu His Ile Arg
330
Ile His Thr Gly Gln
335
Pro
His
Thr
Glu 160
Ser
Ser
Asn
Val
His 240
Met
His
Ala
Lys
Ser 320
Lys
- 191 046157
Pro Phe Gln Cys Arg Ile Cys Met Arg
340 345
Leu Val Arg His Ile Arg Thr His Thr
355 360
Asp Ile Cys Gly Arg Lys Phe Ala Gln
370 375
Thr Lys Ile His Leu Arg Gln Lys Asp
385 390
Leu Met Leu Ala Glu Gly Tyr Arg Leu
405
Ala Ala Ala His Gly Pro His Ala Leu
420 425
Gly Pro Gly Leu Asp Ser Gly Leu Arg
435 440
Pro Pro Pro Pro Arg Gln Pro Gly Ala
450 455
Pro Pro Ser Ser Phe Gln Pro Phe Pro
465 470
Gly Ile Ala His Leu Gln Pro Val Ala 485
Ala Ala Pro Pro Asn Ala Pro Gly Gly
500 505
Pro Ser Ala Ala Ala Pro Pro Pro Pro
515 520
Asp Ala Glu Leu Ile Asp Glu Glu Ala
530 535
Leu Gly Leu His Arg Val Arg Glu Leu
545 550
Ser Glu Phe Asp Cys Phe Ser Asp Leu
565
Phe Ser Thr Ser Gly His
350
Glu Lys Pro Phe Ala Cys 365
Ser Thr Leu Thr Glu His
380
Leu Glu Met Ala Asp His
395 400
Gln Arg Pro Pro Ser Ala
415
Thr Leu Pro Pro Tyr Ala
430
Arg Gly Ala Pro Leu Gly
445
Ala Tyr Gly Ala Phe Gly
460
Val Pro Pro Pro Ala Ala
475 480
Pro Tyr Pro Gly Arg Ala
495
Pro Gly Pro Gln Pro Ala
510
His Ala Leu Gly Gly Met
525
Thr Ser Leu Glu Leu Glu
540
Glu Leu Phe Leu Gly Gln
555 560
Ser Ala Pro Pro Ala Gly
575
Ser Val Ser Cys
580
- 192 046157 <210> 106 <211> 394 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 106
Met Ala Ala Asp His Leu Met Leu 1 5
Ala Glu Gly Tyr Arg Leu Val Gln
15
Arg Pro Pro Ser Ala Ala Ala Ala 20
His Gly Pro His Ala Leu Arg Thr 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly
40
Leu Asp Ser Gly Leu Arg Pro Arg 45
Gly Ala Pro Leu Gly Pro Pro Pro
55
Pro Arg Gln Pro Gly Ala Leu Ala 60
Tyr Gly Ala Phe Gly Pro Pro Ser 65 70
Ser Phe Gln Pro Phe Pro Ala Val
80
Pro Pro Pro Ala Ala Gly Ile Ala 85
His Leu Gln Pro Val Ala Thr Pro
95
Tyr Pro Gly Arg Ala Ala Ala Pro
100
Pro Asn Ala Pro Gly Gly Pro Pro
105 110
Gly Pro Gln Pro Ala Pro Ser Ala
115 120
Ala Ala Pro Pro Pro Pro Ala His
125
Ala Leu Gly Gly Met Asp Ala Glu
130 135
Leu Ile Asp Glu Glu Ala Leu Thr
140
Ser Leu Glu Leu Glu Leu Gly Leu
145 150
His Arg Val Arg Glu Leu Pro Glu
155 160
Leu Phe Leu Gly Gln Ser Glu Phe
165
Asp Cys Phe Ser Asp Leu Gly Ser
170 175
Ala Pro Pro Ala Gly Ser Val Ser
180
Cys Gly Gly Ser Gly Gly Gly Ser
185 190
Gly Gln Ser Gln Leu Ile Lys Pro
195 200
Ser Arg Met Arg Lys Tyr Pro Asn
205
- 193 046157
Arg Pro
210
Ser Lys
Thr Pro
Glu Ser 225
Cys Asp
Arg Arg
230
Ile Arg
Ile His
Thr Gly 245
Arg Asn
Phe Ser
260
Arg Glu
Pro His 215
Phe Ser
Gln Lys
Asp Asn
Glu Arg
Arg Ser
Pro Phe
250
Leu His 265
Thr Gly
Glu Lys 275
Pro Phe
Ala Cys
280
Asp Ile
Pro Tyr 220
Asp Asn 235
Gln Cys
Thr His
Cys Gly
Ala Cys Pro Val
Leu Val Arg His
240
Arg Ile Cys Met
255
Ile Arg Thr His
270
Arg Lys Phe Ala 285
Arg Ser
290
Asp Glu
Leu Val
Arg His 295
Thr Lys
Ile His
300
Leu Arg Gln Lys
Asp Arg 305
Pro Tyr
Ala Cys
310
Pro Val
Glu Ser
Cys Asp 315
Arg Arg Phe Ser
320
Gln Ser
Gly Asn
Leu Thr 325
Glu His
Ile Arg
330
Ile His
Thr Gly Gln Lys
335
Pro Phe
Gln Cys
340
Arg Ile
Cys Met
Arg Asn 345
Phe Ser
Thr Ser Gly His 350
Leu Val
Arg His 355
Ile Arg
Thr His
360
Thr Gly
Glu Lys
Pro Phe Ala Cys 365
Asp Ile
370
Cys Gly
Arg Lys
Phe Ala 375
Gln Asn
Ser Thr
380
Leu Thr Glu His
Thr Lys 385
Ile His
Leu Arg
390
Gln Lys
Asp Lys <210> 107 <211> 388 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 107
Met Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg 1 5 10
Lys Tyr Pro Asn
Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr
Ala Cys Pro Val
- 194 046157
Glu Ser Cys Asp Arg 35
Arg Phe Ser Arg Ser 40
Asp Asn Leu Val Arg 45
Ile Arg Ile His Thr 50
Gly Gln Lys Pro Phe 55
Gln Cys Arg Ile Cys 60
Arg Asn Phe Ser Arg 65
Glu Asp Asn Leu His 70
Thr His Ile Arg Thr 75
Thr Gly Glu Lys Pro
Phe Ala Cys Asp Ile
Cys Gly Arg Lys Phe
Arg Ser Asp Glu Leu
100
Val Arg His Thr Lys
105
Ile His Leu Arg Gln
110
Asp Arg Pro Tyr Ala 115
Cys Pro Val Glu Ser 120
Cys Asp Arg Arg Phe 125
Gln Ser Gly Asn Leu
130
Thr Glu His Ile Arg
135
Ile His Thr Gly Gln
140
Pro Phe Gln Cys Arg 145
Ile Cys Met Arg Asn 150
Phe Ser Thr Ser Gly 155
Leu Val Arg His Ile
165
Arg Thr His Thr Gly
170
Glu Lys Pro Phe Ala
175
Asp Ile Cys Gly Arg
180
Lys Phe Ala Gln Asn
185
Ser Thr Leu Thr Glu
190
Thr Lys Ile His Leu 195
Arg Gln Lys Asp Lys
200
Leu Glu Met Ala Asp
205
Leu Met Leu Ala Glu
210
Gly Tyr Arg Leu Val
215
Gln Arg Pro Pro Ser
220
Ala Ala Ala His Gly 225
Pro His Ala Leu Arg 230
Thr Leu Pro Pro Tyr 235
Gly Pro Gly Leu Asp
245
Ser Gly Leu Arg Pro
250
Arg Gly Ala Pro Leu
255
Pro Pro Pro Pro Arg
260
Gln Pro Gly Ala Leu
265
Ala Tyr Gly Ala Phe
270
His
Met
His 80
Ala
Lys
Ser
Lys
His 160
Cys
His
His
Ala
Ala 240
Gly
Gly
- 195 046157
Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro
275 280
Pro Pro Ala Ala 285
Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr
290 295 300
Pro Gly Arg Ala
Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly
305 310 315
Pro Gln Pro Ala
320
Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala
325 330
Leu Gly Gly Met
335
Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser
340 345
Leu Glu Leu Glu
350
Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu
355 360
Phe Leu Gly Gln 365
Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala
370 375 380
Pro Pro Ala Gly
Ser Val Ser Cys 385 <210> 108 <211> 479 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 108
Met Gln Ser Gln 1
Leu Ile Lys Pro 5
Ser Arg Met Arg 10
Lys Tyr Pro Asn 15
Arg Pro Ser Lys
Thr Pro Pro His
Glu Arg Pro Tyr 25
Ala Cys Pro Val 30
Glu Ser Cys Asp 35
Arg Arg Phe Ser 40
Arg Ser Asp Asn
Leu Val Arg His 45
Ile Arg Ile His 50
Thr Gly Gln Lys 55
Pro Phe Gln Cys 60
Arg Ile Cys Met
Arg Asn Phe Ser 65
Arg Glu Asp Asn 70
Leu His Thr His
Ile Arg Thr His
Thr Gly Glu Lys
Pro Phe Ala Cys
Asp Ile Cys Gly
Arg Lys Phe Ala
- 196 046157
90 95
Arg
Asp
Gln
Pro 145
Leu
Asp
Thr
Glu
Gly 225
Gln
Phe
Asn
Gly
Ser 305
Ala
Ser Asp Glu Leu Val
100
Arg His Thr Lys Ile 105
His Leu Arg Gln Lys 110
Arg Pro Tyr Ala Cys 115
Pro Val Glu Ser Cys
120
Asp Arg Arg Phe Ser 125
Ser Gly Asn Leu Thr 130
Glu His Ile Arg Ile 135
His Thr Gly Gln Lys 140
Phe Gln Cys Arg Ile
150
Cys Met Arg Asn Phe
155
Ser Thr Ser Gly His
160
Val Arg His Ile Arg
165
Thr His Thr Gly Glu
170
Lys Pro Phe Ala Cys
175
Ile Cys Gly Arg Lys
180
Phe Ala Gln Asn Ser
185
Thr Leu Thr Glu His
190
Lys Ile His Leu Arg
195
Gln Lys Asp Lys Leu
200
Glu Met Ser Gly Leu 205
Met Ala Asp His Met 210
Met Ala Met Asn His 215
Gly Arg Phe Pro Asp 220
Thr Asn Gly Leu His
230
His His Pro Ala His
235
Arg Met Gly Met Gly
240
Phe Pro Ser Pro His
245
His His Gln Gln Gln
250
Gln Pro Gln His Ala
255
Asn Ala Leu Met Gly 260
Ala Thr Ser Gly Ile 275
Gly His Pro Pro Ser 290
Gln Phe Met Gly Pro
310
Ser Met Gln Leu Gln
325
Glu His Ile His Tyr 265
Gly Ala Gly Asn Met 270
Arg His Ala Met Gly 280
Ala Leu Ala Pro Ala 295
Pro Val Ala Ser Gln
315
Lys Leu Asn Asn Gln
330
Pro Gly Thr Val Asn
285
Ala Arg Phe Asn Asn 300
Gly Gly Ser Leu Pro
320
Tyr Phe Asn His His
335
- 197 046157
Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
340 345
Pro Ala Ala Gly
350
His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
355 360
Cys Asn Pro Lys 365
His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
370 375 380
Gly Ser Ser Thr
Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
385 390 395
Gly Ser Ser Asn
400
Ser Gly Gly Gly
Ser Gly Ser Gly Asn Met Pro Ala
405 410
Ser Val Ala His
415
Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
420 425
Thr Asp Phe Ile 430
Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
435 440
Gly Leu Asp Arg 445
Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
450 455 460
Glu Phe Asp Phe
Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
465 470 475
Val Ser Cys <210> 109 <211> 476 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 109
Met Ser Gly Leu 1
Glu Met Ala Asp 5
His Met Met Ala
Met Asn His Gly 15
Arg Phe Pro Asp
Gly Thr Asn Gly
Leu His His His 25
Pro Ala His Arg 30
Met Gly Met Gly 35
Gln Phe Pro Ser
Pro His His His
Gln Gln Gln Gln 45
Pro Gln His Ala 50
Phe Asn Ala Leu
Met Gly Glu His
Ile His Tyr Gly
Ala Gly Asn Met
Asn Ala Thr Ser
Gly Val Arg His
Ala Met Gly Pro
- 198 046157
Gly
Arg
Gly
Phe
Pro 145
Cys
Gly
Gly
Ser
Thr 225
Gly
Glu
Val
Pro
Pro 305
75 80
Thr Val Asn Gly Gly
Phe Asn Asn Ser Gln
100
Ser Leu Pro Ala Ser
115
Asn His His Pro Tyr 130
Ala Ala Gly His Gln
150
Asn Pro Lys His Ser
165
Ser Ser Thr Pro Gly 180
Ser Ser Asn Ser Gly
195
Val Ala His Val Pro 210
Asp Phe Ile Asp Glu
230
Leu Asp Arg Ile Lys
245
Phe Asp Phe Met Thr 260
Ser Cys Gln Ser Gln
275
Asn Arg Pro Ser Lys 290
Val Glu Ser Cys Asp
310
His Pro Pro Ser Ala
Phe Met Gly Pro Pro 105
Met Gln Leu Gln Lys
120
Pro His Asn His Tyr 135
Met Asn Gly Thr Asn
155
Gly Gly Ser Ser Thr
170
Gly Ser Gly Ser Ser 185
Gly Gly Ser Gly Ser 200
Ala Ala Met Leu Pro 215
Glu Val Leu Met Ser
235
Glu Leu Pro Glu Leu
250
Asp Phe Val Cys Lys 265
Leu Ile Lys Pro Ser 280
Thr Pro Pro His Glu 295
Arg Arg Phe Ser Arg
315
Leu Ala Pro Ala Ala
Val Ala Ser Gln Gly
110
Leu Asn Asn Gln Tyr
125
Met Pro Asp Leu His 140
Gln His Phe Arg Asp
160
Pro Gly Gly Ser Gly
175
Ser Gly Gly Gly Ala
190
Gly Asn Met Pro Ala 205
Pro Asn Val Ile Asp 220
Leu Val Ile Glu Met
240
Trp Leu Gly Gln Asn
255
Gln Gln Pro Ser Arg 270
Arg Met Arg Lys Tyr
285
Arg Pro Tyr Ala Cys 300
Ser Asp Asn Leu Val
320
- 199 046157
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
325 330
Phe
Gln Cys Arg Ile
335
Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His
340 345
Thr His Ile Arg
350
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
355 360
Cys Gly Arg Lys 365
Phe Ala Arg Ser Asp Glu Leu Val Arg His
370 375
Thr Lys
380
Ile His Leu Arg
Gln Lys Asp 385
Arg Pro Tyr
390
Phe Ser Gln
Ser Gly Asn
405
Gln Lys Pro
Phe Gln Cys 420
Gly His Leu
435
Val Arg His
Ala Cys Asp
450
Ile Cys Gly
Glu His Thr 465
Lys Ile His
470
Ala Cys Pro
Leu Thr Glu
Arg Ile Cys 425
Ile Arg Thr 440
Arg Lys Phe 455
Leu Arg Gln
Val Glu Ser
395
His Ile Arg 410
Met Arg Asn
His Thr Gly
Ala Gln Asn
460
Lys Asp Lys
475 <210> 110 <211> 554 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 110
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr
5 10
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His 20 25
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly 35 40
Cys Asp Arg Arg
400
Ile His Thr Gly 415
Phe Ser Thr Ser
430
Glu Lys Pro Phe 445
Ser Thr Leu Thr
Синтетический
Arg Leu Val Gln 15
Ala Leu Arg Thr 30
Leu Arg Pro Arg 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro
Gly Ala Leu Ala
- 200 046157
55 60
Tyr 65
Pro
Tyr
Gly
Ala
Ser 145
Leu
Ala
Gly
Arg
Pro 225
Leu
Glu
Ala
Cys
Gly Ala Phe Gly Pro Pro 70
Ser Ser Phe Gln Pro Phe Pro Ala Val
80
Pro Pro Ala Ala Gly Ile Ala His 85
Leu Gln Pro Val Ala Thr Pro
95
Pro Gly Arg Ala Ala
100
Pro Gln Pro Ala Pro
115
Leu Gly Gly Met Asp 130
Leu Glu Leu Glu Leu
150
Phe Leu Gly Gln Ser
165
Pro Pro Ala Gly Ser
180
Arg Pro His Ala Cys 195
Ser Asp Asn Leu Val 210
Phe Gln Cys Arg Ile
230
His Thr His Ile Arg
245
Phe Cys Gly Arg Lys 260
Lys Ile His Leu Lys 275
Asp Arg Arg Phe Ser 290
Ala Pro Pro Asn Ala
105
Pro Gly Gly Pro Pro
110
Ser Ala Ala Ala Pro
120
Pro Pro Pro Ala His
125
Ala Glu Leu Ile Asp 135
Glu Glu Ala Leu Thr 140
Gly Leu His Arg Val
155
Glu Phe Asp Cys Phe
170
Val Ser Cys Gly Gly
185
Pro Ala Glu Gly Cys 200
Arg His Leu Arg Ile 215
Cys Met Arg Ser Phe
235
Thr His Thr Gly Glu
250
Phe Ala Arg Ser Asp
265
Gln Lys Glu His Ala
280
Gln Ser Gly Asn Leu 295
Arg Glu Leu Pro Glu
160
Ser Asp Leu Gly Ser
175
Ser Gly Gly Gly Ser
190
Asp Arg Arg Phe Ser 205
His Thr Gly His Lys 220
Ser Arg Glu Asp Asn
240
Lys Pro Phe Ala Cys
255
Glu Leu Val Arg His 270
Cys Pro Ala Glu Gly
285
Thr Glu His Leu Arg 300
- 201 046157
Ile His Thr Gly His 305
Lys Pro Phe Gln Cys 310
Arg Ile Cys Met Arg 315
Phe Ser Thr Ser Gly
325
His Leu Val Arg His
330
Ile Arg Thr His Thr
335
Glu Lys Pro Phe Ala
340
Cys Glu Phe Cys Gly
345
Arg Lys Phe Ala Gln
350
Ser Thr Leu Thr Glu
355
His Ala Lys Ile His 360
Leu Lys Gln Lys Glu 365
Leu Glu Met Ala Asp
370
His Leu Met Leu Ala
375
Glu Gly Tyr Arg Leu 380
Gln Arg Pro Pro Ser 385
Ala Ala Ala Ala His 390
Gly Pro His Ala Leu 395
Thr Leu Pro Pro Tyr
405
Ala Gly Pro Gly Leu
410
Asp Ser Gly Leu Arg
415
Arg Gly Ala Pro Leu
420
Gly Pro Pro Pro Pro
425
Arg Gln Pro Gly Ala
430
Ala Tyr Gly Ala Phe 435
Gly Pro Pro Ser Ser 440
Phe Gln Pro Phe Pro
445
Val Pro Pro Pro Ala
450
Ala Gly Ile Ala His 455
Leu Gln Pro Val Ala
460
Pro Tyr Pro Gly Arg 465
Ala Ala Ala Pro Pro 470
Asn Ala Pro Gly Gly 475
Pro Gly Pro Gln Pro
485
Ala Pro Ser Ala Ala
490
Ala Pro Pro Pro Pro
495
His Ala Leu Gly Gly
500
Met Asp Ala Glu Leu
505
Ile Asp Glu Glu Ala
510
Thr Ser Leu Glu Leu
515
Glu Leu Gly Leu His 520
Arg Val Arg Glu Leu 525
Glu Leu Phe Leu Gly
530
Gln Ser Glu Phe Asp 535
Cys Phe Ser Asp Leu
540
Ser 320
Gly
Asn
Lys
Val
Arg 400
Pro
Leu
Ala
Thr
Pro 480
Ala
Leu
Pro
Gly
Ser Ala Pro Pro Ala 545
Gly Ser Val Ser Cys 550
- 202 046157 <210> 111 <211> 362 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 111
Met Arg Pro His Ala Cys 1 5
Pro Ala Glu Gly Cys Asp 10
Arg Arg Phe Ser 15
Arg Ser Asp Asn Leu Val 20
Arg His Leu Arg Ile His 25
Thr Gly His Lys 30
Pro Phe Gln Cys Arg Ile 35
Cys Met Arg Ser Phe Ser 40
Arg Glu Asp Asn 45
Leu His Thr His Ile Arg 50
Thr His Thr Gly Glu Lys 55 60
Pro Phe Ala Cys
Glu Phe Cys Gly Arg Lys 65 70
Phe Ala Arg Ser Asp Glu 75
Leu Val Arg His
Ala Lys Ile His Leu Lys 85
Gln Lys Glu His Ala Cys 90
Pro Ala Glu Gly
Cys Asp Arg Arg Phe Ser
100
Gln Ser Gly Asn Leu Thr
105
Glu His Leu Arg 110
Ile His Thr Gly His Lys 115
Pro Phe Gln Cys Arg Ile
120
Cys Met Arg Ser 125
Phe Ser Thr Ser Gly His
130
Leu Val Arg His Ile Arg
135 140
Thr His Thr Gly
Glu Lys Pro Phe Ala Cys
145 150
Glu Phe Cys Gly Arg Lys
155
Phe Ala Gln Asn
160
Ser Thr Leu Thr Glu His
165
Ala Lys Ile His Leu Lys
170
Gln Lys Glu Lys 175
Leu Glu Met Ala Asp His
180
Leu Met Leu Ala Glu Gly
185
Tyr Arg Leu Val 190
Gln Arg Pro Pro Ser Ala
195
Ala Ala Ala His Gly Pro 200
His Ala Leu Arg 205
- 203 046157
Thr Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser
210 215 220
Gly Leu Arg Pro
Arg Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln
225 230 235
Pro Gly Ala Leu
240
Ala Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln
245 250
Pro Phe Pro Ala
255
Val Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln
260 265
Pro Val Ala Thr
270
Pro Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala
275 280
Pro Gly Gly Pro 285
Pro Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro
290 295 300
Pro Pro Pro Ala
His Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp
305 310 315
Glu Glu Ala Leu
320
Thr Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val
325 330
Arg Glu Leu Pro
335
Glu Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe
340 345
Ser Asp Leu Gly
350
Ser Ala Pro Pro Ala Gly Ser Val Ser Cys
355 360 <210> 112 <211> 479 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 112
Met Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp
510
Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile His 2025
Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser 3540
Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys
Синтетический
Arg Arg Phe Ser 15
Thr Gly His Lys 30
Arg Glu Asp Asn 45
Pro Phe Ala Cys
- 204 046157
55 60
Glu Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg 65 70 75
Ala Lys Ile His Leu
Lys Gln Lys Glu His
Ala Cys Pro Ala Glu
Cys Asp Arg Arg Phe
100
Ser Gln Ser Gly Asn
105
Leu Thr Glu His Leu
110
Ile His Thr Gly His 115
Lys Pro Phe Gln Cys
120
Arg Ile Cys Met Arg 125
Phe Ser Thr Ser Gly
130
His Leu Val Arg His
135
Ile Arg Thr His Thr 140
Glu Lys Pro Phe Ala 145
Cys Glu Phe Cys Gly 150
Arg Lys Phe Ala Gln 155
Ser Thr Leu Thr Glu
165
His Ala Lys Ile His
170
Leu Lys Gln Lys Glu
175
Lys Ala Glu Lys Gly
180
Gly Ala Pro Ser Ala
185
Ser Ser Ala Pro Pro
190
Ser Leu Ala Pro Val
195
Val Thr Thr Cys Ala
200
Leu Glu Met Ser Gly
205
Glu Met Ala Asp His 210
Met Met Ala Met Asn
215
His Gly Arg Phe Pro
220
Gly Thr Asn Gly Leu 225
His His His Pro Ala 230
His Arg Met Gly Met 235
Gln Phe Pro Ser Pro
245
His His His Gln Gln
250
Gln Gln Pro Gln His
255
Phe Asn Ala Leu Met
260
Gly Glu His Ile His
265
Tyr Gly Ala Gly Asn
270
Asn Ala Thr Ser Gly
275
Ile Arg His Ala Met 280
Gly Pro Gly Thr Val 285
Gly Gly His Pro Pro
290
Ser Ala Leu Ala Pro
295
Ala Ala Arg Phe Asn
300
His 80
Gly
Arg
Ser
Gly
Asn 160
Lys
Val
Leu
Asp
Gly 240
Ala
Met
Asn
Asn
- 205 046157
Ser Gln Phe Met Gly Pro Pro Val Ala Ser Gln Gly
305 310 315
Gly Ser Leu Pro
320
Ala Ser Met Gln Leu Gln Lys Leu Asn Asn Gln Tyr
325 330
Phe Asn His His
335
Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
340 345
Pro Ala Ala Gly
350
His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
355 360
Cys Asn Pro Lys 365
His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
370 375 380
Gly Ser Ser Thr
Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
385 390 395
Gly Ser Ser Asn
400
Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala
405 410
Ser Val Ala His
415
Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
420 425
Thr Asp Phe Ile
430
Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
435 440
Gly Leu Asp Arg 445
Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
450 455 460
Glu Phe Asp Phe
Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
465 470 475
Val Ser Cys <210> 113 <211> 476 <212> Белок <213>
Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический <400>
Met 1
Arg полипептид
113
Ser
Phe
Gly
Pro
Leu
Glu 5
Met
Ala
Asp
His
Met 10
Met
Ala
Met Asn His Gly 15
Asp 20
Gly
Thr
Asn
Gly
Leu 25
His
His
His
Pro Ala His Arg 30
Met
Gly
Met
Gly
Gln
Phe
Pro
Ser
Pro
His
His
His
Gln Gln Gln Gln
- 206 046157
40 45
Pro
Ala 65
Gly
Arg
Gly
Phe
Pro 145
Cys
Gly
Gly
Ser
Thr 225
Gly
Glu
Val
Gln His Ala Phe Asn 50
Gly Asn Met Asn Ala
Thr Val Asn Gly Gly
Phe Asn Asn Ser Gln
100
Ser Leu Pro Ala Ser
115
Asn His His Pro Tyr 130
Ala Ala Gly His Gln
150
Asn Pro Lys His Ser
165
Ser Ser Thr Pro Gly 180
Ser Ser Asn Ser Gly
195
Val Ala His Val Pro 210
Asp Phe Ile Asp Glu
230
Leu Asp Arg Ile Lys
245
Phe Asp Phe Met Thr 260
Ser Cys Arg Pro His
275
Ala Leu Met Gly Glu 55
Thr Ser Gly Val Arg 75
His Pro Pro Ser Ala
Phe Met Gly Pro Pro 105
Met Gln Leu Gln Lys
120
Pro His Asn His Tyr 135
Met Asn Gly Thr Asn
155
Gly Gly Ser Ser Thr
170
Gly Ser Gly Ser Ser 185
Gly Gly Ser Gly Ser
200
Ala Ala Met Leu Pro 215
Glu Val Leu Met Ser
235
Glu Leu Pro Glu Leu
250
Asp Phe Val Cys Lys 265
Ala Cys Pro Ala Glu
280
His Ile His Tyr Gly 60
His Ala Met Gly Pro
Leu Ala Pro Ala Ala
Val Ala Ser Gln Gly
110
Leu Asn Asn Gln Tyr
125
Met Pro Asp Leu His 140
Gln His Phe Arg Asp
160
Pro Gly Gly Ser Gly
175
Ser Gly Gly Gly Ala
190
Gly Asn Met Pro Ala
205
Pro Asn Val Ile Asp 220
Leu Val Ile Glu Met
240
Trp Leu Gly Gln Asn
255
Gln Gln Pro Ser Arg 270
Gly Cys Asp Arg Arg
285
- 207 046157
Phe Ser Arg
290
Ser Asp Asn
Leu Val Arg 295
His Leu Arg
300
Ile His Thr Gly
His Lys Pro 305
Phe Gln Cys
310
Arg Ile Cys
Met Arg Ser
315
Phe Ser Arg Glu
320
Asp Asn Leu
His Thr His
325
Ile Arg Thr
His Thr Gly 330
Glu Lys Pro Phe
335
Ala Cys Glu
Phe Cys Gly 340
Arg Lys Phe
345
Ala Arg Ser
Asp Glu Leu Val
350
Arg His Ala
355
Lys Ile His
Leu Lys Gln
360
Lys Glu His
Ala Cys Pro Ala 365
Glu Gly Cys
370
Asp Arg Arg
Phe Ser Gln 375
Ser Gly Asn
380
Leu Thr Glu His
Leu Arg Ile 385
His Thr Gly
390
His Lys Pro
Phe Gln Cys
395
Arg Ile Cys Met
400
Arg Ser Phe
Ser Thr Ser
405
Gly His Leu
Val Arg His 410
Ile Arg Thr His 415
Thr Gly Glu
Lys Pro Phe 420
Ala Cys Glu
425
Phe Cys Gly
Arg Lys Phe Ala
430
Gln Asn Ser
435
Thr Leu Thr
Glu His Ala
440
Lys Ile His
Leu Lys Gln Lys 445
Glu Lys Lys
450
Ala Glu Lys
Gly Gly Ala 455
Pro Ser Ala
460
Ser Ser Ala Pro
Pro Val Ser 465
Leu Ala Pro
470
Val Val Thr
Thr Cys Ala
475 <210> 114 <211> 559 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 114
Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr 1 5 10
Met Ser Ser Leu
Leu Asn Gln Leu Pro Asp Asn Leu Tyr Pro Glu Glu
Ile Pro Ser Ala
- 208 046157
Leu Asn Leu Phe Ser
Gly Ser Ser Asp Ser 40
Val Val His Tyr Asn 45
Met Ala Thr Glu Asn
Val Met Asp Ile Gly 55
Leu Thr Asn Glu Lys 60
Asn Pro Glu Leu Ser 65
Tyr Ser Gly Ser Phe 70
Gln Pro Ala Pro Gly 75
Lys Thr Val Thr Tyr
Leu Gly Lys Phe Ala
Phe Asp Ser Pro Ser
Trp Cys Gln Asp Asn
100
Ile Ile Ser Leu Met
105
Ser Ala Gly Ile Leu
110
Val Pro Pro Ala Ser
115
Gly Ala Leu Ser Thr 120
Gln Thr Ser Thr Ala
125
Met Val Gln Pro Pro
130
Gln Gly Asp Val Glu
135
Ala Met Tyr Pro Ala 140
Pro Pro Tyr Ser Asn 145
Cys Gly Asp Leu Tyr 150
Ser Glu Pro Val Ser 155
His Asp Pro Gln Gly
165
Asn Pro Gly Leu Ala
170
Tyr Ser Pro Gln Asp
175
Gln Ser Ala Lys Pro
180
Ala Leu Asp Ser Asn
185
Leu Phe Pro Met Ile
190
Asp Tyr Asn Leu Tyr 195
His His Pro Asn Asp
200
Met Gly Ser Ile Pro 205
His Lys Pro Phe Gln
210
Gly Met Asp Pro Ile 215
Arg Val Asn Pro Pro 220
Ile Thr Pro Leu Glu 225
Thr Ile Lys Ala Phe 230
Lys Asp Lys Gln Ile 235
Pro Gly Phe Gly Ser
245
Leu Pro Gln Pro Pro
250
Leu Thr Leu Lys Pro
255
Arg Pro Arg Lys Tyr
260
Pro Asn Arg Pro Ser
265
Lys Thr Pro Leu His
270
Gln
Pro
Asn 80
Asn
Gly
Ser
Leu
Phe 160
Tyr
Pro
Glu
Pro
His 240
Ile
Glu
- 209 046157
Arg Pro His Ala Cys 275
Pro Ala Glu Gly Cys 280
Asp Arg Arg Phe Ser 285
Arg Asp Glu Leu Asn
290
Val His Leu Arg Ile
295
His Thr Gly His Lys 300
Phe Gln Cys Arg Ile 305
Cys Met Arg Ser Phe 310
Ser Arg Ser Asp His 315
Thr Asn His Ile Arg
325
Thr His Thr Gly Glu
330
Lys Pro Phe Ala Cys
335
Phe Cys Gly Arg Lys
340
Phe Ala Arg Ser Asp
345
Asp Leu Val Arg His
350
Lys Ile His Leu Lys 355
Gln Lys Glu His Ala 360
Cys Pro Ala Glu Gly
365
Asp Arg Arg Phe Ser
370
Arg Ser Asp Asn Leu
375
Val Arg His Leu Arg
380
His Thr Gly His Lys 385
Pro Phe Gln Cys Arg 390
Ile Cys Met Arg Ser 395
Ser His Arg Thr Thr
405
Leu Thr Asn His Ile
410
Arg Thr His Thr Gly
415
Lys Pro Phe Ala Cys
420
Glu Phe Cys Gly Arg
425
Lys Phe Ala Arg Glu
430
Asn Leu His Thr His
435
Ala Lys Ile His Leu 440
Lys Gln Lys Glu His 445
Cys Pro Ala Glu Gly
450
Cys Asp Arg Arg Phe
455
Ser Thr Ser His Ser
460
Thr Glu His Leu Arg 465
Ile His Thr Gly His 470
Lys Pro Phe Gln Cys 475
Ile Cys Met Arg Ser
485
Phe Ser Gln Ser Ser
490
Ser Leu Val Arg His
495
Arg Thr His Thr Gly
500
Glu Lys Pro Phe Ala
505
Cys Glu Phe Cys Gly
510
Lys Phe Ala Arg Glu
515
Asp Asn Leu His Thr 520
His Ala Lys Ile His 525
Arg
Pro
Leu 320
Glu
Ala
Cys
Ile
Phe 400
Glu
Asp
Ala
Leu
Arg 480
Ile
Arg
Leu
- 210 046157
Lys Gln Lys Glu Lys Lys Ala Glu
Lys Gly Gly Ala
Pro Ser Ala Ser
530
535
540
Ser Ala Pro Pro Val
Ser Leu Ala Pro Val Val Thr
Thr Cys Ala
545 550 555 <210> 115 <211> 631 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 115
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser
5 10
Синтетический
Pro Leu Gln Ile
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr 20 25
Met Asp Asn Tyr 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly 35 40
Ala Pro Gln Phe 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser
55 60
Asn Ser Ser Ser
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75
Ser Asn Ser Ser
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr
90
Gly Glu Gln Pro
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile
100 105
Ser Leu Asn Asn
110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln
115 120
Thr Thr Arg Leu 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu
130 135 140
Pro Ala Pro Asn
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser
145 150 155
Leu Val Ser Gly
160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser
165 170
Ser Ala Pro Ser
175
- 211 046157
Pro Ala Ala Ser Ser Ala Ser Ala
Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro
210
Thr Pro Asn
Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg
340 345 350
Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu
370 375 380
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
385 390 395
Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Thr
405 410 415
Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu
420 425 430
Cys
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
Arg
Ser
Phe
Thr
Ile 400
Lys
Ser
- 212 046157
Cys Asp
Ile His
450
Phe Ser 465
Glu Lys
Arg Arg 435
Thr Gly
Gln Ser
Pro Phe
Phe Ser
Gln Lys
Ser Ser
470
Ala Cys 485
Asp Asn
Leu His
500
Thr His
Thr Ser 440
Pro Phe 455
Leu Val
Asp Ile
Thr Lys
His Ser
Gln Cys
Arg His
Cys Gly
490
Ile His
505
Leu Thr
Arg Ile
460
Ile Arg 475
Arg Lys
Leu Arg
Lys Ala
Asp Lys 515
Ser Val
Val Ala
520
Ser Ser
Ala Thr
Glu His Ile Arg 445
Cys Met Arg Asn
Thr His Thr Gly
480
Phe Ala Arg Glu
495
Gln Lys Asp Lys 510
Ser Ser Leu Ser 525
Ser Tyr
530
Pro Ser
Pro Val
Ala Thr 535
Ser Tyr
Pro Ser
540
Pro Val Thr Thr
Ser Tyr 545
Pro Ser
Pro Ala
550
Thr Thr
Ser Tyr
Pro Ser 555
Pro Val Pro Thr
560
Ser Phe
Ser Ser
Pro Gly 565
Ser Ser
Thr Tyr
570
Pro Ser
Pro Val His Ser
575
Gly Phe
Pro Ser
580
Pro Ser
Val Ala
Thr Thr
585
Tyr Ser
Ser Val Pro Pro
590
Ala Phe
Pro Ala 595
Gln Val
Ser Ser
600
Phe Pro
Ser Ser
Ala Val Thr Asn 605
Ser Phe
610
Ser Ala
Ser Thr
Gly Leu 615
Ser Asp
Met Thr
620
Ala Thr Phe Ser
Pro Arg 625
Thr Ile
Glu Ile
630
Cys <210> 116 <211> 719 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 116
Синтетический
- 213 046157
Met Ala 1
Ala Ala
Lys Ala 5
Glu Met
Gln Leu
Met Ser
Pro Leu
Ser Asp
Pro Phe
Gly Ser
Phe Pro
His Ser 25
Pro Thr
Met Asp
Pro Lys
Leu Glu 35
Glu Met
Met Leu
Leu Ser
Asn Gly
Ala Pro 45
Gln Ile 15
Asn Tyr
Gln Phe
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser 50 5560
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser 65 70 7580
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro 85 9095
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250255
- 214 046157
Phe
Pro
Leu
Lys 305
Met
Pro
Asp
Gln
Asn 385
Cys
Ile
Cys
Ile
Phe 465
Glu
Asp
Pro Gln Gln Gln Gly 260
Phe Gln Gly Leu Glu
275
Ser Thr Ile Lys Ala 290
Ala Leu Asn Thr Ser
310
Arg Lys Tyr Pro Asn
325
Tyr Ala Cys Pro Val
340
Glu Leu Asn Val His
355
Cys Arg Ile Cys Met 370
His Ile Arg Thr His
390
Gly Arg Lys Phe Ala
405
His Leu Arg Gln Lys 420
Asp Arg Arg Phe Ser
435
His Thr Gly Gln Lys 450
Ser His Arg Thr Thr
470
Lys Pro Phe Ala Cys
485
Asn Leu His Thr His
500
Asp Leu Gly Leu Gly 265
Ser Arg Thr Gln Gln
280
Phe Ala Thr Gln Ser 295
Tyr Gln Ser Gln Leu
315
Arg Pro Ser Lys Thr
330
Glu Ser Cys Asp Arg 345
Ile Arg Ile His Thr
360
Arg Asn Phe Ser Arg 375
Thr Gly Glu Lys Pro
395
Arg Ser Asp Asp Leu
410
Asp Arg Pro Tyr Ala 425
Arg Ser Asp Asn Leu
440
Pro Phe Gln Cys Arg 455
Leu Thr Asn His Ile
475
Asp Ile Cys Gly Arg
490
Thr Lys Ile His Leu 505
Thr Pro Asp Gln Lys
270
Pro Ser Leu Thr Pro
285
Gly Ser Gln Asp Leu 300
Ile Lys Pro Ser Arg
320
Pro Pro His Glu Arg
335
Arg Phe Ser Arg Arg
350
Gly Gln Lys Pro Phe
365
Ser Asp His Leu Thr 380
Phe Ala Cys Asp Ile
400
Val Arg His Thr Lys 415
Cys Pro Val Glu Ser
430
Val Arg His Ile Arg 445
Ile Cys Met Arg Asn 460
Arg Thr His Thr Gly
480
Lys Phe Ala Arg Glu
495
Arg Gln Lys Asp Arg 510
- 215 046157
Pro Tyr
His Ser
530
Gln Cys 545
Arg His
Ala Cys 515
Leu Thr
Arg Ile
Ile Arg
Pro Val
Glu His
Cys Met
550
Thr His 565
Cys Gly
Arg Lys
580
Phe Ala
Ile His
Leu Arg 595
Gln Lys
Ser Ser
610
Ala Thr
Ser Ser
Ser Tyr 625
Pro Ser
Pro Val
630
Ser Tyr
Pro Ser
Pro Val 645
Thr Tyr
Pro Ser
660
Pro Val
Thr Thr
Tyr Ser 675
Ser Val
Glu Ser
520
Ile Arg 535
Arg Asn
Thr Gly
Arg Glu
Asp Lys
600
Leu Ser 615
Thr Thr
Pro Thr
His Ser
Pro Pro
680
Cys Asp
Ile His
Phe Ser
Glu Lys
570
Asp Asn 585
Lys Ala
Ser Tyr
Ser Tyr
Ser Phe
650
Gly Phe 665
Ala Phe
Arg Arg
Thr Gly
540
Gln Ser 555
Pro Phe
Leu His
Asp Lys
Pro Ser
620
Pro Ser 635
Ser Ser
Pro Ser
Pro Ala
Phe Ser Thr Ser 525
Gln Lys Pro Phe
Ser Ser Leu Val
560
Ala Cys Asp Ile
575
Thr His Thr Lys
590
Ser Val Val Ala 605
Pro Val Ala Thr
Pro Ala Thr Thr
640
Pro Gly Ser Ser
655
Pro Ser Val Ala
670
Gln Val Ser Ser 685
Phe Pro
690
Ser Ser
Ala Val
Thr Asn 695
Ser Phe
Ser Ala
700
Ser Thr Gly Leu
Ser Asp 705
Met Thr
Ala Thr
710
Phe Ser
Pro Arg
Thr Ile 715
Glu Ile Cys <210> 117 <211> 627 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический
- 216 046157 <400> 117 Met Ala Ala 1
Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln
10 15
Ser Asp Pro
Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn
25 30
Pro Lys Leu 35
Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln
45
Leu Gly Ala 50
Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser 55 60
Ser Ser Ser 65
Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 70 75
Ser Ser Ser
Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln
90 95
Tyr Glu His
Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn
100 105 110
Glu Lys Val
115
Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg
120 125
Pro Pro Ile
130
Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro
135 140
Ser Gly Asn 145
Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
150 155
Leu Val Ser
Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala
Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro
195
Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
200 205
Phe Pro Thr
210
Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
215 220
Phe Pro Gly 225
Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
230 235
Pro Ala Ala
Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Ile
Tyr
Phe
Ser
Ser 80
Pro
Asn
Leu
Asn
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
- 217 046157
Phe Pro Gln
Gln Gln Gly 260
Asp Leu Gly
265
Leu Gly Thr
Pro Asp Gln
270
Pro Phe Gln
275
Gly Leu Glu
Ser Arg Thr
280
Gln Gln Pro
Ser Leu Thr 285
Leu Ser Thr
290
Ile Lys Ala
Phe Ala Thr 295
Gln Ser Gly
300
Ser Gln Asp
Lys Ala Leu 305
Asn Thr Ser
310
Tyr Gln Ser
Gln Leu Ile
315
Lys Pro Ser
Met Arg Lys
Tyr Pro Asn
325
Arg Pro Ser
Lys Thr Pro 330
Pro His Glu
335
Pro Tyr Ala
Cys Pro Val 340
Glu Ser Cys
345
Asp Arg Arg
Phe Ser Arg
350
Asp Asn Leu
355
Val Arg His
Ile Arg Ile
360
His Thr Gly
Gln Lys Pro 365
Gln Cys Arg
370
Ile Cys Met
Arg Asn Phe 375
Ser His Arg
380
Thr Thr Leu
Asn His Ile 385
Arg Thr His
390
Thr Gly Glu
Lys Pro Phe
395
Ala Cys Asp
Cys Gly Arg
Lys Phe Ala
405
Arg Glu Asp
Asn Leu His 410
Thr His Ile
415
Thr His Thr
Gly Glu Lys 420
Pro Phe Ala
425
Cys Asp Ile
Cys Gly Arg
430
Phe Ser Thr
435
Ser His Ser
Leu Thr Glu
440
His Ile Arg
Ile His Thr 445
Gln Lys Pro
450
Phe Gln Cys
Arg Ile Cys 455
Met Arg Asn
460
Phe Ser Gln
Ser Ser Leu 465
Val Arg His
470
Ile Arg Thr
His Thr Gly 475
Glu Lys Pro
Ala Cys Asp
Ile Cys Gly
485
Arg Lys Phe
Ala Arg Glu 490
Asp Asn Leu
495
Thr His Thr
Lys Ile His
Leu Arg Gln
Lys Asp Lys
Lys Ala Asp
Lys
Pro
Leu
Arg 320
Arg
Ser
Phe
Thr
Ile 400
Arg
Lys
Gly
Ser
Phe 480
His
Lys
- 218 046157
Ser Val
Pro Val
530
Pro Ala 545
Pro Gly
Pro Ser
Gln Val
Ser Thr
610
500
Val Ala 515
Ala Thr
Thr Thr
Ser Ser
Val Ala
580
Ser Ser 595
Gly Leu
Ser Ser
Ser Tyr
Ser Tyr
550
Thr Tyr 565
Thr Thr
Phe Pro
Ser Asp
Ala Thr
520
Pro Ser 535
Pro Ser
Pro Ser
Tyr Ser
Ser Ser
600
Met Thr 615
505
Ser Ser
Pro Val
Pro Val
Pro Val
570
Ser Val
585
Ala Val
Ala Thr
510
Leu Ser
Thr Thr
540
Pro Thr 555
His Ser
Pro Pro
Thr Asn
Phe Ser
620
Ser Tyr Pro Ser 525
Ser Tyr Pro Ser
Ser Phe Ser Ser
560
Gly Phe Pro Ser
575
Ala Phe Pro Ala
590
Ser Phe Ser Ala 605
Pro Arg Thr Ile
Glu Ile Cys 625 <210> 118 <211> 631 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический полипептид <400> 118
Met Ala Ala Ala 1
Lys Ala Glu Met 5
Gln Leu Met Ser
Pro Leu Gln Ile
Ser Asp Pro Phe
Gly Ser Phe Pro
His Ser Pro Thr 25
Met Asp Asn Tyr 30
Pro Lys Leu Glu 35
Glu Met Met Leu
Leu Ser Asn Gly
Ala Pro Gln Phe 45
Leu Gly Ala Ala 50
Gly Ala Pro Glu 55
Gly Ser Gly Ser 60
Asn Ser Ser Ser
Ser Ser Ser Gly 65
Gly Gly Gly Gly 70
Gly Gly Gly Gly 75
Ser Asn Ser Ser
- 219 046157
Ser Ser Ser Ser Thr Phe Asn Pro
Gln Ala Asp Thr Gly Glu Gln
95
Tyr Glu His
Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn
100 105 110
Glu Lys Val
115
Leu Val Glu Thr
Ser Tyr Pro Ser Gln Thr Thr Arg
120 125
Pro Pro
130
Ile Thr
Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro
135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
145 150 155
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Pro
Asn
Leu
Asn
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
Arg
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu
- 220 046157
325
330 335
Pro
Asp
Gln
Thr 385
Cys
Ile
Cys
Ile
Phe 465
Glu
Ser
Lys
Ser
Ser 545
Ser
Tyr Ala Cys Pro Val Glu Ser 340
Cys Asp Arg Arg Phe Ser Arg
345 350
Asn Leu Val Arg His Ile Arg
355 360
Cys Arg Ile Cys Met Arg Asn
370 375
His Ile Arg Thr His Thr Gly
390
Gly Arg Lys Phe Ala Arg Ser 405
His Leu Arg Gln Lys Asp Arg 420
Asp Arg Arg Phe Ser Gln Ser
435 440
His Thr Gly Gln Lys Pro Phe
450 455
Ser Thr Ser Gly His Leu Val 470
Lys Pro Phe Ala Cys Asp Ile
485
Thr Leu Thr Glu His Thr Lys
500
Ala Asp Lys Ser Val Val Ala
515 520
Tyr Pro Ser Pro Val Ala Thr
530 535
Tyr Pro Ser Pro Ala Thr Thr
550
Phe Ser Ser Pro Gly Ser Ser 565
Ile His Thr Gly Gln Lys Pro
365
Phe Ser Arg Glu Asp Asn Leu
380
Glu Lys Pro Phe Ala Cys Asp 395
Asp Glu Leu Val Arg His Thr
410 415
Pro Tyr Ala Cys Pro Val Glu
425 430
Gly Asn Leu Thr Glu His Ile 445
Gln Cys Arg Ile Cys Met Arg 460
Arg His Ile Arg Thr His Thr 475
Cys Gly Arg Lys Phe Ala Gln
490 495
Ile His Leu Arg Gln Lys Asp
505 510
Ser Ser Ala Thr Ser Ser Leu
525
Ser Tyr Pro Ser Pro Val Thr 540
Ser Tyr Pro Ser Pro Val Pro 555
Thr Tyr Pro Ser Pro Val His
570 575
Ser
Phe
His
Ile 400
Lys
Ser
Arg
Asn
Gly 480
Asn
Lys
Ser
Thr
Thr 560
Ser
- 221 046157
Gly Phe
Pro Ser
580
Pro Ser
Val Ala
Ala Phe
Pro Ala 595
Gln Val
Ser Ser
600
Ser Phe
610
Ser Ala
Ser Thr
Gly Leu 615
Thr Thr 585
Phe Pro
Ser Asp
Tyr Ser
Ser Ser
Met Thr
620
Ser Val Pro Pro
590
Ala Val Thr Asn 605
Ala Thr Phe Ser
Pro Arg Thr Ile Glu Ile Cys
625 630 <210> 119 <211> 473 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 119
Синтетический
Met Thr Gly 1
Leu Asn Gln
Leu Asn Leu
Met Ala Thr
Asn Pro Glu 65
Lys Thr Val
Trp Cys Gln
Val Pro Pro
115
Met Val Gln
130
Pro Pro Tyr
Lys Leu Ala 5
Leu Pro Asp 20
Phe Ser Gly
Glu Asn Val
Leu Ser Tyr 70
Thr Tyr Leu 85
Asp Asn Ile 100
Ala Ser Gly
Pro Pro Gln
Ser Asn Cys
Glu Lys Leu
Asn Leu Tyr
Ser Ser Asp 40
Met Asp Ile 55
Ser Gly Ser
Gly Lys Phe
Ile Ser Leu
105
Ala Leu Ser
120
Gly Asp Val 135
Gly Asp Leu
Pro Val Thr 10
Pro Glu Glu
Ser Val Val
Gly Leu Thr 60
Phe Gln Pro 75
Ala Phe Asp 90
Met Ser Ala
Thr Gln Thr
Glu Ala Met
140
Tyr Ser Glu
Met Ser Ser Leu
Ile Pro Ser Ala
His Tyr Asn Gln 45
Asn Glu Lys Pro
Ala Pro Gly Asn 80
Ser Pro Ser Asn
Gly Ile Leu Gly 110
Ser Thr Ala Ser 125
Tyr Pro Ala Leu
Pro Val Ser Phe
- 222 046157
145
150
155
His Asp Pro Gln Gly
165
Asn Pro Gly Leu Ala
170
Tyr Ser Pro Gln Asp
175
Gln Ser Ala Lys Pro
180
Ala Leu Asp Ser Asn
185
Leu Phe Pro Met Ile
190
Asp Tyr Asn Leu Tyr 195
His His Pro Asn Asp
200
Met Gly Ser Ile Pro 205
His Lys Pro Phe Gln 210
Gly Met Asp Pro Ile 215
Arg Val Asn Pro Pro 220
Ile Thr Pro Leu Glu 225
Thr Ile Lys Ala Phe 230
Lys Asp Lys Gln Ile 235
Pro Gly Phe Gly Ser
245
Leu Pro Gln Pro Pro
250
Leu Thr Leu Lys Pro
255
Arg Pro Arg Lys Tyr
260
Pro Asn Arg Pro Ser
265
Lys Thr Pro Leu His
270
Arg Pro His Ala Cys 275
Pro Ala Glu Gly Cys 280
Asp Arg Arg Phe Ser 285
Ser Asp Asn Leu Val
290
Arg His Leu Arg Ile 295
His Thr Gly His Lys
300
Phe Gln Cys Arg Ile 305
Cys Met Arg Ser Phe 310
Ser His Arg Thr Thr 315
Thr Asn His Ile Arg
325
Thr His Thr Gly Glu
330
Lys Pro Phe Ala Cys
335
Phe Cys Gly Arg Lys
340
Phe Ala Arg Glu Asp
345
Asn Leu His Thr His
350
Lys Ile His Leu Lys 355
Gln Lys Glu His Ala 360
Cys Pro Ala Glu Gly
365
Asp Arg Arg Phe Ser
370
Thr Ser His Ser Leu
375
Thr Glu His Leu Arg
380
His Thr Gly His Lys 385
Pro Phe Gln Cys Arg 390
Ile Cys Met Arg Ser 395
160
Tyr
Pro
Glu
Pro
His 240
Ile
Glu
Arg
Pro
Leu 320
Glu
Ala
Cys
Ile
Phe 400
- 223 046157
Ser Gln
Ser Ser
Lys Pro
Phe Ala
420
Asn Leu
His Thr 435
Ala Glu
450
Lys Gly
Leu Ala 465
Pro Val
Ser Leu 405
Cys Glu
His Ala
Gly Ala
Val Thr
470
Val Arg
Phe Cys
Lys Ile 440
Pro Ser 455
Thr Cys
His Ile
410
Gly Arg 425
His Leu
Ala Ser
Ala
Arg Thr
Lys Phe
Lys Gln
Ser Ala
460
His Thr Gly Glu 415
Ala Arg Glu Asp
430
Lys Glu Lys Lys 445
Pro Pro Val Ser <210> 120 <211> 719 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический <400>
Met
Ser
Pro
Leu
Ser 65
Ser
Tyr
Glu
Pro полипептид
120
Ala
Asp
Lys
Gly 50
Ser
Ser
Glu
Lys
Pro
Ala
Ala
Lys 5
Ala
Glu
Met
Gln
Leu
Met
Ser
Pro Leu Gln Ile
Pro
Phe 20
Gly
Ser
Phe
Pro
His 25
Ser
Pro
Thr
Met Asp Asn Tyr 30
Leu 35
Glu
Glu
Met
Met
Leu 40
Leu
Ser
Asn
Gly
Ala Pro Gln Phe 45
Ala
Ala
Gly
Ala
Pro 55
Glu
Gly
Ser
Gly
Ser 60
Asn Ser Ser Ser
Ser
Ser
His
Val
115
Ile
Gly
Gly
Gly 70
Gly
Gly
Gly
Gly
Gly 75
Gly
Ser Asn Ser Ser
Ser
Thr 85
Phe
Asn
Pro
Gln
Ala 90
Asp
Thr
Gly Glu Gln Pro 95
Leu
100
Leu
Thr
Thr
Val
Tyr
Ala
Glu
Thr
Glu
Thr
Gly
Ser
Ser
120
Arg
Phe
105
Pro
Asp
Ile
Ser Leu Asn Asn
110
Tyr
Phe
Pro
Ser
Ser
Leu
Gln
Glu
Thr Thr Arg Leu 125
Pro Ala Pro Asn
- 224 046157
130
135
140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
145 150 155
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Asp
340 345 350
Gly Ala Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu
370 375 380
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
Arg
Pro
Phe
Val
- 225 046157
Arg 385
Cys
Ile
Cys
Ile
Phe 465
Glu
Asp
Pro
Gly
Gln 545
Glu
Cys
Ile
Ser
Ser 625
His Ile Arg Thr His
390
Gly Arg Lys Phe Ala
405
His Leu Arg Gln Lys 420
Asp Arg Arg Phe Ser
435
His Thr Gly Gln Lys 450
Ser Thr Ser Gly Asn
470
Lys Pro Phe Ala Cys
485
Asn Leu Val Arg His 500
Tyr Ala Cys Pro Val
515
His Leu Thr Glu His 530
Cys Arg Ile Cys Met
550
His Ile Arg Thr His
565
Gly Arg Lys Phe Ala
580
His Leu Arg Gln Lys
595
Ser Ala Thr Ser Ser 610
Tyr Pro Ser Pro Val
630
Thr Gly Glu Lys Pro
395
Gln Ser Gly Asp Leu
410
Asp Arg Pro Tyr Ala 425
Thr His Leu Asp Leu
440
Pro Phe Gln Cys Arg 455
Leu Val Arg His Ile
475
Asp Ile Cys Gly Arg
490
Thr Lys Ile His Leu 505
Glu Ser Cys Asp Arg 520
Ile Arg Ile His Thr 535
Arg Asn Phe Ser Glu
555
Thr Gly Glu Lys Pro
570
Gln Ala Gly His Leu 585
Asp Lys Lys Ala Asp 600
Leu Ser Ser Tyr Pro 615
Thr Thr Ser Tyr Pro
635
Phe Ala Cys Asp Ile
400
Arg Arg His Thr Lys 415
Cys Pro Val Glu Ser
430
Ile Arg His Ile Arg 445
Ile Cys Met Arg Asn 460
Arg Thr His Thr Gly
480
Lys Phe Ala Arg Ser
495
Arg Gln Lys Asp Arg 510
Arg Phe Ser Gln Ser
525
Gly Gln Lys Pro Phe 540
Arg Ser His Leu Arg
560
Phe Ala Cys Asp Ile
575
Ala Ser His Thr Lys 590
Lys Ser Val Val Ala
605
Ser Pro Val Ala Thr 620
Ser Pro Ala Thr Thr
640
- 226 046157
Ser Tyr
Pro Ser
Thr Tyr
Pro Ser
660
Thr Thr
Tyr Ser 675
Phe Pro
690
Ser Ser
Pro Val 645
Pro Val
Ser Val
Ala Val
Pro Thr
His Ser
Pro Pro
680
Thr Asn 695
Ser Phe
650
Gly Phe 665
Ala Phe
Ser Phe
Ser Asp Met Thr Ala Thr Phe Ser Pro Arg
705 710 <210> 121 <211> 627 <212> Белок <213> Искусственная последовательность <220>
Ser Ser
Pro Ser
Pro Ala
Ser Ala
700
Thr Ile 715 <223> Описание искусственной последовательности полипептид <400> 121 Met Ala Ala 1
Ser Asp Pro
Pro Lys Leu 35
Leu Gly Ala 50
Ala Lys Ala 5
Phe Gly Ser 20
Glu Glu Met
Ala Gly Ala
Glu Met Gln
Phe Pro His
Met Leu Leu
Pro Glu Gly 55
Leu Met Ser 10
Ser Pro Thr
Ser Asn Gly
Ser Gly Ser 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75
Ser
Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr
90
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile
100 105
Glu Lys Val Leu Val Glu Thr Ser
115 120
Tyr Pro Ser Gln
Pro Gly Ser Ser
655
Pro Ser Val Ala
670
Gln Val Ser Ser 685
Ser Thr Gly Leu
Glu Ile Cys
Синтетический
Pro Leu Gln Ile
Met Asp Asn Tyr 30
Ala Pro Gln Phe 45
Asn Ser Ser Ser
Ser Asn Ser Ser
Gly Glu Gln Pro
Ser Leu Asn Asn
110
Thr Thr Arg Leu 125
- 227 046157
Pro Pro Ile Thr Tyr Thr Gly Arg Phe
130 135
Ser Gly Asn Thr Leu Trp Pro Glu Pro
145 150
Leu Val Ser Met Thr Asn Pro Pro Ala
165
Pro Ala Ala Ser Ser Ala Ser Ala Ser
180 185
Ala Val Pro Ser Asn Asp Ser Ser Pro
195 200
Phe Pro Thr Pro Asn Thr Asp Ile Phe
210 215
Phe Pro Gly Ser Ala Gly Thr Ala Leu 225 230
Pro Ala Ala Lys Gly Gly Phe Gln Val
245
Phe Pro Gln Gln Gln Gly Asp Leu Gly
260 265
Pro Phe Gln Gly Leu Glu Ser Arg Thr
275 280
Leu Ser Thr Ile Lys Ala Phe Ala Thr
290 295
Lys Ala Leu Asn Thr Ser Tyr Gln Ser
305 310
Met Arg Lys Tyr Pro Asn Arg Pro Ser
325
Pro Tyr Ala Cys Pro Val Glu Ser Cys
340 345
Asp Asn Leu Thr Arg His Ile Arg Ile
355 360
Gln Cys Arg Ile Cys Met Arg Asn Phe
370 375
Leu Glu Pro Ala Pro Asn
140
Phe Ser Leu Val Ser Gly
155 160
Ser Ser Ser Ala Pro Ser
175
Ser Pro Pro Leu Ser Cys
190
Tyr Ser Ala Ala Pro Thr
205
Glu Pro Gln Ser Gln Ala
220
Tyr Pro Pro Pro Ala Tyr
235 240
Met Ile Pro Asp Tyr Leu
255
Gly Thr Pro Asp Gln Lys
270
Gln Pro Ser Leu Thr Pro
285
Ser Gly Ser Gln Asp Leu
300
Leu Ile Lys Pro Ser Arg
315 320
Thr Pro Pro His Glu Arg
335
Arg Arg Phe Ser Arg Ser
350
Thr Gly Gln Lys Pro Phe
365
His Ser Thr Thr Leu Thr
380
- 228 046157
Asn 385
Cys
Thr
Phe
Gln
Ser 465
Ala
Thr
Ser
Pro
Pro 545
Pro
Pro
Gln
Ser
Glu 625
His Ile
Gly Arg
His Thr
Ser Thr
435
Lys Pro 450
Ser Leu
Cys Asp
His Thr
Val Val
515
Val Ala 530
Ala Thr
Gly Ser
Ser Val
Val Ser
595
Thr Gly 610
Ile Cys
Arg Thr
Lys Phe
405
Gly Glu 420
Ser His
Phe Gln
Thr Arg
Ile Cys
485
Lys Ile 500
Ala Ser
Thr Ser
Thr Ser
Ser Thr
565
Ala Thr 580
Ser Phe
Leu Ser
His Thr 390
Ala Arg
Lys Pro
Ser Leu
Cys Arg
455
His Ile 470
Gly Arg
His Leu
Ser Ala
Tyr Pro
535
Tyr Pro 550
Tyr Pro
Thr Tyr
Pro Ser
Asp Met
615
Gly Glu
Ser Asp
Phe Ala
425
Thr Glu 440
Ile Cys
Arg Thr
Lys Phe
Arg Gln
505
Thr Ser 520
Ser Pro
Ser Pro
Ser Pro
Ser Ser
585
Ser Ala 600
Thr Ala
Lys Pro
395
Phe Ala
Cys Asp
Asn Arg 410
Cys Asp
His Ile
Met Arg
His Thr
475
Ala Arg 490
Lys Asp
Ser Leu
Val Thr
Val Pro
555
Val His 570
Val Pro
Val Thr
Thr Phe
Lys Thr
Ile Cys
Arg Ile
445
Asn Phe 460
Gly Glu
Ser Asp
Lys Lys
Ser Ser
525
Thr Ser 540
Thr Ser
Ser Gly
Pro Ala
Asn Ser
605
Ser Pro 620
His Ile
415
Gly Arg 430
His Thr
Ser Gln
Lys Pro
Asn Arg
495
Ala Asp 510
Tyr Pro
Tyr Pro
Phe Ser
Phe Pro
575
Phe Pro 590
Phe Ser
Arg Thr
Ile 400
Arg
Lys
Gly
Ser
Phe 480
Lys
Lys
Ser
Ser
Ser 560
Ser
Ala
Ala
Ile
- 229 046157 <210> 122 <211> 473 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 122
Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr
5 10
Синтетический
Met Ser Ser Leu
Leu Asn Gln Leu Pro Asp 20
Asn Leu Tyr Pro Glu Glu 25
Ile Pro Ser Ala
Leu Asn Leu Phe Ser Gly 35
Ser Ser Asp Ser Val Val 40
His Tyr Asn Gln 45
Met Ala Thr Glu Asn Val
Met Asp Ile Gly Leu Thr 55 60
Asn Glu Lys Pro
Asn Pro Glu Leu Ser Tyr 65 70
Ser Gly Ser Phe Gln Pro 75
Ala Pro Gly Asn 80
Lys Thr Val Thr Tyr Leu 85
Gly Lys Phe Ala Phe Asp 90
Ser Pro Ser Asn
Trp Cys Gln Asp Asn Ile
100
Ile Ser Leu Met Ser Ala
105
Gly Ile Leu Gly 110
Val Pro Pro Ala Ser Gly
115
Ala Leu Ser Thr Gln Thr
120
Ser Thr Ala Ser 125
Met Val Gln Pro Pro Gln
130
Gly Asp Val Glu Ala Met
135 140
Tyr Pro Ala Leu
Pro Pro Tyr Ser Asn Cys
145 150
Gly Asp Leu Tyr Ser Glu
155
Pro Val Ser Phe
160
His Asp Pro Gln Gly Asn
165
Pro Gly Leu Ala Tyr Ser
170
Pro Gln Asp Tyr
175
Gln Ser Ala Lys Pro Ala
180
Leu Asp Ser Asn Leu Phe
185
Pro Met Ile Pro
190
Asp Tyr Asn Leu Tyr His
195
His Pro Asn Asp Met Gly
200
Ser Ile Pro Glu 205
- 230 046157
His Lys Pro Phe Gln 210
Gly Met Asp Pro Ile 215
Arg Val Asn Pro Pro 220
Ile Thr Pro Leu Glu 225
Thr Ile Lys Ala Phe 230
Lys Asp Lys Gln Ile 235
Pro Gly Phe Gly Ser
245
Leu Pro Gln Pro Pro
250
Leu Thr Leu Lys Pro
255
Arg Pro Arg Lys Tyr
260
Pro Asn Arg Pro Ser
265
Lys Thr Pro Leu His
270
Arg Pro His Ala Cys 275
Pro Ala Glu Gly Cys 280
Asp Arg Arg Phe Ser 285
Ser Asp Asn Leu Val
290
Arg His Leu Arg Ile 295
His Thr Gly His Lys
300
Phe Gln Cys Arg Ile 305
Cys Met Arg Ser Phe 310
Ser Arg Glu Asp Asn 315
His Thr His Ile Arg
325
Thr His Thr Gly Glu
330
Lys Pro Phe Ala Cys
335
Phe Cys Gly Arg Lys
340
Phe Ala Arg Ser Asp
345
Glu Leu Val Arg His
350
Lys Ile His Leu Lys 355
Gln Lys Glu His Ala 360
Cys Pro Ala Glu Gly 365
Asp Arg Arg Phe Ser
370
Gln Ser Gly Asn Leu 375
Thr Glu His Leu Arg
380
His Thr Gly His Lys 385
Pro Phe Gln Cys Arg 390
Ile Cys Met Arg Ser 395
Ser Thr Ser Gly His
405
Leu Val Arg His Ile
410
Arg Thr His Thr Gly 415
Lys Pro Phe Ala Cys
420
Glu Phe Cys Gly Arg
425
Lys Phe Ala Gln Asn
430
Thr Leu Thr Glu His
435
Ala Lys Ile His Leu 440
Lys Gln Lys Glu Lys 445
Ala Glu Lys Gly Gly 450
Ala Pro Ser Ala Ser
455
Ser Ala Pro Pro Val
460
Pro
His 240
Ile
Glu
Arg
Pro
Leu 320
Glu
Ala
Cys
Ile
Phe 400
Glu
Ser
Lys
Ser
- 231 046157
Leu Ala Pro Val Val Thr Thr Cys Ala
465
470 <210> 123 <211> 627 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 123
Met Ala Ala Ala Lys Ala Glu Met 1 5
Gln Leu Met Ser Pro Leu Gln Ile
15
Ser Asp Pro Phe Gly Ser Phe Pro 20
His Ser Pro Thr Met Asp Asn Tyr 25 30
Pro Lys Leu Glu Glu Met Met Leu
40
Leu Ser Asn Gly Ala Pro Gln Phe 45
Leu Gly Ala Ala Gly Ala Pro Glu
55
Gly Ser Gly Ser Asn Ser Ser Ser 60
Ser Ser Ser Gly Gly Gly Gly Gly 65 70
Gly Gly Gly Gly Ser Asn Ser Ser
80
Ser Ser Ser Ser Thr Phe Asn Pro
Gln Ala Asp Thr Gly Glu Gln Pro
95
Tyr Glu His Leu Thr Ala Glu Ser
100
Phe Pro Asp Ile Ser Leu Asn Asn
105 110
Glu Lys Val Leu Val Glu Thr Ser
115 120
Tyr Pro Ser Gln Thr Thr Arg Leu
125
Pro Pro Ile Thr Tyr Thr Gly Arg
130 135
Phe Ser Leu Glu Pro Ala Pro Asn
140
Ser Gly Asn Thr Leu Trp Pro Glu
145 150
Pro Leu Phe Ser Leu Val Ser Gly
155 160
Leu Val Ser Met Thr Asn Pro Pro
165
Ala Ser Ser Ser Ser Ala Pro Ser
170 175
Pro Ala Ala Ser Ser Ala Ser Ala
180
Ser Gln Ser Pro Pro Leu Ser Cys
185 190
- 232 046157
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala 225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg
340 345 350
Asp Asn Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu
370 375 380
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
385 390 395
Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Ile
405 410 415
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
420 425 430
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr
435 440 445
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
Arg
Ser
Phe
Thr
Ile 400
Arg
Lys
Gly
- 233 046157
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
450 455 460
Phe Ser Thr Ser
Gly His Leu Thr Arg His Ile Arg Thr His Thr Gly
465 470 475
Glu Lys Pro Phe
480
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser
485 490
Ser Thr Arg Lys
495
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Lys
500 505
Lys Ala Asp Lys
510
Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser
515 520
Ser Tyr Pro Ser 525
Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr
530 535 540
Ser Tyr Pro Ser
Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr
545 550 555
Ser Phe Ser Ser
560
Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser
565 570
Gly Phe Pro Ser
575
Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro
580 585
Ala Phe Pro Ala
590
Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn
595 600
Ser Phe Ser Ala 605
Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser
610 615 620
Pro Arg Thr Ile
Glu Ile Cys 625 <210> 124 <211> 627 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 124
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser
5 10
Синтетический
Pro Leu Gln Ile
- 234 046157
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro
25
Thr Met Asp Asn
Pro Lys
Leu Glu Glu Met Met 35
Leu Leu Ser Asn Gly Ala Pro Gln 40 45
Leu Gly Ala Ala
Gly Ala Pro Glu Gly
Ser Gly Ser Asn Ser
Ser
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 65 70 75
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln 85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
145 150 155
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys
Gly Gly Phe Gln Val
245
Pro Met 250
Ile Pro Asp Tyr
255
Phe Pro Gln Gln Gln Gly Asp Leu
260
Gly Leu Gly Thr Pro Asp Gln
265 270
Tyr
Phe
Ser
Ser 80
Pro
Asn
Leu
Asn
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
Lys
- 235 046157
Pro Phe Gln Gly Leu
275
Glu Ser Arg Thr Gln 280
Gln Pro Ser Leu Thr
285
Leu Ser Thr Ile Lys 290
Ala Phe Ala Thr Gln
295
Ser Gly Ser Gln Asp
300
Lys Ala Leu Asn Thr 305
Ser Tyr Gln Ser Gln 310
Leu Ile Lys Pro Ser 315
Met Arg Lys Tyr Pro
325
Asn Arg Pro Ser Lys
330
Thr Pro Pro His Glu
335
Pro Tyr Ala Cys Pro
340
Val Glu Ser Cys Asp
345
Arg Arg Phe Ser Arg
350
Asp Asn Leu Val Arg 355
His Ile Arg Ile His 360
Thr Gly Gln Lys Pro 365
Gln Cys Arg Ile Cys
370
Met Arg Asn Phe Ser 375
Arg Glu Asp Asn Leu 380
Thr His Ile Arg Thr 385
His Thr Gly Glu Lys 390
Pro Phe Ala Cys Asp 395
Cys Gly Arg Lys Phe
405
Ala Arg Ser Asp Glu
410
Leu Val Arg His Ile
415
Thr His Thr Gly Glu
420
Lys Pro Phe Ala Cys
425
Asp Ile Cys Gly Arg
430
Phe Ser Gln Ser Gly
435
Asn Leu Thr Glu His
440
Ile Arg Ile His Thr 445
Gln Lys Pro Phe Gln 450
Cys Arg Ile Cys Met
455
Arg Asn Phe Ser Thr
460
Gly His Leu Val Arg 465
His Ile Arg Thr His 470
Thr Gly Glu Lys Pro 475
Ala Cys Asp Ile Cys
485
Gly Arg Lys Phe Ala
490
Gln Asn Ser Thr Leu
495
Glu His Thr Lys Ile
500
His Leu Arg Gln Lys
505
Asp Lys Lys Ala Asp
510
Ser Val Val Ala Ser
Ser Ala Thr Ser Ser
Leu Ser Ser Tyr Pro
Pro
Leu
Arg 320
Arg
Ser
Phe
His
Ile 400
Arg
Lys
Gly
Ser
Phe 480
Thr
Lys
Ser
- 236 046157
Pro Val
530
Pro Ala 545
Pro Gly
Pro Ser
Gln Val
Ser Thr
610
515
Ala Thr
Thr Thr
Ser Ser
Val Ala
580
Ser Ser 595
Gly Leu
Ser Tyr
Ser Tyr
550
Thr Tyr 565
Thr Thr
Phe Pro
Ser Asp
520
Pro Ser 535
Pro Ser
Pro Ser
Tyr Ser
Ser Ser
600
Met Thr 615
525
Pro Val
Pro Val
Pro Val
570
Ser Val
585
Ala Val
Ala Thr
Glu Ile Cys 625
Thr Thr
540
Pro Thr 555
His Ser
Pro Pro
Thr Asn
Phe Ser
620 <210> 125 <211> 272 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 125
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His
5 10
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 20 25
Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln
40
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
55 60
Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr
70 75
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
90
Ser Tyr Pro Ser
Ser Phe Ser Ser
560
Gly Phe Pro Ser
575
Ala Phe Pro Ala
590
Ser Phe Ser Ala 605
Pro Arg Thr Ile
Синтетический
Gly Val Pro Ala 15
Glu Cys Gly Lys 30
Arg Thr His Thr 45
Ser Phe Ser Arg
Gly Glu Lys Pro 80
Glu Asp Asn Leu
- 237 046157
His Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105
Pro Tyr Lys Cys Pro
110
Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr
165 170 175
Ser Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Asp Ala
210 215 220
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp
225 230 235 240
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
245 250 255
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
260 265 270 <210> 126 <211> 272 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 126
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr
25
Lys Cys Pro Glu Cys Gly Lys 30
- 238 046157
Ser Phe Ser Asp Pro 35
Gly Ala Leu Val Arg 40
His Gln Arg Thr His 45
Gly Glu Lys Pro Tyr 50
Lys Cys Pro Glu Cys 55
Gly Lys Ser Phe Ser 60
Ser Asp Asn Leu Val 65
Arg His Gln Arg Thr 70
His Thr Gly Glu Lys 75
Tyr Lys Cys Pro Glu 85
Cys Gly Lys Ser Phe
Ser Gln Ser Gly Asp
Arg Arg His Gln Arg
100
Thr His Thr Gly Glu
105
Lys Pro Tyr Lys Cys
110
Glu Cys Gly Lys Ser 115
Phe Ser Thr His Leu
120
Asp Leu Ile Arg His 125
Arg Thr His Thr Gly 130
Glu Lys Pro Tyr Lys 135
Cys Pro Glu Cys Gly
140
Ser Phe Ser Thr Ser 145
Gly Asn Leu Val Arg 150
His Gln Arg Thr His 155
Gly Glu Lys Pro Tyr
165
Lys Cys Pro Glu Cys
170
Gly Lys Ser Phe Ser
175
Ser Asp Asn Leu Val
180
Arg His Gln Arg Thr
185
His Thr Gly Lys Lys
190
Ser Lys Arg Pro Ala
195
Ala Thr Lys Lys Ala 200
Gly Gln Ala Lys Lys 205
Lys Gly Ser Tyr Pro
210
Tyr Asp Val Pro Asp
215
Tyr Ala Leu Glu Asp
220
Leu Asp Asp Phe Asp 225
Leu Asp Met Leu Gly 230
Ser Asp Ala Leu Asp 235
Phe Asp Leu Asp Met
245
Leu Gly Ser Asp Ala
250
Leu Asp Asp Phe Asp
255
Asp Met Leu Gly Ser
260
Asp Ala Leu Asp Asp
265
Phe Asp Leu Asp Met
270
Thr
Arg
Pro 80
Leu
Pro
Gln
Lys
Thr 160
Arg
Thr
Lys
Ala
Asp 240
Leu
Leu <210> 127 <211> 261
- 239 046157 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 127
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His
5 10
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 20 25
Синтетический
Gly Val Pro Ala 15
Glu Cys Gly Lys 30
Ser Phe Ser Arg Ser Asp 35
Asn Leu Val Arg His Gln 40
Arg Thr His Thr 45
Gly Glu Lys Pro Tyr Lys 50
Cys Pro Glu Cys Gly Lys 55 60
Ser Phe Ser Arg
Glu Asp Asn Leu His Thr 65 70
His Gln Arg Thr His Thr 75
Gly Glu Lys Pro 80
Tyr Lys Cys Pro Glu Cys 85
Gly Lys Ser Phe Ser Arg 90
Ser Asp Glu Leu 95
Val Arg His Gln Arg Thr
100
His Thr Gly Glu Lys Pro
105
Tyr Lys Cys Pro 110
Glu Cys Gly Lys Ser Phe 115
Ser Gln Ser Gly Asn Leu
120
Thr Glu His Gln 125
Arg Thr His Thr Gly Glu 130
Lys Pro Tyr Lys Cys Pro
135 140
Glu Cys Gly Lys
Ser Phe Ser Thr Ser Gly
145 150
His Leu Val Arg His Gln 155
Arg Thr His Thr
160
Gly Glu Lys Pro Tyr Lys
165
Cys Pro Glu Cys Gly Lys
170
Ser Phe Ser Gln
175
Asn Ser Thr Leu Thr Glu
180
His Gln Arg Thr His Thr
185
Gly Lys Lys Thr 190
Ser Lys Arg Pro Ala Ala
195
Thr Lys Lys Ala Gly Gln
200
Ala Lys Lys Lys 205
Lys Gly Ser Asp Ala Leu
210
Asp Asp Phe Asp Leu Asp
215 220
Met Leu Gly Ser
- 240 046157
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
225 230 235
Ser Asp Ala Leu
240
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
245 250
Leu Asp Asp Phe
255
Asp Leu Asp Met Leu
260 <210> 128 <211> 386 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 128
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr
5 10
Синтетический
Arg Leu Val Gln 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His 20 25
Ala Leu Arg Thr 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly
40
Leu Arg Pro Arg 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro
55 60
Gly Ala Leu Ala
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro 65 70 75
Phe Pro Ala Val
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro 85 90
Val Ala Thr Pro
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro
100 105
Gly Gly Pro Pro 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro
115 120
Pro Pro Ala His 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu
130 135 140
Glu Ala Leu Thr
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg
145 150 155
Glu Leu Pro Glu
160
- 241 046157
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gln
185
Ser Gln Leu Ile Lys
190
Ser Arg Met Arg Lys
195
Tyr Pro Asn Arg Pro
200
Ser Lys Thr Pro Pro
205
Glu Arg Pro Tyr Ala
210
Cys Pro Val Glu Ser
215
Cys Asp Arg Arg Phe 220
Arg Ser Asp Asn Leu 225
Val Arg His Ile Arg 230
Ile His Thr Gly Gln 235
Pro Phe Gln Cys Arg
245
Ile Cys Met Arg Asn
250
Phe Ser Arg Glu Asp
255
Leu His Thr His Ile
260
Arg Thr His Thr Gly
265
Glu Lys Pro Phe Ala
270
Asp Ile Cys Gly Arg 275
Lys Phe Ala Arg Ser 280
Asp Glu Leu Val Arg 285
Thr Lys Ile His Leu 290
Arg Gln Lys Asp Arg 295
Pro Tyr Ala Cys Pro 300
Glu Ser Cys Asp Arg 305
Arg Phe Ser Gln Ser 310
Gly Asn Leu Thr Glu 315
Ile Arg Ile His Thr
325
Gly Gln Lys Pro Phe
330
Gln Cys Arg Ile Cys
335
Arg Asn Phe Ser Thr
340
Ser Gly His Leu Val
345
Arg His Ile Arg Thr
350
Thr Gly Glu Lys Pro
355
Phe Ala Cys Asp Ile 360
Cys Gly Arg Lys Phe 365
Gln Asn Ser Thr Leu
370
Thr Glu His Thr Lys
375
Ile His Leu Arg Gln
380
Ser
Pro
His
Ser
Lys 240
Asn
Cys
His
Val
His 320
Met
His
Ala
Lys
Asp Lys 385 <210> 129 <211> 402 <212> Белок
- 242 046157 <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 129
Синтетический
Met Ala Ala 1
Asp His Leu 5
Met Leu Ala
Glu Gly Tyr 10
Arg Leu Val Gln 15
Arg Pro Pro
Ser Ala Ala 20
Ala Ala His
Gly Pro His
Ala Leu Arg Thr 30
Leu Pro Pro
Tyr Ala Gly
Pro Gly Leu 40
Asp Ser Gly
Leu Arg Pro Arg 45
Gly Ala Pro 50
Leu Gly Pro
Pro Pro Pro 55
Arg Gln Pro
Gly Ala Leu Ala
Tyr Gly Ala 65
Phe Gly Pro
Pro Ser Ser
Phe Gln Pro
Phe Pro Ala Val
Pro Pro Pro
Ala Ala Gly 85
Ile Ala His
Leu Gln Pro 90
Val Ala Thr Pro
Tyr Pro Gly
Arg Ala Ala 100
Ala Pro Pro
105
Asn Ala Pro
Gly Gly Pro Pro 110
Gly Pro Gln
115
Pro Ala Pro
Ser Ala Ala
120
Ala Pro Pro
Pro Pro Ala His 125
Ala Leu Gly
130
Gly Met Asp
Ala Glu Leu 135
Ile Asp Glu
140
Glu Ala Leu Thr
Ser Leu Glu 145
Leu Glu Leu
150
Gly Leu His
Arg Val Arg
155
Glu Leu Pro Glu
160
Leu Phe Leu
Gly Gln Ser
165
Glu Phe Asp
Cys Phe Ser 170
Asp Leu Gly Ser
175
Ala Pro Pro
Ala Gly Ser 180
Val Ser Cys
185
Gly Gly Ser
Gly Gly Gly Ser
190
Gly Gly Gly
195
Ser Gly Gly
Gly Ser Gly
200
Gln Ser Gln
Leu Ile Lys Pro 205
Ser Arg Met
210
Arg Lys Tyr
Pro Asn Arg 215
Pro Ser Lys
220
Thr Pro Pro His
- 243 046157
Glu Arg Pro 225
Arg Ser Asp
Pro Phe Gln
Leu His Thr
275
Tyr Ala Cys
230
Pro Val Glu
Ser Cys Asp
235
Arg Arg Phe Ser
240
Asp Ile
290
Thr Lys 305
Glu Ser
Ile Arg
Arg Asn
Thr Gly
370
Gln Asn 385
Asp Lys <210>
<211>
<212>
Asn Leu Val
245
Arg His Ile
Arg Ile His 250
Thr Gly Gln Lys
255
Cys Arg Ile 260
His Ile Arg
Cys Met Arg
265
Thr His Thr
280
Asn Phe Ser
Gly Glu Lys
Cys Gly
Arg Lys
Ile His
Leu Arg
310
Cys Asp
Arg Arg 325
Ile His
340
Thr Gly
Phe Ser 355
Glu Lys
Ser Thr
130
569 Белок
Thr Ser
Pro Phe
Leu Thr
390
Phe Ala 295
Gln Lys
Phe Ser
Gln Lys
Gly His 360
Ala Cys 375
Glu His
Arg Ser
Asp Glu
300
Asp Arg
Pro Tyr 315
Arg Glu Asp Asn 270
Pro Phe Ala Cys 285
Leu Val Arg His
Ala Cys Pro Val
320
Gln Ser
330
Gly Asn
Leu Thr Glu His
335
Pro Phe 345
Gln Cys
Arg Ile Cys Met
350
Leu Val
Arg His
Ile Arg Thr His 365
Asp Ile
Cys Gly
380
Arg Lys Phe Ala
Thr Lys
Ile His
395
Leu Arg Gln Lys
400 <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 130
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr
5 10
Arg Leu Val Gln 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His
Ala Leu Arg Thr
- 244 046157
Leu Pro Pro Tyr Ala 35
Gly Pro Gly Leu Asp 40
Ser Gly Leu Arg Pro 45
Gly Ala Pro Leu Gly 50
Pro Pro Pro Pro Arg 55
Gln Pro Gly Ala Leu 60
Tyr Gly Ala Phe Gly 65
Pro Pro Ser Ser Phe 70
Gln Pro Phe Pro Ala 75
Pro Pro Pro Ala Ala
Gly Ile Ala His Leu
Gln Pro Val Ala Thr
Tyr Pro Gly Arg Ala
100
Ala Ala Pro Pro Asn
105
Ala Pro Gly Gly Pro
110
Gly Pro Gln Pro Ala
115
Pro Ser Ala Ala Ala
120
Pro Pro Pro Pro Ala
125
Ala Leu Gly Gly Met
130
Asp Ala Glu Leu Ile 135
Asp Glu Glu Ala Leu 140
Ser Leu Glu Leu Glu 145
Leu Gly Leu His Arg 150
Val Arg Glu Leu Pro 155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Ala
185
Asp His Leu Met Leu
190
Glu Gly Tyr Arg Leu 195
Val Gln Arg Pro Pro
200
Ser Ala Ala Ala Ala
205
Gly Pro His Ala Leu
210
Arg Thr Leu Pro Pro 215
Tyr Ala Gly Pro Gly
220
Asp Ser Gly Leu Arg 225
Pro Arg Gly Ala Pro 230
Leu Gly Pro Pro Pro 235
Arg Gln Pro Gly Ala
245
Leu Ala Tyr Gly Ala
250
Phe Gly Pro Pro Ser
255
Phe Gln Pro Phe Pro
260
Ala Val Pro Pro Pro
265
Ala Ala Gly Ile Ala
270
Arg
Ala
Val 80
Pro
Pro
His
Thr
Glu 160
Ser
Ala
His
Leu
Pro 240
Ser
His
- 245 046157
Leu Gln Pro Val Ala
275
Thr Pro Tyr Pro Gly
280
Arg Ala Ala Ala Pro 285
Asn Ala Pro Gly Gly
290
Pro Pro Gly Pro Gln
295
Pro Ala Pro Ser Ala
300
Ala Pro Pro Pro Pro 305
Ala His Ala Leu Gly 310
Gly Met Asp Ala Glu 315
Ile Asp Glu Glu Ala
325
Leu Thr Ser Leu Glu
330
Leu Glu Leu Gly Leu
335
Arg Val Arg Glu Leu
340
Pro Glu Leu Phe Leu
345
Gly Gln Ser Glu Phe
350
Cys Phe Ser Asp Leu
355
Gly Ser Ala Pro Pro 360
Ala Gly Ser Val Ser 365
Gln Ser Gln Leu Ile
370
Lys Pro Ser Arg Met
375
Arg Lys Tyr Pro Asn
380
Pro Ser Lys Thr Pro 385
Pro His Glu Arg Pro 390
Tyr Ala Cys Pro Val 395
Ser Cys Asp Arg Arg
405
Phe Ser Arg Ser Asp
410
Asn Leu Val Arg His
415
Arg Ile His Thr Gly
420
Gln Lys Pro Phe Gln
425
Cys Arg Ile Cys Met
430
Asn Phe Ser Arg Glu 435
Asp Asn Leu His Thr 440
His Ile Arg Thr His 445
Gly Glu Lys Pro Phe
450
Ala Cys Asp Ile Cys 455
Gly Arg Lys Phe Ala
460
Ser Asp Glu Leu Val 465
Arg His Thr Lys Ile 470
His Leu Arg Gln Lys 475
Arg Pro Tyr Ala Cys
485
Pro Val Glu Ser Cys
490
Asp Arg Arg Phe Ser
495
Ser Gly Asn Leu Thr
500
Glu His Ile Arg Ile
505
His Thr Gly Gln Lys
510
Phe Gln Cys Arg Ile 515
Cys Met Arg Asn Phe
520
Ser Thr Ser Gly His
525
Pro
Ala
Leu 320
His
Asp
Cys
Arg
Glu 400
Ile
Arg
Thr
Arg
Asp 480
Gln
Pro
Leu
- 246 046157
Val Arg His Ile Arg Thr His Thr
530 535
Gly Glu Lys
Pro Phe Ala Cys Asp 540
Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr
545 550 555 560
Lys Ile His Leu Arg Gln Lys Asp Lys
565 <210> 131 <211> 585 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 131
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
5 1015
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155160
- 247 046157
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Ala Asp His Leu
195
Met Leu Ala Glu Gly 200
Tyr Arg Leu Val Gln 205
Pro Pro Ser Ala Ala
210
Ala Ala His Gly Pro 215
His Ala Leu Arg Thr
220
Pro Pro Tyr Ala Gly 225
Pro Gly Leu Asp Ser 230
Gly Leu Arg Pro Arg 235
Ala Pro Leu Gly Pro
245
Pro Pro Pro Arg Gln
250
Pro Gly Ala Leu Ala
255
Gly Ala Phe Gly Pro
260
Pro Ser Ser Phe Gln
265
Pro Phe Pro Ala Val
270
Pro Pro Ala Ala Gly
275
Ile Ala His Leu Gln
280
Pro Val Ala Thr Pro
285
Pro Gly Arg Ala Ala 290
Ala Pro Pro Asn Ala
295
Pro Gly Gly Pro Pro 300
Pro Gln Pro Ala Pro 305
Ser Ala Ala Ala Pro 310
Pro Pro Pro Ala His 315
Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
325 330 335
Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
340 345 350
Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
355 360 365
Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
370 375 380
Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
385 390 395
Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
405 410 415
Ser
Ser
Arg
Leu
Gly 240
Tyr
Pro
Tyr
Gly
Ala 320
Ser
Leu
Ala
Gly
Arg 400
Glu
- 248 046157
Ser Cys Asp
Arg Arg Phe 420
Ser Arg Ser
425
Asp Asn Leu
Val Arg His Ile
430
Arg Ile His
435
Thr Gly Gln
Lys Pro Phe
440
Gln Cys Arg
Ile Cys Met Arg 445
Asn Phe Ser
450
Arg Glu Asp
Asn Leu His 455
Thr His Ile
460
Arg Thr His Thr
Gly Glu Lys 465
Pro Phe Ala
470
Cys Asp Ile
Cys Gly Arg
475
Lys Phe Ala Arg
480
Ser Asp Glu
Leu Val Arg
485
His Thr Lys
Ile His Leu 490
Arg Gln Lys Asp
495
Arg Pro Tyr
Ala Cys Pro 500
Val Glu Ser
505
Cys Asp Arg
Arg Phe Ser Gln
510
Ser Gly Asn
515
Leu Thr Glu
His Ile Arg
520
Ile His Thr
Gly Gln Lys Pro 525
Phe Gln Cys
530
Arg Ile Cys
Met Arg Asn 535
Phe Ser Thr
540
Ser Gly His Leu
Val Arg His 545
Ile Arg Thr
550
His Thr Gly
Glu Lys Pro 555
Phe Ala Cys Asp
560
Ile Cys Gly
Arg Lys Phe
565
Ala Gln Asn
Ser Thr Leu 570
Thr Glu His Thr
575
Lys Ile His
Leu Arg Gln 580
Lys Asp Lys
585 <210> 132 <211> 523 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид
Синтетический <400> 132
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
5 10
Ser Asp Ala Leu 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 20 25
Leu Asp Asp Phe 30
- 249 046157
Asp
Met
Val 65
Glu
Ser
Ala
Pro
Pro 145
Ala
Ala
Val
Pro
Gln 225
Pro
Gln
Met
Leu Asp Met
Leu Gly Ser Asp
Ala Leu Asp Asp Phe Asp Leu Asp 45
Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys 50 55 60
Gly Ser Gln
Tyr
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu 70 75 80
Lys Arg Lys Arg Thr 85
Pro Phe Ser Gly Pro
100
Val Pro Ser Arg Ser 115
Tyr Pro Phe Thr Ser 130
Thr Met Val Phe Pro
150
Pro Ala Pro Pro Gln
165
Pro Ala Met Val Ser
180
Leu Ala Pro Gly Pro
195
Thr Gln Ala Gly Glu 210
Phe Asp Asp Glu Asp
230
Ala Val Phe Thr Asp
245
Leu Leu Asn Gln Gly 260
Leu Met Glu Tyr Pro
275
Tyr Glu Thr Phe Lys
Thr Asp Pro Arg Pro
105
Ser Ala Ser Val Pro
120
Ser Leu Ser Thr Ile 135
Ser Gly Gln Ile Ser
155
Val Leu Pro Gln Ala
170
Ala Leu Ala Gln Ala
185
Pro Gln Ala Val Ala
200
Gly Thr Leu Ser Glu 215
Leu Gly Ala Leu Leu
235
Leu Ala Ser Val Asp
250
Ile Pro Val Ala Pro
265
Glu Ala Ile Thr Arg
280
Ser Ile Met Lys Lys
Pro Pro Arg Arg Ile
110
Lys Pro Ala Pro Gln
125
Asn Tyr Asp Glu Phe 140
Gln Ala Ser Ala Leu
160
Pro Ala Pro Ala Pro
175
Pro Ala Pro Val Pro
190
Pro Pro Ala Pro Lys 205
Ala Leu Leu Gln Leu 220
Gly Asn Ser Thr Asp
240
Asn Ser Glu Phe Gln
255
His Thr Thr Glu Pro
270
Leu Val Thr Gly Ala
285
- 250 046157
Gln Arg Pro Pro Asp
290
Pro Ala Pro Ala Pro
295
Leu Gly Ala Pro Gly 300
Pro Asn Gly Leu Leu 305
Ser Gly Asp Glu Asp 310
Phe Ser Ser Ile Ala 315
Met Asp Phe Ser Ala
325
Leu Leu Gly Ser Gly
330
Ser Gly Ser Arg Asp
335
Arg Glu Gly Met Phe
340
Leu Pro Lys Pro Glu
345
Ala Gly Ser Ala Ile
350
Asp Val Phe Glu Gly 355
Arg Glu Val Cys Gln 360
Pro Lys Arg Ile Arg 365
Phe His Pro Pro Gly
370
Ser Pro Trp Ala Asn
375
Arg Pro Leu Pro Ala 380
Leu Ala Pro Thr Pro 385
Thr Gly Pro Val His 390
Glu Pro Val Gly Ser 395
Thr Pro Ala Pro Val
405
Pro Gln Pro Leu Asp
410
Pro Ala Pro Ala Val
415
Pro Glu Ala Ser His
420
Leu Leu Glu Asp Pro
425
Asp Glu Glu Thr Ser
430
Ala Val Lys Ala Leu 435
Arg Glu Met Ala Asp 440
Thr Val Ile Pro Gln
445
Glu Glu Ala Ala Ile
450
Cys Gly Gln Met Asp
455
Leu Ser His Pro Pro
460
Arg Gly His Leu Asp 465
Glu Leu Thr Thr Thr 470
Leu Glu Ser Met Thr 475
Asp Leu Asn Leu Asp
485
Ser Pro Leu Thr Pro
490
Glu Leu Asn Glu Ile
495
Asp Thr Phe Leu Asn
500
Asp Glu Cys Leu Leu
505
His Ala Met His Ile
510
Leu
Asp 320
Ser
Ser
Pro
Ser
Leu 400
Thr
Gln
Lys
Pro
Glu 480
Leu
Ser
Thr Gly Leu Ser Ile 515
Phe Asp Thr Ser Leu 520
Phe <210> 133 <211> 50
- 251 046157 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 133
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
510
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 2025
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp 3540
Синтетический
Ser Asp Ala Leu 15
Leu Asp Asp Phe 30
Phe Asp Leu Asp 45
Met Leu <210> 134 <211> 275 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 134
Синтетический
Met Ser Gly 1
Arg Phe Pro
Met Gly Met 35
Pro Gln His 50
Ala Gly Asn 65
Gly Thr Val
Leu Glu Met
Asp Gly Thr 20
Gly Gln Phe
Ala Phe Asn
Met Asn Ala
Asn Gly Gly 85
Arg Phe Asn
Asn Ser Gln 100
Gly Ser Leu
Pro Ala Ser
Ala Asp His
Asn Gly Leu 25
Pro Ser Pro 40
Ala Leu Met 55
Thr Ser Gly
His Pro Pro
Phe Met Gly
105
Met Gln Leu
Met Met Ala 10
His His His
His His His
Gly Glu His 60
Ile Arg His 75
Ser Ala Leu 90
Pro Pro Val
Gln Lys Leu
Met Asn His Gly 15
Pro Ala His Arg 30
Gln Gln Gln Gln 45
Ile His Tyr Gly
Ala Met Gly Pro 80
Ala Pro Ala Ala
Ala Ser Gln Gly 110
Asn Asn Gln Tyr
- 252 046157
115 120125
Phe Asn His His Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
130 135140
Pro Ala Ala Gly His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
145 150 155160
Cys Asn Pro Lys His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
165 170175
Gly Ser Ser Thr Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
180 185190
Gly Ser Ser Asn Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala
195 200205
Ser Val Ala His Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
210 215220
Thr Asp Phe Ile Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
225 230 235240
Gly Leu Asp Arg Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
245 250255
Glu Phe Asp Phe Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
260 265270
Val Ser Cys
275 <210> 135 <211> 183 <212> Белок <213>
Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 135
Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg Pro
5 1015
Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr LeuPro
2530
Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly Ala 35 4045
- 253 046157
Pro Leu
Gly Pro
Pro Pro
Ala Phe 65
Gly Pro
Pro Ser
Pro Ala
Ala Gly
Ile Ala 85
Gly Arg
Ala Ala
100
Ala Pro
Gln Pro
Ala Pro 115
Ser Ala
Gly Gly
130
Met Asp
Ala Glu
Glu Leu 145
Glu Leu
Gly Leu
150
Leu Gly
Gln Ser
Glu Phe 165
Pro Ala
Gly Ser
180
Val Ser
Pro Arg 55
Ser Phe
His Leu
Pro Asn
Ala Ala
120
Leu Ile 135
His Arg
Asp Cys
Cys
Gln Pro
Gln Pro
Gln Pro
Ala Pro 105
Pro Pro
Asp Glu
Val Arg
Phe Ser
170
Gly Ala 60
Phe Pro 75
Val Ala
Gly Gly
Pro Pro
Glu Ala
140
Glu Leu 155
Asp Leu
Leu Ala Tyr Gly
Ala Val Pro Pro
Thr Pro Tyr Pro 95
Pro Pro Gly Pro
110
Ala His Ala Leu 125
Leu Thr Ser Leu
Pro Glu Leu Phe
160
Gly Ser Ala Pro
175 <210> 136 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности
Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота
- 254 046157 <400> 136
Cys Xaa Cys Xaa His Xaa His 1 5 <210> 137 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 137
Cys Xaa Cys Xaa Cys Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa Cys Xaa
5 10 15
Cys <210> 138 <211> 17 <212> Белок <213> Искусственная последовательность
- 255 046157 <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 138
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa His Xaa Cys Xaa Cys Xaa
5 10 15
Cys <210> 139 <211> 15 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2)
- 256 046157 <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(8) <223> Любая аминокислота <220>
<221> MOD_RES <222> (10)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (15) . . (15) <223> Cys, His, or Asp <400> 139
Cys Xaa Cys Xaa His Xaa Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa
5 10 15 <210> 140 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
- 257 046157 <221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 140
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa Cys Xaa
5 10 15
Cys <210> 141 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 141
Cys Xaa Cys Xaa Cys Xaa His 1 5
- 258 046157 <210> 142 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 142
Cys Xaa Cys Xaa His Xaa Cys 1 5 <210> 143 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12)
- 259 046157 <223> Любая аминокислота <220>
<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 143
Cys Xaa Cys Xaa His Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His Xaa
5 10 15
Cys <210> 144 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220>
<221> MOD_RES
- 260 046157 <222> (16)..(16) <223> Любая аминокислота <400> 144
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His Xaa
5 10 15
Cys <210> 145 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 145
Cys Xaa Cys Xaa Cys Xaa Cys 1 5 <210> 146 <211> 17 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220>
<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220>
- 261 046157 <221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>
<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220>
<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220>
<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220>
<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 146
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa His Xaa His Xaa
5 10 15
Cys <210> 147 <211> 344 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <220>
<221> MISC_FEATURE <222> (8)..(322) <223> Эта область может содержать 1-15 повторяющихся звеньев Tyr Lys Cys Pro Glu Cys
Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro <220>
<221> NON_CONS <222> (18)..(19) <220>
<221> NON_CONS <222> (39)..(40) <220>
<221> NON_CONS <222> (60)..(61)
- 262 046157
NON_CONS (81) .. (82)
NON_CONS (102) .. (103)
NON_CONS (123)..(124)
NON_CONS (144) .. (145)
NON_CONS (165)..(166)
NON_CONS (186)..(187)
NON_CONS (207)..(208)
NON_CONS (228)..(229)
NON_CONS (249)..(250)
NON_CONS (270)..(271)
NON_CONS (291)..(292)
NON_CONS (312)..(313)
NON_CONS (333)..(334)
Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400>
147
Leu Glu Pro 1
Gly
Glu Lys Pro Tyr Lys 5
Cys Pro Glu Cys Gly 10
Lys Ser 15
Phe Ser His
Gln 20
Arg Thr His Thr Gly
Glu Lys Pro Tyr Lys
Cys Pro
- 263 046157
Glu Cys Gly Lys Ser 35
Phe Ser His Gln Arg 40
Thr His Thr Gly Glu Lys 45
Pro Tyr Lys Cys Pro 50
Glu Cys Gly Lys Ser 55
Phe Ser His Gln Arg Thr 60
His Thr Gly Glu Lys 65
Pro Tyr Lys Cys Pro 70
Glu Cys Gly Lys Ser Phe 75 80
Ser His Gln Arg Thr
His Thr Gly Glu Lys
Pro Tyr Lys Cys Pro Glu 95
Cys Gly Lys Ser Phe
100
Ser His Gln Arg Thr
105
His Thr Gly Glu Lys Pro
110
Tyr Lys Cys Pro Glu 115
Cys Gly Lys Ser Phe 120
Ser His Gln Arg Thr His
125
Thr Gly Glu Lys Pro
130
Tyr Lys Cys Pro Glu
135
Cys Gly Lys Ser Phe Ser 140
His Gln Arg Thr His 145
Thr Gly Glu Lys Pro 150
Tyr Lys Cys Pro Glu Cys
155 160
Gly Lys Ser Phe Ser
165
His Gln Arg Thr His
170
Thr Gly Glu Lys Pro Tyr
175
Lys Cys Pro Glu Cys
180
Gly Lys Ser Phe Ser
185
His Gln Arg Thr His Thr
190
Gly Glu Lys Pro Tyr
195
Lys Cys Pro Glu Cys 200
Gly Lys Ser Phe Ser His
205
Gln Arg Thr His Thr
210
Gly Glu Lys Pro Tyr
215
Lys Cys Pro Glu Cys Gly
220
Lys Ser Phe Ser His 225
Gln Arg Thr His Thr 230
Gly Glu Lys Pro Tyr Lys
235 240
Cys Pro Glu Cys Gly
245
Lys Ser Phe Ser His
250
Gln Arg Thr His Thr Gly
255
Glu Lys Pro Tyr Lys
260
Cys Pro Glu Cys Gly
265
Lys Ser Phe Ser His Gln
270
Arg Thr His Thr Gly
Glu Lys Pro Tyr Lys
Cys Pro Glu Cys Gly Lys
- 264 046157
275
280
Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys
290 295300
Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr
305 310315
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
325330
285
Pro Tyr Lys Cys
His Thr Gly Glu
320
Ser His Gln Arg
335
Thr His Thr Gly Lys Lys Thr Ser
340 <210> 148 <211> 292 <212> Белок <213> Искусственная последовательность <220>
< 223> Описание искусственной последовательности полипептид
Синтетический <220>
< 221> MOD_RES < 222> (8) .. (57) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (8)..(57) < 223> Эта область может содержать 1-50 остатков <220>
< 221> MOD_RES < 222> (65).. (114) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (65)..(114) < 223> Эта область может содержать 1-50 остатков <220>
< 221> MOD_RES < 222> (122)..(171) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (122)..(171) < 223> Эта область может содержать 1-50 остатков <220>
< 221> MOD_RES < 222> (179)..(228) < 223> Любая аминокислота
- 265 046157 <220>
<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1<220>
<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1<400> 148
Arg Ser Asp Asn Leu Val Arg Xaa Xaa 1 5
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
25
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
40
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
55
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 85
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105
Xaa Xaa Arg Ser Asp Glu Leu Val Arg
115 120
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165
Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 статков статков
Xaa Xaa Xaa Xaa Xaa Xaa
Xaa Xaa Xaa Xaa Xaa Xaa 30
Xaa Xaa Xaa Xaa Xaa Xaa 45
Glu Asp Asn Leu His Thr 60
Xaa Xaa Xaa Xaa Xaa Xaa
80
Xaa Xaa Xaa Xaa Xaa Xaa 95
Xaa Xaa Xaa Xaa Xaa Xaa
110
Xaa Xaa Xaa Xaa Xaa Xaa
125
Xaa Xaa Xaa Xaa Xaa Xaa
140
Xaa Xaa Xaa Xaa Xaa Xaa
155 160
Xaa Gln Ser Gly Asn Leu 175
Xaa Xaa Xaa Xaa Xaa Xaa
190
- 266 046157
Xaa Xaa
Xaa Xaa
210
Xaa Xaa 225
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 195
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 260
Xaa Xaa 275
Xaa Xaa
Xaa Xaa
Thr Ser
230
Xaa Xaa 245
Xaa Xaa
Xaa Xaa
Xaa Xaa
200
Xaa Xaa 215
Gly His
Xaa Xaa
Xaa Xaa
Xaa Xaa
280
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
220
Leu Val Arg Xaa
235
Xaa Xaa
250
Xaa Xaa
Xaa Xaa 265
Xaa Xaa
Xaa Xaa 205
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
270
Xaa Xaa
Xaa Xaa
Xaa Xaa
240
Xaa Xaa 255
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Gln Asn Ser
285
Thr Leu Thr Glu
290 <210> 149 <211> 292 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <220>
< 221> MOD_RES < 222> (8) .. (57) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (8)..(57) < 223> Эта область может содержать 1-50 остатков <220>
< 221> MOD_RES < 222> (65)..(114) < 223> Любая аминокислота <220>
< 221> MISC_FEATURE < 222> (65)..(114) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (122)..(171)
- 267 046157 <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-50 остатков <400> 149 Arg Ser Asp 1
Asn Leu Val
Arg Xaa Xaa
Xaa Xaa Xaa 10
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 20
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 45
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 55
His Arg Thr
Thr Leu Thr
Xaa Xaa Xaa 65
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 90
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa 100
Xaa Xaa Xaa
105
Xaa Xaa Xaa
Xaa Xaa Xaa
110
Xaa Xaa Arg
115
Glu Asp Asn
Leu His Thr
120
Xaa Xaa Xaa
Xaa Xaa Xaa 125
Xaa Xaa Xaa
130
Xaa Xaa Xaa
Xaa Xaa Xaa 135
Xaa Xaa Xaa
140
Xaa Xaa Xaa
Xaa
Xaa
Xaa
Asn
Xaa 80
Xaa
Xaa
Xaa
Xaa
- 268 046157
Xaa Xaa 145
Xaa Xaa
Thr Glu
Xaa Xaa
Xaa Xaa 210
Xaa Xaa 225
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
180
Xaa Xaa 195
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
260
Xaa Xaa 275
Asn Leu His Thr
290 <210> 150 <211> 292 <212> Белок
Xaa Xaa
150
Xaa Xaa 165
Xaa Xaa
Xaa Xaa
Xaa Xaa
Gln Ser
230
Xaa Xaa 245
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
200
Xaa Xaa 215
Ser Ser
Xaa Xaa
Xaa Xaa
Xaa Xaa
280
Xaa Xaa
Xaa Xaa
170
Xaa Xaa 185
Xaa Xaa
Xaa Xaa
Xaa Xaa 155
Xaa Thr
Xaa Xaa
Xaa Xaa
Xaa Xaa 220
Xaa Xaa
Ser His
Xaa Xaa
190
Xaa Xaa 205
Xaa Xaa
Xaa Xaa
160
Ser Leu 175
Xaa Xaa
Xaa Xaa
Xaa Xaa
Leu Val Arg Xaa
235
Xaa Xaa
Xaa Xaa
240
Xaa Xaa
250
Xaa Xaa 265
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
270 <213> Искусственная последовательность <220>
Xaa Xaa 255
Xaa Xaa
Xaa Arg Glu Asp 285 <223> Описание искусственной последовательности: Синтетический полипептид <220>
<221> MOD_RES <222> (8) .. (57) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (8)..(57) <223> Эта область может содержать 1-50 остатков <221> MOD_RES <220>
- 269 046157 <222> (65) .. (114) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (65)..(114) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (122)..(171) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-50 остатков <220>
<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-50 остатков <400> 150
Asp Pro Gly Ala Leu Val Arg Xaa 1 5
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 25
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 35
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 45
Xaa Xaa 15
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 55
Xaa Arg Ser Asp Asn Leu Val Arg 60
Xaa Xaa 65
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 75
Xaa Xaa
Xaa Xaa
Xaa Xaa
Xaa Xaa 85
Xaa Xaa
Xaa
Xaa Xaa Xaa 90
Xaa Xaa
Xaa Xaa 80
Xaa Xaa 95
- 270 046157
Xaa
Xaa
Xaa
Xaa
100
Xaa
Xaa
Xaa
Xaa
Xaa
105
Xaa
Xaa
Xaa
Xaa
Xaa
110
Xaa
Xaa
Xaa
Xaa
Gln
115
Ser
Gly
Asp
Leu
Arg 120
Arg
Xaa
Xaa
Xaa
Xaa
125
Xaa
Xaa
Xaa
Xaa
Xaa
130
Xaa
Xaa
Xaa
Xaa
Xaa
135
Xaa
Xaa
Xaa
Xaa
Xaa
140
Xaa
Xaa
Xaa
Xaa
Xaa
145
Xaa
Xaa
Xaa
Xaa
Xaa
150
Xaa
Xaa
Xaa
Xaa
Xaa
155
Xaa
Xaa
Xaa
Xaa
Xaa
160
Xaa
Xaa
Xaa
Xaa
Xaa
165
Xaa
Xaa
Xaa
Xaa
Xaa
170
Xaa
Thr
His
Leu
Asp 175
Leu
Ile
Arg
Xaa
Xaa
180
Xaa
Xaa
Xaa
Xaa
Xaa
185
Xaa
Xaa
Xaa
Xaa
Xaa
190
Xaa
Xaa
Xaa
Xaa
Xaa
195
Xaa
Xaa
Xaa
Xaa
Xaa
200
Xaa
Xaa
Xaa
Xaa
Xaa
205
Xaa
Xaa
Xaa
Xaa
Xaa
210
Xaa
Xaa
Xaa
Xaa
Xaa
215
Xaa
Xaa
Xaa
Xaa
Xaa
220
Xaa
Xaa
Xaa
Xaa
Xaa
225
Xaa
Xaa
Xaa
Thr
Ser
230
Gly
Asn
Leu
Val
Arg 235
Xaa
Xaa
Xaa
Xaa
Xaa
240
Xaa
Xaa
Xaa
Xaa
Xaa
245
Xaa
Xaa
Xaa
Xaa
Xaa
250
Xaa
Xaa
Xaa
Xaa
Xaa
255
Xaa
Xaa
Xaa
Xaa
Xaa
260
Xaa
Xaa
Xaa
Xaa
Xaa
265
Xaa
Xaa
Xaa
Xaa
Xaa
270
Xaa
Xaa
Xaa
Xaa
Xaa
275
Xaa
Xaa
Xaa
Xaa
Xaa
280
Xaa
Xaa
Xaa
Xaa
Xaa
285
Arg
Ser
Asp
Asn Leu Val Arg
290 <210> 151 <211> 463 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <220>
- 271 046157 <221> MOD_RES <222> (8) .. (57) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (8)..(57) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (65).. (114) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (65)..(114) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (122)..(171) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (293)..(342) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (293)..(342) <223> Эта область может содержать 1-5 <220>
<221> MOD_RES <222> (350)..(399) <223> Любая аминокислота остатков остатков остатков остатков остатков остатков
- 272 046157 <220>
<221> MISC_FEATURE <222> (350)..(399) <223> Эта область может содержать 1<220>
<221> MOD_RES <222> (407)..(456) <223> Любая аминокислота <220>
<221> MISC_FEATURE <222> (407)..(456) <223> Эта область может содержать 1<400> 151
Arg Arg Asp Glu Leu Asn Val Xaa Xaa 1 5
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
25
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
40
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
55
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 85
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105
Xaa Xaa Arg Ser Asp Asp Leu Val Arg
115 120
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165
Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 статков статков
Xaa Xaa Xaa Xaa Xaa Xaa
Xaa Xaa Xaa Xaa Xaa Xaa 30
Xaa Xaa Xaa Xaa Xaa Xaa 45
Ser Asp His Leu Thr Asn 60
Xaa Xaa Xaa Xaa Xaa Xaa
80
Xaa Xaa Xaa Xaa Xaa Xaa 95
Xaa Xaa Xaa Xaa Xaa Xaa
110
Xaa Xaa Xaa Xaa Xaa Xaa
125
Xaa Xaa Xaa Xaa Xaa Xaa
140
Xaa Xaa Xaa Xaa Xaa Xaa
155 160
Xaa Arg Ser Asp Asn Leu 175
Xaa Xaa Xaa Xaa Xaa Xaa
190
- 273 046157
Xaa Xaa Xaa
195
Xaa Xaa Xaa
Xaa Xaa Xaa
200
Xaa Xaa Xaa
Xaa Xaa Xaa 205
Xaa Xaa Xaa
210
Xaa Xaa Xaa
Xaa Xaa Xaa 215
Xaa Xaa Xaa
220
Xaa Xaa Xaa
Xaa Xaa Xaa 225
Xaa His Arg
230
Thr Thr Leu
Thr Asn Xaa
235
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
245
Xaa Xaa Xaa
Xaa Xaa Xaa 250
Xaa Xaa Xaa
255
Xaa Xaa Xaa
Xaa Xaa Xaa 260
Xaa Xaa Xaa
265
Xaa Xaa Xaa
Xaa Xaa Xaa
270
Xaa Xaa Xaa
275
Xaa Xaa Xaa
Xaa Xaa Xaa
280
Xaa Xaa Xaa
Xaa Arg Glu 285
Asn Leu His
290
Thr Xaa Xaa
Xaa Xaa Xaa 295
Xaa Xaa Xaa
300
Xaa Xaa Xaa
Xaa Xaa Xaa 305
Xaa Xaa Xaa
310
Xaa Xaa Xaa
Xaa Xaa Xaa
315
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
325
Xaa Xaa Xaa
Xaa Xaa Xaa 330
Xaa Xaa Xaa
335
Xaa Xaa Xaa
Xaa Xaa Xaa 340
Thr Ser His
345
Ser Leu Thr
Glu Xaa Xaa
350
Xaa Xaa Xaa
355
Xaa Xaa Xaa
Xaa Xaa Xaa
360
Xaa Xaa Xaa
Xaa Xaa Xaa 365
Xaa Xaa Xaa
370
Xaa Xaa Xaa
Xaa Xaa Xaa 375
Xaa Xaa Xaa
380
Xaa Xaa Xaa
Xaa Xaa Xaa 385
Xaa Xaa Xaa
390
Xaa Xaa Xaa
Xaa Xaa Xaa
395
Xaa Xaa Xaa
Ser Ser Ser
Leu Val Arg
405
Xaa Xaa Xaa
Xaa Xaa Xaa 410
Xaa Xaa Xaa
415
Xaa Xaa Xaa
Xaa Xaa Xaa 420
Xaa Xaa Xaa
425
Xaa Xaa Xaa
Xaa Xaa Xaa
430
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa Xaa Xaa
Xaa
Xaa
Xaa 240
Xaa
Xaa
Asp
Xaa
Xaa 320
Xaa
Xaa
Xaa
Xaa
Gln 400
Xaa
Xaa
Xaa
- 274 046157
435
440
445
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Glu Asp Asn Leu His Thr
450 455 460 <210> 152 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 152
Arg Ser Asp Asn Leu Val Arg
5 <210> 153 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 153
Arg Glu Asp Asn Leu His Thr
5 <210> 154 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 154 Arg Ser Asp Glu Leu Val Arg 1 5 <210> 155 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 155 Gln Ser Gly Asn Leu Thr Glu 1 5
- 275 046157 <210> 156 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 156
Thr Ser Gly His Leu Val Arg
5 <210> 157 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 157
Gln Asn Ser Thr Leu Thr Glu
5 <210> 158 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 158
Asp Pro Gly Ala Leu Val Arg
5 <210> 159 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 159
His Arg Thr Thr Leu Thr Asn
5 <210> 160 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический
- 276 046157 пептид <400> 160
Gln Ser Gly Asp Leu Arg Arg <210> 161 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 161
Thr Ser His Ser Leu Thr Glu
5 <210> 162 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 162
Thr His Leu Asp Leu Ile Arg
5 <210> 163 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 163
Gln Ser Ser Ser Leu Val Arg
5 <210> 164 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 164
Thr Ser Gly Asn Leu Val Arg
5
- 277 046157 <210> 165 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 165
Arg Arg Asp Glu Leu Asn Val
5 <210> 166 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 166
Arg Ser Asp Asp Leu Val Arg
5 <210> 167 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 167
Arg Ser Asp His Leu Thr Asn
5 <210> 168 <211> 16 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 168
Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys 1 5 10 15 <210> 169 <211> 7 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический
- 278 046157 пептид <400> 169
Pro Lys Lys Lys Arg Lys Val <210> 170 <211> 16 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 170
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 171 <211> 9 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 171
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
5 <210> 172 <211> 2009 <212> Белок <213> Homo sapiens <400> 172
Met Glu Gln Thr Val Leu Val Pro Pro Gly Pro Asp Ser Phe Asn Phe
5 1015
Phe Thr Arg Glu Ser Leu Ala Ala Ile Glu Arg Arg Ile Ala Glu Glu 20 2530
Lys Ala Lys Asn Pro Lys Pro Asp Lys Lys Asp Asp Asp Glu Asn Gly 35 4045
Pro Lys Pro Asn Ser Asp Leu Glu Ala Gly Lys Asn Leu Pro Phe Ile 50 5560
Tyr Gly Asp Ile Pro Pro Glu Met Val Ser Glu Pro Leu Glu Asp Leu 65 70 7580
Asp Pro Tyr Tyr Ile Asn Lys Lys Thr Phe Ile Val Leu Asn Lys Gly 85 9095
- 279 046157
Lys Ala Ile Phe Arg
100
Phe Ser Ala Thr Ser
105
Ala Leu Tyr Ile Leu
110
Pro Phe Asn Pro Leu
115
Arg Lys Ile Ala Ile 120
Lys Ile Leu Val His 125
Leu Phe Ser Met Leu
130
Ile Met Cys Thr Ile
135
Leu Thr Asn Cys Val 140
Met Thr Met Ser Asn 145
Pro Pro Asp Trp Thr 150
Lys Asn Val Glu Tyr 155
Phe Thr Gly Ile Tyr
165
Thr Phe Glu Ser Leu
170
Ile Lys Ile Ile Ala
175
Gly Phe Cys Leu Glu
180
Asp Phe Thr Phe Leu
185
Arg Asp Pro Trp Asn
190
Leu Asp Phe Thr Val 195
Ile Thr Phe Ala Tyr
200
Val Thr Glu Phe Val
205
Leu Gly Asn Val Ser
210
Ala Leu Arg Thr Phe 215
Arg Val Leu Arg Ala
220
Lys Thr Ile Ser Val 225
Ile Pro Gly Leu Lys 230
Thr Ile Val Gly Ala 235
Ile Gln Ser Val Lys
245
Lys Leu Ser Asp Val
250
Met Ile Leu Thr Val
255
Cys Leu Ser Val Phe
260
Ala Leu Ile Gly Leu
265
Gln Leu Phe Met Gly
270
Leu Arg Asn Lys Cys
275
Ile Gln Trp Pro Pro
280
Thr Asn Ala Ser Leu
285
Glu His Ser Ile Glu
290
Lys Asn Ile Thr Val
295
Asn Tyr Asn Gly Thr
300
Ile Asn Glu Thr Val 305
Phe Glu Phe Asp Trp 310
Lys Ser Tyr Ile Gln 315
Ser Arg Tyr His Tyr
325
Phe Leu Glu Gly Phe
330
Leu Asp Ala Leu Leu
335
Gly Asn Ser Ser Asp
Ala Gly Gln Cys Pro
Glu Gly Tyr Met Cys
Thr
Ser
Phe
Thr 160
Arg
Trp
Asp
Leu
Leu 240
Phe
Asn
Glu
Leu
Asp 320
Cys
Val
- 280 046157
340
345
350
Lys Ala Gly Arg Asn
355
Pro Asn Tyr Gly Tyr 360
Thr Ser Phe Asp Thr 365
Ser Trp Ala Phe Leu
370
Ser Leu Phe Arg Leu
375
Met Thr Gln Asp Phe 380
Glu Asn Leu Tyr Gln 385
Leu Thr Leu Arg Ala 390
Ala Gly Lys Thr Tyr 395
Ile Phe Phe Val Leu
405
Val Ile Phe Leu Gly
410
Ser Phe Tyr Leu Ile
415
Leu Ile Leu Ala Val
420
Val Ala Met Ala Tyr
425
Glu Glu Gln Asn Gln
430
Thr Leu Glu Glu Ala
435
Glu Gln Lys Glu Ala 440
Glu Phe Gln Gln Met
445
Glu Gln Leu Lys Lys 450
Gln Gln Glu Ala Ala
455
Gln Gln Ala Ala Thr
460
Thr Ala Ser Glu His 465
Ser Arg Glu Pro Ser 470
Ala Ala Gly Arg Leu 475
Asp Ser Ser Ser Glu
485
Ala Ser Lys Leu Ser
490
Ser Lys Ser Ala Lys
495
Arg Arg Asn Arg Arg
500
Lys Lys Arg Lys Gln
505
Lys Glu Gln Ser Gly
510
Glu Glu Lys Asp Glu 515
Asp Glu Phe Gln Lys 520
Ser Glu Ser Glu Asp
525
Ile Arg Arg Lys Gly
530
Phe Arg Phe Ser Ile 535
Glu Gly Asn Arg Leu
540
Tyr Glu Lys Arg Tyr 545
Ser Ser Pro His Gln 550
Ser Leu Leu Ser Ile 555
Gly Ser Leu Phe Ser
565
Pro Arg Arg Asn Ser
570
Arg Thr Ser Leu Phe
575
Phe Arg Gly Arg Ala
580
Lys Asp Val Gly Ser
585
Glu Asn Asp Phe Ala
590
Phe
Trp
Met 400
Asn
Ala
Ile
Ala
Ser 480
Glu
Gly
Ser
Thr
Arg 560
Ser
Asp
- 281 046157
Asp Glu His Ser Thr Phe Glu Asp Asn
595 600
Phe Val Pro Arg Arg His Gly Glu Arg
610 615
Thr Ser Arg Ser Ser Arg Met Leu Ala
625 630
Met His Ser Thr Val Asp Cys Asn Gly 645
Pro Ser Val Pro Thr Ser Pro Val Gly
660 665
Ile Asp Lys Pro Ala Thr Asp Asp Asn
675 680
Met Arg Lys Arg Arg Ser Ser Ser Phe
690 695
Glu Asp Pro Ser Gln Arg Gln Arg Ala
705 710
Thr Asn Thr Val Glu Glu Leu Glu Glu
725
Cys Trp Tyr Lys Phe Ser Asn Ile Phe
740 745
Tyr Trp Leu Lys Val Lys His Val Val
755 760
Phe Val Asp Leu Ala Ile Thr Ile Cys
770 775
Met Ala Met Glu His Tyr Pro Met Thr 785 790
Thr Val Gly Asn Leu Val Phe Thr Gly
805
Leu Lys Ile Ile Ala Met Asp Pro Tyr
820 825
Asn Ile Phe Asp Gly Phe Ile Val Thr
835 840
Ser Arg Arg Asp Ser Leu
605
Asn Ser Asn Leu Ser Gln
620
Phe Pro Ala Asn Gly Lys
635 640
Val Ser Leu Val Gly Gly
655
Leu Leu Pro Glu Val Ile
670
Thr Thr Thr Glu Thr Glu
685
Val Ser Met Asp Phe Leu
700
Ser Ile Ala Ser Ile Leu
715 720
Arg Gln Lys Cys Pro Pro
735
Ile Trp Asp Cys Ser Pro
750
Leu Val Val Met Asp Pro 765
Val Leu Asn Thr Leu Phe
780
His Phe Asn Asn Val Leu
795 800
Phe Thr Ala Glu Met Phe
815
Tyr Phe Gln Glu Gly Trp
830
Ser Leu Val Glu Leu Gly 845
- 282 046157
Leu
Arg 865
Lys
Leu
Gly
Leu
Phe 945
Glu
Val
Ser
Met
Ala
Ile
Leu
Ile
Ser
Ala Asn Val Glu Gly 850
Val Phe Lys Leu Ala
870
Ile Ile Gly Asn Ser
885
Ala Ile Ile Val Phe
900
Lys Ser Tyr Lys Asp
915
Pro Arg Trp His Met 930
Arg Val Leu Cys Gly
950
Val Ala Gly Gln Ala
965
Ile Gly Asn Leu Val 980
Leu Ser Val Leu Arg 855
Lys Ser Trp Pro Thr
875
Val Gly Ala Leu Gly
890
Ile Phe Ala Val Val
905
Cys Val Cys Lys Ile 920
Asn Asp Phe Phe His 935
Glu Trp Ile Glu Thr
955
Met Cys Leu Thr Val
970
Val Leu Asn Leu Phe
985
Ser Phe Ser Ala Asp Asn
995
Ser Phe Arg Leu Leu 860
Leu Asn Met Leu Ile
880
Asn Leu Thr Leu Val
895
Gly Met Gln Leu Phe 910
Ala Ser Asp Cys Gln 925
Ser Phe Leu Ile Val 940
Met Trp Asp Cys Met
960
Phe Met Met Val Met
975
Leu Ala Leu Leu Leu
990
Leu Ala Ala Thr Asp Asp Asp Asn Glu 1000 1005
Asn 1010 | Asn | Leu | Gln | Ile | Ala 1015 | Val | Asp | Arg | Met | His 1020 | Lys | Gly | Val |
Tyr 1025 | Val | Lys | Arg | Lys | Ile 1030 | Tyr | Glu | Phe | Ile | Gln 1035 | Gln | Ser | Phe |
Arg 1040 | Lys | Gln | Lys | Ile | Leu 1045 | Asp | Glu | Ile | Lys | Pro 1050 | Leu | Asp | Asp |
Asn 1055 | Asn | Lys | Lys | Asp | Ser 1060 | Cys | Met | Ser | Asn | His 1065 | Thr | Ala | Glu |
Gly 1070 | Lys | Asp | Leu | Asp | Tyr 1075 | Leu | Lys | Asp | Val | Asn 1080 | Gly | Thr | Thr |
Gly 1085 | Ile | Gly | Thr | Gly | Ser 1090 | Ser | Val | Glu | Lys | Tyr 1095 | Ile | Ile | Asp |
- 283 046157
Glu | Ser 1100 | Asp | Tyr | Met | Ser | Phe 1105 | Ile | Asn | Asn | Pro | Ser 1110 | Leu | Thr | Val |
Thr | Val 1115 | Pro | Ile | Ala | Val | Gly 1120 | Glu | Ser | Asp | Phe | Glu 1125 | Asn | Leu | Asn |
Thr | Glu 1130 | Asp | Phe | Ser | Ser | Glu 1135 | Ser | Asp | Leu | Glu | Glu 1140 | Ser | Lys | Glu |
Lys | Leu 1145 | Asn | Glu | Ser | Ser | Ser 1150 | Ser | Ser | Glu | Gly | Ser 1155 | Thr | Val | Asp |
Ile | Gly 1160 | Ala | Pro | Val | Glu | Glu 1165 | Gln | Pro | Val | Val | Glu 1170 | Pro | Glu | Glu |
Thr | Leu 1175 | Glu | Pro | Glu | Ala | Cys 1180 | Phe | Thr | Glu | Gly | Cys 1185 | Val | Gln | Arg |
Phe | Lys 1190 | Cys | Cys | Gln | Ile | Asn 1195 | Val | Glu | Glu | Gly | Arg 1200 | Gly | Lys | Gln |
Trp | Trp 1205 | Asn | Leu | Arg | Arg | Thr 1210 | Cys | Phe | Arg | Ile | Val 1215 | Glu | His | Asn |
Trp | Phe 1220 | Glu | Thr | Phe | Ile | Val 1225 | Phe | Met | Ile | Leu | Leu 1230 | Ser | Ser | Gly |
Ala | Leu 1235 | Ala | Phe | Glu | Asp | Ile 1240 | Tyr | Ile | Asp | Gln | Arg 1245 | Lys | Thr | Ile |
Lys | Thr 1250 | Met | Leu | Glu | Tyr | Ala 1255 | Asp | Lys | Val | Phe | Thr 1260 | Tyr | Ile | Phe |
Ile | Leu 1265 | Glu | Met | Leu | Leu | Lys 1270 | Trp | Val | Ala | Tyr | Gly 1275 | Tyr | Gln | Thr |
Tyr | Phe 1280 | Thr | Asn | Ala | Trp | Cys 1285 | Trp | Leu | Asp | Phe | Leu 1290 | Ile | Val | Asp |
Val | Ser 1295 | Leu | Val | Ser | Leu | Thr 1300 | Ala | Asn | Ala | Leu | Gly 1305 | Tyr | Ser | Glu |
Leu | Gly 1310 | Ala | Ile | Lys | Ser | Leu 1315 | Arg | Thr | Leu | Arg | Ala 1320 | Leu | Arg | Pro |
Leu | Arg | Ala | Leu | Ser | Arg | Phe | Glu | Gly | Met | Arg | Val | Val | Val | Asn |
- 284 046157
1325 1330 1335
Ala | Leu 1340 | Leu | Gly | Ala | Ile | Pro 1345 | Ser | Ile | Met | Asn | Val 1350 | Leu | Leu | Val |
Cys | Leu 1355 | Ile | Phe | Trp | Leu | Ile 1360 | Phe | Ser | Ile | Met | Gly 1365 | Val | Asn | Leu |
Phe | Ala 1370 | Gly | Lys | Phe | Tyr | His 1375 | Cys | Ile | Asn | Thr | Thr 1380 | Thr | Gly | Asp |
Arg | Phe 1385 | Asp | Ile | Glu | Asp | Val 1390 | Asn | Asn | His | Thr | Asp 1395 | Cys | Leu | Lys |
Leu | Ile 1400 | Glu | Arg | Asn | Glu | Thr 1405 | Ala | Arg | Trp | Lys | Asn 1410 | Val | Lys | Val |
Asn | Phe 1415 | Asp | Asn | Val | Gly | Phe 1420 | Gly | Tyr | Leu | Ser | Leu 1425 | Leu | Gln | Val |
Ala | Thr 1430 | Phe | Lys | Gly | Trp | Met 1435 | Asp | Ile | Met | Tyr | Ala 1440 | Ala | Val | Asp |
Ser | Arg 1445 | Asn | Val | Glu | Leu | Gln 1450 | Pro | Lys | Tyr | Glu | Glu 1455 | Ser | Leu | Tyr |
Met | Tyr 1460 | Leu | Tyr | Phe | Val | Ile 1465 | Phe | Ile | Ile | Phe | Gly 1470 | Ser | Phe | Phe |
Thr | Leu 1475 | Asn | Leu | Phe | Ile | Gly 1480 | Val | Ile | Ile | Asp | Asn 1485 | Phe | Asn | Gln |
Gln | Lys 1490 | Lys | Lys | Phe | Gly | Gly 1495 | Gln | Asp | Ile | Phe | Met 1500 | Thr | Glu | Glu |
Gln | Lys 1505 | Lys | Tyr | Tyr | Asn | Ala 1510 | Met | Lys | Lys | Leu | Gly 1515 | Ser | Lys | Lys |
Pro | Gln 1520 | Lys | Pro | Ile | Pro | Arg 1525 | Pro | Gly | Asn | Lys | Phe 1530 | Gln | Gly | Met |
Val | Phe 1535 | Asp | Phe | Val | Thr | Arg 1540 | Gln | Val | Phe | Asp | Ile 1545 | Ser | Ile | Met |
Ile | Leu | Ile | Cys | Leu | Asn | Met | Val | Thr | Met | Met | Val | Glu | Thr | Asp |
1550 1555 1560
- 285 046157
Asp | Gln 1565 | Ser | Glu | Tyr | Val | Thr 1570 | Thr | Ile | Leu | Ser | Arg 1575 | Ile | Asn | Leu |
Val | Phe | Ile | Val | Leu | Phe | Thr | Gly | Glu | Cys | Val | Leu | Lys | Leu | Ile |
1580 | 1585 | 1590 | ||||||||||||
Ser | Leu | Arg | His | Tyr | Tyr | Phe | Thr | Ile | Gly | Trp | Asn | Ile | Phe | Asp |
1595 | 1600 | 1605 | ||||||||||||
Phe | Val | Val | Val | Ile | Leu | Ser | Ile | Val | Gly | Met | Phe | Leu | Ala | Glu |
1610 | 1615 | 1620 | ||||||||||||
Leu | Ile | Glu | Lys | Tyr | Phe | Val | Ser | Pro | Thr | Leu | Phe | Arg | Val | Ile |
1625 | 1630 | 1635 |
Arg | Leu 1640 | Ala | Arg | Ile | Gly | Arg 1645 | Ile | Leu | Arg | Leu | Ile 1650 | Lys | Gly | Ala |
Lys | Gly 1655 | Ile | Arg | Thr | Leu | Leu 1660 | Phe | Ala | Leu | Met | Met 1665 | Ser | Leu | Pro |
Ala | Leu 1670 | Phe | Asn | Ile | Gly | Leu 1675 | Leu | Leu | Phe | Leu | Val 1680 | Met | Phe | Ile |
Tyr | Ala 1685 | Ile | Phe | Gly | Met | Ser 1690 | Asn | Phe | Ala | Tyr | Val 1695 | Lys | Arg | Glu |
Val | Gly 1700 | Ile | Asp | Asp | Met | Phe 1705 | Asn | Phe | Glu | Thr | Phe 1710 | Gly | Asn | Ser |
Met | Ile 1715 | Cys | Leu | Phe | Gln | Ile 1720 | Thr | Thr | Ser | Ala | Gly 1725 | Trp | Asp | Gly |
Leu | Leu 1730 | Ala | Pro | Ile | Leu | Asn 1735 | Ser | Lys | Pro | Pro | Asp 1740 | Cys | Asp | Pro |
Asn | Lys 1745 | Val | Asn | Pro | Gly | Ser 1750 | Ser | Val | Lys | Gly | Asp 1755 | Cys | Gly | Asn |
Pro | Ser 1760 | Val | Gly | Ile | Phe | Phe 1765 | Phe | Val | Ser | Tyr | Ile 1770 | Ile | Ile | Ser |
Phe | Leu 1775 | Val | Val | Val | Asn | Met 1780 | Tyr | Ile | Ala | Val | Ile 1785 | Leu | Glu | Asn |
Phe | Ser 1790 | Val | Ala | Thr | Glu | Glu 1795 | Ser | Ala | Glu | Pro | Leu 1800 | Ser | Glu | Asp |
- 286 046157
Asp | Phe 1805 | Glu | Met | Phe | Tyr | Glu 1810 | Val | Trp | Glu | Lys | Phe 1815 | Asp | Pro | Asp |
Ala | Thr 1820 | Gln | Phe | Met | Glu | Phe 1825 | Glu | Lys | Leu | Ser | Gln 1830 | Phe | Ala | Ala |
Ala | Leu 1835 | Glu | Pro | Pro | Leu | Asn 1840 | Leu | Pro | Gln | Pro | Asn 1845 | Lys | Leu | Gln |
Leu | Ile 1850 | Ala | Met | Asp | Leu | Pro 1855 | Met | Val | Ser | Gly | Asp 1860 | Arg | Ile | His |
Cys | Leu 1865 | Asp | Ile | Leu | Phe | Ala 1870 | Phe | Thr | Lys | Arg | Val 1875 | Leu | Gly | Glu |
Ser | Gly 1880 | Glu | Met | Asp | Ala | Leu 1885 | Arg | Ile | Gln | Met | Glu 1890 | Glu | Arg | Phe |
Met | Ala 1895 | Ser | Asn | Pro | Ser | Lys 1900 | Val | Ser | Tyr | Gln | Pro 1905 | Ile | Thr | Thr |
Thr | Leu 1910 | Lys | Arg | Lys | Gln | Glu 1915 | Glu | Val | Ser | Ala | Val 1920 | Ile | Ile | Gln |
Arg | Ala 1925 | Tyr | Arg | Arg | His | Leu 1930 | Leu | Lys | Arg | Thr | Val 1935 | Lys | Gln | Ala |
Ser | Phe 1940 | Thr | Tyr | Asn | Lys | Asn 1945 | Lys | Ile | Lys | Gly | Gly 1950 | Ala | Asn | Leu |
Leu | Ile 1955 | Lys | Glu | Asp | Met | Ile 1960 | Ile | Asp | Arg | Ile | Asn 1965 | Glu | Asn | Ser |
Ile | Thr 1970 | Glu | Lys | Thr | Asp | Leu 1975 | Thr | Met | Ser | Thr | Ala 1980 | Ala | Cys | Pro |
Pro | Ser 1985 | Tyr | Asp | Arg | Val | Thr 1990 | Lys | Pro | Ile | Val | Glu 1995 | Lys | His | Glu |
Gln | Glu 2000 | Gly | Lys | Asp | Glu | Lys 2005 | Ala | Lys | Gly | Lys |
<210> <211> <212> <213> | 173 1052 Белок Homo sapiens |
<400> | 173 |
- 287 046157
Lys Arg Asn Tyr Ile Leu Gly Leu Ala 1 5
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg
25
Arg Leu Phe Lys Glu Ala Asn Val Glu
40
Lys Arg Gly Ala Arg Arg Leu Lys Arg
55
Arg Val Lys Lys Leu Leu Phe Asp Tyr 65 70
Glu Leu Ser Gly Ile Asn Pro Tyr Glu 85
Gln Lys Leu Ser Glu Glu Glu Phe Ser
100 105
Lys Arg Arg Gly Val His Asn Val Asn
115 120
Asn Glu Leu Ser Thr Lys Glu Gln Ile
130 135
Glu Glu Lys Tyr Val Ala Glu Leu Gln
145 150
Gly Glu Val Arg Gly Ser Ile Asn Arg
165
Lys Glu Ala Lys Gln Leu Leu Lys Val
180 185
Asp Gln Ser Phe Ile Asp Thr Tyr Ile
195 200
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly
210 215
Ile Lys Glu Trp Tyr Glu Met Leu Met
225 230
Glu Glu Leu Arg Ser Val Lys Tyr Ala
245
Gly Ile Thr Ser Val Gly 15
Val Ile Asp Ala Gly Val
Asn Glu Gly Arg Arg Ser 45
Arg Arg His Arg Ile Gln 60
Leu Leu Thr Asp His Ser 75 80
Arg Val Lys Gly Leu Ser 95
Ala Leu Leu His Leu Ala
110
Val Glu Glu Asp Thr Gly
125
Arg Asn Ser Lys Ala Leu
140
Glu Arg Leu Lys Lys Asp
155 160
Lys Thr Ser Asp Tyr Val
175
Lys Ala Tyr His Gln Leu
190
Leu Leu Glu Thr Arg Arg
205
Pro Phe Gly Trp Lys Asp
220
His Cys Thr Tyr Phe Pro
235 240
Asn Ala Asp Leu Tyr Asn
255
- 288 046157
Ala Leu Asn Asp Leu
260
Asn Asn Leu Val Ile
265
Thr Arg Asp Glu Asn
270
Lys Leu Glu Tyr Tyr 275
Glu Lys Phe Gln Ile
280
Ile Glu Asn Val Phe
285
Gln Lys Lys Lys Pro 290
Thr Leu Lys Gln Ile
295
Ala Lys Glu Ile Leu
300
Asn Glu Glu Asp Ile 305
Lys Gly Tyr Arg Val 310
Thr Ser Thr Gly Lys 315
Glu Phe Thr Asn Leu
325
Lys Val Tyr His Asp
330
Ile Lys Asp Ile Thr
335
Arg Lys Glu Ile Ile
340
Glu Asn Ala Glu Leu
345
Leu Asp Gln Ile Ala
350
Ile Leu Thr Ile Tyr
355
Gln Ser Ser Glu Asp 360
Ile Gln Glu Glu Leu
365
Asn Leu Asn Ser Glu
370
Leu Thr Gln Glu Glu
375
Ile Glu Gln Ile Ser
380
Leu Lys Gly Tyr Thr 385
Gly Thr His Asn Leu 390
Ser Leu Lys Ala Ile 395
Leu Ile Leu Asp Glu
405
Leu Trp His Thr Asn
410
Asp Asn Gln Ile Ala
415
Phe Asn Arg Leu Lys
420
Leu Val Pro Lys Lys
425
Val Asp Leu Ser Gln
430
Lys Glu Ile Pro Thr
435
Thr Leu Val Asp Asp
440
Phe Ile Leu Ser Pro
445
Val Lys Arg Ser Phe
450
Ile Gln Ser Ile Lys 455
Val Ile Asn Ala Ile
460
Lys Lys Tyr Gly Leu 465
Pro Asn Asp Ile Ile 470
Ile Glu Leu Ala Arg 475
Lys Asn Ser Lys Asp
485
Ala Gln Lys Met Ile
490
Asn Glu Met Gln Lys
495
Asn Arg Gln Thr Asn
500
Glu Arg Ile Glu Glu
505
Ile Ile Arg Thr Thr
510
Glu
Lys
Val
Pro 320
Ala
Lys
Thr
Asn
Asn 400
Ile
Gln
Val
Ile
Glu 480
Arg
Gly
- 289 046157
Lys
Gln
Leu 545
Ser
Glu
Ser
Asn
Leu 625
Ile
Asn
Lys
Phe
Leu 705
Asp
Ala
Phe
Glu Asn Ala Lys Tyr 515
Glu Gly Lys Cys Leu 530
Leu Asn Asn Pro Phe
550
Val Ser Phe Asp Asn
565
Glu Ala Ser Lys Lys
580
Ser Asp Ser Lys Ile
595
Leu Ala Lys Gly Lys 610
Leu Glu Glu Arg Asp
630
Asn Arg Asn Leu Val
645
Leu Leu Arg Ser Tyr 660
Ser Ile Asn Gly Gly
675
Lys Lys Glu Arg Asn 690
Ile Ile Ala Asn Ala
710
Lys Ala Lys Lys Val
725
Glu Ser Met Pro Glu
740
Ile Thr Pro His Gln
Leu Ile Glu Lys Ile 520
Tyr Ser Leu Glu Ala 535
Asn Tyr Glu Val Asp
555
Ser Phe Asn Asn Lys
570
Gly Asn Arg Thr Pro 585
Ser Tyr Glu Thr Phe
600
Gly Arg Ile Ser Lys 615
Ile Asn Arg Phe Ser
635
Asp Thr Arg Tyr Ala
650
Phe Arg Val Asn Asn 665
Phe Thr Ser Phe Leu
680
Lys Gly Tyr Lys His 695
Asp Phe Ile Phe Lys
715
Met Glu Asn Gln Met
730
Ile Glu Thr Glu Gln
745
Ile Lys His Ile Lys
Lys Leu His Asp Met
525
Ile Pro Leu Glu Asp 540
His Ile Ile Pro Arg
560
Val Leu Val Lys Gln
575
Phe Gln Tyr Leu Ser 590
Lys Lys His Ile Leu 605
Thr Lys Lys Glu Tyr 620
Val Gln Lys Asp Phe
640
Thr Arg Gly Leu Met
655
Leu Asp Val Lys Val
670
Arg Arg Lys Trp Lys
685
His Ala Glu Asp Ala 700
Glu Trp Lys Lys Leu
720
Phe Glu Glu Lys Gln
735
Glu Tyr Lys Glu Ile 750
Asp Phe Lys Asp Tyr
- 290 046157
755 760 765
Lys
Asp 785
Val
Lys
Pro
Glu
Thr 865
Tyr
Pro
Phe
Asn
Cys 945
Phe
Leu
Val
Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
790 795 800
Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
870 875 880
Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
950 955 960
Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
- 291 046157
Asp
Lys 1010
Arg
Pro
Pro
Arg
Ile 1015
Ile
Lys
Thr
Ile
Ala
1020
Ser
Lys Thr
Gln
Ser
1025
Ile
Lys
Lys
Tyr
Ser
1030
Thr
Asp
Ile
Leu
Gly 1035
Asn
Leu Tyr
Glu
Val
1040
Lys
Ser
Lys
Lys
His
1045
Pro
Gln
Ile
Ile
Lys 1050
Lys
Gly <210> 174 <211> 1148 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 174
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
5 1015
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 20 2530
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 35 4045
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 50 5560
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 65 70 7580
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 85 9095
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
100 105110
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
115 120125
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
130 135140
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
145 150 155160
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
- 292 046157
165
170
175
Asp Gly Glu Val Arg
180
Gly Ser Ile Asn Arg
185
Phe Lys Thr Ser Asp
190
Val Lys Glu Ala Lys
195
Gln Leu Leu Lys Val 200
Gln Lys Ala Tyr His 205
Leu Asp Gln Ser Phe
210
Ile Asp Thr Tyr Ile
215
Asp Leu Leu Glu Thr
220
Arg Thr Tyr Tyr Glu 225
Gly Pro Gly Glu Gly 230
Ser Pro Phe Gly Trp 235
Asp Ile Lys Glu Trp
245
Tyr Glu Met Leu Met
250
Gly His Cys Thr Tyr
255
Pro Glu Glu Leu Arg
260
Ser Val Lys Tyr Ala
265
Tyr Asn Ala Asp Leu
270
Asn Ala Leu Asn Asp 275
Leu Asn Asn Leu Val
280
Ile Thr Arg Asp Glu
285
Glu Lys Leu Glu Tyr
290
Tyr Glu Lys Phe Gln 295
Ile Ile Glu Asn Val
300
Lys Gln Lys Lys Lys 305
Pro Thr Leu Lys Gln 310
Ile Ala Lys Glu Ile 315
Val Asn Glu Glu Asp
325
Ile Lys Gly Tyr Arg
330
Val Thr Ser Thr Gly
335
Pro Glu Phe Thr Asn
340
Leu Lys Val Tyr His
345
Asp Ile Lys Asp Ile
350
Ala Arg Lys Glu Ile 355
Ile Glu Asn Ala Glu
360
Leu Leu Asp Gln Ile 365
Lys Ile Leu Thr Ile 370
Tyr Gln Ser Ser Glu 375
Asp Ile Gln Glu Glu 380
Thr Asn Leu Asn Ser 385
Glu Leu Thr Gln Glu 390
Glu Ile Glu Gln Ile 395
Asn Leu Lys Gly Tyr
405
Thr Gly Thr His Asn
410
Leu Ser Leu Lys Ala
415
Tyr
Gln
Arg
Lys 240
Phe
Tyr
Asn
Phe
Leu 320
Lys
Thr
Ala
Leu
Ser 400
Ile
- 293 046157
Asn Leu Ile Leu Asp
420
Glu Leu Trp His Thr
425
Asn Asp Asn Gln Ile
430
Ile Phe Asn Arg Leu
435
Lys Leu Val Pro Lys
440
Lys Val Asp Leu Ser
445
Gln Lys Glu Ile Pro 450
Thr Thr Leu Val Asp
455
Asp Phe Ile Leu Ser
460
Val Val Lys Arg Ser 465
Phe Ile Gln Ser Ile 470
Lys Val Ile Asn Ala 475
Ile Lys Lys Tyr Gly
485
Leu Pro Asn Asp Ile
490
Ile Ile Glu Leu Ala
495
Glu Lys Asn Ser Lys
500
Asp Ala Gln Lys Met
505
Ile Asn Glu Met Gln
510
Arg Asn Arg Gln Thr 515
Asn Glu Arg Ile Glu 520
Glu Ile Ile Arg Thr 525
Gly Lys Glu Asn Ala
530
Lys Tyr Leu Ile Glu 535
Lys Ile Lys Leu His 540
Met Gln Glu Gly Lys 545
Cys Leu Tyr Ser Leu 550
Glu Ala Ile Pro Leu 555
Asp Leu Leu Asn Asn
565
Pro Phe Asn Tyr Glu
570
Val Asp His Ile Ile
575
Arg Ser Val Ser Phe
580
Asp Asn Ser Phe Asn
585
Asn Lys Val Leu Val
590
Gln Glu Glu Ala Ser
595
Lys Lys Gly Asn Arg
600
Thr Pro Phe Gln Tyr
605
Ser Ser Ser Asp Ser 610
Lys Ile Ser Tyr Glu 615
Thr Phe Lys Lys His 620
Leu Asn Leu Ala Lys 625
Gly Lys Gly Arg Ile 630
Ser Lys Thr Lys Lys 635
Tyr Leu Leu Glu Glu
645
Arg Asp Ile Asn Arg
650
Phe Ser Val Gln Lys
655
Phe Ile Asn Arg Asn
660
Leu Val Asp Thr Arg
665
Tyr Ala Thr Arg Gly
670
Ala
Gln
Pro
Ile 480
Arg
Lys
Thr
Asp
Glu 560
Pro
Lys
Leu
Ile
Glu 640
Asp
Leu
- 294 046157
Met
Val
Lys 705
Ala
Leu
Gln
Ile
Tyr 785
Asn
Ile
Lys
Asp
Asp 865
Leu
Lys
Tyr
Asn Leu Leu Arg Ser 675
Lys Ser Ile Asn Gly 690
Phe Lys Lys Glu Arg
710
Leu Ile Ile Ala Asn
725
Asp Lys Ala Lys Lys 740
Ala Glu Ser Met Pro
755
Phe Ile Thr Pro His 770
Lys Tyr Ser His Arg
790
Asp Thr Leu Tyr Ser
805
Val Asn Asn Leu Asn
820
Lys Leu Ile Asn Lys
835
Pro Gln Thr Tyr Gln 850
Glu Lys Asn Pro Leu
870
Thr Lys Tyr Ser Lys
885
Tyr Tyr Gly Asn Lys 900
Pro Asn Ser Arg Asn 915
Tyr Phe Arg Val Asn 680
Gly Phe Thr Ser Phe 695
Asn Lys Gly Tyr Lys
715
Ala Asp Phe Ile Phe
730
Val Met Glu Asn Gln
745
Glu Ile Glu Thr Glu
760
Gln Ile Lys His Ile 775
Val Asp Lys Lys Pro
795
Thr Arg Lys Asp Asp
810
Gly Leu Tyr Asp Lys 825
Ser Pro Glu Lys Leu
840
Lys Leu Lys Leu Ile 855
Tyr Lys Tyr Tyr Glu
875
Lys Asp Asn Gly Pro
890
Leu Asn Ala His Leu
905
Lys Val Val Lys Leu 920
Asn Leu Asp Val Lys
685
Leu Arg Arg Lys Trp 700
His His Ala Glu Asp
720
Lys Glu Trp Lys Lys
735
Met Phe Glu Glu Lys 750
Gln Glu Tyr Lys Glu 765
Lys Asp Phe Lys Asp 780
Asn Arg Glu Leu Ile
800
Lys Gly Asn Thr Leu
815
Asp Asn Asp Lys Leu 830
Leu Met Tyr His His 845
Met Glu Gln Tyr Gly 860
Glu Thr Gly Asn Tyr
880
Val Ile Lys Lys Ile
895
Asp Ile Thr Asp Asp 910
Ser Leu Lys Pro Tyr
925
- 295 046157
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
930 935940
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
945 950 955960
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
965 970975
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
980 985990
Glu Leu Tyr Arg Val Ile
995
Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
10001005
Glu Val | Asn | Met | Ile | Asp | Ile 1015 | Thr | Tyr | Arg | Glu | Tyr 1020 | Leu | Glu | Asn | |
1010 | ||||||||||||||
Met | Asn 1025 | Asp | Lys | Arg | Pro | Pro 1030 | Arg | Ile | Ile | Lys | Thr 1035 | Ile | Ala | Ser |
Lys | Thr 1040 | Gln | Ser | Ile | Lys | Lys 1045 | Tyr | Ser | Thr | Asp | Ile 1050 | Leu | Gly | Asn |
Leu | Tyr 1055 | Glu | Val | Lys | Ser | Lys 1060 | Lys | His | Pro | Gln | Ile 1065 | Ile | Lys | Lys |
Gly | Lys 1070 | Arg | Pro | Ala | Ala | Thr 1075 | Lys | Lys | Ala | Gly | Gln 1080 | Ala | Lys | Lys |
Lys | Lys 1085 | Gly | Ser | Tyr | Pro | Tyr 1090 | Asp | Val | Pro | Asp | Tyr 1095 | Ala | Leu | Glu |
Asp | Ala 1100 | Leu | Asp | Asp | Phe | Asp 1105 | Leu | Asp | Met | Leu | Gly 1110 | Ser | Asp | Ala |
Leu | Asp 1115 | Asp | Phe | Asp | Leu | Asp 1120 | Met | Leu | Gly | Ser | Asp 1125 | Ala | Leu | Asp |
Asp | Phe 1130 | Asp | Leu | Asp | Met | Leu 1135 | Gly | Ser | Asp | Ala | Leu 1140 | Asp | Asp | Phe |
Asp Leu Asp Met Leu
1145 <210> 175
- 296 046157 <211> 387 <212> Белок <213> Homo sapiens <400> 175
Met Thr Gly Lys Leu 1 5
Ala Glu Lys Leu Pro
Val Thr Met Ser Ser
Leu Asn Gln Leu Pro
Asp Asn Leu Tyr Pro
Glu Glu Ile Pro Ser
Leu Asn Leu Phe Ser
Gly Ser Ser Asp Ser 40
Val Val His Tyr Asn 45
Met Ala Thr Glu Asn 50
Val Met Asp Ile Gly 55
Leu Thr Asn Glu Lys 60
Asn Pro Glu Leu Ser 65
Tyr Ser Gly Ser Phe 70
Gln Pro Ala Pro Gly 75
Lys Thr Val Thr Tyr
Leu Gly Lys Phe Ala
Phe Asp Ser Pro Ser
Trp Cys Gln Asp Asn
100
Ile Ile Ser Leu Met
105
Ser Ala Gly Ile Leu
110
Val Pro Pro Ala Ser
115
Gly Ala Leu Ser Thr 120
Gln Thr Ser Thr Ala
125
Met Val Gln Pro Pro
130
Gln Gly Asp Val Glu 135
Ala Met Tyr Pro Ala 140
Pro Pro Tyr Ser Asn 145
Cys Gly Asp Leu Tyr 150
Ser Glu Pro Val Ser 155
His Asp Pro Gln Gly
165
Asn Pro Gly Leu Ala
170
Tyr Ser Pro Gln Asp
175
Gln Ser Ala Lys Pro
180
Ala Leu Asp Ser Asn
185
Leu Phe Pro Met Ile
190
Asp Tyr Asn Leu Tyr 195
His His Pro Asn Asp
200
Met Gly Ser Ile Pro 205
His Lys Pro Phe Gln 210
Gly Met Asp Pro Ile 215
Arg Val Asn Pro Pro 220
Ile Thr Pro Leu Glu 225
Thr Ile Lys Ala Phe 230
Lys Asp Lys Gln Ile 235
Leu
Ala
Gln
Pro
Asn 80
Asn
Gly
Ser
Leu
Phe 160
Tyr
Pro
Glu
Pro
His 240
- 297 046157
Pro Gly Phe Gly Ser Leu Pro Gln Pro Pro Leu Thr Leu Lys Pro Ile
245 250255
Arg Pro Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Leu His Glu
260 265270
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
275 280285
Ser Asp Glu Leu Thr Arg His Leu Arg Ile His Thr Gly His Lys Pro
290 295300
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Ser Asp His Leu
305 310 315320
Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
325 330335
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Ala
340 345350
Lys Ile His Leu Lys Gln Lys Glu Lys Lys Ala Glu Lys Gly Gly Ala
355 360365
Pro Ser Ala Ser Ser Ala Pro Pro Val Ser Leu Ala Pro Val Val Thr
370 375380
Thr Cys Ala 385 <210> 176 <211> 543 <212> Белок <213> Homo sapiens <400> 176
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
5 1015
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr 20 2530
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe 35 4045
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser 50 5560
- 298 046157
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 65 70 75
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln 85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser
145 150 155
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala
225 230 235
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser
305 310 315
Ser 80
Pro
Asn
Leu
Asn
Gly 160
Ser
Cys
Thr
Ala
Tyr 240
Leu
Lys
Pro
Leu
Arg 320
- 299 046157
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345350
Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr
370 375380
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395400
Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Thr Lys
405 410415
Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys Ser Val Val Ala
420 425430
Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser Pro Val Ala Thr
435 440445
Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser Pro Ala Thr Thr
450 455460
Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser Pro Gly Ser Ser
465 470 475480
Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser Pro Ser Val Ala
485 490495
Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala Gln Val Ser Ser
500 505510
Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala Ser Thr Gly Leu
515 520525
Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile Glu Ile Cys
530 535540 <210> 177 <211> 8 <212> Белок <213> Искусственная последовательность
- 300 046157 <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 177
Gly Gly Ser Gly Gly Gly Ser Gly
5 <210> 178 <211> 16 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <400> 178
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly 1 5 10 15 <210> 179 <211> 4 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 179
Gly Gly Gly Ser <210> 180 <211> 5 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 180
Gly Gly Gly Gly Ser
5 <210> 181 <211> 4 <212> Белок <213> Искусственная последовательность
- 301 046157 <220>
<223> Описание искусственной последовательности: Синтетический пептид <220>
<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 181
Gly Gly Ser Gly <210> 182 <211> 9 <212> ДНК <213> Homo sapiens <400> 182 gcgkgggcg 9 <210> 183 <211> 76 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 183 gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60 caacttgttg gcgaga 76 <210> 184 <211> 3871 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 184 ggaggaagcc | atcaactaaa | ctacaatgac | tgtaagatac | aaaattggga | atggtaacat | 60 |
attttgaagt | tctgttgaca | taaagaatca | tgatattaat | gcccatggaa | atgaaagggc | 120 |
gatcaacact | atggtttgaa | aagggggaaa | ttgtagagca | cagatgtgtt | cgtgtggcag | 180 |
tgtgctgtct | ctagcaatac | tcagagaaga | gagagaacaa | tgaaattctg | attggcccca | 240 |
gtgtgagccc | agatgaggtt | cagctgccaa | ctttctcttt | cacatcttat | gaaagtcatt | 300 |
taagcacaac | taactttttt | tttttttttt | tttttttgag | acagagtctt | gctctgttgc | 360 |
ccaggacaga | gtgcagtagt | gactcaatct | cggctcactg | cagcctccac | ctcctaggct | 420 |
caaacggtcc | tcctgcatca | gcctcccaag | tagctggaat | tacaggagtg | gcccaccatg | 480 |
- 302 046157 cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540 ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata600 ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg660 gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg720 aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag780 agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc840 tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg900 gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag960 gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat1020 tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc1080 gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac1140 tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc1200 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccg ccgaccacct gatgctcgcc gagggctacc2100 gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg ctccggactc2160 tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg gctccgctgg2220 ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg ccgccgtcct2280 ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac ctgcagcctg2340
- 303 046157 tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga ggccccccgg 2400 gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc ctgggcggca2460 tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag ctggggctgc2520 accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac tgcttctcgg2580 acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt ggtggttctg2640 gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg cccagcaaga2700 cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc cgcttctccc2760 gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc ttccagtgcc2820 gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc cgcacccaca2880 caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg agcgatgaac2940 ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct tgcccagtgg3000 agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc cgcatccaca3060 caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca agtggacatc3120 tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac atctgtggaa3180 gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg cggcagaagg3240 acaagtaact cgaggaaacc cagcagacaa tgtagctaga cccagtagcc agatgtagct3300 aaagagaccg gttcactgtg agaaacccag cagacaatgt agctagaccc agtagccaga3360 tgtagctaaa gagaccggtt cactgtgaaa gcttgggtgg catccctgtg acccctcccc3420 agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg tcctaataaa3480 attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg ggtggagggg3540 ggtggtatgg agcaaggggc aagttgggaa gacaacctgt agggcctgcg gggtctattg3600 ggaaccaagc tggagtgcag tggcacaatc ttggctcact gcaatctccg cctcctgggt3660 tcaagcgatt ctcctgcctc agcctcccga gttgttggga ttccaggcat gcatgaccag3720 gctcagctaa tttttgtttt tttggtagag acggggtttc accatattgg ccaggctggt3780 ctccaactcc taatctcagg tgatctaccc accttggcct cccaaattgc tgggattaca3840 ggcgtgaacc actgctccct tccctgtcct t3871 <210> 185 <211> 22 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 185
- 304 046157 tgtctcggca ttgagaacat tc <210> 186 <211> 21 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 186 attggtggga ggccattgta t 21 <210> 187 <211> 20 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 187 accacagtcc atgccatcac 20 <210> 188 <211> 20 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 188 tccaccaccc tgttgctgta 20 <210> 189 <211> 20 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 189 caaaaaagcc acaaaagcct 20 <210> 190 <211> 20 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер
- 305 046157 <400> 190 ttagctccgc aagaaacatc <210> 191 <211> 23 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 191 ccatggaact ggctcgattt cac 23 <210> 192 <211> 21 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 192 attggtggga ggccactgta t 21 <210> 193 <211> 27 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический probe <400> 193 aggcctgaaa accattgtgg gagccct 27 <210> 194 <211> 24 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 194 gaatgtggga aatcattcag tcgc 24 <210> 195 <211> 24 <212> ДНК <213> Искусственная последовательность <220>
- 306 046157 <223> Описание искусственной последовательности: Синтетический праймер <400> 195 gcaagttatc ctctcgtgag aagg <210> 196 <211> 29 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический probe <400> 196 gcgacaacct ggtgagacat caacgcacc 29 <210> 197 <211> 22 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 197 gctgttatct cttgtgggct gt 22 <210> 198 <211> 22 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 198 aaactcatgg gagctgccgg tt 22 <210> 199 <211> 25 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический probe <400> 199 ccacacaaat ctctccctgg cattg 25 <210> 200 <211> 24 <212> ДНК <213> Искусственная последовательность
- 307 046157 <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 200 gaatgtggga aatcattcag tcgc 24 <210> 201 <211> 24 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический праймер <400> 201 gcaagttatc ctctcgtgag aagg 24 <210> 202 <211> 29 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический probe <400> 202 gcgacaacct ggtgagacat caacgcacc 29 <210> 203 <211> 1182 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 203
atggccgccg | accacctgat | gctcgccgag | ggctaccgcc | tggtgcagag | gccgccgtcc | 60 |
gccgccgccg | cccatggccc | tcatgcgctc | cggactctgc | cgccgtacgc | gggcccgggc | 120 |
ctggacagtg | ggctgaggcc | gcggggggct | ccgctggggc | cgccgccgcc | ccgccaaccc | 180 |
ggggccctgg | cgtacggggc | cttcgggccg | ccgtcctcct | tccagccctt | tccggccgtg | 240 |
cctccgccgg | ccgcgggcat | cgcgcacctg | cagcctgtgg | cgacgccgta | ccccggccgc | 300 |
gcggccgcgc | cccccaacgc | tccgggaggc | cccccgggcc | cgcagccggc | cccaagcgcc | 360 |
gcagccccgc | cgccgcccgc | gcacgccctg | ggcggcatgg | acgccgaact | catcgacgag | 420 |
gaggcgctga | cgtcgctgga | gctggagctg | gggctgcacc | gcgtgcgcga | gctgcccgag | 480 |
ctgttcctgg | gccagagcga | gttcgactgc | ttctcggact | tggggtccgc | gccgcccgcc | 540 |
- 308 046157
ggctccgtga | gctgcggtgg | ttctggtggt | ggttctggtc | agtcccagct | catcaaaccc | 600 |
agccgcatgc | gcaagtaccc | caaccggccc | agcaagacgc | ccccccacga | acgcccttac | 660 |
gcttgcccag | tggagtcctg | tgatcgccgc | ttctcccgca | gcgacaacct | ggtgagacac | 720 |
atccgcatcc | acacaggcca | gaagcccttc | cagtgccgca | tctgcatgag | aaacttcagc | 780 |
cgagaggata | acttgcacac | tcacatccgc | acccacacag | gcgaaaagcc | cttcgcctgc | 840 |
gacatctgtg | gaagaaagtt | tgcccggagc | gatgaacttg | tccgacatac | caagatccac | 900 |
ttgcggcaga | aggaccgccc | ttacgcttgc | ccagtggagt | cctgtgatcg | ccgcttctcc | 960 |
caatcaggga | atctgactga | gcacatccgc | atccacacag | gccagaagcc | cttccagtgc | 1020 |
cgcatctgca | tgagaaactt | cagcacaagt | ggacatctgg | tacgccacat | ccgcacccac | 1080 |
acaggcgaaa | agcccttcgc | ctgcgacatc | tgtggaagaa | agtttgccca | gaatagtacc | 1140 |
ctgaccgaac | ataccaagat | ccacttgcgg | cagaaggaca | ag | 1182 |
<210> 204 <211> 1206 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 204 atggccgccg accacctgat gctcgccgag ggctaccgcc tggtgcagag gccgccgtcc60 gccgccgccg cccatggccc tcatgcgctc cggactctgc cgccgtacgc gggcccgggc120 ctggacagtg ggctgaggcc gcggggggct ccgctggggc cgccgccgcc ccgccaaccc180 ggggccctgg cgtacggggc cttcgggccg ccgtcctcct tccagccctt tccggccgtg240 cctccgccgg ccgcgggcat cgcgcacctg cagcctgtgg cgacgccgta ccccggccgc300 gcggccgcgc cccccaacgc tccgggaggc cccccgggcc cgcagccggc cccaagcgcc360 gcagccccgc cgccgcccgc gcacgccctg ggcggcatgg acgccgaact catcgacgag420 gaggcgctga cgtcgctgga gctggagctg gggctgcacc gcgtgcgcga gctgcccgag480 ctgttcctgg gccagagcga gttcgactgc ttctcggact tggggtccgc gccgcccgcc540 ggctccgtga gctgcggtgg ttctggtggt ggttctggtg gtggcagcgg gggaggttct600 ggtcagtccc agctcatcaa acccagccgc atgcgcaagt accccaaccg gcccagcaag660 acgccccccc acgaacgccc ttacgcttgc ccagtggagt cctgtgatcg ccgcttctcc720 cgcagcgaca acctggtgag acacatccgc atccacacag gccagaagcc cttccagtgc780 cgcatctgca tgagaaactt cagccgagag gataacttgc acactcacat ccgcacccac840 acaggcgaaa agcccttcgc ctgcgacatc tgtggaagaa agtttgcccg gagcgatgaa900
- 309 046157
cttgtccgac | ataccaagat | ccacttgcgg | cagaaggacc | gcccttacgc | ttgcccagtg | 960 |
gagtcctgtg | atcgccgctt | ctcccaatca | gggaatctga | ctgagcacat | ccgcatccac | 1020 |
acaggccaga | agcccttcca | gtgccgcatc | tgcatgagaa | acttcagcac | aagtggacat | 1080 |
ctggtacgcc | acatccgcac | ccacacaggc | gaaaagccct | tcgcctgcga | catctgtgga | 1140 |
agaaagtttg | cccagaatag | taccctgacc | gaacatacca | agatccactt | gcggcagaag | 1200 |
gacaag | 1206 |
<210> 205 <211> 402 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 205
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
5 1015
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155160
- 310 046157
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Gly Gly Ser Gly 195
Gly Gly Ser Gly Gln 200
Ser Gln Leu Ile Lys
205
Ser Arg Met Arg Lys
210
Tyr Pro Asn Arg Pro
215
Ser Lys Thr Pro Pro
220
Glu Arg Pro Tyr Ala 225
Cys Pro Val Glu Ser 230
Cys Asp Arg Arg Phe 235
Arg Ser Asp Asn Leu
245
Val Arg His Ile Arg
250
Ile His Thr Gly Gln
255
Pro Phe Gln Cys Arg
260
Ile Cys Met Arg Asn
265
Phe Ser Arg Glu Asp
270
Leu His Thr His Ile
275
Arg Thr His Thr Gly
280
Glu Lys Pro Phe Ala 285
Asp Ile Cys Gly Arg 290
Lys Phe Ala Arg Ser
295
Asp Glu Leu Val Arg 300
Thr Lys Ile His Leu 305
Arg Gln Lys Asp Arg 310
Pro Tyr Ala Cys Pro 315
Glu Ser Cys Asp Arg
325
Arg Phe Ser Gln Ser
330
Gly Asn Leu Thr Glu
335
Ile Arg Ile His Thr
340
Gly Gln Lys Pro Phe
345
Gln Cys Arg Ile Cys
350
Arg Asn Phe Ser Thr 355
Ser Gly His Leu Val 360
Arg His Ile Arg Thr 365
Thr Gly Glu Lys Pro
370
Phe Ala Cys Asp Ile 375
Cys Gly Arg Lys Phe 380
Gln Asn Ser Thr Leu 385
Thr Glu His Thr Lys 390
Ile His Leu Arg Gln 395
Ser
Ser
Pro
His
Ser 240
Lys
Asn
Cys
His
Val 320
His
Met
His
Ala
Lys 400
Asp Lys
- 311 046157 <210> 206 <211> 1707 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 206 atggccgcag | atcacctgat | gctggctgaa | ggctacagac | tggtgcagcg | gcctccatct | 60 |
gccgctgccg | cccacggccc | ccacgccctg | agaacactgc | ccccctacgc | cggccctggt | 120 |
cttgatagcg | gactcagacc | tagaggcgcc | cctctgggcc | ctccacctcc | aagacagcct | 180 |
ggagccctgg | cctacggcgc | cttcggccct | ccttctagct | tccagccctt | ccccgccgtg | 240 |
cctcctccag | ccgctggcat | cgcccacctg | cagcctgtgg | ccacccctta | ccccggaaga | 300 |
gccgccgccc | ctccaaacgc | ccctggcgga | cctcctggcc | cccagcctgc | tccaagcgcc | 360 |
gctgcccctc | cacctcctgc | tcatgccctg | ggcggcatgg | acgccgagct | gatcgacgag | 420 |
gaagccctga | ccagcctgga | actggaactg | ggcctgcaca | gagtgcggga | actgcctgag | 480 |
ctgttcctgg | gacagagcga | gttcgactgc | ttcagcgacc | tgggcagcgc | ccctcctgcc | 540 |
ggctctgtgt | cctgcgccga | ccacctgatg | ctcgccgagg | gctaccgcct | ggtgcagagg | 600 |
ccgccgtccg | ccgccgccgc | ccatggccct | catgcgctcc | ggactctgcc | gccgtacgcg | 660 |
ggcccgggcc | tggacagtgg | gctgaggccg | cggggggctc | cgctggggcc | gccgccgccc | 720 |
cgccaacccg | gggccctggc | gtacggggcc | ttcgggccgc | cgtcctcctt | ccagcccttt | 780 |
ccggccgtgc | ctccgccggc | cgcgggcatc | gcgcacctgc | agcctgtggc | gacgccgtac | 840 |
cccggccgcg | ccgccgcgcc | ccccaacgct | ccgggaggcc | ccccgggccc | gcagccggcc | 900 |
ccaagcgccg | cagccccgcc | gccgcccgcg | cacgccctgg | gcggcatgga | cgccgaactc | 960 |
atcgacgagg | aggcgctgac | gtcgctggag | ctggagctgg | ggctgcaccg | cgtgcgcgag | 1020 |
ctgcccgagc | tgttcctggg | ccagagcgag | ttcgactgct | tctcggactt | ggggtccgcg | 1080 |
ccgcccgccg | gctccgtgag | ctgccagtcc | cagctcatca | aacccagccg | catgcgcaag | 1140 |
taccccaacc | ggcccagcaa | gacgcccccc | cacgaacgcc | cttacgcttg | cccagtggag | 1200 |
tcctgtgatc | gccgcttctc | ccgcagcgac | aacctggtga | gacacatccg | catccacaca | 1260 |
ggccagaagc | ccttccagtg | ccgcatctgc | atgagaaact | tcagccgaga | ggataacttg | 1320 |
cacactcaca | tccgcaccca | cacaggcgaa | aagcccttcg | cctgcgacat | ctgtggaaga | 1380 |
aagtttgccc | ggagcgatga | acttgtccga | cataccaaga | tccacttgcg | gcagaaggac | 1440 |
cgcccttacg | cttgcccagt | ggagtcctgt | gatcgccgct | tctcccaatc | agggaatctg | 1500 |
actgagcaca | tccgcatcca | cacaggccag | aagcccttcc | agtgccgcat | ctgcatgaga | 1560 |
- 312 046157
aacttcagca | caagtggaca | tctggtacgc | cacatccgca | cccacacagg | cgaaaagccc | 1620 |
ttcgcctgcg | acatctgtgg | aagaaagttt | gcccagaata | gtaccctgac | cgaacatacc | 1680 |
aagatccact | tgcggcagaa | ggacaag | 1707 |
<210> 207 <211> 569 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 207
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
5 1015
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170175
Ala Pro Pro Ala Gly Ser Val Ser Cys Ala Asp His Leu Met Leu Ala
180 185190
- 313 046157
Glu Gly Tyr Arg Leu
195
Val Gln Arg Pro Pro
200
Ser Ala Ala Ala Ala
205
Gly Pro His Ala Leu
210
Arg Thr Leu Pro Pro 215
Tyr Ala Gly Pro Gly
220
Asp Ser Gly Leu Arg 225
Pro Arg Gly Ala Pro 230
Leu Gly Pro Pro Pro 235
Arg Gln Pro Gly Ala
245
Leu Ala Tyr Gly Ala
250
Phe Gly Pro Pro Ser
255
Phe Gln Pro Phe Pro
260
Ala Val Pro Pro Pro
265
Ala Ala Gly Ile Ala
270
Leu Gln Pro Val Ala
275
Thr Pro Tyr Pro Gly
280
Arg Ala Ala Ala Pro 285
Asn Ala Pro Gly Gly 290
Pro Pro Gly Pro Gln 295
Pro Ala Pro Ser Ala
300
Ala Pro Pro Pro Pro 305
Ala His Ala Leu Gly 310
Gly Met Asp Ala Glu 315
Ile Asp Glu Glu Ala
325
Leu Thr Ser Leu Glu
330
Leu Glu Leu Gly Leu
335
Arg Val Arg Glu Leu
340
Pro Glu Leu Phe Leu
345
Gly Gln Ser Glu Phe
350
Cys Phe Ser Asp Leu
355
Gly Ser Ala Pro Pro 360
Ala Gly Ser Val Ser 365
Gln Ser Gln Leu Ile
370
Lys Pro Ser Arg Met
375
Arg Lys Tyr Pro Asn 380
Pro Ser Lys Thr Pro 385
Pro His Glu Arg Pro 390
Tyr Ala Cys Pro Val 395
Ser Cys Asp Arg Arg
405
Phe Ser Arg Ser Asp
410
Asn Leu Val Arg His
415
Arg Ile His Thr Gly
420
Gln Lys Pro Phe Gln
425
Cys Arg Ile Cys Met
430
Asn Phe Ser Arg Glu
Asp Asn Leu His Thr
His Ile Arg Thr His
His
Leu
Pro 240
Ser
His
Pro
Ala
Leu 320
His
Asp
Cys
Arg
Glu 400
Ile
Arg
Thr
- 314 046157
Gly Glu
450
Ser Asp 465
Arg Pro
435
Lys Pro
Glu Leu
Tyr Ala
Phe Ala
Val Arg
470
Cys Pro 485
Ser Gly
Asn Leu
500
Thr Glu
440
Cys Asp 455
His Thr
Val Glu
His Ile
Ile Cys
Lys Ile
Ser Cys
490
Arg Ile 505
Phe Gln
Cys Arg 515
Ile Cys
Met Arg
520
Asn Phe
Gly Arg
460
His Leu 475
Asp Arg
His Thr
Ser Thr
Val Arg
530
His Ile
Arg Thr
His Thr 535
Gly Glu
Lys Pro
540
Ile Cys 545
Gly Arg
Lys Phe
550
Ala Gln
Asn Ser
Thr Leu 555
445
Lys Phe
Arg Gln
Arg Phe
Gly Gln
510
Ser Gly 525
Phe Ala
Thr Glu
Ala Arg
Lys Asp
480
Ser Gln
495
Lys Pro
His Leu
Cys Asp
His Thr
560
Lys Ile His Leu Arg Gln Lys Asp Lys
565 <210> 208 <211> 1755 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 208 atggccgcag | atcacctgat | gctggctgaa | ggctacagac | tggtgcagcg | gcctccatct |
gccgctgccg | cccacggccc | ccacgccctg | agaacactgc | ccccctacgc | cggccctggt |
cttgatagcg | gactcagacc | tagaggcgcc | cctctgggcc | ctccacctcc | aagacagcct |
ggagccctgg | cctacggcgc | cttcggccct | ccttctagct | tccagccctt | ccccgccgtg |
cctcctccag | ctgctggcat | cgcccacctg | cagcctgtgg | ccacccctta | ccccggaaga |
gccgccgccc | ctccaaacgc | ccctggcgga | cctcctggcc | cccagcctgc | tccaagcgcc |
gctgcccctc | cacctcctgc | tcatgccctg | ggcggcatgg | acgccgagct | gatcgacgag |
gaagccctga | ccagcctgga | actggaactg | ggcctgcaca | gagtgcggga | actgcctgag |
ctgttcctgg | gacagagcga | gttcgactgc | ttcagcgacc | tgggcagcgc | ccctcctgcc |
120
180
240
300
360
420
480
540
- 315 046157
ggctctgtgt | cctgcggcgg | cagcggcggc | ggaagcggcg | ccgaccacct | gatgctcgcc | 600 |
gagggctacc | gcctggtgca | gaggccgccg | tccgccgccg | ccgcccatgg | ccctcatgcg | 660 |
ctccggactc | tgccgccgta | cgcgggcccg | ggcctggaca | gtgggctgag | gccgcggggg | 720 |
gctccgctgg | ggccgccgcc | gccccgccaa | cccggggccc | tggcgtacgg | ggccttcggg | 780 |
ccgccgtcct | ccttccagcc | ctttccggcc | gtgcctccgc | cggccgcggg | catcgcgcac | 840 |
ctgcagcctg | tggcgacgcc | gtaccccggc | cgcgcggccg | cgccccccaa | cgctccggga | 900 |
ggccccccgg | gcccgcagcc | ggccccaagc | gccgcagccc | cgccgccgcc | cgcgcacgcc | 960 |
ctgggcggca | tggacgccga | actcatcgac | gaggaggcgc | tgacgtcgct | ggagctggag | 1020 |
ctggggctgc | accgcgtgcg | cgagctgccc | gagctgttcc | tgggccagag | cgagttcgac | 1080 |
tgcttctcgg | acttggggtc | cgcgccgccc | gccggctccg | tgagctgcgg | tggttctggt | 1140 |
ggtggttctg | gtcagtccca | gctcatcaaa | cccagccgca | tgcgcaagta | ccccaaccgg | 1200 |
cccagcaaga | cgccccccca | cgaacgccct | tacgcttgcc | cagtggagtc | ctgtgatcgc | 1260 |
cgcttctccc | gcagcgacaa | cctggtgaga | cacatccgca | tccacacagg | ccagaagccc | 1320 |
ttccagtgcc | gcatctgcat | gagaaacttc | agccgagagg | ataacttgca | cactcacatc | 1380 |
cgcacccaca | caggcgaaaa | gcccttcgcc | tgcgacatct | gtggaagaaa | gtttgcccgg | 1440 |
agcgatgaac | ttgtccgaca | taccaagatc | cacttgcggc | agaaggaccg | cccttacgct | 1500 |
tgcccagtgg | agtcctgtga | tcgccgcttc | tcccaatcag | ggaatctgac | tgagcacatc | 1560 |
cgcatccaca | caggccagaa | gcccttccag | tgccgcatct | gcatgagaaa | cttcagcaca | 1620 |
agtggacatc | tggtacgcca | catccgcacc | cacacaggcg | aaaagccctt | cgcctgcgac | 1680 |
atctgtggaa | gaaagtttgc | ccagaatagt | accctgaccg | aacataccaa | gatccacttg | 1740 |
cggcagaagg | acaag | 1755 |
<210> 209 <211> 585 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 209
Met Ala Ala Asp His Leu Met Leu 1 5
Ala Glu Gly Tyr Arg Leu Val Gln
15
Arg Pro Pro Ser Ala Ala Ala Ala 20
His Gly Pro His Ala Leu Arg Thr 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly
40
Leu Asp Ser Gly Leu Arg Pro Arg 45
- 316 046157
Gly Ala Pro Leu Gly 50
Pro Pro Pro Pro Arg 55
Gln Pro Gly Ala Leu 60
Tyr Gly Ala Phe Gly 65
Pro Pro Ser Ser Phe 70
Gln Pro Phe Pro Ala 75
Pro Pro Pro Ala Ala
Gly Ile Ala His Leu
Gln Pro Val Ala Thr
Tyr Pro Gly Arg Ala
100
Ala Ala Pro Pro Asn
105
Ala Pro Gly Gly Pro
110
Gly Pro Gln Pro Ala
115
Pro Ser Ala Ala Ala
120
Pro Pro Pro Pro Ala
125
Ala Leu Gly Gly Met
130
Asp Ala Glu Leu Ile 135
Asp Glu Glu Ala Leu 140
Ser Leu Glu Leu Glu 145
Leu Gly Leu His Arg 150
Val Arg Glu Leu Pro 155
Leu Phe Leu Gly Gln
165
Ser Glu Phe Asp Cys
170
Phe Ser Asp Leu Gly
175
Ala Pro Pro Ala Gly
180
Ser Val Ser Cys Gly
185
Gly Ser Gly Gly Gly
190
Gly Ala Asp His Leu
195
Met Leu Ala Glu Gly
200
Tyr Arg Leu Val Gln 205
Pro Pro Ser Ala Ala
210
Ala Ala His Gly Pro 215
His Ala Leu Arg Thr
220
Pro Pro Tyr Ala Gly 225
Pro Gly Leu Asp Ser 230
Gly Leu Arg Pro Arg 235
Ala Pro Leu Gly Pro
245
Pro Pro Pro Arg Gln
250
Pro Gly Ala Leu Ala
255
Gly Ala Phe Gly Pro
260
Pro Ser Ser Phe Gln
265
Pro Phe Pro Ala Val
270
Pro Pro Ala Ala Gly
275
Ile Ala His Leu Gln
280
Pro Val Ala Thr Pro
285
Pro Gly Arg Ala Ala
Ala Pro Pro Asn Ala
Pro Gly Gly Pro Pro
Ala
Val 80
Pro
Pro
His
Thr
Glu 160
Ser
Ser
Arg
Leu
Gly 240
Tyr
Pro
Tyr
Gly
- 317 046157
290
295
300
Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
305 310 315
Leu Gly Gly Met Asp Ala Glu Leu
325
Ile Asp Glu Glu Ala Leu Thr
330 335
Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
340 345 350
Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
355 360 365
Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
370 375 380
Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
385 390 395
Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
405 410 415
Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His
420 425 430
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
435 440 445
Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His
450 455 460
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
465 470 475
Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys
485 490 495
Arg Pro Tyr Ala Cys Pro Val Glu
500
Ser Cys Asp Arg Arg Phe Ser
505 510
Ser Gly Asn Leu Thr Glu His 515
Ile Arg Ile His Thr Gly Gln Lys
520 525
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
530 535
Thr Ser Gly His 540
Ala 320
Ser
Leu
Ala
Gly
Arg 400
Glu
Ile
Arg
Thr
Arg 480
Asp
Gln
Pro
Leu
- 318 046157
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
545
550
555
560
Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr
565
570
575
Lys Ile His Leu Arg Gln Lys Asp Lys
580
585 <210> 210 <211> 1113 <212> ДНК <213> Homo sapiens <400> 210 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggaggaa gattcgaaat480 aaaagatctg ctcaagagag ccgcaggaaa aagaaggtgt acgttggggg tttagagagc540 cgggtcttga aatacacagc ccagaatatg gagcttcaga acaaagtaca gcttctggag600 gaacagaatt tgtcccttct agatcaactg aggaaactcc aggccatggt gattgagatc660 tcaaacaaaa ccagcagcag cagcacctgc atcttggtcc tgctagtctc cttctgcctc720 ctccttgtac ctgctatgta ctcctctgac acaaggggga gcctgccagc tgagcatgga780 gtgttgtccc gccagcttcg tgccctcccc agtgaggacc cttaccagct ggagctgcct840 gccctgcagt cagaagtgcc gaaagacagc acacaccagt ggttggacgg ctcagactgt900 gtactccagg cccctggcaa cacttcctgc ctgctgcatt acatgcctca ggctcccagt960 gcagagcctc ccctggagtg gcccttccct gacctcttct cagagcctct ctgccgaggt1020 cccatcctcc ccctgcaggc aaatctcaca aggaagggag gatggcttcc tactggtagc1080 ccctctgtca ttttgcagga cagatactca ggc1113 <210> 211 <211> 371 <212> Белок <213> Homo sapiens <400> 211
- 319 046157
Met 1
Leu
Ala
Glu
Asn 65
Tyr
Cys
Ala
Leu
Lys 145
Lys
Gly
Gln
Gln
Ser 225
Leu
Glu Leu Glu Leu Asp 5
Glu Glu Ser Gly Asp 20
Pro Leu Asp Trp Ala 35
Val Asp Asp Leu Leu 50
Ile Leu Ser Ser Ser
Ser Leu Pro Arg Glu 85
Arg Lys Glu Gly Thr 100
Glu Gln Glu Ile Ala
115
Leu Glu Lys Glu Gly 130
Thr Glu Glu Gln Ile
150
Arg Ser Ala Gln Glu
165
Leu Glu Ser Arg Val
180
Asn Lys Val Gln Leu 195
Leu Arg Lys Leu Gln 210
Ser Ser Ser Thr Cys
230
Leu Val Pro Ala Met
245
Ala Gly Asp Gln Asp
Leu Gly Thr Ala Pro 25
Leu Pro Leu Ser Glu 40
Cys Ser Leu Leu Ser 55
Asn Pro Cys Leu Val 75
Thr Val Ser Met Asp
Gln Met Thr Pro Gln
105
Arg Leu Val Leu Thr 120
Leu Ile Leu Pro Glu 135
Leu Lys Arg Val Arg
155
Ser Arg Arg Lys Lys
170
Leu Lys Tyr Thr Ala
185
Leu Glu Glu Gln Asn
200
Ala Met Val Ile Glu 215
Ile Leu Val Leu Leu
235
Tyr Ser Ser Asp Thr
250
Leu Leu Ala Phe Leu
Asp Glu Ala Val Arg 30
Val Pro Ser Asp Trp 45
Pro Pro Ala Ser Leu 60
His His Asp His Thr
Leu Glu Ser Glu Ser
His Met Glu Glu Leu
110
Asp Glu Glu Lys Ser 125
Thr Leu Pro Leu Thr 140
Arg Lys Ile Arg Asn
160
Lys Val Tyr Val Gly
175
Gln Asn Met Glu Leu
190
Leu Ser Leu Leu Asp
205
Ile Ser Asn Lys Thr 220
Val Ser Phe Cys Leu
240
Arg Gly Ser Leu Pro
255
- 320 046157
Ala Glu His Gly Val Leu Ser Arg
260
Gln Leu Arg Ala Leu Pro Ser Glu
265 270
Asp Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys
275 280285
Asp Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala
290 295300
Pro Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser
305 310 315320
Ala Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro
325 330335
Leu Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys
340 345350
Gly Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg
355 360365
Tyr Ser Gly
370 <210> 212 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 212
atggagctgg | aattggatgc | tggtgaccaa | gacctgctgg | ccttcctgct | agaggaaagt | 60 |
ggagatttgg | ggacggcacc | cgatgaggcc | gtgagggccc | cactggactg | ggcgctgccg | 120 |
ctttctgagg | tgccgagcga | ctgggaagta | gatgatttgc | tgtgctccct | gctgagtccc | 180 |
ccagcgtcgt | tgaacattct | cagctcctcc | aacccctgcc | ttgtccacca | tgaccacacc | 240 |
tactccctcc | cacgggaaac | tgtctctatg | gatctagaga | gtgagagctg | tagaaaagag | 300 |
gggacccaga | tgactccaca | gcatatggag | gagctggcag | agcaggagat | tgctaggcta | 360 |
gtactgacag | atgaggagaa | gagtctattg | gagaaggagg | ggcttattct | gcctgagaca | 420 |
cttcctctca | ctaagacaga | ggaacaaatt | ctgaaacgtg | tgcggctcga | accaggtgaa | 480 |
aaaccttaca | aatgtcctga | atgtgggaaa | tcattcagtc | gcagcgacaa | cctggtgaga | 540 |
catcaacgca | cccatacagg | agaaaaacct | tataaatgtc | cagaatgtgg | aaagtccttc | 600 |
- 321 046157
tcacgagagg | ataacttgca | cactcatcaa | cgaacacata | ctggtgaaaa | accatacaag | 660 |
tgtcccgaat | gtggtaaaag | ttttagccgg | agcgatgaac | ttgtccgaca | ccaacgaacc | 720 |
catacaggcg | agaagcctta | caaatgtccc | gagtgtggca | agagcttctc | acaatcaggg | 780 |
aatctgactg | agcatcaacg | aactcatacc | ggggaaaaac | cttacaagtg | tccagagtgt | 840 |
gggaagagct | tttccacaag | tggacatctg | gtacgccacc | agaggacaca | tacaggggag | 900 |
aagccctaca | aatgccccga | atgcggtaaa | agtttctctc | agaatagtac | cctgaccgaa | 960 |
caccagcgaa | cacacactgg | gaaaaaaacg | agtgtgtacg | ttgggggttt | agagagccgg | 1020 |
gtcttgaaat | acacagccca | gaatatggag | cttcagaaca | aagtacagct | tctggaggaa | 1080 |
cagaatttgt | cccttctaga | tcaactgagg | aaactccagg | ccatggtgat | tgagatctca | 1140 |
aacaaaacca | gcagcagcag | cacctgcatc | ttggtcctgc | tagtctcctt | ctgcctcctc | 1200 |
cttgtacctg | ctatgtactc | ctctgacaca | agggggagcc | tgccagctga | gcatggagtg | 1260 |
ttgtcccgcc | agcttcgtgc | cctccccagt | gaggaccctt | accagctgga | gctgcctgcc | 1320 |
ctgcagtcag | aagtgccgaa | agacagcaca | caccagtggt | tggacggctc | agactgtgta | 1380 |
ctccaggccc | ctggcaacac | ttcctgcctg | ctgcattaca | tgcctcaggc | tcccagtgca | 1440 |
gagcctcccc | tggagtggcc | cttccctgac | ctcttctcag | agcctctctg | ccgaggtccc | 1500 |
atcctccccc | tgcaggcaaa | tctcacaagg | aagggaggat | ggcttcctac | tggtagcccc | 1560 |
tctgtcattt | tgcaggacag | atactcaggc | 1590 |
<210> 213 <211> 530 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 213
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
5 1015
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala ValArg
2530
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 7580
- 322 046157
Tyr
Cys
Ala
Leu
Lys 145
Lys
Asn
Cys
His
Gly 225
His
Ser
Lys
His
Cys 305
His
Ser Leu Pro Arg Glu
Thr Val Ser Met Asp
Leu Glu Ser Glu Ser
Arg Lys Glu Gly Thr 100
Glu Gln Glu Ile Ala
115
Leu Glu Lys Glu Gly 130
Thr Glu Glu Gln Ile
150
Pro Tyr Lys Cys Pro
165
Leu Val Arg His Gln 180
Pro Glu Cys Gly Lys 195
Gln Arg Thr His Thr 210
Lys Ser Phe Ser Arg
230
Thr Gly Glu Lys Pro
245
Gln Ser Gly Asn Leu
260
Pro Tyr Lys Cys Pro
275
Leu Val Arg His Gln 290
Pro Glu Cys Gly Lys
310
Gln Arg Thr His Thr
Gln Met Thr Pro Gln
105
His Met Glu Glu Leu
110
Arg Leu Val Leu Thr 120
Asp Glu Glu Lys Ser 125
Leu Ile Leu Pro Glu 135
Thr Leu Pro Leu Thr 140
Leu Lys Arg Val Arg
155
Glu Cys Gly Lys Ser
170
Arg Thr His Thr Gly 185
Ser Phe Ser Arg Glu
200
Gly Glu Lys Pro Tyr 215
Ser Asp Glu Leu Val
235
Tyr Lys Cys Pro Glu
250
Thr Glu His Gln Arg
265
Glu Cys Gly Lys Ser 280
Arg Thr His Thr Gly 295
Ser Phe Ser Gln Asn
315
Gly Lys Lys Thr Ser
Leu Glu Pro Gly Glu
160
Phe Ser Arg Ser Asp
175
Glu Lys Pro Tyr Lys
190
Asp Asn Leu His Thr 205
Lys Cys Pro Glu Cys 220
Arg His Gln Arg Thr
240
Cys Gly Lys Ser Phe
255
Thr His Thr Gly Glu
270
Phe Ser Thr Ser Gly 285
Glu Lys Pro Tyr Lys 300
Ser Thr Leu Thr Glu
320
Val Tyr Val Gly Gly
- 323 046157
325 330
335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn
340 345
Met Glu Leu Gln
350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser
355 360
Leu Leu Asp Gln 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser
370 375 380
Asn Lys Thr Ser
Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val Ser
385 390 395
Phe Cys Leu Leu
400
Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly
405 410
Ser Leu Pro Ala
415
Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu
420 425
Pro Ser Glu Asp
430
Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu
435 440
Val Pro Lys Asp 445
Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val
450 455 460
Leu Gln Ala Pro
Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln
465 470 475
Ala Pro Ser Ala
480
Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe
485 490
Ser Glu Pro Leu
495
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu
500 505
Thr Arg Lys Gly
510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu
515 520
Gln Asp Arg Tyr 525
Ser Gly
530 <210> 214 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полинуклеотид
Синтетический
- 324 046157 <400> 214 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcttga gcccggagag480 aagccgtaca agtgccctga gtgcggcaag tcttttagca gaagagacga acttaatgtc540 caccagcgaa cgcatactgg tgaaaagccc tataaatgtc ctgaatgtgg gaaatcattc600 tccagccgca gaacctgtag ggctcaccag cgaacacaca ccggcgaaaa accatacaaa660 tgtccagaat gcgggaaatc cttttctcag tcatccaact tggtgagaca tcaacgcacg720 cacactggag aaaagcctta caaatgcccg gaatgtggaa agtctttttc ccaattggcc780 catttgcgag cccatcagag gactcacacg ggcgagaaac cttacaaatg cccggaatgc840 gggaaatctt tttcaacgag tggcaacctc gtaagacacc aaagaacgca tacaggcgaa900 aagccatata agtgtcctga gtgtggtaaa tcattctcac acaggaccac cctgacaaat960 caccagcgca cgcacaccgg caagaagaca agcgtgtacg ttgggggttt agagagccgg1020 gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa1080 cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca1140 aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc1200 cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg1260 ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc1320 ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta1380 ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca1440 gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc1500 atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc1560 tctgtcattt tgcaggacag atactcaggc1590 <210> 215 <211> 530 <212> Белок <213> Искусственная последовательность <220>
- 325 046157 <223> Описание искусственной последовательности полипептид <400> 215
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu 1 5 10
Синтетический
Leu Ala Phe Leu
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp 20 25
Glu Ala Val Arg 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val
40
Pro Ser Asp Trp 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro
55 60
Pro Ala Ser Leu
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His 65 70 75
His Asp His Thr
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu
90
Glu Ser Glu Ser
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His
100 105
Met Glu Glu Leu
110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp
115 120
Glu Glu Lys Ser 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr
130 135 140
Leu Pro Leu Thr
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu
145 150 155
Glu Pro Gly Glu
160
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
165 170
Ser Arg Arg Asp
175
Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu
180 185
Lys Pro Tyr Lys
190
Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Arg Arg
195 200
Thr Cys Arg Ala 205
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
210 215 220
Cys Pro Glu Cys
Gly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val Arg
225 230 235
His Gln Arg Thr
240
- 326 046157
His
Ser
Lys
Asn
Cys 305
His
Leu
Asn
Leu
Ser 385
Leu
Glu
Pro
Ser
Gly 465
Glu
Thr Gly Glu Lys Pro
245
Gln Leu Ala His Leu
260
Pro Tyr Lys Cys Pro
275
Leu Val Arg His Gln 290
Pro Glu Cys Gly Lys
310
Gln Arg Thr His Thr
325
Glu Ser Arg Val Leu
340
Lys Val Gln Leu Leu
355
Arg Lys Leu Gln Ala 370
Ser Ser Thr Cys Ile
390
Val Pro Ala Met Tyr
405
His Gly Val Leu Ser
420
Tyr Gln Leu Glu Leu
435
Thr His Gln Trp Leu 450
Asn Thr Ser Cys Leu
470
Pro Pro Leu Glu Trp
485
Tyr Lys Cys Pro Glu
250
Cys Gly Lys Ser Phe
255
Arg Ala His Gln Arg 265
Glu Cys Gly Lys Ser
280
Arg Thr His Thr Gly 295
Ser Phe Ser His Arg
315
Gly Lys Lys Thr Ser
330
Lys Tyr Thr Ala Gln
345
Glu Glu Gln Asn Leu
360
Met Val Ile Glu Ile 375
Leu Val Leu Leu Val
395
Ser Ser Asp Thr Arg
410
Arg Gln Leu Arg Ala 425
Pro Ala Leu Gln Ser
440
Asp Gly Ser Asp Cys 455
Leu His Tyr Met Pro
475
Pro Phe Pro Asp Leu
490
Thr His Thr Gly Glu
270
Phe Ser Thr Ser Gly 285
Glu Lys Pro Tyr Lys 300
Thr Thr Leu Thr Asn
320
Val Tyr Val Gly Gly
335
Asn Met Glu Leu Gln
350
Ser Leu Leu Asp Gln
365
Ser Asn Lys Thr Ser 380
Ser Phe Cys Leu Leu
400
Gly Ser Leu Pro Ala
415
Leu Pro Ser Glu Asp 430
Glu Val Pro Lys Asp 445
Val Leu Gln Ala Pro 460
Gln Ala Pro Ser Ala
480
Phe Ser Glu Pro Leu
495
- 327 046157
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly 500 505 510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr 515 520 525
Ser Gly 530 <210> 216 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 216 atggagctgg | aattggatgc | tggtgaccaa | gacctgctgg | ccttcctgct | agaggaaagt | 60 |
ggagatttgg | ggacggcacc | cgatgaggcc | gtgagggccc | cactggactg | ggcgctgccg | 120 |
ctttctgagg | tgccgagcga | ctgggaagta | gatgatttgc | tgtgctccct | gctgagtccc | 180 |
ccagcgtcgt | tgaacattct | cagctcctcc | aacccctgcc | ttgtccacca | tgaccacacc | 240 |
tactccctcc | cacgggaaac | tgtctctatg | gatctagaga | gtgagagctg | tagaaaagag | 300 |
gggacccaga | tgactccaca | gcatatggag | gagctggcag | agcaggagat | tgctaggcta | 360 |
gtactgacag | atgaggagaa | gagtctattg | gagaaggagg | ggcttattct | gcctgagaca | 420 |
cttcctctca | ctaagacaga | ggaacaaatt | ctgaaacgtg | tgcggcgccc | ttacgcttgc | 480 |
ccagtggagt | cctgtgatcg | ccgcttctcc | cgcagcgaca | acctggtgag | acacatccgc | 540 |
atccacacag | gccagaagcc | cttccagtgc | cgcatctgca | tgagaaactt | cagccgagag | 600 |
gataacttgc | acactcacat | ccgcacccac | acaggcgaaa | agcccttcgc | ctgcgacatc | 660 |
tgtggaagaa | agtttgcccg | gagcgatgaa | cttgtccgac | ataccaagat | ccacttgcgg | 720 |
cagaaggacc | gcccttacgc | ttgcccagtg | gagtcctgtg | atcgccgctt | ctcccaatca | 780 |
gggaatctga | ctgagcacat | ccgcatccac | acaggccaga | agcccttcca | gtgccgcatc | 840 |
tgcatgagaa | acttcagcac | aagtggacat | ctggtacgcc | acatccgcac | ccacacaggc | 900 |
gaaaagccct | tcgcctgcga | catctgtgga | agaaagtttg | cccagaatag | taccctgacc | 960 |
gaacatacca | agatccactt | gcggcagaag | gacgtgtacg | ttgggggttt | agagagccgg | 1020 |
gtcttgaaat | acacagccca | gaatatggag | cttcagaaca | aagtacagct | tctggaggaa | 1080 |
cagaatttgt | cccttctaga | tcaactgagg | aaactccagg | ccatggtgat | tgagatctca | 1140 |
aacaaaacca | gcagcagcag | cacctgcatc | ttggtcctgc | tagtctcctt | ctgcctcctc | 1200 |
- 328 046157
cttgtacctg | ctatgtactc | ctctgacaca | agggggagcc | tgccagctga | gcatggagtg | 1260 |
ttgtcccgcc | agcttcgtgc | cctccccagt | gaggaccctt | accagctgga | gctgcctgcc | 1320 |
ctgcagtcag | aagtgccgaa | agacagcaca | caccagtggt | tggacggctc | agactgtgta | 1380 |
ctccaggccc | ctggcaacac | ttcctgcctg | ctgcattaca | tgcctcaggc | tcccagtgca | 1440 |
gagcctcccc | tggagtggcc | cttccctgac | ctcttctcag | agcctctctg | ccgaggtccc | 1500 |
atcctccccc | tgcaggcaaa | tctcacaagg | aagggaggat | ggcttcctac | tggtagcccc | 1560 |
tctgtcattt | tgcaggacag | atactcaggc | 1590 |
<210> 217 <211> 530 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 217
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu 1 5 1015
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 2530
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 7580
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser 85 9095
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys
- 329 046157
145
Pro
Arg
Cys
Thr
Phe 225
Gln
Phe
Gln
Gly
Ala 305
Glu
Leu
Asn
Leu
Ser 385
150
155
160
Val Glu Ser Cys Asp
165
Arg Arg Phe Ser Arg
170
Ser Asp Asn Leu Val
175
His Ile Arg Ile His
180
Met Arg Asn Phe Ser 195
His Thr Gly Glu Lys 210
Ala Arg Ser Asp Glu
230
Lys Asp Arg Pro Tyr
245
Ser Gln Ser Gly Asn 260
Lys Pro Phe Gln Cys
275
His Leu Val Arg His 290
Cys Asp Ile Cys Gly
310
His Thr Lys Ile His
325
Glu Ser Arg Val Leu
340
Lys Val Gln Leu Leu
355
Arg Lys Leu Gln Ala 370
Ser Ser Thr Cys Ile
390
Thr Gly Gln Lys Pro 185
Phe Gln Cys Arg Ile
190
Arg Glu Asp Asn Leu
200
Pro Phe Ala Cys Asp 215
Leu Val Arg His Thr
235
Ala Cys Pro Val Glu
250
Leu Thr Glu His Ile
265
Arg Ile Cys Met Arg 280
Ile Arg Thr His Thr 295
Arg Lys Phe Ala Gln
315
Leu Arg Gln Lys Asp
330
Lys Tyr Thr Ala Gln
345
Glu Glu Gln Asn Leu
360
Met Val Ile Glu Ile 375
Leu Val Leu Leu Val
395
His Thr His Ile Arg
205
Ile Cys Gly Arg Lys 220
Lys Ile His Leu Arg
240
Ser Cys Asp Arg Arg
255
Arg Ile His Thr Gly 270
Asn Phe Ser Thr Ser
285
Gly Glu Lys Pro Phe 300
Asn Ser Thr Leu Thr
320
Val Tyr Val Gly Gly
335
Asn Met Glu Leu Gln
350
Ser Leu Leu Asp Gln
365
Ser Asn Lys Thr Ser 380
Ser Phe Cys Leu Leu
400
- 330 046157
Leu Val
Pro Ala
Glu His
Gly Val
420
Pro Tyr
Gln Leu 435
Ser Thr
450
His Gln
Met Tyr 405
Leu Ser
Glu Leu
Trp Leu
Gly Asn 465
Thr Ser
Cys Leu
470
Glu Pro
Pro Leu
Glu Trp 485
Cys Arg
Gly Pro
500
Ile Leu
Gly Trp
Leu Pro 515
Thr Gly
Ser Ser
Arg Gln
Pro Ala 440
Asp Gly 455
Leu His
Pro Phe
Pro Leu
Ser Pro
520
Asp Thr
410
Leu Arg 425
Leu Gln
Ser Asp
Tyr Met
Pro Asp
490
Gln Ala 505
Ser Val
Arg Gly
Ala Leu
Ser Glu
Cys Val
460
Pro Gln 475
Leu Phe
Asn Leu
Ile Leu
Ser Leu
Pro Ser
430
Val Pro 445
Leu Gln
Ala Pro
Ser Glu
Thr Arg
510
Gln Asp 525
Pro Ala 415
Glu Asp
Lys Asp
Ala Pro
Ser Ala
480
Pro Leu 495
Lys Gly
Arg Tyr
Ser Gly
530 <210> 218 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 218 atggagctgg | aattggatgc | tggtgaccaa | gacctgctgg | ccttcctgct | agaggaaagt |
ggagatttgg | ggacggcacc | cgatgaggcc | gtgagggccc | cactggactg | ggcgctgccg |
ctttctgagg | tgccgagcga | ctgggaagta | gatgatttgc | tgtgctccct | gctgagtccc |
ccagcgtcgt | tgaacattct | cagctcctcc | aacccctgcc | ttgtccacca | tgaccacacc |
tactccctcc | cacgggaaac | tgtctctatg | gatctagaga | gtgagagctg | tagaaaagag |
gggacccaga | tgactccaca | gcatatggag | gagctggcag | agcaggagat | tgctaggcta |
gtactgacag | atgaggagaa | gagtctattg | gagaaggagg | ggcttattct | gcctgagaca |
cttcctctca | ctaagacaga | ggaacaaatt | ctgaaacgtg | tgcggcgccc | ttacgcttgc |
ccagtggagt | cctgtgatcg | ccgcttctcc | cgctcagaca | acctcgttcg | acacatccgc |
120
180
240
300
360
420
480
540
- 331 046157
atccacacag | gccagaagcc | cttccagtgc | cgcatctgca | tgagaaactt | cagccaccgg | 600 |
actacactca | cgaaccacat | ccgcacccac | acaggcgaaa | agcccttcgc | ctgcgacatc | 660 |
tgtggaagaa | agtttgccag | agaagacaat | ctccatactc | ataccaagat | ccacttgcgg | 720 |
cagaaggacc | gcccttacgc | ttgcccagtg | gagtcctgtg | atcgccgctt | ctccaccagc | 780 |
cattctctca | ctgaacacat | ccgcatccac | acaggccaga | agcccttcca | gtgccgcatc | 840 |
tgcatgagaa | acttcagcca | gtctagctca | ctggtgaggc | acatccgcac | ccacacaggc | 900 |
gaaaagccct | tcgcctgcga | catctgtgga | agaaagtttg | ccagggagga | taacctgcat | 960 |
acgcatacca | agatccactt | gcggcagaag | gacgtgtacg | ttgggggttt | agagagccgg | 1020 |
gtcttgaaat | acacagccca | gaatatggag | cttcagaaca | aagtacagct | tctggaggaa | 1080 |
cagaatttgt | cccttctaga | tcaactgagg | aaactccagg | ccatggtgat | tgagatctca | 1140 |
aacaaaacca | gcagcagcag | cacctgcatc | ttggtcctgc | tagtctcctt | ctgcctcctc | 1200 |
cttgtacctg | ctatgtactc | ctctgacaca | agggggagcc | tgccagctga | gcatggagtg | 1260 |
ttgtcccgcc | agcttcgtgc | cctccccagt | gaggaccctt | accagctgga | gctgcctgcc | 1320 |
ctgcagtcag | aagtgccgaa | agacagcaca | caccagtggt | tggacggctc | agactgtgta | 1380 |
ctccaggccc | ctggcaacac | ttcctgcctg | ctgcattaca | tgcctcaggc | tcccagtgca | 1440 |
gagcctcccc | tggagtggcc | cttccctgac | ctcttctcag | agcctctctg | ccgaggtccc | 1500 |
atcctccccc | tgcaggcaaa | tctcacaagg | aagggaggat | ggcttcctac | tggtagcccc | 1560 |
tctgtcattt | tgcaggacag | atactcaggc | 1590 |
<210> 219 <211> 530 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 219
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu 1 5 1015
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 2530
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560
- 332 046157
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val 65 7075
His His Asp His Thr
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser 85 9095
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu 100 105110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser 115 120125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr 130 135140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys
145 150 155160
Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val
165 170175
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile
180 185190
Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu Thr Asn His Ile Arg
195 200205
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
210 215220
Phe Ala Arg Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg
225 230 235240
Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg
245 250255
Phe Ser Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly
260 265270
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
275 280285
Ser Ser Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
290 295300
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His
305 310 315320
- 333 046157
Thr His Thr Lys Ile His Leu Arg
325
Gln Lys Asp Val Tyr Val Gly Gly
330 335
Leu Glu
Ser Arg Val
340
Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln
345 350
Asn Lys Val Gln
355
Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln
360 365
Leu Arg Lys Leu Gln Ala Met Val
370 375
Ile Glu Ile Ser Asn Lys Thr Ser
380
Ser Ser Ser Thr Cys
385
Ile Leu Val Leu Leu Val Ser Phe Cys Leu Leu
390 395400
Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro Ala
405 410415
Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu Asp
420 425430
Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys Asp
435 440445
Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala Pro
450 455460
Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser Ala
465 470 475480
Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro Leu
485 490495
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly
500 505510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr
515 520525
Ser Gly
530 <210> 220 <211> 1140 <212> ДНК <213> Искусственная последовательность
- 334 046157 <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 220 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggctcga accaggtgaa480 aaaccttaca aatgtcctga atgtgggaaa tcattcagtc gcagcgacaa cctggtgaga540 catcaacgca cccatacagg agaaaaacct tataaatgtc cagaatgtgg aaagtccttc600 tcacgagagg ataacttgca cactcatcaa cgaacacata ctggtgaaaa accatacaag660 tgtcccgaat gtggtaaaag ttttagccgg agcgatgaac ttgtccgaca ccaacgaacc720 catacaggcg agaagcctta caaatgtccc gagtgtggca agagcttctc acaatcaggg780 aatctgactg agcatcaacg aactcatacc ggggaaaaac cttacaagtg tccagagtgt840 gggaagagct tttccacaag tggacatctg gtacgccacc agaggacaca tacaggggag900 aagccctaca aatgccccga atgcggtaaa agtttctctc agaatagtac cctgaccgaa960 caccagcgaa cacacactgg gaaaaaaacg agtgtgtacg ttgggggttt agagagccgg1020 gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa1080 cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatatca1140 <210> 221 <211> 380 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 221
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
- 335 046157
40 45
Glu
Asn 65
Tyr
Cys
Ala
Leu
Lys 145
Lys
Asn
Cys
His
Gly 225
His
Ser
Lys
Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser 50 55 60
Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His 70 75
Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu 85 90 95
Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu
100 105 110
Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys
115 120 125
Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu
130 135 140
Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu Glu Pro Gly
150 155
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
165 170 175
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
180 185 190
Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
195 200 205
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
210 215 220
Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg
230 235
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
245 250 255
Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly
260 265 270
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser
275 280 285
Leu
Thr 80
Ser
Leu
Ser
Thr
Glu 160
Asp
Lys
Thr
Cys
Thr 240
Phe
Glu
Gly
- 336 046157
His Leu Val Arg His Gln Arg Thr
290 295
His Thr Gly Glu Lys Pro Tyr Lys
300
Cys Pro Glu Cys Gly Lys Ser Phe
305 310
Ser Gln Asn Ser Thr Leu Thr Glu
315 320
His Gln Arg Thr His Thr Gly Lys
325
Lys Thr Ser Val Tyr Val Gly Gly
330 335
Leu Glu Ser Arg Val Leu Lys Tyr
340
Thr Ala Gln Asn Met Glu Leu Gln
345 350
Asn Lys Val Gln Leu Leu Glu Glu
355 360
Gln Asn Leu Ser Leu Leu Asp Gln
365
Leu Arg Lys Leu Gln Ala Met Val
370 375
Ile Glu Ile Ser
380 <210> 222 <211> 1140 <212> ДНК <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 222 atggagctgg | aattggatgc | tggtgaccaa | gacctgctgg | ccttcctgct | agaggaaagt | 60 |
ggagatttgg | ggacggcacc | cgatgaggcc | gtgagggccc | cactggactg | ggcgctgccg | 120 |
ctttctgagg | tgccgagcga | ctgggaagta | gatgatttgc | tgtgctccct | gctgagtccc | 180 |
ccagcgtcgt | tgaacattct | cagctcctcc | aacccctgcc | ttgtccacca | tgaccacacc | 240 |
tactccctcc | cacgggaaac | tgtctctatg | gatctagaga | gtgagagctg | tagaaaagag | 300 |
gggacccaga | tgactccaca | gcatatggag | gagctggcag | agcaggagat | tgctaggcta | 360 |
gtactgacag | atgaggagaa | gagtctattg | gagaaggagg | ggcttattct | gcctgagaca | 420 |
cttcctctca | ctaagacaga | ggaacaaatt | ctgaaacgtg | tgcggcgccc | ttacgcttgc | 480 |
ccagtggagt | cctgtgatcg | ccgcttctcc | cgcagcgaca | acctggtgag | acacatccgc | 540 |
atccacacag | gccagaagcc | cttccagtgc | cgcatctgca | tgagaaactt | cagccgagag | 600 |
gataacttgc | acactcacat | ccgcacccac | acaggcgaaa | agcccttcgc | ctgcgacatc | 660 |
tgtggaagaa | agtttgcccg | gagcgatgaa | cttgtccgac | ataccaagat | ccacttgcgg | 720 |
cagaaggacc | gcccttacgc | ttgcccagtg | gagtcctgtg | atcgccgctt | ctcccaatca | 780 |
gggaatctga | ctgagcacat | ccgcatccac | acaggccaga | agcccttcca | gtgccgcatc | 840 |
tgcatgagaa | acttcagcac | aagtggacat | ctggtacgcc | acatccgcac | ccacacaggc | 900 |
- 337 046157 gaaaagccct gaacatacca gtcttgaaat cagaatttgt tcgcctgcga agatccactt acacagccca cccttctaga catctgtgga gcggcagaag gaatatggag tcaactgagg agaaagtttg gacgtgtacg cttcagaaca aaactccagg cccagaatag ttgggggttt aagtacagct ccatggtgat taccctgacc agagagccgg tctggaggaa tgagatctca
960
1020
1080
1140 <210> 223 <211> 380 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности: Синтетический полипептид <400> 223
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
5 10 15
Leu Glu Glu
Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu
40
Ser Glu Val Pro Ser Asp Trp 45
Glu Val Asp Asp Leu Leu Cys
55
Ser Leu Leu Ser Pro Pro Ala Ser Leu
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 75 80
Tyr Ser
Leu Pro
Cys Arg
Lys Glu
100
Ala Glu
Gln Glu 115
Leu Leu
130
Glu Lys
Lys Thr 145
Glu Glu
Pro Val
Glu Ser
Arg Glu 85
Gly Thr
Ile Ala
Glu Gly
Gln Ile
150
Cys Asp 165
Thr Val
Ser Met
Asp Leu
Glu Ser
Gln Met
Thr Pro 105
Gln His
Met Glu
110
Arg Leu
120
Val Leu
Thr Asp
Glu Glu 125
Leu Ile 135
Leu Pro
Glu Thr
140
Leu Pro
Leu Lys
Arg Val
Arg Arg 155
Pro Tyr
Arg Arg
Phe Ser
170
Arg Ser
Asp Asn
Glu Ser 95
Glu Leu
Lys Ser
Leu Thr
Ala Cys 160
Leu Val 175
- 338 046157
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
180 185
Gln Cys Arg Ile
190
Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His
195 200
Thr His Ile Arg 205
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
210 215 220
Cys Gly Arg Lys
Phe Ala Arg Ser Asp Glu Leu Val Arg His 225 230
Thr Lys 235
Ile His Leu Arg
240
Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser
245 250
Cys Asp Arg Arg
255
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg
260 265
Ile His Thr Gly 270
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
275 280
Phe Ser Thr Ser 285
Gly His Leu Val Arg His Ile Arg Thr His Thr Gly
290 295 300
Glu Lys Pro Phe
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn
305 310 315
Ser Thr Leu Thr
320
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Val
325 330
Tyr Val Gly Gly
335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn
340 345
Met Glu Leu Gln
350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser
355 360
Leu Leu Asp Gln 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser
370 375 380 <210> 224 <211> 155 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 224
Синтетический
- 339 046157
Met Glu 1
Leu Glu
Leu Asp 5
Ala Gly
Asp Gln
Asp Leu
Leu Ala Phe Leu
Leu Glu
Glu Ser
Gly Asp
Leu Gly
Thr Ala 25
Pro Asp
Glu Ala Val Arg 30
Ala Pro
Leu Asp 35
Trp Ala
Leu Pro
Leu Ser
Glu Val
Pro Ser Asp Trp 45
Glu Val
Asp Asp
Leu Leu
Cys Ser 55
Leu Leu
Ser Pro
Pro Ala Ser Leu
Asn Ile 65
Leu Ser
Ser Ser
Asn Pro
Cys Leu
Val His 75
His Asp His Thr
Tyr Ser
Leu Pro
Arg Glu 85
Thr Val
Ser Met
Asp Leu
Glu Ser Glu Ser
Cys Arg
Lys Glu
100
Gly Thr
Gln Met
Thr Pro 105
Gln His
Met Glu Glu Leu
110
Ala Glu
Gln Glu 115
Ile Ala
Arg Leu
120
Val Leu
Thr Asp
Glu Glu Lys Ser 125
Leu Leu
130
Glu Lys
Glu Gly
Leu Ile 135
Leu Pro
Glu Thr
140
Leu Pro Leu Thr
Lys Thr 145
Glu Glu
Gln Ile
150
Leu Lys
Arg Val
Arg 155 <210> 225 <211> 199 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 225
Синтетический
Val Tyr Val Gly Gly Leu 1 5
Glu Ser Arg Val Leu Lys 10
Tyr Thr Ala Gln 15
Asn Met Glu Leu Gln Asn
Lys Val Gln Leu Leu Glu 25
Glu Gln Asn Leu
Ser Leu Leu Asp Gln Leu 35
Arg Lys Leu Gln Ala Met 40
Val Ile Glu Ile 45
Ser Asn Lys Thr Ser Ser
Ser Ser Thr Cys Ile Leu
Val Leu Leu Val
- 340 046157
55 60
Ser Phe 65
Gly Ser
Leu Pro
Glu Val
Cys Leu
Leu Pro
Ser Glu
100
Pro Lys 115
Leu Leu
Val Pro
Ala Met
Ala Glu 85
Asp Pro
Asp Ser
His Gly
Val Leu
Tyr Gln
Leu Glu 105
Thr His
120
Gln Trp
Val Leu
130
Gln Ala
Pro Gly
Asn Thr 135
Ser Cys
Gln Ala 145
Pro Ser
Ala Glu
150
Pro Pro
Leu Glu
Phe Ser
Glu Pro
Leu Cys 165
Arg Gly
Pro Ile
170
Leu Thr
Arg Lys
180
Gly Gly
Trp Leu
Pro Thr 185
Tyr Ser 75
Ser Arg
Leu Pro
Leu Asp
Leu Leu
140
Trp Pro 155
Leu Pro
Gly Ser
Ser Asp Thr Arg 80
Gln Leu Arg Ala 95
Ala Leu Gln Ser
110
Gly Ser Asp Cys 125
His Tyr Met Pro
Phe Pro Asp Leu
160
Leu Gln Ala Asn
175
Pro Ser Val Ile
190
Leu Gln
Asp Arg 195
Tyr Ser
Gly <210> 226 <211> 49 <212> Белок <213> Искусственная последовательность <220>
<223> Описание искусственной последовательности полипептид <400> 226
Синтетический
Val Tyr Val Gly Gly Leu 1 5
Asn Met Glu Leu Gln Asn
Ser Leu Leu Asp Gln Leu 35
Glu Ser Arg Val Leu Lys 10
Lys Val Gln Leu Leu Glu 25
Arg Lys Leu Gln Ala Met 40
Tyr Thr Ala Gln 15
Glu Gln Asn Leu
Val Ile Glu Ile 45
Ser
Claims (24)
1. Полинуклеотид, содержащий последовательность нуклеиновой кислоты, кодирующую не встречающийся в природе фактор транскрипции, причем не встречающийся в природе фактор транскрипции содержит аминокислотную последовательность, имеющую по меньшей мере 97% идентичность последовательности SEQ ID NO: 127.
2. Полинуклеотид по п.1, в котором не встречающийся в природе фактор транскрипции содержит аминокислотную последовательность SEQ ID NO: 127.
3. Полинуклеотид по п.1 или 2, где полинуклеотид дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в парвальбумин (PV)содержащих нейронах, чем в других типах клеток, и где регуляторный элемент содержит SEQ ID NO: 1, 2, 3 или 4.
4. Полинуклеотид по п.3, в котором регуляторный элемент содержит SEQ ID NO: 2.
5. Полинуклеотид по любому из пп.1-4, дополнительно содержащий микроРНК связывающий сайт.
6. Полинуклеотид по п.5, в котором микроРНК связывающий сайт содержит SEQ ID NO: 9, 11 или 13.
7. Полинуклеотид по п.5, в котором микроРНК связывающий сайт содержит SEQ ID NO: 7, 14 или 15.
8. Полинуклеотид по п.5, где полинуклеотид содержит последовательность нуклеиновой кислоты, характеризующуюся идентичностью, составляющей по меньшей мере 95% по отношению к SEQ ID NO: 71.
9. Полинуклеотид по п.5, где полинуклеотид содержит SEQ ID NO: 71.
10. Полинуклеотид по любому из пп.1-9, где не встречающийся в природе фактор транскрипции увеличивает экспрессию гена SCNIA в клетке.
11. Экспрессионный вектор, содержащий полинуклеотид по любому из пп.1-10.
12. Экспрессионный вектор по п.11, где экспрессионный вектор представляет собой вирусный вектор.
13. Экспрессионный вектор по п.11, где вирусный вектор представляет собой аденоассоциированный вирусный (AAV) вектор.
14. Экспрессионный вектор по п.13, где AAV вектор имеет серотип AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10, AAV птиц, AAV крупного рогатого скота, AAV собак, AAV лошадей, AAV приматов, AAV не приматов, AAV овец, scAAV, scAAV1, scAAV2, scAAV5, scAAV8 или scAAV9, или их гибриды.
15. Экспрессионный вектор по п.14, где полинуклеотид дополнительно содержит последовательность 5' AAV инвертированного концевого повтора (ITR) и последовательность 3' AAV ITR.
16. Экспрессионный вектор по п.15, где каждая из последовательностей 5' AAV ITR и 3' AAV ITR независимо представляет собой AAV1, AAV2, AAV5, AAV8 или AAV9.
17. Фармацевтическая композиция, содержащая полинуклеотид по любому из пп.1-10 или экспрессионный вектор по любому из пп.11-16.
18. Клетка, содержащая полинуклеотид по любому из пп.1-10 или экспресионный вектор по любому из пп.11-16.
19. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для лечения эпилепсии у нуждающегося в этом субъекта.
20. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для лечения синдрома Драве у нуждающегося в этом субъекта.
21. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для снижения частоты или продолжительности припадков.
22. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для лечения эпилепсии у нуждающегося в этом субъекта.
23. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для лечения синдрома Драве у нуждающегося в этом субъекта.
24. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для снижения частоты или продолжительности припадков.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/854,238 | 2019-05-29 | ||
US62/857,727 | 2019-06-05 | ||
US63/008,569 | 2020-04-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
EA046157B1 true EA046157B1 (ru) | 2024-02-12 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12083188B2 (en) | Engineered DNA binding proteins | |
KR102604159B1 (ko) | 조직 선택적 트랜스진 발현 | |
US20220136009A1 (en) | Compositions and methods for selective gene regulation | |
CN107438671B (zh) | 变体RNAi | |
TW201920679A (zh) | 眼部疾病之細胞模式及用於眼部疾病的療法 | |
US20230365963A1 (en) | Methods for treating neurological disease | |
US20220193264A1 (en) | Compositions and methods for treating laminopathies | |
CN112639108A (zh) | 治疗非综合征性感觉神经性听力损失的方法 | |
CN116134134A (zh) | 用于治疗c9orf72相关疾病的三功能腺伴随病毒(aav)载体 | |
EA046157B1 (ru) | Композиции и способы селективной регуляции экспрессии генов | |
TW202221119A (zh) | Dna結合域轉活化子及其用途 |