RU2774415C1 - Artificial nucleic acid molecules - Google Patents
Artificial nucleic acid molecules Download PDFInfo
- Publication number
- RU2774415C1 RU2774415C1 RU2020111527A RU2020111527A RU2774415C1 RU 2774415 C1 RU2774415 C1 RU 2774415C1 RU 2020111527 A RU2020111527 A RU 2020111527A RU 2020111527 A RU2020111527 A RU 2020111527A RU 2774415 C1 RU2774415 C1 RU 2774415C1
- Authority
- RU
- Russia
- Prior art keywords
- nucleic acid
- utr
- acid molecule
- ribosomal protein
- protein
- Prior art date
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 340
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 339
- 229920000401 Three prime untranslated region Polymers 0.000 claims abstract description 317
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 248
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 248
- 102000002278 Ribosomal Proteins Human genes 0.000 claims abstract description 125
- 108010000605 Ribosomal Proteins Proteins 0.000 claims abstract description 125
- 229920001850 Nucleic acid sequence Polymers 0.000 claims abstract description 124
- 210000004027 cells Anatomy 0.000 claims abstract description 123
- 230000014509 gene expression Effects 0.000 claims abstract description 88
- 230000001965 increased Effects 0.000 claims abstract description 37
- 101710037100 RPL35A Proteins 0.000 claims abstract description 19
- 108090000878 ribosomal protein S9 Proteins 0.000 claims abstract description 18
- 102100011969 RPS21 Human genes 0.000 claims abstract description 13
- 101710008327 RPS27 Proteins 0.000 claims abstract description 13
- 102100011245 RPS27 Human genes 0.000 claims abstract description 13
- 101710008326 RPS28 Proteins 0.000 claims abstract description 13
- 102100011971 RPS28 Human genes 0.000 claims abstract description 13
- 102100013428 RPS29 Human genes 0.000 claims abstract description 13
- 108010092936 ribosomal protein S21 Proteins 0.000 claims abstract description 13
- 108010093173 ribosomal protein S29 Proteins 0.000 claims abstract description 13
- 102100010692 RPL35A Human genes 0.000 claims abstract description 12
- 102100018787 RPS19 Human genes 0.000 claims abstract description 12
- 108010093046 ribosomal protein S19 Proteins 0.000 claims abstract description 12
- 108020005345 3' Untranslated Regions Proteins 0.000 claims abstract description 6
- 125000003729 nucleotide group Chemical group 0.000 claims description 190
- 239000002773 nucleotide Substances 0.000 claims description 180
- 108020004999 Messenger RNA Proteins 0.000 claims description 156
- 229920002106 messenger RNA Polymers 0.000 claims description 155
- 229920001320 Leader sequence (mRNA) Polymers 0.000 claims description 103
- 229920000160 (ribonucleotides)n+m Polymers 0.000 claims description 100
- 108020004412 RNA 3' Polyadenylation Signals Proteins 0.000 claims description 65
- 229920000320 RNA (poly(A)) Polymers 0.000 claims description 58
- 229920003013 deoxyribonucleic acid Polymers 0.000 claims description 58
- -1 ORFs Polymers 0.000 claims description 57
- 230000001402 polyadenylating Effects 0.000 claims description 37
- 241000282414 Homo sapiens Species 0.000 claims description 36
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical class C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 21
- 101710036998 RPL36AL Proteins 0.000 claims description 20
- 210000004962 mammalian cells Anatomy 0.000 claims description 18
- 102100007734 RPS16 Human genes 0.000 claims description 17
- 108010092955 ribosomal protein S16 Proteins 0.000 claims description 17
- 108090000221 Ribosomal protein S6 Proteins 0.000 claims description 16
- 102000004282 ribosomal protein S9 Human genes 0.000 claims description 16
- 102100018270 RPL36AL Human genes 0.000 claims description 13
- 108060001084 Luciferase family Proteins 0.000 claims description 12
- 230000003612 virological Effects 0.000 claims description 9
- 102000018146 globin family Human genes 0.000 claims description 6
- 108060003196 globin family Proteins 0.000 claims description 6
- 241000219194 Arabidopsis Species 0.000 claims description 5
- 229920000453 Consensus sequence Polymers 0.000 claims description 5
- 241000196324 Embryophyta Species 0.000 claims description 5
- 102100004985 GUSB Human genes 0.000 claims description 3
- 108010060309 Glucuronidase Proteins 0.000 claims description 3
- 102100019126 HBB Human genes 0.000 claims description 3
- 108091005902 Hemoglobin subunit beta Proteins 0.000 claims description 3
- 108091005938 enhanced green fluorescent protein Proteins 0.000 claims description 2
- 102100001964 RPS6 Human genes 0.000 claims 4
- 229920000062 Coding strand Polymers 0.000 claims 1
- 108010033826 ribosomal protein S1 Proteins 0.000 claims 1
- 239000000126 substance Substances 0.000 abstract description 12
- 230000000694 effects Effects 0.000 abstract description 11
- 102100002024 RPS9 Human genes 0.000 abstract 2
- 235000018102 proteins Nutrition 0.000 description 216
- 108091007172 antigens Proteins 0.000 description 84
- 102000038129 antigens Human genes 0.000 description 84
- 239000000427 antigen Substances 0.000 description 81
- 230000004048 modification Effects 0.000 description 55
- 238000006011 modification reaction Methods 0.000 description 55
- 238000004519 manufacturing process Methods 0.000 description 51
- 150000001413 amino acids Chemical group 0.000 description 46
- 230000000875 corresponding Effects 0.000 description 44
- 230000035897 transcription Effects 0.000 description 43
- 238000001890 transfection Methods 0.000 description 39
- 230000001717 pathogenic Effects 0.000 description 35
- 235000001014 amino acid Nutrition 0.000 description 32
- 210000000987 Immune System Anatomy 0.000 description 29
- 230000002068 genetic Effects 0.000 description 29
- 125000002091 cationic group Chemical group 0.000 description 27
- 239000002671 adjuvant Substances 0.000 description 26
- 244000052769 pathogens Species 0.000 description 26
- 230000000240 adjuvant Effects 0.000 description 25
- 201000010099 disease Diseases 0.000 description 25
- 239000000203 mixture Substances 0.000 description 25
- 238000002255 vaccination Methods 0.000 description 24
- 108020004705 Codon Proteins 0.000 description 23
- 239000008194 pharmaceutical composition Substances 0.000 description 23
- 102000004196 processed proteins & peptides Human genes 0.000 description 21
- 108090000765 processed proteins & peptides Proteins 0.000 description 21
- 235000000346 sugar Nutrition 0.000 description 21
- 206010028980 Neoplasm Diseases 0.000 description 20
- 229920001405 Coding region Polymers 0.000 description 19
- 230000000977 initiatory Effects 0.000 description 19
- 150000001875 compounds Chemical class 0.000 description 18
- 230000001225 therapeutic Effects 0.000 description 18
- 241000700605 Viruses Species 0.000 description 17
- 238000001415 gene therapy Methods 0.000 description 17
- 230000028993 immune response Effects 0.000 description 17
- 229920000642 polymer Polymers 0.000 description 17
- 229960005486 vaccines Drugs 0.000 description 17
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 16
- 239000000969 carrier Substances 0.000 description 16
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 15
- 229920000978 Start codon Polymers 0.000 description 15
- 238000010367 cloning Methods 0.000 description 15
- 201000011510 cancer Diseases 0.000 description 14
- 238000000338 in vitro Methods 0.000 description 14
- 210000001519 tissues Anatomy 0.000 description 14
- 229920001776 Mature messenger RNA Polymers 0.000 description 13
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 13
- 230000027455 binding Effects 0.000 description 13
- 230000003308 immunostimulating Effects 0.000 description 13
- 230000000087 stabilizing Effects 0.000 description 13
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 12
- 102000003861 Ribosomal protein S6 Human genes 0.000 description 12
- 229920001949 Transfer RNA Polymers 0.000 description 12
- 108020004566 Transfer RNA Proteins 0.000 description 12
- 230000003044 adaptive Effects 0.000 description 12
- 230000033289 adaptive immune response Effects 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 12
- 230000002163 immunogen Effects 0.000 description 12
- NYHBQMYGNKIUIF-PXMDKTAGSA-N Guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1O[C@@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-PXMDKTAGSA-N 0.000 description 11
- 229940029575 Guanosine Drugs 0.000 description 11
- 102100012350 RPS17 Human genes 0.000 description 11
- 210000003705 Ribosomes Anatomy 0.000 description 11
- 230000004913 activation Effects 0.000 description 11
- 108090001123 antibodies Proteins 0.000 description 11
- 102000004965 antibodies Human genes 0.000 description 11
- 125000005647 linker group Chemical group 0.000 description 11
- 108010093121 ribosomal protein S17 Proteins 0.000 description 11
- 239000001226 triphosphate Substances 0.000 description 11
- UHDGCWIWMRVCDJ-XVFCMESISA-N Cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-XVFCMESISA-N 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N Cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- IQFYYKKMVGJFEH-XLPZGREQSA-N DEOXYTHYMIDINE Chemical class O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 10
- 102100017209 RPL32 Human genes 0.000 description 10
- 210000001744 T-Lymphocytes Anatomy 0.000 description 10
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 10
- 230000015788 innate immune response Effects 0.000 description 10
- 150000002632 lipids Chemical class 0.000 description 10
- 239000007788 liquid Substances 0.000 description 10
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 10
- 239000002719 pyrimidine nucleotide Substances 0.000 description 10
- 150000003230 pyrimidines Chemical class 0.000 description 10
- 230000004044 response Effects 0.000 description 10
- 229920000795 Polyadenylation Polymers 0.000 description 9
- 230000000295 complement Effects 0.000 description 9
- 125000003835 nucleoside group Chemical group 0.000 description 9
- 108091007521 restriction endonucleases Proteins 0.000 description 9
- 230000029663 wound healing Effects 0.000 description 9
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 8
- 102100008842 GH1 Human genes 0.000 description 8
- 108010051696 Growth Hormone Proteins 0.000 description 8
- 208000008466 Metabolic Disease Diseases 0.000 description 8
- 101710005290 RPL32 Proteins 0.000 description 8
- 102100018263 RPL36 Human genes 0.000 description 8
- 101710004228 RPL36 Proteins 0.000 description 8
- 230000033115 angiogenesis Effects 0.000 description 8
- 230000033228 biological regulation Effects 0.000 description 8
- 201000009910 diseases by infectious agent Diseases 0.000 description 8
- 230000036039 immunity Effects 0.000 description 8
- 230000035800 maturation Effects 0.000 description 8
- 230000001105 regulatory Effects 0.000 description 8
- 102000004285 ribosomal protein L3 Human genes 0.000 description 8
- 108090000894 ribosomal protein L3 Proteins 0.000 description 8
- OIRDTQYFTABQOQ-SXVXDFOESA-N Adenosine Natural products Nc1ncnc2c1ncn2[C@@H]3O[C@@H](CO)[C@H](O)[C@@H]3O OIRDTQYFTABQOQ-SXVXDFOESA-N 0.000 description 7
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 7
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- 102100004642 RPL11 Human genes 0.000 description 7
- 102100014460 RPL13A Human genes 0.000 description 7
- 101710036098 RPL13A Proteins 0.000 description 7
- 101710005407 RPL26 Proteins 0.000 description 7
- 102100012944 RPL26 Human genes 0.000 description 7
- 102100002510 RPL27 Human genes 0.000 description 7
- 101710036997 RPL36A Proteins 0.000 description 7
- 102100017281 RPL36A Human genes 0.000 description 7
- 102100018988 RPS18 Human genes 0.000 description 7
- 101710008328 RPS23 Proteins 0.000 description 7
- 102100011970 RPS23 Human genes 0.000 description 7
- 102100013490 RPS26 Human genes 0.000 description 7
- 101710008321 RPS26 Proteins 0.000 description 7
- 102100012492 RPS8 Human genes 0.000 description 7
- 102000013817 Ribosomal protein L13 Human genes 0.000 description 7
- 108050003655 Ribosomal protein L13 Proteins 0.000 description 7
- 102000010983 Ribosomal protein S13 Human genes 0.000 description 7
- 108050001197 Ribosomal protein S13 Proteins 0.000 description 7
- 229960005305 adenosine Drugs 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000001413 cellular Effects 0.000 description 7
- 238000005755 formation reaction Methods 0.000 description 7
- 239000000122 growth hormone Substances 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 102000005962 receptors Human genes 0.000 description 7
- 108020003175 receptors Proteins 0.000 description 7
- 230000001172 regenerating Effects 0.000 description 7
- 108010025552 ribosomal protein L11 Proteins 0.000 description 7
- 108010033800 ribosomal protein S8 Proteins 0.000 description 7
- 108010067528 ribosomal proteins L27 Proteins 0.000 description 7
- 101710037032 rpl3001 Proteins 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 6
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 6
- 241000725303 Human immunodeficiency virus Species 0.000 description 6
- 239000005089 Luciferase Substances 0.000 description 6
- 229920002873 Polyethylenimine Polymers 0.000 description 6
- 102100015122 RPL22 Human genes 0.000 description 6
- 101710004304 RPL22 Proteins 0.000 description 6
- 102100010932 RPL23 Human genes 0.000 description 6
- 101710044970 RPL23A Proteins 0.000 description 6
- 102100009761 RPL23A Human genes 0.000 description 6
- 102100018258 RPL37A Human genes 0.000 description 6
- 101710037008 RPL37A Proteins 0.000 description 6
- 101710005288 RPL38 Proteins 0.000 description 6
- 102100017280 RPL38 Human genes 0.000 description 6
- 102100014339 RPS2 Human genes 0.000 description 6
- 101710029124 RPS3A Proteins 0.000 description 6
- 206010039073 Rheumatoid arthritis Diseases 0.000 description 6
- 108050001924 Ribosomal protein L23 Proteins 0.000 description 6
- 229940035893 Uracil Drugs 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 6
- 230000004059 degradation Effects 0.000 description 6
- 238000006731 degradation reaction Methods 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 102000027675 major histocompatibility complex family Human genes 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 102000004394 ribosomal protein S10 Human genes 0.000 description 6
- 108090000928 ribosomal protein S10 Proteins 0.000 description 6
- 108090000842 ribosomal protein S18 Proteins 0.000 description 6
- 102000002689 toll-like receptors Human genes 0.000 description 6
- 108020000411 toll-like receptors Proteins 0.000 description 6
- 210000003719 B-Lymphocytes Anatomy 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 229940104302 Cytosine Drugs 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 210000004443 Dendritic Cells Anatomy 0.000 description 5
- 206010012601 Diabetes mellitus Diseases 0.000 description 5
- 108090000394 Erythropoietin Proteins 0.000 description 5
- 102000003951 Erythropoietin Human genes 0.000 description 5
- 241000701806 Human papillomavirus Species 0.000 description 5
- 210000002540 Macrophages Anatomy 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 208000008589 Obesity Diseases 0.000 description 5
- 102100004905 RPL10 Human genes 0.000 description 5
- 102100012065 RPL12 Human genes 0.000 description 5
- 101710005416 RPL12 Proteins 0.000 description 5
- 102100018670 RPL15 Human genes 0.000 description 5
- 102100013504 RPL17 Human genes 0.000 description 5
- 102100009958 RPL18A Human genes 0.000 description 5
- 102100014138 RPL39 Human genes 0.000 description 5
- 102100018320 RPL4 Human genes 0.000 description 5
- 102100018107 RPL7 Human genes 0.000 description 5
- 101710027129 RPL7 Proteins 0.000 description 5
- 102100014054 RPL7A Human genes 0.000 description 5
- 101710005331 RPL7A Proteins 0.000 description 5
- 102100018145 RPL8 Human genes 0.000 description 5
- 102100016602 RPS12 Human genes 0.000 description 5
- 102100004495 RPS15A Human genes 0.000 description 5
- 101710006563 RPS15A Proteins 0.000 description 5
- 102100017329 RPS20 Human genes 0.000 description 5
- 101710008324 RPS24 Proteins 0.000 description 5
- 102100007185 RPS24 Human genes 0.000 description 5
- 102100011252 RPS25 Human genes 0.000 description 5
- 101710008325 RPS25 Proteins 0.000 description 5
- 102100018838 RPS27A Human genes 0.000 description 5
- 102100018472 RPS3 Human genes 0.000 description 5
- 102100018869 RPS3A Human genes 0.000 description 5
- 102100004903 RPS7 Human genes 0.000 description 5
- 102100012979 RPSA Human genes 0.000 description 5
- 101710024037 RPSA Proteins 0.000 description 5
- 108090000986 Ribosomal protein L10 Proteins 0.000 description 5
- 102000004387 Ribosomal protein L14 Human genes 0.000 description 5
- 108090000985 Ribosomal protein L14 Proteins 0.000 description 5
- 108090000983 Ribosomal protein L15 Proteins 0.000 description 5
- 102000004209 Ribosomal protein L5 Human genes 0.000 description 5
- 108090000776 Ribosomal protein L5 Proteins 0.000 description 5
- 102000004337 Ribosomal protein S5 Human genes 0.000 description 5
- 108090000902 Ribosomal protein S5 Proteins 0.000 description 5
- 230000001154 acute Effects 0.000 description 5
- 125000003277 amino group Chemical group 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 229940105423 erythropoietin Drugs 0.000 description 5
- 210000003527 eukaryotic cell Anatomy 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 239000003446 ligand Substances 0.000 description 5
- 239000002502 liposome Substances 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 230000011987 methylation Effects 0.000 description 5
- 238000007069 methylation reaction Methods 0.000 description 5
- 230000000051 modifying Effects 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 235000020824 obesity Nutrition 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 230000002035 prolonged Effects 0.000 description 5
- 108010013519 rat ribosomal protein L8 Proteins 0.000 description 5
- 108010025578 ribosomal protein L17 Proteins 0.000 description 5
- 102000003926 ribosomal protein L18 Human genes 0.000 description 5
- 108090000343 ribosomal protein L18 Proteins 0.000 description 5
- 108010019034 ribosomal protein L18a Proteins 0.000 description 5
- 108010025387 ribosomal protein L39 Proteins 0.000 description 5
- 108090000893 ribosomal protein L4 Proteins 0.000 description 5
- 102000004291 ribosomal protein L6 Human genes 0.000 description 5
- 108090000892 ribosomal protein L6 Proteins 0.000 description 5
- 102000004346 ribosomal protein L9 Human genes 0.000 description 5
- 108090000907 ribosomal protein L9 Proteins 0.000 description 5
- 102000004413 ribosomal protein S11 Human genes 0.000 description 5
- 108090000930 ribosomal protein S11 Proteins 0.000 description 5
- 108010092841 ribosomal protein S12 Proteins 0.000 description 5
- 102000004314 ribosomal protein S14 Human genes 0.000 description 5
- 108090000850 ribosomal protein S14 Proteins 0.000 description 5
- 108010088974 ribosomal protein S15a Proteins 0.000 description 5
- 108090000904 ribosomal protein S2 Proteins 0.000 description 5
- 108010092942 ribosomal protein S20 Proteins 0.000 description 5
- 108010033804 ribosomal protein S3 Proteins 0.000 description 5
- 108010033786 ribosomal protein S4 Proteins 0.000 description 5
- 108010033405 ribosomal protein S7 Proteins 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 200000000019 wound Diseases 0.000 description 5
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 4
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 4
- 101710027066 ALB Proteins 0.000 description 4
- 102100001249 ALB Human genes 0.000 description 4
- 206010000599 Acromegaly Diseases 0.000 description 4
- 208000008787 Cardiovascular Disease Diseases 0.000 description 4
- 206010010356 Congenital anomaly Diseases 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- 241000709661 Enterovirus Species 0.000 description 4
- 102100006624 F9 Human genes 0.000 description 4
- 102000033231 FAU Human genes 0.000 description 4
- 101700086334 FAU Proteins 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 102100002631 HBA1 Human genes 0.000 description 4
- 230000036499 Half live Effects 0.000 description 4
- 229940088597 Hormone Drugs 0.000 description 4
- 102100008356 IDS Human genes 0.000 description 4
- UGQMRVRMYYASKQ-KMPDEGCQSA-N Inosine Natural products O[C@H]1[C@H](O)[C@@H](CO)O[C@@H]1N1C(N=CNC2=O)=C2N=C1 UGQMRVRMYYASKQ-KMPDEGCQSA-N 0.000 description 4
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 4
- 102000004218 Insulin-like growth factor I Human genes 0.000 description 4
- 108090000723 Insulin-like growth factor I Proteins 0.000 description 4
- 208000002551 Irritable Bowel Syndrome Diseases 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- 206010053643 Neurodegenerative disease Diseases 0.000 description 4
- 101710013761 RPL10A Proteins 0.000 description 4
- 102100014171 RPL10A Human genes 0.000 description 4
- 102100004947 RPL10L Human genes 0.000 description 4
- 101710038017 RPL10L Proteins 0.000 description 4
- 102100013620 RPL19 Human genes 0.000 description 4
- 101710004264 RPL19 Proteins 0.000 description 4
- 102100002384 RPL21 Human genes 0.000 description 4
- 102100003959 RPL22L1 Human genes 0.000 description 4
- 101710039243 RPL22L1 Proteins 0.000 description 4
- 102100002442 RPL24 Human genes 0.000 description 4
- 102100006779 RPL28 Human genes 0.000 description 4
- 102100019387 RPL29 Human genes 0.000 description 4
- 102100016918 RPL30 Human genes 0.000 description 4
- 102100017215 RPL31 Human genes 0.000 description 4
- 102100011235 RPL34 Human genes 0.000 description 4
- 102100008330 RPL37 Human genes 0.000 description 4
- 101710005286 RPL37 Proteins 0.000 description 4
- 102100001321 RPL39L Human genes 0.000 description 4
- 101710037252 RPL39L Proteins 0.000 description 4
- 102100016145 RPL39P5 Human genes 0.000 description 4
- 101710013784 RPL39P5 Proteins 0.000 description 4
- 102100014644 RPL41 Human genes 0.000 description 4
- 101710005428 RPL41 Proteins 0.000 description 4
- 101710005414 RPLP1 Proteins 0.000 description 4
- 102100008018 RPS10P5 Human genes 0.000 description 4
- 101710006653 RPS10P5 Proteins 0.000 description 4
- 102100011243 RPS27L Human genes 0.000 description 4
- 101710007892 RPS27L Proteins 0.000 description 4
- 102100011879 RPS4Y1 Human genes 0.000 description 4
- 101710022985 RPS4Y1 Proteins 0.000 description 4
- 241000725643 Respiratory syncytial virus Species 0.000 description 4
- 108050009586 Ribosomal protein L28 Proteins 0.000 description 4
- 108090000180 Ribosomal protein L31 Proteins 0.000 description 4
- 102000017528 Ribosomal protein L35 Human genes 0.000 description 4
- 108050005789 Ribosomal protein L35 Proteins 0.000 description 4
- QORWJWZARLRLPR-UHFFFAOYSA-H Tricalcium phosphate Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 4
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 4
- 108010001801 Tumor Necrosis Factor-alpha Proteins 0.000 description 4
- 208000001072 Type 2 Diabetes Mellitus Diseases 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 125000002015 acyclic group Chemical group 0.000 description 4
- 150000003838 adenosines Chemical class 0.000 description 4
- 229940050528 albumin Drugs 0.000 description 4
- 108010053584 alpha-Globins Proteins 0.000 description 4
- 230000000890 antigenic Effects 0.000 description 4
- 230000002238 attenuated Effects 0.000 description 4
- 230000001580 bacterial Effects 0.000 description 4
- UIIMBOGNXHQVGW-UHFFFAOYSA-M buffer Substances [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 4
- 239000001506 calcium phosphate Substances 0.000 description 4
- 229910000389 calcium phosphate Inorganic materials 0.000 description 4
- 235000011010 calcium phosphates Nutrition 0.000 description 4
- 238000001804 debridement Methods 0.000 description 4
- 230000002708 enhancing Effects 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- 210000002865 immune cell Anatomy 0.000 description 4
- 229960003786 inosine Drugs 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 239000002609 media Substances 0.000 description 4
- 239000002105 nanoparticle Substances 0.000 description 4
- 125000004430 oxygen atoms Chemical group O* 0.000 description 4
- 235000021317 phosphate Nutrition 0.000 description 4
- 201000004681 psoriasis Diseases 0.000 description 4
- 108010062505 ribosomal protein 3 Proteins 0.000 description 4
- 108090000327 ribosomal protein L21 Proteins 0.000 description 4
- 108010025463 ribosomal protein L24 Proteins 0.000 description 4
- 108010025498 ribosomal protein L29 Proteins 0.000 description 4
- 108010025327 ribosomal protein L30 Proteins 0.000 description 4
- 108010025396 ribosomal protein L34 Proteins 0.000 description 4
- 102000004093 ribosomal protein S15 Human genes 0.000 description 4
- 108090000530 ribosomal protein S15 Proteins 0.000 description 4
- 108010011179 ribosomal protein S27a Proteins 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000011105 stabilization Methods 0.000 description 4
- 230000005026 transcription initiation Effects 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 3
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1H-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 description 3
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1H-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 3
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 3
- RYYIULNRIVUMTQ-UHFFFAOYSA-N 6-chloroguanine Chemical compound NC1=NC(Cl)=C2N=CNC2=N1 RYYIULNRIVUMTQ-UHFFFAOYSA-N 0.000 description 3
- 206010000891 Acute myocardial infarction Diseases 0.000 description 3
- 229960000643 Adenine Drugs 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Natural products NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 229940024546 Aluminum Hydroxide Gel Drugs 0.000 description 3
- 208000007502 Anemia Diseases 0.000 description 3
- 206010002556 Ankylosing spondylitis Diseases 0.000 description 3
- 229960005348 Antithrombin III Drugs 0.000 description 3
- 102000004411 Antithrombin-III Human genes 0.000 description 3
- 108090000935 Antithrombin-III Proteins 0.000 description 3
- 241000180579 Arca Species 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 102100007326 BIRC5 Human genes 0.000 description 3
- 210000004369 Blood Anatomy 0.000 description 3
- 210000001772 Blood Platelets Anatomy 0.000 description 3
- 210000000988 Bone and Bones Anatomy 0.000 description 3
- 102100006400 CSF2 Human genes 0.000 description 3
- 206010007554 Cardiac failure Diseases 0.000 description 3
- 206010008631 Cholera Diseases 0.000 description 3
- 208000009863 Chronic Kidney Failure Diseases 0.000 description 3
- 229920002676 Complementary DNA Polymers 0.000 description 3
- 229920002307 Dextran Polymers 0.000 description 3
- ZPTBLXKRQACLCR-XVFCMESISA-N Dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 3
- REZZEXDLIUJMMS-UHFFFAOYSA-M Dimethyldioctadecylammonium chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CCCCCCCCCCCCCCCCCC REZZEXDLIUJMMS-UHFFFAOYSA-M 0.000 description 3
- 206010014698 Endocrine disease Diseases 0.000 description 3
- 101710003421 FGF Proteins 0.000 description 3
- 102100015617 FGF17 Human genes 0.000 description 3
- 102100008453 FOLH1 Human genes 0.000 description 3
- 101700036477 FOLH1 Proteins 0.000 description 3
- 206010016165 Failure to thrive Diseases 0.000 description 3
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 3
- 206010019280 Heart failure Diseases 0.000 description 3
- 208000007363 Insulin-Like Growth Factor I Deficiency Diseases 0.000 description 3
- 102000000589 Interleukin-1 Human genes 0.000 description 3
- 108010002352 Interleukin-1 Proteins 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 101700052761 MUC1 Proteins 0.000 description 3
- 208000000690 Mucopolysaccharidosis VI Diseases 0.000 description 3
- 108010027520 N-Acetylgalactosamine-4-Sulfatase Proteins 0.000 description 3
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N6-Methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 3
- 108010038807 Oligopeptides Proteins 0.000 description 3
- 102000015636 Oligopeptides Human genes 0.000 description 3
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 3
- 241000288906 Primates Species 0.000 description 3
- 208000010378 Pulmonary Embolism Diseases 0.000 description 3
- 101710037056 RPL26L1 Proteins 0.000 description 3
- 102100012928 RPL26L1 Human genes 0.000 description 3
- 101710037057 RPL27A Proteins 0.000 description 3
- 102100019291 RPL27A Human genes 0.000 description 3
- 101710005311 RPL3L Proteins 0.000 description 3
- 102100018308 RPL3L Human genes 0.000 description 3
- 102100005441 RPL7L1 Human genes 0.000 description 3
- 101710005332 RPL7L1 Proteins 0.000 description 3
- 102100013488 RPS26P11 Human genes 0.000 description 3
- 101710007973 RPS26P11 Proteins 0.000 description 3
- 206010038444 Renal failure chronic Diseases 0.000 description 3
- 206010039491 Sarcoma Diseases 0.000 description 3
- 108010002687 Survivin Proteins 0.000 description 3
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N Tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 3
- 102000036902 Thrombopoietin Human genes 0.000 description 3
- 108010041111 Thrombopoietin Proteins 0.000 description 3
- 229940104230 Thymidine Drugs 0.000 description 3
- 102000016715 Transforming Growth Factor beta Receptors Human genes 0.000 description 3
- 102400000757 Ubiquitin Human genes 0.000 description 3
- 108090000848 Ubiquitin Proteins 0.000 description 3
- 102100015249 VEGFA Human genes 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- 125000000217 alkyl group Chemical group 0.000 description 3
- 229940037003 alum Drugs 0.000 description 3
- 230000000692 anti-sense Effects 0.000 description 3
- 230000030741 antigen processing and presentation Effects 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 125000004432 carbon atoms Chemical group C* 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 3
- 230000001684 chronic Effects 0.000 description 3
- 239000000412 dendrimer Substances 0.000 description 3
- 229920000736 dendritic polymer Polymers 0.000 description 3
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 230000028996 humoral immune response Effects 0.000 description 3
- 230000004727 humoral immunity Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 201000002273 mucopolysaccharidosis II Diseases 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 210000000056 organs Anatomy 0.000 description 3
- 230000001575 pathological Effects 0.000 description 3
- 229920000962 poly(amidoamine) Polymers 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000035755 proliferation Effects 0.000 description 3
- 230000002633 protecting Effects 0.000 description 3
- 229940096913 pseudoisocytidine Drugs 0.000 description 3
- 230000002829 reduced Effects 0.000 description 3
- 108010025325 ribosomal protein L32 Proteins 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 210000001082 somatic cell Anatomy 0.000 description 3
- 201000010874 syndrome Diseases 0.000 description 3
- HMLGSIZOMSVISS-ONJSNURVSA-N (7R)-7-[[(2Z)-2-(2-amino-1,3-thiazol-4-yl)-2-(2,2-dimethylpropanoyloxymethoxyimino)acetyl]amino]-3-ethenyl-8-oxo-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylic acid Chemical compound N([C@@H]1C(N2C(=C(C=C)CSC21)C(O)=O)=O)C(=O)\C(=N/OCOC(=O)C(C)(C)C)C1=CSC(N)=N1 HMLGSIZOMSVISS-ONJSNURVSA-N 0.000 description 2
- CITHEXJVPOWHKC-UUWRZZSWSA-N 1,2-di-O-myristoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCC CITHEXJVPOWHKC-UUWRZZSWSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-hydroxypyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 2
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 2
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 2,6-Diaminopurine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 2
- MPCAJMNYNOGXPB-UHFFFAOYSA-N 2-(hydroxymethyl)oxane-3,4,5-triol Chemical class OCC1OCC(O)C(O)C1O MPCAJMNYNOGXPB-UHFFFAOYSA-N 0.000 description 2
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 2
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- DWRXFEITVBNRMK-JXOAFFINSA-N 5-Methyluridine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 2
- OZQDLJNDRVBCST-SHUUEZRQSA-N 5-amino-2-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,2,4-triazin-3-one Chemical compound O=C1N=C(N)C=NN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZQDLJNDRVBCST-SHUUEZRQSA-N 0.000 description 2
- XYVLZAYJHCECPN-UHFFFAOYSA-L 6-aminohexyl phosphate Chemical compound NCCCCCCOP([O-])([O-])=O XYVLZAYJHCECPN-UHFFFAOYSA-L 0.000 description 2
- WYXSYVWAUAUWLD-SHUUEZRQSA-N 6-azauridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=N1 WYXSYVWAUAUWLD-SHUUEZRQSA-N 0.000 description 2
- ZKBQDFAWXLTYKS-UHFFFAOYSA-N 6-chloro-7H-purine Chemical compound ClC1=NC=NC2=C1NC=N2 ZKBQDFAWXLTYKS-UHFFFAOYSA-N 0.000 description 2
- 108050002744 60S acidic ribosomal protein P0 Proteins 0.000 description 2
- 102000012162 60S acidic ribosomal protein P0 Human genes 0.000 description 2
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-Methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 2
- 102100015004 ARSA Human genes 0.000 description 2
- 101700084127 AVP Proteins 0.000 description 2
- 102100017238 AVP Human genes 0.000 description 2
- 206010000060 Abdominal distension Diseases 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N Adenosine monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 2
- 239000000275 Adrenocorticotropic Hormone Substances 0.000 description 2
- 208000000103 Anorexia Nervosa Diseases 0.000 description 2
- 108010003596 Antennapedia Homeodomain Protein Proteins 0.000 description 2
- 102000006306 Antigen Receptors Human genes 0.000 description 2
- 108010083359 Antigen Receptors Proteins 0.000 description 2
- 210000000612 Antigen-Presenting Cells Anatomy 0.000 description 2
- 229960001230 Asparagine Drugs 0.000 description 2
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 2
- 101800001866 Atrial natriuretic peptide Proteins 0.000 description 2
- 102400001289 Atrial natriuretic peptide Human genes 0.000 description 2
- 241000589968 Borrelia Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 229940077737 Brain-Derived Neurotrophic Factor Drugs 0.000 description 2
- 108090000715 Brain-Derived Neurotrophic Factor Proteins 0.000 description 2
- 102000004219 Brain-Derived Neurotrophic Factor Human genes 0.000 description 2
- 102100008990 CASP8 Human genes 0.000 description 2
- 101700075287 CASP8 Proteins 0.000 description 2
- 102100016493 CD33 Human genes 0.000 description 2
- 101700017647 CD33 Proteins 0.000 description 2
- 102100010237 CLN6 Human genes 0.000 description 2
- 101700052332 CLN6 Proteins 0.000 description 2
- 102100005176 CSF1 Human genes 0.000 description 2
- 102100001891 CTAG1A Human genes 0.000 description 2
- 101710004449 CTAG1A Proteins 0.000 description 2
- 229960004015 Calcitonin Drugs 0.000 description 2
- 102400000113 Calcitonin Human genes 0.000 description 2
- 108060001064 Calcitonin Proteins 0.000 description 2
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 2
- 102000019679 Cell-Penetrating Peptides Human genes 0.000 description 2
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 2
- 229920001661 Chitosan Polymers 0.000 description 2
- 229940038705 Chlamydia trachomatis Drugs 0.000 description 2
- 241000606153 Chlamydia trachomatis Species 0.000 description 2
- 229940038704 Clostridium perfringens Drugs 0.000 description 2
- 241000193468 Clostridium perfringens Species 0.000 description 2
- 206010011401 Crohn's disease Diseases 0.000 description 2
- FMGSKLZLMKYGDP-USOAJAOKSA-N Dehydroepiandrosterone Chemical compound C1[C@@H](O)CC[C@]2(C)[C@H]3CC[C@](C)(C(CC4)=O)[C@@H]4[C@@H]3CC=C21 FMGSKLZLMKYGDP-USOAJAOKSA-N 0.000 description 2
- 241000710829 Dengue virus group Species 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N Deoxyribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- 206010056340 Diabetic ulcer Diseases 0.000 description 2
- 101700033006 EGF Proteins 0.000 description 2
- 102100010813 EGF Human genes 0.000 description 2
- 229940110715 ENZYMES FOR TREATMENT OF WOUNDS AND ULCERS Drugs 0.000 description 2
- 101700008821 EXO Proteins 0.000 description 2
- 101700083023 EXRN Proteins 0.000 description 2
- 241001115402 Ebolavirus Species 0.000 description 2
- 208000005189 Embolism Diseases 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 241001529459 Enterovirus A71 Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 229940093738 Enzymes for ALIMENTARY TRACT AND METABOLISM Drugs 0.000 description 2
- 229940116977 Epidermal Growth Factor Drugs 0.000 description 2
- 102100000368 F8 Human genes 0.000 description 2
- 101700070229 F8 Proteins 0.000 description 2
- 101700074227 F9 Proteins 0.000 description 2
- 101700000156 FGF17 Proteins 0.000 description 2
- 102100008645 FGF3 Human genes 0.000 description 2
- 101700010264 FGF5 Proteins 0.000 description 2
- 102100007408 FGF5 Human genes 0.000 description 2
- 101700012851 FGF6 Proteins 0.000 description 2
- 102100007407 FGF6 Human genes 0.000 description 2
- 102100007405 FGF7 Human genes 0.000 description 2
- 101700033323 FGF7 Proteins 0.000 description 2
- 201000005603 Fabry disease Diseases 0.000 description 2
- 108010076282 Factor IX Proteins 0.000 description 2
- 229960000301 Factor VIII Drugs 0.000 description 2
- 102000001690 Factor VIII Human genes 0.000 description 2
- 108010054218 Factor VIII Proteins 0.000 description 2
- 102100008255 GAA Human genes 0.000 description 2
- 101710010383 GAA Proteins 0.000 description 2
- 101700010630 GHRL Proteins 0.000 description 2
- 208000007345 Glycogen Storage Disease Diseases 0.000 description 2
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 2
- 108010084340 Gonadotropin-Releasing Hormone Proteins 0.000 description 2
- 102100016400 HBEGF Human genes 0.000 description 2
- 101700029736 HBEGF Proteins 0.000 description 2
- 102100016996 HHAT Human genes 0.000 description 2
- 108060004720 HHAT Proteins 0.000 description 2
- 102100003420 HMMR Human genes 0.000 description 2
- 206010018987 Haemorrhage Diseases 0.000 description 2
- 208000009292 Hemophilia A Diseases 0.000 description 2
- 208000009429 Hemophilia B Diseases 0.000 description 2
- 241000711549 Hepacivirus C Species 0.000 description 2
- 206010062506 Heparin-induced thrombocytopenia Diseases 0.000 description 2
- 241000700721 Hepatitis B virus Species 0.000 description 2
- 208000009889 Herpes Simplex Diseases 0.000 description 2
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 2
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 2
- 241000701041 Human betaherpesvirus 7 Species 0.000 description 2
- 241000046923 Human bocavirus Species 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- 241000701027 Human herpesvirus 6 Species 0.000 description 2
- 102100015972 IL2 Human genes 0.000 description 2
- 102100014204 IL22 Human genes 0.000 description 2
- 102100014193 IL7 Human genes 0.000 description 2
- 101710004181 INTS2 Proteins 0.000 description 2
- DOUYETYNHWVLEO-UHFFFAOYSA-N Imiquimod Chemical compound C1=CC=CC2=C3N(CC(C)C)C=NC3=C(N)N=C21 DOUYETYNHWVLEO-UHFFFAOYSA-N 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 108010065805 Interleukin-12 Proteins 0.000 description 2
- 102000013462 Interleukin-12 Human genes 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 108010002616 Interleukin-5 Proteins 0.000 description 2
- 108010002586 Interleukin-7 Proteins 0.000 description 2
- 229920002459 Intron Polymers 0.000 description 2
- 108020004391 Introns Proteins 0.000 description 2
- 102100013180 KDR Human genes 0.000 description 2
- 101700058542 KLK3 Proteins 0.000 description 2
- 208000001083 Kidney Disease Diseases 0.000 description 2
- 108091007520 L ribosomal proteins Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 102100018587 LPGAT1 Human genes 0.000 description 2
- 101710025361 LPGAT1 Proteins 0.000 description 2
- 206010024324 Leukaemias Diseases 0.000 description 2
- 210000000265 Leukocytes Anatomy 0.000 description 2
- 210000002751 Lymph Anatomy 0.000 description 2
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 description 2
- 210000003563 Lymphoid Tissue Anatomy 0.000 description 2
- 102100009695 MAGEC1 Human genes 0.000 description 2
- 101710027723 MAGEC1 Proteins 0.000 description 2
- 102100009692 MAGEC2 Human genes 0.000 description 2
- 101710027725 MAGEC2 Proteins 0.000 description 2
- 102100008857 MLANA Human genes 0.000 description 2
- 102100002396 MRPS30 Human genes 0.000 description 2
- 102100006037 MUC1 Human genes 0.000 description 2
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 240000003121 Marrubium vulgare Species 0.000 description 2
- 206010061289 Metastatic neoplasm Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000700560 Molluscum contagiosum virus Species 0.000 description 2
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 description 2
- 208000005340 Mucopolysaccharidosis III Diseases 0.000 description 2
- 229940010383 Mycobacterium tuberculosis Drugs 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 2
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 description 2
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 2
- PIJXCSUPSNFXNE-QRZOAFCBSA-N N-acetyl-4-(N-acetylglucosaminyl)muramoyl-L-alanyl-D-isoglutamine Chemical compound OC(=O)CC[C@H](C(N)=O)NC(=O)[C@H](C)NC(=O)[C@@H](C)O[C@@H]1[C@@H](NC(C)=O)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O)[C@@H](CO)O1 PIJXCSUPSNFXNE-QRZOAFCBSA-N 0.000 description 2
- 102000018942 N-acetylgalactosamine-4-sulfatase activity proteins Human genes 0.000 description 2
- 102100009139 NGF Human genes 0.000 description 2
- 102100002997 NPEPPS Human genes 0.000 description 2
- 101710027788 NPEPPS Proteins 0.000 description 2
- 102100016138 NTF4 Human genes 0.000 description 2
- 108010025020 Nerve Growth Factor Proteins 0.000 description 2
- 208000002537 Neuronal Ceroid-Lipofuscinosis Diseases 0.000 description 2
- 229940032018 Neurotrophin 3 Drugs 0.000 description 2
- 108090000742 Neurotrophin-3 Proteins 0.000 description 2
- 102000004230 Neurotrophin-3 Human genes 0.000 description 2
- 210000004940 Nucleus Anatomy 0.000 description 2
- 102100014581 PAPOLG Human genes 0.000 description 2
- 101710021134 PAPOLG Proteins 0.000 description 2
- 102100007816 PDGFC Human genes 0.000 description 2
- 108060006375 POMC Proteins 0.000 description 2
- 102100008873 POMC Human genes 0.000 description 2
- 102100020223 PRH1 Human genes 0.000 description 2
- 101710025567 PSAT1 Proteins 0.000 description 2
- 102100017963 PSCA Human genes 0.000 description 2
- 101700038464 PSCA Proteins 0.000 description 2
- 101700008337 PSMA Proteins 0.000 description 2
- 101710045166 PSRP1 Proteins 0.000 description 2
- 102100004173 PXDN Human genes 0.000 description 2
- 101700032218 PXDN Proteins 0.000 description 2
- 102000035443 Peptidases Human genes 0.000 description 2
- 108091005771 Peptidases Proteins 0.000 description 2
- 229920001212 Poly(beta amino esters) Polymers 0.000 description 2
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 2
- 229940097325 Prolactin Drugs 0.000 description 2
- 102000003946 Prolactin Human genes 0.000 description 2
- 108010057464 Prolactin Proteins 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 229960000856 Protein C Drugs 0.000 description 2
- 208000008425 Protein Deficiency Diseases 0.000 description 2
- 101000427221 RPL36AL Proteins 0.000 description 2
- 241000711798 Rabies lyssavirus Species 0.000 description 2
- 108010033725 Recombinant Proteins Proteins 0.000 description 2
- 102000007312 Recombinant Proteins Human genes 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 102100006460 STEAP1 Human genes 0.000 description 2
- 101710009474 STEAP1 Proteins 0.000 description 2
- 102100002942 SYCP1 Human genes 0.000 description 2
- 101700084525 SYCP1 Proteins 0.000 description 2
- 229920000972 Sense strand Polymers 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 206010040943 Skin ulcer Diseases 0.000 description 2
- ATHGHQPFGPMSJY-UHFFFAOYSA-N Spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 2
- PFNFFQXMRSDOHW-UHFFFAOYSA-N Spermine Chemical compound NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 2
- YYGNTYWPHWGJRM-RUSDCZJESA-N Squalene Natural products C(=C\CC/C(=C\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)(\CC/C=C(\C)/C)/C YYGNTYWPHWGJRM-RUSDCZJESA-N 0.000 description 2
- 101700043169 Synb Proteins 0.000 description 2
- 230000024932 T cell mediated immunity Effects 0.000 description 2
- 108091008153 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- 210000000400 T-Lymphocytes, Cytotoxic Anatomy 0.000 description 2
- 108010028305 TEL-AML1 fusion protein Proteins 0.000 description 2
- 102100014320 TGFB1 Human genes 0.000 description 2
- 102100002617 TLR1 Human genes 0.000 description 2
- 101700068316 TLR1 Proteins 0.000 description 2
- 101700053398 TLR10 Proteins 0.000 description 2
- 102100011746 TLR10 Human genes 0.000 description 2
- 102100012096 TLR2 Human genes 0.000 description 2
- 101700064022 TLR2 Proteins 0.000 description 2
- 102100012088 TLR3 Human genes 0.000 description 2
- 101700023131 TLR3 Proteins 0.000 description 2
- 102100012087 TLR4 Human genes 0.000 description 2
- 101700022711 TLR4 Proteins 0.000 description 2
- 102100006352 TLR5 Human genes 0.000 description 2
- 101700025666 TLR5 Proteins 0.000 description 2
- 102100006353 TLR6 Human genes 0.000 description 2
- 101700030074 TLR6 Proteins 0.000 description 2
- 102100006355 TLR7 Human genes 0.000 description 2
- 101700075266 TLR7 Proteins 0.000 description 2
- 102100006354 TLR8 Human genes 0.000 description 2
- 101700071772 TLR8 Proteins 0.000 description 2
- 102100016391 TLR9 Human genes 0.000 description 2
- 102100009581 TPBG Human genes 0.000 description 2
- 101700065141 TPBG Proteins 0.000 description 2
- 210000000447 Th1 Cells Anatomy 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N Thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 241000710771 Tick-borne encephalitis virus Species 0.000 description 2
- 108010060818 Toll-Like Receptor 9 Proteins 0.000 description 2
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 2
- 108010092867 Transforming Growth Factor beta Receptors Proteins 0.000 description 2
- HDZZVAMISRMYHH-LITAXDCLSA-N Tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO)[C@H](O)[C@H]1O HDZZVAMISRMYHH-LITAXDCLSA-N 0.000 description 2
- 108009000112 Type II diabetes mellitus Proteins 0.000 description 2
- 108020003635 Untranslated Regions Proteins 0.000 description 2
- 229920000146 Untranslated region Polymers 0.000 description 2
- DRTQHJPVMGBUCF-UCVXFZOQSA-N Uridine Natural products O[C@H]1[C@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UCVXFZOQSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 229940045145 Uridine Drugs 0.000 description 2
- 208000000558 Varicose Ulcer Diseases 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 241000710772 Yellow fever virus Species 0.000 description 2
- JMUHBNWAORSSBD-WKYWBUFDSA-N [(2R)-3-[2-[[(2S)-2-[[(4R)-4-[[(2S)-2-[[(2R)-2-[(3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxypropanoyl]amino]propanoyl]amino]-5-amino-5-oxopentanoyl]amino]propanoyl]amino]ethoxy-hydroxyphosphoryl]oxy-2-hexadecanoyloxypropyl] hexad Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@@H](OC(=O)CCCCCCCCCCCCCCC)COP(O)(=O)OCCNC(=O)[C@H](C)NC(=O)CC[C@H](C(N)=O)NC(=O)[C@H](C)NC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)OC(O)[C@@H]1NC(C)=O JMUHBNWAORSSBD-WKYWBUFDSA-N 0.000 description 2
- JCAQMQLAHNGVPY-UUOKFMHZSA-N [(2R,3S,4R,5R)-3,4-dihydroxy-5-(2,2,4-trioxo-1H-imidazo[4,5-c][1,2,6]thiadiazin-7-yl)oxolan-2-yl]methyl dihydrogen phosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NS(=O)(=O)NC2=O)=C2N=C1 JCAQMQLAHNGVPY-UUOKFMHZSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K [O-]P([O-])([O-])=O Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- DBFUQOZREOHGAV-UAKXSSHOSA-N [[(2R,3S,4R,5R)-5-(4-amino-5-bromo-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=C(Br)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 DBFUQOZREOHGAV-UAKXSSHOSA-N 0.000 description 2
- YIJVOACVHQZMKI-JXOAFFINSA-N [[(2R,3S,4R,5R)-5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 YIJVOACVHQZMKI-JXOAFFINSA-N 0.000 description 2
- VEWJOCYCKIZKKV-BLOUUBGSSA-N [[(2R,5S)-5-(2,4-dioxo-1H-pyrimidin-5-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1C1=CNC(=O)NC1=O VEWJOCYCKIZKKV-BLOUUBGSSA-N 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 201000005510 acute lymphocytic leukemia Diseases 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- 125000003545 alkoxy group Chemical group 0.000 description 2
- 125000003282 alkyl amino group Chemical group 0.000 description 2
- 229960004238 anakinra Drugs 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940019336 antithrombotic Enzymes Drugs 0.000 description 2
- KBZOIRJILGZLEJ-LGYYRGKSSA-N argipressin Chemical compound C([C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@@H](C(N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)=O)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(N)=O)C1=CC=CC=C1 KBZOIRJILGZLEJ-LGYYRGKSSA-N 0.000 description 2
- 125000001769 aryl amino group Chemical group 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 230000001588 bifunctional Effects 0.000 description 2
- 229920001400 block copolymer Polymers 0.000 description 2
- CPELXLSAUQHCOX-UHFFFAOYSA-M bromide Chemical compound [Br-] CPELXLSAUQHCOX-UHFFFAOYSA-M 0.000 description 2
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 2
- 125000002837 carbocyclic group Chemical group 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-M chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 2
- 201000000522 chronic kidney disease Diseases 0.000 description 2
- 230000024203 complement activation Effects 0.000 description 2
- IDLFZVILOHSSID-OVLDLUHVSA-N corticotropin Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](N)CO)C1=CC=C(O)C=C1 IDLFZVILOHSSID-OVLDLUHVSA-N 0.000 description 2
- 210000004748 cultured cells Anatomy 0.000 description 2
- 230000001186 cumulative Effects 0.000 description 2
- 201000003883 cystic fibrosis Diseases 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 230000001086 cytosolic Effects 0.000 description 2
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 125000004663 dialkyl amino group Chemical group 0.000 description 2
- 125000004986 diarylamino group Chemical group 0.000 description 2
- 125000005240 diheteroarylamino group Chemical group 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- BPHQZTVXXXJVHI-UHFFFAOYSA-N dimyristoyl phosphatidylglycerol Chemical compound CCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCC(O)CO)OC(=O)CCCCCCCCCCCCC BPHQZTVXXXJVHI-UHFFFAOYSA-N 0.000 description 2
- 229960003724 dimyristoylphosphatidylcholine Drugs 0.000 description 2
- 229960005160 dimyristoylphosphatidylglycerol Drugs 0.000 description 2
- 229940079593 drugs Drugs 0.000 description 2
- 210000003162 effector T lymphocyte Anatomy 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 201000000523 end stage renal failure Diseases 0.000 description 2
- 229960004222 factor IX Drugs 0.000 description 2
- 201000003542 factor VIII deficiency Diseases 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 229960005390 galsulfase Drugs 0.000 description 2
- 108010089296 galsulfase Proteins 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 150000004676 glycans Polymers 0.000 description 2
- 125000003976 glyceryl group Chemical group [H]C([*])([H])C(O[H])([H])C(O[H])([H])[H] 0.000 description 2
- 125000000267 glycino group Chemical group [H]N([*])C([H])([H])C(=O)O[H] 0.000 description 2
- 201000004502 glycogen storage disease II Diseases 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 229940020899 hematological Enzymes Drugs 0.000 description 2
- 125000005241 heteroarylamino group Chemical group 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- PHNWGDTYCJFUGZ-UHFFFAOYSA-L hexyl phosphate Chemical compound CCCCCCOP([O-])([O-])=O PHNWGDTYCJFUGZ-UHFFFAOYSA-L 0.000 description 2
- 102000027796 human RPL36AL protein Human genes 0.000 description 2
- 125000004435 hydrogen atoms Chemical class [H]* 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 230000001976 improved Effects 0.000 description 2
- 230000002458 infectious Effects 0.000 description 2
- 200000000018 inflammatory disease Diseases 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002427 irreversible Effects 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000001394 metastastic Effects 0.000 description 2
- YACKEPLHDIMKIO-UHFFFAOYSA-L methylphosphonate(2-) Chemical group CP([O-])([O-])=O YACKEPLHDIMKIO-UHFFFAOYSA-L 0.000 description 2
- 229960005225 mifamurtide Drugs 0.000 description 2
- 108060005018 mobB Proteins 0.000 description 2
- 101700045377 mvp1 Proteins 0.000 description 2
- 230000001338 necrotic Effects 0.000 description 2
- 102000007638 nef Gene Products Human genes 0.000 description 2
- 108010007207 nef Gene Products Proteins 0.000 description 2
- 201000008051 neuronal ceroid lipofuscinosis Diseases 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 125000001820 oxy group Chemical group [*:1]O[*:2] 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 229960005489 paracetamol Drugs 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 108010027841 pegademase bovine Proteins 0.000 description 2
- 239000000546 pharmaceutic aid Substances 0.000 description 2
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical class NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 229920001983 poloxamer Polymers 0.000 description 2
- 229920001481 poly(stearyl methacrylate) Polymers 0.000 description 2
- 108040000983 polyphosphate:AMP phosphotransferase activity proteins Proteins 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Polymers 0.000 description 2
- 230000001124 posttranscriptional Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009712 regulation of translation Effects 0.000 description 2
- 230000001850 reproductive Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108010034467 ribosomal protein P0 Proteins 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 201000000980 schizophrenia Diseases 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 239000005451 thionucleotide Substances 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical class [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 230000017423 tissue regeneration Effects 0.000 description 2
- 108090000464 transcription factors Proteins 0.000 description 2
- 102000003995 transcription factors Human genes 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 230000001960 triggered Effects 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 229960003726 vasopressin Drugs 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 229940051021 yellow-fever virus Drugs 0.000 description 2
- CPCWCRHPTDMVFU-UHFFFAOYSA-N (2-hydroxy-4,5-dioctadecoxypentyl)-dimethylazanium;chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCCCCOCC(CC(O)C[NH+](C)C)OCCCCCCCCCCCCCCCCCC CPCWCRHPTDMVFU-UHFFFAOYSA-N 0.000 description 1
- JLWUWXCKSOIFPS-KQYNXXCUSA-N (2R,3R,4R,5R)-5-(2,6-diaminopurin-9-yl)-2-(hydroxymethyl)-4-methoxyoxolan-3-ol Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC(N)=NC(N)=C2N=C1 JLWUWXCKSOIFPS-KQYNXXCUSA-N 0.000 description 1
- ZGYYPTJWJBEXBC-QYYRPYCUSA-N (2R,3R,4R,5R)-5-(6-aminopurin-9-yl)-4-fluoro-2-(hydroxymethyl)oxolan-3-ol Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1F ZGYYPTJWJBEXBC-QYYRPYCUSA-N 0.000 description 1
- BIXYYZIIJIXVFW-UUOKFMHZSA-N (2R,3R,4S,5R)-2-(6-amino-2-chloropurin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O BIXYYZIIJIXVFW-UUOKFMHZSA-N 0.000 description 1
- KYJLJOJCMUFWDY-UUOKFMHZSA-N (2R,3R,4S,5R)-2-(6-amino-8-azidopurin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound [N-]=[N+]=NC1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O KYJLJOJCMUFWDY-UUOKFMHZSA-N 0.000 description 1
- CQKMBZHLOYVGHW-QYYRPYCUSA-N (2R,3S,4R,5R)-4-amino-5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-ol Chemical compound N[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(N)=C2N=C1 CQKMBZHLOYVGHW-QYYRPYCUSA-N 0.000 description 1
- IFVJLCHSLGMHEY-QYYRPYCUSA-N (2R,3S,4R,5R)-5-(6-aminopurin-9-yl)-4-azido-2-(hydroxymethyl)oxolan-3-ol Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1N=[N+]=[N-] IFVJLCHSLGMHEY-QYYRPYCUSA-N 0.000 description 1
- WMLBMYGMIFJTCS-HUROMRQRSA-N (2R,3S,5R)-2-[(9-phenylxanthen-9-yl)oxymethyl]-5-purin-9-yloxolan-3-ol Chemical compound C([C@H]1O[C@H](C[C@@H]1O)N1C2=NC=NC=C2N=C1)OC1(C2=CC=CC=C2OC2=CC=CC=C21)C1=CC=CC=C1 WMLBMYGMIFJTCS-HUROMRQRSA-N 0.000 description 1
- OPCHFPHZPIURNA-MFERNQICSA-N (2S)-2,5-bis(3-aminopropylamino)-N-[2-(dioctadecylamino)acetyl]pentanamide Chemical compound CCCCCCCCCCCCCCCCCCN(CC(=O)NC(=O)[C@H](CCCNCCCN)NCCCN)CCCCCCCCCCCCCCCCCC OPCHFPHZPIURNA-MFERNQICSA-N 0.000 description 1
- LIFNDDBLJFPEAN-BPSSIEEOSA-N (2S)-4-amino-2-[[(2S)-2-[[2-[[2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-oxopyrrolidine-2-carbonyl]amino]propanoyl]amino]hexanoyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@@H]1CCC(=O)N1 LIFNDDBLJFPEAN-BPSSIEEOSA-N 0.000 description 1
- MYUOTPIQBPUQQU-CKTDUXNWSA-N (2S,3R)-2-amino-N-[[9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-methylsulfanylpurin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C12=NC(SC)=NC(NC(=O)NC(=O)[C@@H](N)[C@@H](C)O)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MYUOTPIQBPUQQU-CKTDUXNWSA-N 0.000 description 1
- OPPXXSJNEJKHJA-CKTDUXNWSA-N (2S,3R)-2-amino-N-[[9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C1=NC=2C(NC(=O)NC(=O)[C@@H](N)[C@H](O)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OPPXXSJNEJKHJA-CKTDUXNWSA-N 0.000 description 1
- NKUHWWPUOXOIIR-CRCLSJGQSA-N (4R)-5-amino-4-[[(2S)-2-azaniumylpropanoyl]amino]-5-oxopentanoate Chemical compound C[C@H](N)C(=O)N[C@@H](C(N)=O)CCC(O)=O NKUHWWPUOXOIIR-CRCLSJGQSA-N 0.000 description 1
- DEQANNDTNATYII-OULOTJBUSA-N (4R,7S,10S,13R,16S,19R)-10-(4-aminobutyl)-19-[[(2R)-2-amino-3-phenylpropanoyl]amino]-16-benzyl-N-[(2R,3R)-1,3-dihydroxybutan-2-yl]-7-[(1R)-1-hydroxyethyl]-13-(1H-indol-3-ylmethyl)-6,9,12,15,18-pentaoxo-1,2-dithia-5,8,11,14,17-pentazacycloicosane-4-carboxa Chemical compound C([C@@H](N)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC=2C=CC=CC=2)NC1=O)C(=O)N[C@H](CO)[C@H](O)C)C1=CC=CC=C1 DEQANNDTNATYII-OULOTJBUSA-N 0.000 description 1
- SNKAWJBJQDLSFF-NVKMUCNASA-N 1,2-dioleoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC SNKAWJBJQDLSFF-NVKMUCNASA-N 0.000 description 1
- PIICEJLVQHRZGT-UHFFFAOYSA-N 1,2-ethanediamine Chemical compound NCCN PIICEJLVQHRZGT-UHFFFAOYSA-N 0.000 description 1
- GMRQFYUYWCNGIN-ZVUFCXRFSA-N 1,25-dihydroxy vitamin D3 Chemical compound C1([C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@@H](CCCC(C)(C)O)C)=CC=C1C[C@@H](O)C[C@H](O)C1=C GMRQFYUYWCNGIN-ZVUFCXRFSA-N 0.000 description 1
- GBBJCSTXCAQSSJ-JXOAFFINSA-N 1-[(2R,3R,4R,5R)-3-fluoro-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](F)[C@H](O)[C@@H](CO)O1 GBBJCSTXCAQSSJ-JXOAFFINSA-N 0.000 description 1
- UIYWFOZZIZEEKJ-XVFCMESISA-N 1-[(2R,3R,4R,5R)-3-fluoro-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound F[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 UIYWFOZZIZEEKJ-XVFCMESISA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N 1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(methylamino)pyrimidin-2-one Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- LLIPTMWIZVIUSX-XVFCMESISA-N 1-[(2R,3R,4S,5R)-3-amino-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound N[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 LLIPTMWIZVIUSX-XVFCMESISA-N 0.000 description 1
- MRUKYOQQKHNMFI-XVFCMESISA-N 1-[(2R,3R,4S,5R)-3-azido-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound [N-]=[N+]=N[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MRUKYOQQKHNMFI-XVFCMESISA-N 0.000 description 1
- YHRRPHCORALGKQ-FDDDBJFASA-N 2'-O-methyl-5-methyluridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(C)=C1 YHRRPHCORALGKQ-FDDDBJFASA-N 0.000 description 1
- HPHXOIULGYVAKW-IOSLPCCCSA-N 2'-O-methylinosine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 HPHXOIULGYVAKW-IOSLPCCCSA-N 0.000 description 1
- WGNUTGFETAXDTJ-OOJXKGFFSA-N 2'-O-methylpseudouridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O WGNUTGFETAXDTJ-OOJXKGFFSA-N 0.000 description 1
- LDGWQMRUWMSZIU-LQDDAWAPSA-M 2,3-bis[(Z)-octadec-9-enoxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)C)OCCCCCCCC\C=C/CCCCCCCC LDGWQMRUWMSZIU-LQDDAWAPSA-M 0.000 description 1
- KWVJHCQQUFDPLU-YEUCEMRASA-N 2,3-bis[[(Z)-octadec-9-enoyl]oxy]propyl-trimethylazanium Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KWVJHCQQUFDPLU-YEUCEMRASA-N 0.000 description 1
- WALUVDCNGPQPOD-UHFFFAOYSA-M 2,3-di(tetradecoxy)propyl-(2-hydroxyethyl)-dimethylazanium;bromide Chemical compound [Br-].CCCCCCCCCCCCCCOCC(C[N+](C)(C)CCO)OCCCCCCCCCCCCCC WALUVDCNGPQPOD-UHFFFAOYSA-M 0.000 description 1
- GVDKLYIMIVTKOA-UHFFFAOYSA-N 2-(2,3-dihexadecoxypropoxymethoxy)ethyl-trimethylazanium Chemical compound CCCCCCCCCCCCCCCCOCC(COCOCC[N+](C)(C)C)OCCCCCCCCCCCCCCCC GVDKLYIMIVTKOA-UHFFFAOYSA-N 0.000 description 1
- HLYBTPMYFWWNJN-UHFFFAOYSA-N 2-(2,4-dioxo-1H-pyrimidin-5-yl)-2-hydroxyacetic acid Chemical compound OC(=O)C(O)C1=CNC(=O)NC1=O HLYBTPMYFWWNJN-UHFFFAOYSA-N 0.000 description 1
- JVOJULURLCZUDE-UHFFFAOYSA-N 2-(2-aminopurin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C12=NC(N)=NC=C2N=CN1C1OC(CO)C(O)C1O JVOJULURLCZUDE-UHFFFAOYSA-N 0.000 description 1
- SGAKLDIYNFXTCK-UHFFFAOYSA-N 2-[(2,4-dioxo-1H-pyrimidin-5-yl)methylamino]acetic acid Chemical compound OC(=O)CNCC1=CNC(=O)NC1=O SGAKLDIYNFXTCK-UHFFFAOYSA-N 0.000 description 1
- SVBOROZXXYRWJL-UHFFFAOYSA-N 2-[(4-oxo-2-sulfanylidene-1H-pyrimidin-5-yl)methylamino]acetic acid Chemical compound OC(=O)CNCC1=CNC(=S)NC1=O SVBOROZXXYRWJL-UHFFFAOYSA-N 0.000 description 1
- LTHJXDSHSVNJKG-UHFFFAOYSA-N 2-[2-[2-[2-(2-methylprop-2-enoyloxy)ethoxy]ethoxy]ethoxy]ethyl 2-methylprop-2-enoate Chemical compound CC(=C)C(=O)OCCOCCOCCOCCOC(=O)C(C)=C LTHJXDSHSVNJKG-UHFFFAOYSA-N 0.000 description 1
- VJKJOPUEUOTEBX-TURQNECASA-N 2-[[1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-5-yl]methylamino]ethanesulfonic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCCS(O)(=O)=O)=C1 VJKJOPUEUOTEBX-TURQNECASA-N 0.000 description 1
- PFCLMNDDPTZJHQ-XLPZGREQSA-N 2-amino-7-[(2R,4S,5R)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-1H-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 PFCLMNDDPTZJHQ-XLPZGREQSA-N 0.000 description 1
- ASUCSHXLTWZYBA-UMMCILCDSA-N 2-amino-8-bromo-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3H-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=C(Br)N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ASUCSHXLTWZYBA-UMMCILCDSA-N 0.000 description 1
- UXUZARPLRQRNNX-DXTOWSMRSA-N 2-amino-9-[(2R,3R,4R,5R)-3-fluoro-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-3H-purin-6-one Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1F UXUZARPLRQRNNX-DXTOWSMRSA-N 0.000 description 1
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 description 1
- HPKQEMIXSLRGJU-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methyl-3H-purine-6,8-dione Chemical compound O=C1N(C)C(C(NC(N)=N2)=O)=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HPKQEMIXSLRGJU-UUOKFMHZSA-N 0.000 description 1
- VDCRFBBZFHHYGT-IOSLPCCCSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-prop-2-enyl-3H-purine-6,8-dione Chemical compound O=C1N(CC=C)C=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VDCRFBBZFHHYGT-IOSLPCCCSA-N 0.000 description 1
- ROPTVRLUGSPXNH-DXTOWSMRSA-N 2-amino-9-[(2R,3R,4S,5R)-3-amino-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-3H-purin-6-one Chemical compound N[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(N)=NC2=O)=C2N=C1 ROPTVRLUGSPXNH-DXTOWSMRSA-N 0.000 description 1
- PHGQZPFEHQOLJM-DXTOWSMRSA-N 2-amino-9-[(2R,3R,4S,5R)-3-azido-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-3H-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1N=[N+]=[N-] PHGQZPFEHQOLJM-DXTOWSMRSA-N 0.000 description 1
- BGTXMQUSDNMLDW-AEHJODJJSA-N 2-amino-9-[(2R,3S,4R,5R)-3-fluoro-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3H-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@]1(O)F BGTXMQUSDNMLDW-AEHJODJJSA-N 0.000 description 1
- PBFLIOAJBULBHI-JJNLEZRASA-N 2-amino-N-[[9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]acetamide Chemical compound C1=NC=2C(NC(=O)NC(=O)CN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PBFLIOAJBULBHI-JJNLEZRASA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- TUDKBZAMOFJOSO-UHFFFAOYSA-N 2-methoxy-7H-purin-6-amine Chemical compound COC1=NC(N)=C2NC=NC2=N1 TUDKBZAMOFJOSO-UHFFFAOYSA-N 0.000 description 1
- IQZWKGWOBPJWMX-IOSLPCCCSA-N 2-methyladenosine Chemical compound C12=NC(C)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IQZWKGWOBPJWMX-IOSLPCCCSA-N 0.000 description 1
- FXGXEFXCWDTSQK-UHFFFAOYSA-N 2-methylsulfanyl-7H-purin-6-amine Chemical compound CSC1=NC(N)=C2NC=NC2=N1 FXGXEFXCWDTSQK-UHFFFAOYSA-N 0.000 description 1
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N 289-95-2 Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K 2qpq Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N 3-Amino-1,4-dimethyl-5H-pyrido[4,3-b]indole Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- LKKMLIBUAXYLOY-UHFFFAOYSA-N 3-Amino-1-methyl-5H-pyrido[4,3-b]indole Chemical compound N1C2=CC=CC=C2C2=C1C=C(N)N=C2C LKKMLIBUAXYLOY-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 1
- MPOYBFYHRQBZPM-UHFFFAOYSA-N 3H-pyridin-4-one Chemical compound O=C1CC=NC=C1 MPOYBFYHRQBZPM-UHFFFAOYSA-N 0.000 description 1
- GJAKJCICANKRFD-UHFFFAOYSA-N 4-acetyl-4-amino-1,3-dihydropyrimidin-2-one Chemical compound CC(=O)C1(N)NC(=O)NC=C1 GJAKJCICANKRFD-UHFFFAOYSA-N 0.000 description 1
- NVZFZMCNALTPBY-XVFCMESISA-N 4-amino-1-[(2R,3R,4R,5R)-3-fluoro-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](F)[C@H](O)[C@@H](CO)O1 NVZFZMCNALTPBY-XVFCMESISA-N 0.000 description 1
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 4-amino-1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-(hydroxymethyl)pyrimidin-2-one Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- FECRKKQKJNKYNF-XVFCMESISA-N 4-amino-1-[(2R,3R,4S,5R)-3-amino-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound N[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(N)C=C1 FECRKKQKJNKYNF-XVFCMESISA-N 0.000 description 1
- FEOYKPQEERVCAV-XVFCMESISA-N 4-amino-1-[(2R,3R,4S,5R)-3-azido-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](N=[N+]=[N-])[C@H](O)[C@@H](CO)O1 FEOYKPQEERVCAV-XVFCMESISA-N 0.000 description 1
- XRZWVSXEDRYQGC-UHFFFAOYSA-N 4-cyclohexylpyrrolidin-1-ium-2-carboxylate Chemical compound C1NC(C(=O)O)CC1C1CCCCC1 XRZWVSXEDRYQGC-UHFFFAOYSA-N 0.000 description 1
- LZINOQJQXIEBNN-UHFFFAOYSA-N 4-hydroxybutyl dihydrogen phosphate Chemical compound OCCCCOP(O)(O)=O LZINOQJQXIEBNN-UHFFFAOYSA-N 0.000 description 1
- JHWGFJBTMHEZME-UHFFFAOYSA-N 4-prop-2-enoyloxybutyl prop-2-enoate Chemical compound C=CC(=O)OCCCCOC(=O)C=C JHWGFJBTMHEZME-UHFFFAOYSA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-Bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-Methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- RZCIEJXAILMSQK-JXOAFFINSA-N 5-Methyluridine triphosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 1
- XMIFBEZRFMTGRL-NHSUTOTLSA-N 5-Taurinomethyl-2-thiouridine Chemical compound OC1C(O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C(CNCCS(O)(=O)=O)=C1 XMIFBEZRFMTGRL-NHSUTOTLSA-N 0.000 description 1
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 description 1
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1H-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 1
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1H-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 1
- LQGKDMHENBFVRC-UHFFFAOYSA-N 5-aminopentan-1-ol Chemical compound NCCCCCO LQGKDMHENBFVRC-UHFFFAOYSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- YIZYCHKPHCPKHZ-PNHWDRBUSA-N 5-methoxycarbonylmethyluridine Chemical compound O=C1NC(=O)C(CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YIZYCHKPHCPKHZ-PNHWDRBUSA-N 0.000 description 1
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 1
- SNNBPMAXGYBMHM-JXOAFFINSA-N 5-methyl-2-thiouridine Chemical compound S=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 SNNBPMAXGYBMHM-JXOAFFINSA-N 0.000 description 1
- OGBMKVWORPGQRR-UMXFMPSGSA-N 52232-67-4 Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 description 1
- PNIUDKTTWRTUMX-MWKIOEHESA-N 6-amino-1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2H-pyrazolo[3,4-d]pyrimidin-4-one Chemical compound N1C=C2C(=O)N=C(N)N=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PNIUDKTTWRTUMX-MWKIOEHESA-N 0.000 description 1
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1H-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 1
- ZDRFDHHANOYUTE-IOSLPCCCSA-N 6-methylthioinosine Chemical compound C1=NC=2C(SC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDRFDHHANOYUTE-IOSLPCCCSA-N 0.000 description 1
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 1
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 description 1
- SYPRQIWERSQQNL-KQYNXXCUSA-O 7-methylxanthosine Chemical compound C1=2NC(=O)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SYPRQIWERSQQNL-KQYNXXCUSA-O 0.000 description 1
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7H-pyrrolo[2,3-d]pyrimidin-4-amine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 1
- OAUKGFJQZRGECT-UUOKFMHZSA-N 8-Azaadenosine Chemical compound N1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OAUKGFJQZRGECT-UUOKFMHZSA-N 0.000 description 1
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3H-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 description 1
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3H-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 description 1
- 102100004948 ABCD1 Human genes 0.000 description 1
- 101700067361 ACAP1 Proteins 0.000 description 1
- 102100017481 ACTN4 Human genes 0.000 description 1
- 101700014681 ACTN4 Proteins 0.000 description 1
- 108060005293 AGA Proteins 0.000 description 1
- 229940035674 ANESTHETICS Drugs 0.000 description 1
- 101710040001 ANG Proteins 0.000 description 1
- 102100007742 ANGPT1 Human genes 0.000 description 1
- 101710043860 ANGPT1 Proteins 0.000 description 1
- 102100007747 ANGPT2 Human genes 0.000 description 1
- 101710043855 ANGPT2 Proteins 0.000 description 1
- 101710043859 ANGPT4 Proteins 0.000 description 1
- 102100011249 ANGPTL2 Human genes 0.000 description 1
- 101710043745 ANGPTL2 Proteins 0.000 description 1
- 102100011247 ANGPTL3 Human genes 0.000 description 1
- 101710043744 ANGPTL3 Proteins 0.000 description 1
- 102100011244 ANGPTL4 Human genes 0.000 description 1
- 102100007755 ANGPTL5 Human genes 0.000 description 1
- 101710043759 ANGPTL5 Proteins 0.000 description 1
- 102100007754 ANGPTL6 Human genes 0.000 description 1
- 101710043740 ANGPTL6 Proteins 0.000 description 1
- 101710043738 ANGPTL7 Proteins 0.000 description 1
- 102100007745 ANGPTL7 Human genes 0.000 description 1
- 102100017392 ANO7 Human genes 0.000 description 1
- 101700064647 ANO7 Proteins 0.000 description 1
- 101710028063 APCS Proteins 0.000 description 1
- 102100015011 ARSB Human genes 0.000 description 1
- 101700050663 ART1 Proteins 0.000 description 1
- 102100017310 ART1 Human genes 0.000 description 1
- 102100004323 ASPG Human genes 0.000 description 1
- 102100017057 ATP5MC2 Human genes 0.000 description 1
- 101710042430 ATP5MC2 Proteins 0.000 description 1
- 108010042708 Acetylmuramyl-Alanyl-Isoglutamine Proteins 0.000 description 1
- 241000588626 Acinetobacter baumannii Species 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 206010000565 Acquired immunodeficiency syndrome Diseases 0.000 description 1
- 208000004476 Acute Coronary Syndrome Diseases 0.000 description 1
- 201000004304 Addison's disease Diseases 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- 206010001233 Adenoma benign Diseases 0.000 description 1
- 229960003190 Adenosine Monophosphate Drugs 0.000 description 1
- 108091022188 Adenosine deaminases Proteins 0.000 description 1
- 102000009914 Adenosine deaminases Human genes 0.000 description 1
- 229950006790 Adenosine phosphate Drugs 0.000 description 1
- 208000005676 Adrenogenital Syndrome Diseases 0.000 description 1
- 206010064930 Age-related macular degeneration Diseases 0.000 description 1
- 108010090726 Alefacept Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K Aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K Aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 229940024545 Aluminum Hydroxide Drugs 0.000 description 1
- 206010001897 Alzheimer's disease Diseases 0.000 description 1
- 102000007299 Amphiregulin Human genes 0.000 description 1
- 108010033760 Amphiregulin Proteins 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 108010002367 Anaphase-Promoting Complex-Cyclosome Apc3 Subunit Proteins 0.000 description 1
- 241000606646 Anaplasma Species 0.000 description 1
- 241000605281 Anaplasma phagocytophilum Species 0.000 description 1
- 241001511271 Ancylostoma braziliense Species 0.000 description 1
- 241000498253 Ancylostoma duodenale Species 0.000 description 1
- 206010002261 Androgen deficiency Diseases 0.000 description 1
- 101700025229 Ang2 Proteins 0.000 description 1
- 101700023370 Ang3 Proteins 0.000 description 1
- 101700065913 Ang4 Proteins 0.000 description 1
- 108010019907 Angiopoietin-like 4 Protein Proteins 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 229960000983 Anistreplase Drugs 0.000 description 1
- 108010058207 Anistreplase Proteins 0.000 description 1
- 241001135700 Arcanobacterium haemolyticum Species 0.000 description 1
- 206010003178 Arterial thrombosis Diseases 0.000 description 1
- 206010003210 Arteriosclerosis Diseases 0.000 description 1
- 206010003211 Arteriosclerosis coronary artery Diseases 0.000 description 1
- 241000244185 Ascaris lumbricoides Species 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 206010067162 Asthenospermia Diseases 0.000 description 1
- 208000006673 Asthma Diseases 0.000 description 1
- 241001533362 Astroviridae Species 0.000 description 1
- 101710043900 At2g44920 Proteins 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 206010003816 Autoimmune disease Diseases 0.000 description 1
- 229960002756 Azacitidine Drugs 0.000 description 1
- 206010003883 Azoospermia Diseases 0.000 description 1
- 108091008154 B cell receptors Proteins 0.000 description 1
- 102100013894 BCL2 Human genes 0.000 description 1
- 108060000885 BCL2 Proteins 0.000 description 1
- 102100007311 BMP10 Human genes 0.000 description 1
- 101700058635 BMP10 Proteins 0.000 description 1
- 101700009099 BMP15 Proteins 0.000 description 1
- 102100007312 BMP15 Human genes 0.000 description 1
- 102100005377 BMP2 Human genes 0.000 description 1
- 101700000123 BMP2 Proteins 0.000 description 1
- 102100005375 BMP3 Human genes 0.000 description 1
- 101700001588 BMP3 Proteins 0.000 description 1
- 102100015886 BMP4 Human genes 0.000 description 1
- 101700005069 BMP4 Proteins 0.000 description 1
- 102100015881 BMP5 Human genes 0.000 description 1
- 101700018737 BMP5 Proteins 0.000 description 1
- 102100015880 BMP6 Human genes 0.000 description 1
- 101700086945 BMP6 Proteins 0.000 description 1
- 102100015882 BMP7 Human genes 0.000 description 1
- 101700060441 BMP7 Proteins 0.000 description 1
- 101710010423 BN863_22000 Proteins 0.000 description 1
- 101710042656 BQ2027_MB1231C Proteins 0.000 description 1
- 102100007281 BRCA1 Human genes 0.000 description 1
- 108010042977 BRCA1 Protein Proteins 0.000 description 1
- 108010000750 BRCA2 Protein Proteins 0.000 description 1
- 102000002280 BRCA2 Protein Human genes 0.000 description 1
- 102100014217 BRDT Human genes 0.000 description 1
- 101700074072 BRDT Proteins 0.000 description 1
- 101710019228 BSG Proteins 0.000 description 1
- 102100013858 BSG Human genes 0.000 description 1
- 102100001432 BTC Human genes 0.000 description 1
- 101700038892 BTC Proteins 0.000 description 1
- 241000223836 Babesia Species 0.000 description 1
- 229940065181 Bacillus anthracis Drugs 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 229940075612 Bacillus cereus Drugs 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 229940092524 Bartonella henselae Drugs 0.000 description 1
- 241001518086 Bartonella henselae Species 0.000 description 1
- HYNPZTKLUNHGPM-KKERQHFVSA-N Becaplermin Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](Cc2cnc[nH]2)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(=N)N)C(=O)N3CCC[C@H]3C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@@H]4CCCN4C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]5CCCN5C(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H]6CCCN6C(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@@H]7CCCN7C(=O)[C@H](Cc8c[nH]c9c8cccc9)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)N HYNPZTKLUNHGPM-KKERQHFVSA-N 0.000 description 1
- 108010081589 Becaplermin Proteins 0.000 description 1
- JYZIHLWOWKMNNX-UHFFFAOYSA-N Benzimidazole Chemical compound C1=C[CH]C2=NC=NC2=C1 JYZIHLWOWKMNNX-UHFFFAOYSA-N 0.000 description 1
- OIRCOABEOLEUMC-GEJPAHFPSA-N Bivalirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 OIRCOABEOLEUMC-GEJPAHFPSA-N 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 229940011597 Blastocystis hominis Drugs 0.000 description 1
- 241000726107 Blastocystis hominis Species 0.000 description 1
- 241000228405 Blastomyces dermatitidis Species 0.000 description 1
- 210000000601 Blood Cells Anatomy 0.000 description 1
- 210000001124 Body Fluids Anatomy 0.000 description 1
- 108090000654 Bone Morphogenetic Protein 1 Proteins 0.000 description 1
- 102000004152 Bone Morphogenetic Protein 1 Human genes 0.000 description 1
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 1
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 1
- 229940052491 Bordetella pertussis Drugs 0.000 description 1
- 241000588832 Bordetella pertussis Species 0.000 description 1
- 229940097269 Borrelia burgdorferi Drugs 0.000 description 1
- 241000589969 Borreliella burgdorferi Species 0.000 description 1
- 241000589562 Brucella Species 0.000 description 1
- 241000244038 Brugia malayi Species 0.000 description 1
- 206010006550 Bulimia nervosa Diseases 0.000 description 1
- 241001453380 Burkholderia Species 0.000 description 1
- 241000589513 Burkholderia cepacia Species 0.000 description 1
- 229940074375 Burkholderia mallei Drugs 0.000 description 1
- 241000722910 Burkholderia mallei Species 0.000 description 1
- 241001136175 Burkholderia pseudomallei Species 0.000 description 1
- LCKIHCRZXREOJU-KYXWUPHJSA-N C(NCCS(=O)(=O)O)N1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O Chemical compound C(NCCS(=O)(=O)O)N1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O LCKIHCRZXREOJU-KYXWUPHJSA-N 0.000 description 1
- 101710008973 CAP01 Proteins 0.000 description 1
- 101700021786 CAP2 Proteins 0.000 description 1
- 101700067793 CAPZB Proteins 0.000 description 1
- IRBSRWVXPGHGGK-LNYQSQCFSA-N CC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O Chemical compound CC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IRBSRWVXPGHGGK-LNYQSQCFSA-N 0.000 description 1
- OULMZHKWILMJEK-UHFFFAOYSA-N CCCCCCCCCCCCCCCCOCC(COC(=O)CCC(=O)OCC[N+](C)(C)C)OCCCCCCCCCCCCCCCC Chemical compound CCCCCCCCCCCCCCCCOCC(COC(=O)CCC(=O)OCC[N+](C)(C)C)OCCCCCCCCCCCCCCCC OULMZHKWILMJEK-UHFFFAOYSA-N 0.000 description 1
- 102100013472 CCK Human genes 0.000 description 1
- 102100003215 CCNB1 Human genes 0.000 description 1
- 102100019529 CCND1 Human genes 0.000 description 1
- 102100005826 CD19 Human genes 0.000 description 1
- 101700087100 CD19 Proteins 0.000 description 1
- 101700020617 CD22 Proteins 0.000 description 1
- 102100000189 CD22 Human genes 0.000 description 1
- 102100013077 CD4 Human genes 0.000 description 1
- 101700022938 CD4 Proteins 0.000 description 1
- 108010029697 CD40 Ligand Proteins 0.000 description 1
- 102100003729 CD40LG Human genes 0.000 description 1
- 102100019283 CD52 Human genes 0.000 description 1
- 108010065524 CD52 Antigen Proteins 0.000 description 1
- 102100013391 CD55 Human genes 0.000 description 1
- 101710006195 CD55 Proteins 0.000 description 1
- 101700080477 CD80 Proteins 0.000 description 1
- 102100019451 CD80 Human genes 0.000 description 1
- 102100013075 CDC27 Human genes 0.000 description 1
- 101700008359 CDK4 Proteins 0.000 description 1
- 102100019398 CDK4 Human genes 0.000 description 1
- 102000033243 CDKN2A Human genes 0.000 description 1
- 101710043956 CEACAM5 Proteins 0.000 description 1
- 101710043948 CEACAM7 Proteins 0.000 description 1
- 102100016295 CFI Human genes 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-L CHEBI:8154 Chemical class [O-]P([O-])=O ABLZXFCXXLZCGV-UHFFFAOYSA-L 0.000 description 1
- 102100012342 CLCA2 Human genes 0.000 description 1
- 101700083678 CLCA2 Proteins 0.000 description 1
- 102100018261 CLIP1 Human genes 0.000 description 1
- 101700045773 CLIP1 Proteins 0.000 description 1
- 101700065655 CML28 Proteins 0.000 description 1
- 102100010791 CNTNAP1 Human genes 0.000 description 1
- 101710009595 CNTNAP1 Proteins 0.000 description 1
- YZSZLBRBVWAXFW-LNYQSQCFSA-N COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 description 1
- 102100016705 COL18A1 Human genes 0.000 description 1
- 101700013656 COTL1 Proteins 0.000 description 1
- 102100011102 COTL1 Human genes 0.000 description 1
- 101710011982 CRISP1 Proteins 0.000 description 1
- 102100011494 CSAG2 Human genes 0.000 description 1
- 101700073572 CSAG2 Proteins 0.000 description 1
- 102100006435 CSF3 Human genes 0.000 description 1
- 102100004467 CT83 Human genes 0.000 description 1
- 101710023900 CT83 Proteins 0.000 description 1
- 102100005284 CTAG2 Human genes 0.000 description 1
- 101700050838 CTAG2 Proteins 0.000 description 1
- 206010006895 Cachexia Diseases 0.000 description 1
- 241000714198 Caliciviridae Species 0.000 description 1
- 102000004082 Calreticulin Human genes 0.000 description 1
- 108090000549 Calreticulin Proteins 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 229940095731 Candida albicans Drugs 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 206010007247 Carbuncle Diseases 0.000 description 1
- 206010007270 Carcinoid syndrome Diseases 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 206010007572 Cardiac hypertrophy Diseases 0.000 description 1
- 210000000845 Cartilage Anatomy 0.000 description 1
- 108090000712 Cathepsin B Proteins 0.000 description 1
- 102000004225 Cathepsin B Human genes 0.000 description 1
- 108090000624 Cathepsin L Proteins 0.000 description 1
- 102000004172 Cathepsin L Human genes 0.000 description 1
- 210000002421 Cell Wall Anatomy 0.000 description 1
- 206010057248 Cell death Diseases 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 206010008531 Chills Diseases 0.000 description 1
- 241001647372 Chlamydia pneumoniae Species 0.000 description 1
- 241001647378 Chlamydia psittaci Species 0.000 description 1
- 229940107137 Cholecystokinin Drugs 0.000 description 1
- 108010048926 Cholecystokinin Proteins 0.000 description 1
- 102000009016 Cholera Toxin Human genes 0.000 description 1
- 108010049048 Cholera Toxin Proteins 0.000 description 1
- 241000251556 Chordata Species 0.000 description 1
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 1
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 1
- 208000000668 Chronic Pancreatitis Diseases 0.000 description 1
- 108010003422 Circulating Thymic Factor Proteins 0.000 description 1
- 102000005221 Cleavage Stimulation Factor Human genes 0.000 description 1
- 108010081236 Cleavage Stimulation Factor Proteins 0.000 description 1
- 241001327965 Clonorchis sinensis Species 0.000 description 1
- 241000193163 Clostridioides difficile Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 241000193449 Clostridium tetani Species 0.000 description 1
- 241000223203 Coccidioides Species 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 102000020504 Collagenase family Human genes 0.000 description 1
- 108060005980 Collagenase family Proteins 0.000 description 1
- 108009000280 Complement Activation Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 208000008448 Congenital Adrenal Hyperplasia Diseases 0.000 description 1
- 210000002808 Connective Tissue Anatomy 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 229940118765 Coxiella burnetii Drugs 0.000 description 1
- 241000606678 Coxiella burnetii Species 0.000 description 1
- 201000010450 Creutzfeldt-Jakob disease Diseases 0.000 description 1
- 241000150230 Crimean-Congo hemorrhagic fever orthonairovirus Species 0.000 description 1
- 241000221204 Cryptococcus neoformans Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000223935 Cryptosporidium Species 0.000 description 1
- 206010011652 Cushing's syndrome Diseases 0.000 description 1
- 108010060385 Cyclin B1 Proteins 0.000 description 1
- 108010058546 Cyclin D1 Proteins 0.000 description 1
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N Cytidine monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- 101710004105 DCT Proteins 0.000 description 1
- 102100007097 DCT Human genes 0.000 description 1
- 102100010133 DDX43 Human genes 0.000 description 1
- 101700054602 DDX43 Proteins 0.000 description 1
- 101000455891 DNASE1 Proteins 0.000 description 1
- 101700012796 DOCK9 Proteins 0.000 description 1
- XULFJDKZVHTRLG-JDVCJPALSA-N DOSPA trifluoroacetate Chemical compound [O-]C(=O)C(F)(F)F.CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)CCNC(=O)C(CCCNCCCN)NCCCN)OCCCCCCCC\C=C/CCCCCCCC XULFJDKZVHTRLG-JDVCJPALSA-N 0.000 description 1
- 102100010857 DSE Human genes 0.000 description 1
- 101700017729 DSE Proteins 0.000 description 1
- 206010051055 Deep vein thrombosis Diseases 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 208000001490 Dengue Diseases 0.000 description 1
- 206010012310 Dengue fever Diseases 0.000 description 1
- KHWCHTKSEGGWEX-RRKCRQDMSA-N Deoxyadenosine monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 1
- NCMVOABPESMRCP-SHYZEUOFSA-N Deoxycytidine monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 1
- LTFMZDNNPPEQNG-KVQBGUIXSA-N Deoxyguanosine monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 1
- 208000001380 Diabetic Ketoacidosis Diseases 0.000 description 1
- 206010012689 Diabetic retinopathy Diseases 0.000 description 1
- 206010012735 Diarrhoea Diseases 0.000 description 1
- 241000157306 Dientamoeba fragilis Species 0.000 description 1
- ZBCBWPMODOFKDW-UHFFFAOYSA-N Diethanolamine Chemical compound OCCNCCO ZBCBWPMODOFKDW-UHFFFAOYSA-N 0.000 description 1
- OIVLITBTBDPEFK-UHFFFAOYSA-N Dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 1
- 241000402062 Dolphin rhabdovirus Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 208000001708 Dupuytren Contracture Diseases 0.000 description 1
- 102000003425 EC 1.14.18.1 Human genes 0.000 description 1
- 108060008724 EC 1.14.18.1 Proteins 0.000 description 1
- 101710038747 EEF1A1 Proteins 0.000 description 1
- 102100006066 EEF1A1 Human genes 0.000 description 1
- 101710005269 EEF1B2 Proteins 0.000 description 1
- 102100017665 EEF1B2 Human genes 0.000 description 1
- 102100017277 EEF1D Human genes 0.000 description 1
- 101710005267 EEF1D Proteins 0.000 description 1
- 101710005263 EEF1G Proteins 0.000 description 1
- 102100005930 EEF1G Human genes 0.000 description 1
- 102100014127 EEF2 Human genes 0.000 description 1
- 101710007779 EEF2 Proteins 0.000 description 1
- 102100008216 EFTUD2 Human genes 0.000 description 1
- 101710016368 EFTUD2 Proteins 0.000 description 1
- 102100008522 EIF2S3 Human genes 0.000 description 1
- 101710032382 EIF2S3 Proteins 0.000 description 1
- 101700029145 EIF3C Proteins 0.000 description 1
- 102100010307 EIF3C Human genes 0.000 description 1
- 101700063373 EIF3E Proteins 0.000 description 1
- 102100016857 EIF3E Human genes 0.000 description 1
- 101700035181 EIF3F Proteins 0.000 description 1
- 102100003939 EIF3F Human genes 0.000 description 1
- 101700032926 EIF3H Proteins 0.000 description 1
- 102100001583 EIF3H Human genes 0.000 description 1
- 101700041998 EIF3K Proteins 0.000 description 1
- 102100001580 EIF3K Human genes 0.000 description 1
- 101700062464 EIF3L Proteins 0.000 description 1
- 102100016359 EIF3L Human genes 0.000 description 1
- 101710006762 EIF4A2 Proteins 0.000 description 1
- 102100008772 EIF4A2 Human genes 0.000 description 1
- 102100009758 ELF2 Human genes 0.000 description 1
- 101700005328 ELF2 Proteins 0.000 description 1
- 102100009705 ENG Human genes 0.000 description 1
- 108060002563 EPCAM Proteins 0.000 description 1
- 102100016629 EPGN Human genes 0.000 description 1
- 102100016627 EPHA2 Human genes 0.000 description 1
- 102100001810 EPHA3 Human genes 0.000 description 1
- 101700072570 EREG Proteins 0.000 description 1
- 102100019146 EREG Human genes 0.000 description 1
- 102100015158 EXOSC5 Human genes 0.000 description 1
- 101710008005 EXOSC5 Proteins 0.000 description 1
- 102100016041 EZH2 Human genes 0.000 description 1
- 101700041849 EZH2 Proteins 0.000 description 1
- 241000244160 Echinococcus Species 0.000 description 1
- 241000605314 Ehrlichia Species 0.000 description 1
- 241000605310 Ehrlichia chaffeensis Species 0.000 description 1
- 241000605282 Ehrlichia ewingii Species 0.000 description 1
- 108010036395 Endoglin Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010079505 Endostatins Proteins 0.000 description 1
- 108010032976 Enfuvirtide Proteins 0.000 description 1
- 229940007078 Entamoeba histolytica Drugs 0.000 description 1
- 241000224432 Entamoeba histolytica Species 0.000 description 1
- 241000194033 Enterococcus Species 0.000 description 1
- 241000988559 Enterovirus A Species 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 108010055196 EphA2 Receptor Proteins 0.000 description 1
- 108010055191 EphA3 Receptor Proteins 0.000 description 1
- 241001480035 Epidermophyton Species 0.000 description 1
- 108010016906 Epigen Proteins 0.000 description 1
- 208000010228 Erectile Dysfunction Diseases 0.000 description 1
- 210000003743 Erythrocytes Anatomy 0.000 description 1
- 206010051814 Eschar Diseases 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241001036088 Escherichia coli O104:H4 Species 0.000 description 1
- 241000028466 Escherichia coli O111 Species 0.000 description 1
- 241001646719 Escherichia coli O157:H7 Species 0.000 description 1
- 108010011459 Exenatide Proteins 0.000 description 1
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exendin-4 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 1
- 102000013165 Exonucleases Human genes 0.000 description 1
- 108060002716 Exonucleases Proteins 0.000 description 1
- 210000001808 Exosomes Anatomy 0.000 description 1
- 102100009074 FBN1 Human genes 0.000 description 1
- 101700001106 FBN1 Proteins 0.000 description 1
- 102100000261 FGF10 Human genes 0.000 description 1
- 101700052889 FGF10 Proteins 0.000 description 1
- 101700050155 FGF11 Proteins 0.000 description 1
- 102100000262 FGF11 Human genes 0.000 description 1
- 101700081916 FGF12 Proteins 0.000 description 1
- 102100000263 FGF12 Human genes 0.000 description 1
- 101700001153 FGF16 Proteins 0.000 description 1
- 102100015608 FGF16 Human genes 0.000 description 1
- 101700047578 FGF19 Proteins 0.000 description 1
- 102100015614 FGF19 Human genes 0.000 description 1
- 101700028871 FGF20 Proteins 0.000 description 1
- 102100007142 FGF20 Human genes 0.000 description 1
- 101700029026 FGF22 Proteins 0.000 description 1
- 102100008637 FGF22 Human genes 0.000 description 1
- 101700036284 FGF23 Proteins 0.000 description 1
- 102100008636 FGF23 Human genes 0.000 description 1
- 102100007406 FGF4 Human genes 0.000 description 1
- 101700036125 FGF4 Proteins 0.000 description 1
- 101700012405 FGF8 Proteins 0.000 description 1
- 102100015613 FGF8 Human genes 0.000 description 1
- 102100015612 FGF9 Human genes 0.000 description 1
- 101700084870 FGF9 Proteins 0.000 description 1
- 229940118764 FRANCISELLA TULARENSIS Drugs 0.000 description 1
- 229940012414 Factor VIIa Drugs 0.000 description 1
- 108010054265 Factor VIIa Proteins 0.000 description 1
- 241000204939 Fasciola gigantica Species 0.000 description 1
- 241000242711 Fasciola hepatica Species 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 1
- 108090000379 Fibroblast Growth Factor 2 Proteins 0.000 description 1
- 102000003974 Fibroblast Growth Factor 2 Human genes 0.000 description 1
- 108090000385 Fibroblast Growth Factor 7 Proteins 0.000 description 1
- 102000003972 Fibroblast Growth Factor 7 Human genes 0.000 description 1
- 102000018233 Fibroblast growth factor family Human genes 0.000 description 1
- 108050007372 Fibroblast growth factor family Proteins 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 241000244009 Filarioidea Species 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 229940028334 Follicle Stimulating Hormone Drugs 0.000 description 1
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 1
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 1
- 241000589602 Francisella tularensis Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 102100020211 GAGE1 Human genes 0.000 description 1
- 101700009370 GAGE1 Proteins 0.000 description 1
- 102100017547 GAGE2D Human genes 0.000 description 1
- 101710041314 GAGE2D Proteins 0.000 description 1
- 102100020599 GAGE4 Human genes 0.000 description 1
- 101710030152 GAGE4 Proteins 0.000 description 1
- 102100020206 GAGE5 Human genes 0.000 description 1
- 101700044998 GAGE5 Proteins 0.000 description 1
- 102100020205 GAGE6 Human genes 0.000 description 1
- 101700042143 GAGE6 Proteins 0.000 description 1
- 101700002869 GAGE7 Proteins 0.000 description 1
- 101710037116 GAPC3 Proteins 0.000 description 1
- 101700005903 GAST Proteins 0.000 description 1
- 102100001448 GAST Human genes 0.000 description 1
- 101700054771 GCA Proteins 0.000 description 1
- 102100003313 GHRL Human genes 0.000 description 1
- 102100000312 GLA Human genes 0.000 description 1
- 101700016449 GLA Proteins 0.000 description 1
- 102100011343 GLB1 Human genes 0.000 description 1
- 102100007996 GPC3 Human genes 0.000 description 1
- 101700044749 GPC3 Proteins 0.000 description 1
- 102100014519 GPNMB Human genes 0.000 description 1
- 101700040370 GPNMB Proteins 0.000 description 1
- 101710014269 GZMK Proteins 0.000 description 1
- QIGJYVCQYDKYDW-SDOYDPJRSA-N Galactose-α-1,3-galactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@H]1[C@@H](O)[C@@H](CO)OC(O)[C@@H]1O QIGJYVCQYDKYDW-SDOYDPJRSA-N 0.000 description 1
- 108010093031 Galactosidases Proteins 0.000 description 1
- 102000002464 Galactosidases Human genes 0.000 description 1
- 206010018048 Gaucher's disease Diseases 0.000 description 1
- 244000168141 Geotrichum candidum Species 0.000 description 1
- 235000017388 Geotrichum candidum Nutrition 0.000 description 1
- 102000012004 Ghrelin Human genes 0.000 description 1
- 241000224467 Giardia intestinalis Species 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 229960002743 Glutamine Drugs 0.000 description 1
- 229940096919 Glycogen Drugs 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- BYSGBSNPRWKUQH-UJDJLXLFSA-N Glycogen Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](O)[C@@H](O[C@@H]2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)O1 BYSGBSNPRWKUQH-UJDJLXLFSA-N 0.000 description 1
- NMJREATYWWNIKX-UHFFFAOYSA-N GnRH Chemical compound C1CCC(C(=O)NCC(N)=O)N1C(=O)C(CC(C)C)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)CNC(=O)C(NC(=O)C(CO)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)C(CC=1NC=NC=1)NC(=O)C1NC(=O)CC1)CC1=CC=C(O)C=C1 NMJREATYWWNIKX-UHFFFAOYSA-N 0.000 description 1
- 241000880292 Gnathostoma Species 0.000 description 1
- 239000000579 Gonadotropin-Releasing Hormone Substances 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 206010053759 Growth retardation Diseases 0.000 description 1
- 241000190708 Guanarito mammarenavirus Species 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N Guanosine monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 208000005721 HIV Infections Diseases 0.000 description 1
- 102100020458 HLA-A Human genes 0.000 description 1
- 108010075704 HLA-A Antigens Proteins 0.000 description 1
- 108010036972 HLA-A11 Antigen Proteins 0.000 description 1
- 108010074032 HLA-A2 Antigen Proteins 0.000 description 1
- 102000026088 HLA-A2 Antigen Human genes 0.000 description 1
- 102100013310 HNRNPA1 Human genes 0.000 description 1
- 101710006011 HNRNPA1 Proteins 0.000 description 1
- 101700024210 HPT1 Proteins 0.000 description 1
- 229940047650 Haemophilus influenzae Drugs 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 229940037467 Helicobacter pylori Drugs 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 206010019663 Hepatic failure Diseases 0.000 description 1
- 208000006454 Hepatitis Diseases 0.000 description 1
- 208000002672 Hepatitis B Diseases 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 241000724709 Hepatitis delta virus Species 0.000 description 1
- 210000003494 Hepatocytes Anatomy 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 108090001101 Hepsin Proteins 0.000 description 1
- 102000004989 Hepsin Human genes 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 208000002557 Hidradenitis Diseases 0.000 description 1
- 108010088652 Histocompatibility Antigens Class I Proteins 0.000 description 1
- 102000008949 Histocompatibility Antigens Class I Human genes 0.000 description 1
- 108010027412 Histocompatibility Antigens Class II Proteins 0.000 description 1
- 102000018713 Histocompatibility Antigens Class II Human genes 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241000228404 Histoplasma capsulatum Species 0.000 description 1
- 229960003911 Histrelin acetate Drugs 0.000 description 1
- 241000308514 Hortaea werneckii Species 0.000 description 1
- 102000003864 Human Follicle Stimulating Hormone Human genes 0.000 description 1
- 108010082302 Human Follicle Stimulating Hormone Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108091006822 Human Serum Albumin Proteins 0.000 description 1
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 1
- 206010020429 Human ehrlichiosis Diseases 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 241000829111 Human polyomavirus 1 Species 0.000 description 1
- 102000001974 Hyaluronidase Human genes 0.000 description 1
- 108010074224 Hyaluronoglucosaminidase Proteins 0.000 description 1
- 206010020578 Hyperbilirubinaemia Diseases 0.000 description 1
- 206010020583 Hypercalcaemia Diseases 0.000 description 1
- 208000002682 Hyperkalemia Diseases 0.000 description 1
- 206010021082 Hypoprolactinaemia Diseases 0.000 description 1
- 208000002762 Hypoproteinemia Diseases 0.000 description 1
- 206010021137 Hypovolaemia Diseases 0.000 description 1
- 101700035985 IDS Proteins 0.000 description 1
- 102100008355 IDUA Human genes 0.000 description 1
- 101700055777 IDUA Proteins 0.000 description 1
- 101700046422 IFNA Proteins 0.000 description 1
- 101700011451 IFNB1 Proteins 0.000 description 1
- 102100015720 IFNB1 Human genes 0.000 description 1
- 101700086956 IFNG Proteins 0.000 description 1
- 102100016020 IFNG Human genes 0.000 description 1
- 102100014231 IGF1 Human genes 0.000 description 1
- 101700074337 IGF1 Proteins 0.000 description 1
- 101700036616 IL16 Proteins 0.000 description 1
- 101700055740 IL19 Proteins 0.000 description 1
- 102100014200 IL26 Human genes 0.000 description 1
- 101700082799 IL2RA Proteins 0.000 description 1
- 101700069907 IL31 Proteins 0.000 description 1
- 101700016780 IL32 Proteins 0.000 description 1
- 102100002950 ISG20 Human genes 0.000 description 1
- 101700015336 ISG20 Proteins 0.000 description 1
- 108010053927 Iduronate Sulfatase Proteins 0.000 description 1
- 108010003381 Iduronidase Proteins 0.000 description 1
- 102000004627 Iduronidase Human genes 0.000 description 1
- 206010021425 Immune system disease Diseases 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 108010043496 Immunoglobulin Idiotypes Proteins 0.000 description 1
- 231100000608 Immunotoxin Toxicity 0.000 description 1
- 108010004484 Immunotoxins Proteins 0.000 description 1
- 206010021750 Infantile spasms Diseases 0.000 description 1
- 208000000509 Infertility Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010022114 Injury Diseases 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000003777 Interleukin-1 beta Human genes 0.000 description 1
- 108090000193 Interleukin-1 beta Proteins 0.000 description 1
- 102000003814 Interleukin-10 Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 229940117681 Interleukin-12 Drugs 0.000 description 1
- 108090000176 Interleukin-13 Proteins 0.000 description 1
- 102000003816 Interleukin-13 Human genes 0.000 description 1
- 108090000172 Interleukin-15 Proteins 0.000 description 1
- 102000013691 Interleukin-17 Human genes 0.000 description 1
- 108050003558 Interleukin-17 family Proteins 0.000 description 1
- 108090000171 Interleukin-18 Proteins 0.000 description 1
- 108010065637 Interleukin-23 Proteins 0.000 description 1
- 108010066979 Interleukin-27 Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 102000000646 Interleukin-3 Human genes 0.000 description 1
- 108010067003 Interleukin-33 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 102000004388 Interleukin-4 Human genes 0.000 description 1
- 102000000743 Interleukin-5 Human genes 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 229940100994 Interleukin-7 Drugs 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000004890 Interleukin-8 Human genes 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 102000000585 Interleukin-9 Human genes 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 229940047122 Interleukins Drugs 0.000 description 1
- 206010022983 Iron metabolism disease Diseases 0.000 description 1
- 206010061256 Ischaemic stroke Diseases 0.000 description 1
- 241000701460 JC polyomavirus Species 0.000 description 1
- 241000710842 Japanese encephalitis virus Species 0.000 description 1
- 241000712890 Junin mammarenavirus Species 0.000 description 1
- 208000003456 Juvenile Arthritis Diseases 0.000 description 1
- 206010059176 Juvenile idiopathic arthritis Diseases 0.000 description 1
- 101710030888 KDR Proteins 0.000 description 1
- 101710033922 KRAS Proteins 0.000 description 1
- 210000003734 Kidney Anatomy 0.000 description 1
- 210000000822 Killer Cells, Natural Anatomy 0.000 description 1
- 241000589014 Kingella kingae Species 0.000 description 1
- 241001534216 Klebsiella granulomatis Species 0.000 description 1
- 206010023497 Kuru Diseases 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 102100005410 LINE-1 retrotransposable element ORF2 protein Human genes 0.000 description 1
- 102100011847 LTB Human genes 0.000 description 1
- 101710040539 LTB Proteins 0.000 description 1
- 102100011875 LTF Human genes 0.000 description 1
- 102100012931 LUZP4 Human genes 0.000 description 1
- 101700045497 LUZP4 Proteins 0.000 description 1
- 229940116108 Lactase Drugs 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- 229940078795 Lactoferrin Drugs 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- GUBGYTABKSRVRQ-UUNJERMWSA-N Lactose Natural products O([C@@H]1[C@H](O)[C@H](O)[C@H](O)O[C@@H]1CO)[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@H](CO)O1 GUBGYTABKSRVRQ-UUNJERMWSA-N 0.000 description 1
- 108010000851 Laminin Receptors Proteins 0.000 description 1
- 102000002297 Laminin Receptors Human genes 0.000 description 1
- 241000712902 Lassa mammarenavirus Species 0.000 description 1
- 229940115932 Legionella pneumophila Drugs 0.000 description 1
- 241000589242 Legionella pneumophila Species 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- OTQCKZUSUGYWBD-BRHMIFOHSA-N Lepirudin Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)[C@@H](C)O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)[C@@H](C)O)C1=CC=C(O)C=C1 OTQCKZUSUGYWBD-BRHMIFOHSA-N 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N Leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 108010092277 Leptin Proteins 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 229940040461 Lipase Drugs 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 229940115931 Listeria monocytogenes Drugs 0.000 description 1
- 241000186779 Listeria monocytogenes Species 0.000 description 1
- 210000004185 Liver Anatomy 0.000 description 1
- 208000007903 Liver Failure Diseases 0.000 description 1
- 206010071083 Luteinising hormone deficiency Diseases 0.000 description 1
- 210000004698 Lymphocytes Anatomy 0.000 description 1
- 108010074338 Lymphokines Proteins 0.000 description 1
- 102000008072 Lymphokines Human genes 0.000 description 1
- 208000003543 Lymphoma, T-Cell, Cutaneous Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 102100009702 MAGEB5 Human genes 0.000 description 1
- 101710027701 MAGEB5 Proteins 0.000 description 1
- 102100009700 MAGEB6 Human genes 0.000 description 1
- 101710027699 MAGEB6 Proteins 0.000 description 1
- 102100012876 MAGEC3 Human genes 0.000 description 1
- 101710027724 MAGEC3 Proteins 0.000 description 1
- 102100012869 MAGED2 Human genes 0.000 description 1
- 101710027715 MAGED2 Proteins 0.000 description 1
- 102100012870 MAGED4 Human genes 0.000 description 1
- 101710027717 MAGED4B Proteins 0.000 description 1
- 102100012872 MAGEF1 Human genes 0.000 description 1
- 101710027593 MAGEF1 Proteins 0.000 description 1
- 102100002272 MAGEL2 Human genes 0.000 description 1
- 101710027612 MAGEL2 Proteins 0.000 description 1
- 108010010995 MART-1 Antigen Proteins 0.000 description 1
- 102100004664 MC1R Human genes 0.000 description 1
- 101710031876 MC1R Proteins 0.000 description 1
- 210000004470 MDP Anatomy 0.000 description 1
- 102100008861 ME1 Human genes 0.000 description 1
- 101710012502 ME1 Proteins 0.000 description 1
- 101710012503 ME6 Proteins 0.000 description 1
- 102100014726 MECP2 Human genes 0.000 description 1
- 101700029603 MECP2 Proteins 0.000 description 1
- 102100008175 MGAM Human genes 0.000 description 1
- 102100012240 MGAT5 Human genes 0.000 description 1
- 101710012533 MLANA Proteins 0.000 description 1
- 102100016819 MMP11 Human genes 0.000 description 1
- 101700081066 MMP11 Proteins 0.000 description 1
- 102100018023 MOK Human genes 0.000 description 1
- 101700007600 MOK Proteins 0.000 description 1
- 101710005599 MRPL28 Proteins 0.000 description 1
- 102100000165 MS4A1 Human genes 0.000 description 1
- 101710010909 MS4A1 Proteins 0.000 description 1
- 101700031459 MSP-1 Proteins 0.000 description 1
- 101710033910 MT-I Proteins 0.000 description 1
- 101700061402 MTRX Proteins 0.000 description 1
- 102100006044 MUC16 Human genes 0.000 description 1
- 101700008449 MUC16 Proteins 0.000 description 1
- 102100013951 MUC2 Human genes 0.000 description 1
- 101700036633 MUC2 Proteins 0.000 description 1
- 241000712898 Machupo mammarenavirus Species 0.000 description 1
- 229920002521 Macromolecule Polymers 0.000 description 1
- 241000555676 Malassezia Species 0.000 description 1
- 208000003393 Mammary Paget's Disease Diseases 0.000 description 1
- 241001115401 Marburgvirus Species 0.000 description 1
- 208000001826 Marfan Syndrome Diseases 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 208000003289 Meconium Ileus Diseases 0.000 description 1
- 210000002752 Melanocytes Anatomy 0.000 description 1
- 108010049137 Member 1 Subfamily D ATP Binding Cassette Transporter Proteins 0.000 description 1
- 208000001145 Metabolic Syndrome Diseases 0.000 description 1
- 241001660197 Metagonimus Species 0.000 description 1
- 206010027452 Metastases to bone Diseases 0.000 description 1
- 206010068115 Metastatic carcinoid tumour Diseases 0.000 description 1
- 229960003105 Metformin Drugs 0.000 description 1
- 241000243190 Microsporidia Species 0.000 description 1
- 210000003470 Mitochondria Anatomy 0.000 description 1
- 102000013967 Monokines Human genes 0.000 description 1
- 108010050619 Monokines Proteins 0.000 description 1
- 206010028093 Mucopolysaccharidosis Diseases 0.000 description 1
- 208000002678 Mucopolysaccharidosis Diseases 0.000 description 1
- 206010056893 Mucopolysaccharidosis VII Diseases 0.000 description 1
- 206010028116 Mucosal inflammation Diseases 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 208000007101 Muscle Cramp Diseases 0.000 description 1
- 206010028334 Muscle spasms Diseases 0.000 description 1
- 206010028400 Mutagenic effect Diseases 0.000 description 1
- 241000186362 Mycobacterium leprae Species 0.000 description 1
- 241000178382 Mycobacterium lepromatosis Species 0.000 description 1
- 241000187917 Mycobacterium ulcerans Species 0.000 description 1
- 208000010125 Myocardial Infarction Diseases 0.000 description 1
- 102000003505 Myosin family Human genes 0.000 description 1
- 108060008487 Myosin family Proteins 0.000 description 1
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- LALUHJOWIKDRQY-XKLVTHTNSA-N N-(6-aminohexyl)-2-[[9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]amino]acetamide Chemical compound C1=NC=2C(NCC(=O)NCCCCCCN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O LALUHJOWIKDRQY-XKLVTHTNSA-N 0.000 description 1
- 102000029089 N-acetylglucosamine-6-sulfatase Human genes 0.000 description 1
- 108010023320 N-acetylglucosamine-6-sulfatase Proteins 0.000 description 1
- AAFYOVPTFNNVDN-UHFFFAOYSA-N N-methyl-N-phenacylnitrous amide Chemical compound O=NN(C)CC(=O)C1=CC=CC=C1 AAFYOVPTFNNVDN-UHFFFAOYSA-N 0.000 description 1
- 102100001364 NAGLU Human genes 0.000 description 1
- 101700057002 NAPA Proteins 0.000 description 1
- 101700001465 NBR1 Proteins 0.000 description 1
- 101700077124 NCAM1 Proteins 0.000 description 1
- 102100007544 NCAM1 Human genes 0.000 description 1
- 102100006167 NCL Human genes 0.000 description 1
- 101700004898 NFYC Proteins 0.000 description 1
- 102100017283 NFYC Human genes 0.000 description 1
- 102100007592 NKX3-1 Human genes 0.000 description 1
- 101710012871 NKX3-1 Proteins 0.000 description 1
- 102000012064 NLR Proteins Human genes 0.000 description 1
- 102100011220 NME2 Human genes 0.000 description 1
- 101710008030 NME2 Proteins 0.000 description 1
- 108060005497 NOB1 Proteins 0.000 description 1
- 102100011126 NOB1 Human genes 0.000 description 1
- 108091005678 NOD-like receptors Proteins 0.000 description 1
- 102100020079 NPM1 Human genes 0.000 description 1
- 101710026364 NPM1 Proteins 0.000 description 1
- 102100015657 NRG2 Human genes 0.000 description 1
- 101700080329 NRG2 Proteins 0.000 description 1
- 102100015651 NRG3 Human genes 0.000 description 1
- 101700055981 NRG3 Proteins 0.000 description 1
- 102100015654 NRG4 Human genes 0.000 description 1
- 101700056003 NRG4 Proteins 0.000 description 1
- 101700079360 NTF4 Proteins 0.000 description 1
- 102100016291 NUDCD1 Human genes 0.000 description 1
- 101710037689 NUDCD1 Proteins 0.000 description 1
- 102100001256 NUMA1 Human genes 0.000 description 1
- 101700042042 NXT1 Proteins 0.000 description 1
- 241000224438 Naegleria fowleri Species 0.000 description 1
- 241000737052 Naso hexacanthus Species 0.000 description 1
- 241000498270 Necator americanus Species 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 229940052778 Neisseria meningitidis Drugs 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 206010028913 Nelson's syndrome Diseases 0.000 description 1
- 108009000551 Nephrotic syndrome Proteins 0.000 description 1
- 206010029164 Nephrotic syndrome Diseases 0.000 description 1
- 229940053128 Nerve Growth Factor Drugs 0.000 description 1
- 102000014413 Neuregulin Human genes 0.000 description 1
- 108050003475 Neuregulin Proteins 0.000 description 1
- 102400000058 Neuregulin-1 Human genes 0.000 description 1
- 108090000556 Neuregulin-1 Proteins 0.000 description 1
- 102000002111 Neuropilin Human genes 0.000 description 1
- 108050009450 Neuropilin Proteins 0.000 description 1
- 102000003683 Neurotrophin-4 Human genes 0.000 description 1
- 108090000099 Neurotrophin-4 Proteins 0.000 description 1
- 208000006660 Niemann-Pick Disease Diseases 0.000 description 1
- 241000526636 Nipah henipavirus Species 0.000 description 1
- 241000187678 Nocardia asteroides Species 0.000 description 1
- 208000002154 Non-Small-Cell Lung Carcinoma Diseases 0.000 description 1
- 108009000071 Non-small cell lung cancer Proteins 0.000 description 1
- 102100003616 OR51E2 Human genes 0.000 description 1
- 101710013186 OR51E2 Proteins 0.000 description 1
- 101700045069 ORF4 Proteins 0.000 description 1
- 102100017240 OXT Human genes 0.000 description 1
- 101710008205 OXT Proteins 0.000 description 1
- 229960002700 Octreotide Drugs 0.000 description 1
- 108010016076 Octreotide Proteins 0.000 description 1
- 208000008634 Oligospermia Diseases 0.000 description 1
- 108010039593 Opsonin Proteins Proteins 0.000 description 1
- 229960003104 Ornithine Drugs 0.000 description 1
- 241000150452 Orthohantavirus Species 0.000 description 1
- 208000010191 Osteitis Deformans Diseases 0.000 description 1
- 102000004067 Osteocalcin Human genes 0.000 description 1
- 108090000573 Osteocalcin Proteins 0.000 description 1
- 108010081689 Osteopontin Proteins 0.000 description 1
- 102000004264 Osteopontin Human genes 0.000 description 1
- 208000001132 Osteoporosis Diseases 0.000 description 1
- 206010025310 Other lymphomas Diseases 0.000 description 1
- 108020005203 Oxidases Proteins 0.000 description 1
- XNOPRXBHLZRZKH-DSZYJQQASA-N Oxytocin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@H](N)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(N)=O)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 XNOPRXBHLZRZKH-DSZYJQQASA-N 0.000 description 1
- 229960001723 Oxytocin Drugs 0.000 description 1
- 101700019601 PAB2 Proteins 0.000 description 1
- 102100008391 PABPC1 Human genes 0.000 description 1
- 102100010412 PABPN1 Human genes 0.000 description 1
- 101710043399 PABPN1 Proteins 0.000 description 1
- 101700048234 PAGE4 Proteins 0.000 description 1
- 102100003599 PAGE4 Human genes 0.000 description 1
- 101700016759 PARK7 Proteins 0.000 description 1
- 102100002595 PATE1 Human genes 0.000 description 1
- 101700020169 PATE1 Proteins 0.000 description 1
- 101710037560 PCDHB16 Proteins 0.000 description 1
- 102100007815 PDGFB Human genes 0.000 description 1
- 101700041067 PDGFC Proteins 0.000 description 1
- 102100017565 PDGFD Human genes 0.000 description 1
- 101700025642 PDGFD Proteins 0.000 description 1
- 102100012897 PGF Human genes 0.000 description 1
- 108060006216 PIGF Proteins 0.000 description 1
- 101710010583 PLAU Proteins 0.000 description 1
- 102100006820 PMEL Human genes 0.000 description 1
- 101700035121 PMEL Proteins 0.000 description 1
- 102100019861 POTED Human genes 0.000 description 1
- 101700015494 POTED Proteins 0.000 description 1
- 102100006759 PRAME Human genes 0.000 description 1
- 108060006580 PRAME Proteins 0.000 description 1
- 102100006752 PRAP1 Human genes 0.000 description 1
- 101700069732 PRAP1 Proteins 0.000 description 1
- 102100010241 PRDX5 Human genes 0.000 description 1
- 101700072488 PRDX5 Proteins 0.000 description 1
- 108060006601 PRM1 Proteins 0.000 description 1
- 101700007412 PRP Proteins 0.000 description 1
- 101700026796 PRSS8 Proteins 0.000 description 1
- 101710028881 PSAP Proteins 0.000 description 1
- 102100002896 PSG2 Human genes 0.000 description 1
- 101700004495 PSG2 Proteins 0.000 description 1
- 101700068068 PSM Proteins 0.000 description 1
- 102100015381 PTGS2 Human genes 0.000 description 1
- 101710040930 PTGS2 Proteins 0.000 description 1
- 101000032483 PTH Proteins 0.000 description 1
- 102100017341 PTPRK Human genes 0.000 description 1
- 101700082511 PTPRK Proteins 0.000 description 1
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N PUROMYCIN Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 1
- 229950010131 PUROMYCIN Drugs 0.000 description 1
- 102100009677 PWWP3A Human genes 0.000 description 1
- 108060006838 PWWP3A Proteins 0.000 description 1
- 206010052765 Pancreatic duct obstruction Diseases 0.000 description 1
- 206010033628 Pancreatic insufficiency Diseases 0.000 description 1
- 206010033649 Pancreatitis chronic Diseases 0.000 description 1
- 229940055729 Papain Drugs 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 208000004362 Penile Induration Diseases 0.000 description 1
- 108010088535 Pep-1 peptide Proteins 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 241000150350 Peribunyaviridae Species 0.000 description 1
- 201000005429 Peyronie's disease Diseases 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- 206010056238 Phantom pain Diseases 0.000 description 1
- 108010022233 Plasminogen Activator Inhibitor 1 Proteins 0.000 description 1
- 108090000614 Plasminogen activator inhibitor-2 Proteins 0.000 description 1
- 102000004179 Plasminogen activator inhibitor-2 Human genes 0.000 description 1
- 241000224016 Plasmodium Species 0.000 description 1
- 229920000096 Plastarch material Polymers 0.000 description 1
- 206010035534 Platelet disease Diseases 0.000 description 1
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 1
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 1
- 241000142787 Pneumocystis jirovecii Species 0.000 description 1
- 108010012887 Poly(A)-Binding Protein I Proteins 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 206010048834 Polycystic liver disease Diseases 0.000 description 1
- 239000004698 Polyethylene (PE) Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 208000001685 Postmenopausal Osteoporosis Diseases 0.000 description 1
- 241000048284 Potato virus P Species 0.000 description 1
- NRKVKVQDUCJPIZ-MKAGXXMWSA-N Pramlintide acetate Chemical compound C([C@@H](C(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 NRKVKVQDUCJPIZ-MKAGXXMWSA-N 0.000 description 1
- 208000006155 Precocious Puberty Diseases 0.000 description 1
- 206010036596 Premature ejaculation Diseases 0.000 description 1
- 208000004210 Pressure Ulcer Diseases 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000004433 Proto-Oncogene Proteins c-pim-1 Human genes 0.000 description 1
- 108010017121 Proto-Oncogene Proteins c-pim-1 Proteins 0.000 description 1
- 206010037162 Psoriatic arthropathy Diseases 0.000 description 1
- 206010037549 Purpura Diseases 0.000 description 1
- 241001672981 Purpura Species 0.000 description 1
- 102100009250 RACK1 Human genes 0.000 description 1
- 210000003324 RBC Anatomy 0.000 description 1
- 108091005677 RIG-I-like receptors Proteins 0.000 description 1
- 229940098348 RINFABATE Drugs 0.000 description 1
- 230000021839 RNA stabilization Effects 0.000 description 1
- 101700044827 RNMT Proteins 0.000 description 1
- 101710004302 RPL28 Proteins 0.000 description 1
- 101710038545 RPL43A Proteins 0.000 description 1
- 101710038546 RPL43B Proteins 0.000 description 1
- 101710007830 RPS18 Proteins 0.000 description 1
- 101700016451 RPS2 Proteins 0.000 description 1
- 101710007926 RPS21A Proteins 0.000 description 1
- 101710007893 RPS27A Proteins 0.000 description 1
- 101700032456 RPS4 Proteins 0.000 description 1
- 101710008308 RPS4X Proteins 0.000 description 1
- 229960000424 Rasburicase Drugs 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108010044157 Receptors for Activated C Kinase Proteins 0.000 description 1
- 206010038435 Renal failure Diseases 0.000 description 1
- 206010062237 Renal impairment Diseases 0.000 description 1
- 206010057190 Respiratory tract infection Diseases 0.000 description 1
- 229960002917 Reteplase Drugs 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 206010072736 Rheumatic disease Diseases 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 229920002049 Ribosomal DNA Polymers 0.000 description 1
- 241000606701 Rickettsia Species 0.000 description 1
- 241000606723 Rickettsia akari Species 0.000 description 1
- 229940046939 Rickettsia prowazekii Drugs 0.000 description 1
- 241000606697 Rickettsia prowazekii Species 0.000 description 1
- 229940075118 Rickettsia rickettsii Drugs 0.000 description 1
- 241000606695 Rickettsia rickettsii Species 0.000 description 1
- 241000606726 Rickettsia typhi Species 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 102100020102 SAGE1 Human genes 0.000 description 1
- 101700079108 SAGE1 Proteins 0.000 description 1
- 241000315672 SARS coronavirus Species 0.000 description 1
- 102100004228 SART1 Human genes 0.000 description 1
- 101710037092 SART1 Proteins 0.000 description 1
- 101700037991 SART3 Proteins 0.000 description 1
- 101710009148 SERPINA1 Proteins 0.000 description 1
- 102100008879 SERPINB8 Human genes 0.000 description 1
- 101710015086 SERPINB8 Proteins 0.000 description 1
- 102100008875 SERPINB9 Human genes 0.000 description 1
- 101710015093 SERPINB9 Proteins 0.000 description 1
- 102100007015 SERPINE1 Human genes 0.000 description 1
- 101700016899 SH2B1 Proteins 0.000 description 1
- 102100001435 SH2D1A Human genes 0.000 description 1
- 101710013575 SH2D1A Proteins 0.000 description 1
- 102100000596 SIRT2 Human genes 0.000 description 1
- 101700058417 SIRT2 Proteins 0.000 description 1
- 101710003940 SPA17 Proteins 0.000 description 1
- 101710041088 SPAC16C9.04c Proteins 0.000 description 1
- 101710039435 SPAC2C4.12c Proteins 0.000 description 1
- 101710013770 SPBC2A9.03 Proteins 0.000 description 1
- 102100005017 SPDEF Human genes 0.000 description 1
- 101700071106 SPDEF Proteins 0.000 description 1
- 101710006037 SRV2 Proteins 0.000 description 1
- 102100004865 SSX2 Human genes 0.000 description 1
- 101700030927 SSX2 Proteins 0.000 description 1
- 102100017517 SUB1 Human genes 0.000 description 1
- 101700063611 SUB1 Proteins 0.000 description 1
- 241000192617 Sabia mammarenavirus Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 206010039447 Salmonellosis Diseases 0.000 description 1
- 235000002912 Salvia officinalis Nutrition 0.000 description 1
- 241000509427 Sarcoptes scabiei Species 0.000 description 1
- 241000490025 Schefflera digitata Species 0.000 description 1
- 241000242678 Schistosoma Species 0.000 description 1
- 101710017884 Segment-8 Proteins 0.000 description 1
- 210000001625 Seminal Vesicles Anatomy 0.000 description 1
- 210000002966 Serum Anatomy 0.000 description 1
- 208000009642 Severe combined immunodeficiency due to adenosine deaminase deficiency Diseases 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 206010040550 Shigella infection Diseases 0.000 description 1
- 241000150288 Sin Nombre orthohantavirus Species 0.000 description 1
- 210000003491 Skin Anatomy 0.000 description 1
- 201000001828 Sly syndrome Diseases 0.000 description 1
- 208000001203 Smallpox Diseases 0.000 description 1
- 229960000553 Somatostatin Drugs 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 208000005198 Spinal Stenosis Diseases 0.000 description 1
- 241001149963 Sporothrix schenckii Species 0.000 description 1
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N Squalane Chemical compound CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 1
- 229940031439 Squalene Drugs 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229940076185 Staphylococcus aureus Drugs 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 206010041969 Steatorrhoea Diseases 0.000 description 1
- 229940030998 Streptococcus agalactiae Drugs 0.000 description 1
- 241000193985 Streptococcus agalactiae Species 0.000 description 1
- 229940031000 Streptococcus pneumoniae Drugs 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 229940076156 Streptococcus pyogenes Drugs 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 229960005202 Streptokinase Drugs 0.000 description 1
- 108010023197 Streptokinase Proteins 0.000 description 1
- 241000244177 Strongyloides stercoralis Species 0.000 description 1
- 210000004304 Subcutaneous Tissue Anatomy 0.000 description 1
- 206010042496 Sunburn Diseases 0.000 description 1
- 108010032166 TARP Proteins 0.000 description 1
- 108091005711 TGF-beta receptors Proteins 0.000 description 1
- 101700038204 TGFA Proteins 0.000 description 1
- 101700041213 TGFB1 Proteins 0.000 description 1
- 102100002456 TGFB2 Human genes 0.000 description 1
- 101700020851 TGFB2 Proteins 0.000 description 1
- 102100016214 THPO Human genes 0.000 description 1
- 101710040065 THPO Proteins 0.000 description 1
- 102100018690 TPT1 Human genes 0.000 description 1
- 101700073473 TPT1 Proteins 0.000 description 1
- 101710028952 TP_0022 Proteins 0.000 description 1
- 102100003485 TRAF3 Human genes 0.000 description 1
- 102100008416 TSPYL2 Human genes 0.000 description 1
- 101710036648 TSPYL2 Proteins 0.000 description 1
- 101700046552 TXVE Proteins 0.000 description 1
- 101700074751 TXVE1 Proteins 0.000 description 1
- 101700066797 TXVE2 Proteins 0.000 description 1
- 101710039516 TY1B Proteins 0.000 description 1
- 101710038549 TY1B-BL Proteins 0.000 description 1
- 101710038430 TY1B-BR Proteins 0.000 description 1
- 101710031758 TY1B-DR1 Proteins 0.000 description 1
- 101710031790 TY1B-DR3 Proteins 0.000 description 1
- 101710031892 TY1B-DR4 Proteins 0.000 description 1
- 101710031776 TY1B-DR5 Proteins 0.000 description 1
- 101710031870 TY1B-DR6 Proteins 0.000 description 1
- 101710040208 TY1B-ER1 Proteins 0.000 description 1
- 101710040142 TY1B-ER2 Proteins 0.000 description 1
- 101710033209 TY1B-GR1 Proteins 0.000 description 1
- 101710032781 TY1B-GR2 Proteins 0.000 description 1
- 101710032639 TY1B-GR3 Proteins 0.000 description 1
- 101710029707 TY1B-H Proteins 0.000 description 1
- 101710021448 TY1B-JR1 Proteins 0.000 description 1
- 101710021467 TY1B-JR2 Proteins 0.000 description 1
- 101710010147 TY1B-LR1 Proteins 0.000 description 1
- 101710010132 TY1B-LR2 Proteins 0.000 description 1
- 101710010183 TY1B-LR3 Proteins 0.000 description 1
- 101710010162 TY1B-LR4 Proteins 0.000 description 1
- 101710004759 TY1B-ML1 Proteins 0.000 description 1
- 101710004702 TY1B-ML2 Proteins 0.000 description 1
- 101710004726 TY1B-MR1 Proteins 0.000 description 1
- 101710004694 TY1B-MR2 Proteins 0.000 description 1
- 101710045288 TY1B-NL1 Proteins 0.000 description 1
- 101710045299 TY1B-NL2 Proteins 0.000 description 1
- 101710038226 TY1B-OL Proteins 0.000 description 1
- 101710038249 TY1B-OR Proteins 0.000 description 1
- 101710035894 TY1B-PL Proteins 0.000 description 1
- 101710035891 TY1B-PR1 Proteins 0.000 description 1
- 101710036010 TY1B-PR2 Proteins 0.000 description 1
- 101710036003 TY1B-PR3 Proteins 0.000 description 1
- 102100007096 TYRP1 Human genes 0.000 description 1
- 241000244155 Taenia Species 0.000 description 1
- 241000244157 Taenia solium Species 0.000 description 1
- 108010049264 Teriparatide Proteins 0.000 description 1
- 208000001435 Thromboembolism Diseases 0.000 description 1
- NZVYCXVTEHPMHE-ZSUJOUNUSA-N Thymalfasin Chemical compound CC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NZVYCXVTEHPMHE-ZSUJOUNUSA-N 0.000 description 1
- 108010078233 Thymalfasin Proteins 0.000 description 1
- 229940113082 Thymine Drugs 0.000 description 1
- 102400000800 Thymosin alpha-1 Human genes 0.000 description 1
- 108090000373 Tissue plasminogen activator Proteins 0.000 description 1
- 102000003978 Tissue plasminogen activator Human genes 0.000 description 1
- 231100000765 Toxin Toxicity 0.000 description 1
- 241000244030 Toxocara canis Species 0.000 description 1
- 241000244020 Toxocara cati Species 0.000 description 1
- 229940118701 Toxoplasma gondii Drugs 0.000 description 1
- 241000223997 Toxoplasma gondii Species 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 102000009618 Transforming Growth Factors Human genes 0.000 description 1
- 108010009583 Transforming Growth Factors Proteins 0.000 description 1
- 102000006747 Transforming growth factor alpha Human genes 0.000 description 1
- PBKWZFANFUTEPS-CWUSWOHSSA-N Transportan Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(N)=O)[C@@H](C)CC)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CN)[C@@H](C)O)C1=CC=C(O)C=C1 PBKWZFANFUTEPS-CWUSWOHSSA-N 0.000 description 1
- 241000589884 Treponema pallidum Species 0.000 description 1
- 229940096911 Trichinella spiralis Drugs 0.000 description 1
- 241000243777 Trichinella spiralis Species 0.000 description 1
- 241000224527 Trichomonas vaginalis Species 0.000 description 1
- 241000223238 Trichophyton Species 0.000 description 1
- 241001489145 Trichuris trichiura Species 0.000 description 1
- 241000223105 Trypanosoma brucei Species 0.000 description 1
- 241000223109 Trypanosoma cruzi Species 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 208000010380 Tumor Lysis Syndrome Diseases 0.000 description 1
- 206010045170 Tumour lysis syndrome Diseases 0.000 description 1
- 206010045181 Turner's syndrome Diseases 0.000 description 1
- NMUSYJAQQFHJEW-KVTDHHQDSA-N U-18,496 Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 1
- 102100011082 UBA5 Human genes 0.000 description 1
- 108060008745 UBA5 Proteins 0.000 description 1
- 102100005739 UBR4 Human genes 0.000 description 1
- 108060008760 UBR4 Proteins 0.000 description 1
- 102100012704 UQCRB Human genes 0.000 description 1
- 101710008828 UQCRB Proteins 0.000 description 1
- 101710009757 UROD Proteins 0.000 description 1
- 206010064996 Ulcerative keratitis Diseases 0.000 description 1
- 206010068760 Ulcers Diseases 0.000 description 1
- 241000202921 Ureaplasma urealyticum Species 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N Uridine monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
- 229960005356 Urokinase Drugs 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 102100015207 VEGFB Human genes 0.000 description 1
- 102100015206 VEGFC Human genes 0.000 description 1
- 102100015205 VEGFD Human genes 0.000 description 1
- 101700068327 VTCN1 Proteins 0.000 description 1
- 102100014952 VTCN1 Human genes 0.000 description 1
- 108010073925 Vascular Endothelial Growth Factor B Proteins 0.000 description 1
- 108010073923 Vascular Endothelial Growth Factor C Proteins 0.000 description 1
- 108010073919 Vascular Endothelial Growth Factor D Proteins 0.000 description 1
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 206010047249 Venous thrombosis Diseases 0.000 description 1
- 229940118696 Vibrio cholerae Drugs 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 241000710886 West Nile virus Species 0.000 description 1
- 241000710951 Western equine encephalitis virus Species 0.000 description 1
- 208000000208 Wet Macular Degeneration Diseases 0.000 description 1
- 206010052428 Wound Diseases 0.000 description 1
- 241000244005 Wuchereria bancrofti Species 0.000 description 1
- UBORTCNDUKBEOP-UUOKFMHZSA-N Xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 1
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 1
- CAEFEWVYEZABLA-UUOKFMHZSA-N Xanthosine 5-triphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 CAEFEWVYEZABLA-UUOKFMHZSA-N 0.000 description 1
- 101700045543 YGY3 Proteins 0.000 description 1
- 101700017361 YML1 Proteins 0.000 description 1
- 101700043161 YOR3 Proteins 0.000 description 1
- 101700035048 YTR3 Proteins 0.000 description 1
- 101700075752 YXYB Proteins 0.000 description 1
- 229940098232 Yersinia enterocolitica Drugs 0.000 description 1
- 241000607447 Yersinia enterocolitica Species 0.000 description 1
- 229940118695 Yersinia pestis Drugs 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241000607477 Yersinia pseudotuberculosis Species 0.000 description 1
- RPQZTTQVRYEKCR-WCTZXXKLSA-N Zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 1
- ISXSJGHXHUZXNF-LXZPIJOJSA-N [(3S,8S,9S,10R,13R,14S,17R)-10,13-dimethyl-17-[(2R)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1H-cyclopenta[a]phenanthren-3-yl] N-[2-(dimethylamino)ethyl]carbamate;hydrochloride Chemical compound Cl.C1C=C2C[C@@H](OC(=O)NCCN(C)C)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 ISXSJGHXHUZXNF-LXZPIJOJSA-N 0.000 description 1
- 241000606834 [Haemophilus] ducreyi Species 0.000 description 1
- GKVHYBAWZAYQDO-XVFCMESISA-N [[(2R,3S,4R,5R)-3,4-dihydroxy-5-(2-oxo-4-sulfanylidenepyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@@H](O)[C@@H]1N1C(=O)NC(=S)C=C1 GKVHYBAWZAYQDO-XVFCMESISA-N 0.000 description 1
- ABOQIBZHFFLOGM-UAKXSSHOSA-N [[(2R,3S,4R,5R)-3,4-dihydroxy-5-(5-iodo-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@@H](O)[C@@H]1N1C(=O)NC(=O)C(I)=C1 ABOQIBZHFFLOGM-UAKXSSHOSA-N 0.000 description 1
- QTWNSBVFPSAMPO-IOSLPCCCSA-N [[(2R,3S,4R,5R)-3,4-dihydroxy-5-(6-imino-1-methylpurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QTWNSBVFPSAMPO-IOSLPCCCSA-N 0.000 description 1
- LCQWKKZWHQFOAH-IOSLPCCCSA-N [[(2R,3S,4R,5R)-3,4-dihydroxy-5-[6-(methylamino)purin-9-yl]oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O LCQWKKZWHQFOAH-IOSLPCCCSA-N 0.000 description 1
- CABDYDUZLRXGTB-UUOKFMHZSA-N [[(2R,3S,4R,5R)-5-(2,6-diaminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O CABDYDUZLRXGTB-UUOKFMHZSA-N 0.000 description 1
- YWHNPOKVSACYOQ-KQYNXXCUSA-N [[(2R,3S,4R,5R)-5-(2-amino-1-methyl-6-oxopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O YWHNPOKVSACYOQ-KQYNXXCUSA-N 0.000 description 1
- GLIPDAOPPNSQCA-KQYNXXCUSA-N [[(2R,3S,4R,5R)-5-(2-amino-6-methoxypurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=NC=2C(OC)=NC(N)=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O GLIPDAOPPNSQCA-KQYNXXCUSA-N 0.000 description 1
- NCKFQXVRKKNRBB-SHUUEZRQSA-N [[(2R,3S,4R,5R)-5-(3,5-dioxo-1,2,4-triazin-2-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=N1 NCKFQXVRKKNRBB-SHUUEZRQSA-N 0.000 description 1
- WJUFDWJKJXOYSB-XVFCMESISA-N [[(2R,3S,4R,5R)-5-(4-amino-2-sulfanylidenepyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 WJUFDWJKJXOYSB-XVFCMESISA-N 0.000 description 1
- ZPZGYYNOHSQDQC-UAKXSSHOSA-N [[(2R,3S,4R,5R)-5-(4-amino-5-iodo-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=C(I)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 ZPZGYYNOHSQDQC-UAKXSSHOSA-N 0.000 description 1
- UOVXAGVICVPZQP-SHUUEZRQSA-N [[(2R,3S,4R,5R)-5-(5-amino-3-oxo-1,2,4-triazin-2-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=NN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 UOVXAGVICVPZQP-SHUUEZRQSA-N 0.000 description 1
- IWFHOSULCAJGRM-UAKXSSHOSA-N [[(2R,3S,4R,5R)-5-(5-bromo-2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@@H](O)[C@@H]1N1C(=O)NC(=O)C(Br)=C1 IWFHOSULCAJGRM-UAKXSSHOSA-N 0.000 description 1
- PQISXOFEOCLOCT-UUOKFMHZSA-N [[(2R,3S,4R,5R)-5-(6-amino-8-azidopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound [N-]=[N+]=NC1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O PQISXOFEOCLOCT-UUOKFMHZSA-N 0.000 description 1
- WDPOFPOWJQWIPX-UUOKFMHZSA-N [[(2R,3S,4R,5R)-5-(7-aminotriazolo[4,5-d]pyrimidin-3-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound N1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O WDPOFPOWJQWIPX-UUOKFMHZSA-N 0.000 description 1
- KHYOUGAATNYCAZ-XVFCMESISA-J [[[(2R,3S,4R,5R)-3,4-dihydroxy-5-(4-oxo-2-sulfanylidenepyrimidin-1-yl)oxolan-2-yl]methoxy-oxidophosphoryl]oxy-oxidophosphoryl] phosphate Chemical compound O1[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@@H](O)[C@@H]1N1C(=S)NC(=O)C=C1 KHYOUGAATNYCAZ-XVFCMESISA-J 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 102000010126 acid sphingomyelin phosphodiesterase activity proteins Human genes 0.000 description 1
- 108040005465 acid sphingomyelin phosphodiesterase activity proteins Proteins 0.000 description 1
- 230000002378 acidificating Effects 0.000 description 1
- 150000001252 acrylic acid derivatives Chemical class 0.000 description 1
- 201000011452 adrenoleukodystrophy Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 229960002833 aflibercept Drugs 0.000 description 1
- 108010081667 aflibercept Proteins 0.000 description 1
- 229960004470 agalsidase beta Drugs 0.000 description 1
- 108010056760 agalsidase beta Proteins 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 229960002459 alefacept Drugs 0.000 description 1
- 230000002009 allergen Effects 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 108010034034 alpha-1,6-mannosylglycoprotein beta 1,6-N-acetylglucosaminyltransferase Proteins 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 108010009380 alpha-N-acetyl-D-glucosaminidase Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 230000003444 anaesthetic Effects 0.000 description 1
- 230000003042 antagnostic Effects 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000001475 anti-trypsic Effects 0.000 description 1
- 230000000840 anti-viral Effects 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 125000000089 arabinosyl group Chemical class C1([C@@H](O)[C@H](O)[C@H](O)CO1)* 0.000 description 1
- 230000001623 arteriogenic Effects 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 201000002055 autistic disease Diseases 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 230000003376 axonal Effects 0.000 description 1
- 201000008680 babesiosis Diseases 0.000 description 1
- 108010003152 bacteriophage T7 RNA polymerase Proteins 0.000 description 1
- 229960004787 becaplermin Drugs 0.000 description 1
- 102000015735 beta Catenin Human genes 0.000 description 1
- 108060000903 beta Catenin Proteins 0.000 description 1
- 208000005980 beta-Thalassemia Diseases 0.000 description 1
- 150000001576 beta-amino acids Chemical class 0.000 description 1
- 201000004532 bilirubin metabolic disease Diseases 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000003115 biocidal Effects 0.000 description 1
- 101710040757 birc5.2 Proteins 0.000 description 1
- 108010055460 bivalirudin Proteins 0.000 description 1
- 229960001500 bivalirudin Drugs 0.000 description 1
- 230000000740 bleeding Effects 0.000 description 1
- 231100000319 bleeding Toxicity 0.000 description 1
- 230000023555 blood coagulation Effects 0.000 description 1
- 201000002393 blood protein disease Diseases 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 108010025307 buforin II Proteins 0.000 description 1
- 101700035324 byn Proteins 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 235000020964 calcitriol Nutrition 0.000 description 1
- 239000011612 calcitriol Substances 0.000 description 1
- BPKIGYQJPYCAOW-FFJTTWKXSA-I calcium;potassium;disodium;(2S)-2-hydroxypropanoate;dichloride;dihydroxide;hydrate Chemical group O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].C[C@H](O)C([O-])=O BPKIGYQJPYCAOW-FFJTTWKXSA-I 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000000271 cardiovascular Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000005591 charge neutralization Effects 0.000 description 1
- 150000001793 charged compounds Chemical class 0.000 description 1
- 108010059385 chemotactic factor inactivator Proteins 0.000 description 1
- 231100000005 chromosome aberration Toxicity 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 229960005188 collagen Drugs 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 239000008139 complexing agent Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 201000006233 congestive heart failure Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 238000007887 coronary angioplasty Methods 0.000 description 1
- 201000007336 cryptococcosis Diseases 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 125000000753 cycloalkyl group Chemical group 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000016396 cytokine production Effects 0.000 description 1
- 230000001472 cytotoxic Effects 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000003247 decreasing Effects 0.000 description 1
- 229940119350 dehydroepiandrosterone Drugs 0.000 description 1
- 108010017271 denileukin diftitox Proteins 0.000 description 1
- 229960002923 denileukin diftitox Drugs 0.000 description 1
- 229960003964 deoxycholic acid Drugs 0.000 description 1
- 230000001419 dependent Effects 0.000 description 1
- 230000001809 detectable Effects 0.000 description 1
- 201000010064 diabetes insipidus Diseases 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 150000004985 diamines Chemical class 0.000 description 1
- 201000008286 diarrhea Diseases 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 210000002249 digestive system Anatomy 0.000 description 1
- OGQYPPBGSLZBEG-UHFFFAOYSA-N dimethyl(dioctadecyl)azanium Chemical compound CCCCCCCCCCCCCCCCCC[N+](C)(C)CCCCCCCCCCCCCCCCCC OGQYPPBGSLZBEG-UHFFFAOYSA-N 0.000 description 1
- PSLWZOIUBRXAQW-UHFFFAOYSA-M dimethyl(dioctadecyl)azanium;bromide Chemical compound [Br-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CCCCCCCCCCCCCCCCCC PSLWZOIUBRXAQW-UHFFFAOYSA-M 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 230000001516 effect on protein Effects 0.000 description 1
- 230000002500 effect on skin Effects 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 231100000507 endocrine disrupting Toxicity 0.000 description 1
- 201000009273 endometriosis Diseases 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- PEASPLKKXBYDKL-FXEVSJAOSA-N enfuvirtide Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(C)=O)[C@@H](C)O)[C@@H](C)CC)C1=CN=CN1 PEASPLKKXBYDKL-FXEVSJAOSA-N 0.000 description 1
- 229960002062 enfuvirtide Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 101700013556 entH Proteins 0.000 description 1
- 230000002255 enzymatic Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 102000017256 epidermal growth factor-activated receptor activity proteins Human genes 0.000 description 1
- 108040009258 epidermal growth factor-activated receptor activity proteins Proteins 0.000 description 1
- 231100000333 eschar Toxicity 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- CKTNHGVJKUQEBM-UHFFFAOYSA-N ethylazanide Chemical compound CC[NH-] CKTNHGVJKUQEBM-UHFFFAOYSA-N 0.000 description 1
- 229960001519 exenatide Drugs 0.000 description 1
- 201000007089 exocrine pancreatic insufficiency Diseases 0.000 description 1
- 101700001741 fatB Proteins 0.000 description 1
- 230000002349 favourable Effects 0.000 description 1
- 235000021050 feed intake Nutrition 0.000 description 1
- 101700023228 fgf8a Proteins 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 108090000047 fibroblast growth factor 13 Proteins 0.000 description 1
- 108090000046 fibroblast growth factor 14 Proteins 0.000 description 1
- 102000003685 fibroblast growth factor 14 Human genes 0.000 description 1
- 102000003973 fibroblast growth factor 21 Human genes 0.000 description 1
- 108090000376 fibroblast growth factor 21 Proteins 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037240 fusion proteins Human genes 0.000 description 1
- 230000002496 gastric Effects 0.000 description 1
- 108091006088 gene-regulatory proteins Proteins 0.000 description 1
- 102000034448 gene-regulatory proteins Human genes 0.000 description 1
- 239000003193 general anesthetic agent Substances 0.000 description 1
- 201000002406 genetic disease Diseases 0.000 description 1
- 230000012178 germinal center formation Effects 0.000 description 1
- BGHSOEHUOOAYMY-JTZMCQEISA-N ghrelin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)CN)C1=CC=CC=C1 BGHSOEHUOOAYMY-JTZMCQEISA-N 0.000 description 1
- 235000019410 glycyrrhizin Nutrition 0.000 description 1
- 231100000001 growth retardation Toxicity 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000009067 heart development Effects 0.000 description 1
- 201000010238 heart disease Diseases 0.000 description 1
- 230000004217 heart function Effects 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 102000018511 hepcidin family Human genes 0.000 description 1
- 108060003558 hepcidin family Proteins 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 201000007162 hidradenitis suppurativa Diseases 0.000 description 1
- BKEMVGVBBDMHKL-VYFXDUNUSA-N histrelin acetate Chemical compound CC(O)=O.CC(O)=O.CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC(N=C1)=CN1CC1=CC=CC=C1 BKEMVGVBBDMHKL-VYFXDUNUSA-N 0.000 description 1
- 238000002657 hormone replacement therapy Methods 0.000 description 1
- 102000037439 human DNASE1 protein Human genes 0.000 description 1
- 102000036364 human PTH protein Human genes 0.000 description 1
- 108010003425 hyaluronan-mediated motility receptor Proteins 0.000 description 1
- 229960002773 hyaluronidase Drugs 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000002209 hydrophobic Effects 0.000 description 1
- 230000000640 hydroxylating Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000000148 hypercalcaemia Effects 0.000 description 1
- 229960002396 idursulfase Drugs 0.000 description 1
- 108010072166 idursulfase Proteins 0.000 description 1
- 239000012216 imaging agent Substances 0.000 description 1
- 229960002751 imiquimod Drugs 0.000 description 1
- 229940115258 immunocyanin Drugs 0.000 description 1
- 239000000677 immunologic agent Substances 0.000 description 1
- 230000002637 immunotoxin Effects 0.000 description 1
- 239000002596 immunotoxin Substances 0.000 description 1
- 230000001771 impaired Effects 0.000 description 1
- 201000001881 impotence Diseases 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 231100000535 infertility Toxicity 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 108090000681 interleukin 20 Proteins 0.000 description 1
- 108040006849 interleukin-2 receptor activity proteins Proteins 0.000 description 1
- 108010074108 interleukin-21 Proteins 0.000 description 1
- 108010074109 interleukin-22 Proteins 0.000 description 1
- 230000003834 intracellular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000000366 juvenile Effects 0.000 description 1
- 201000002215 juvenile rheumatoid arthritis Diseases 0.000 description 1
- 101710030893 kdrl Proteins 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 230000002147 killing Effects 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 229960002486 laronidase Drugs 0.000 description 1
- 229960004408 lepirudin Drugs 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- 102000004882 lipase Human genes 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 108090001060 lipase Proteins 0.000 description 1
- GZQKNULLWNGMCW-PWQABINMSA-J lipid A(4-) Chemical compound O1[C@H](CO)[C@@H](OP([O-])([O-])=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP([O-])([O-])=O)O1 GZQKNULLWNGMCW-PWQABINMSA-J 0.000 description 1
- 231100000835 liver failure Toxicity 0.000 description 1
- 235000015250 liver sausages Nutrition 0.000 description 1
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 201000005244 lung non-small cell carcinoma Diseases 0.000 description 1
- 230000002934 lysing Effects 0.000 description 1
- 108009000345 mRNA Processing Proteins 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- 230000012976 mRNA stabilization Effects 0.000 description 1
- 230000034701 macropinocytosis Effects 0.000 description 1
- 230000003211 malignant Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 101700083754 mcp3 Proteins 0.000 description 1
- 230000001404 mediated Effects 0.000 description 1
- 210000001806 memory B lymphocyte Anatomy 0.000 description 1
- 210000003071 memory T lymphocyte Anatomy 0.000 description 1
- 230000009245 menopause Effects 0.000 description 1
- 102000003735 mesothelin Human genes 0.000 description 1
- 108090000015 mesothelin Proteins 0.000 description 1
- 230000002503 metabolic Effects 0.000 description 1
- XZWYZXLIPXDOLR-UHFFFAOYSA-N metformin Chemical compound CN(C)C(=N)NC(N)=N XZWYZXLIPXDOLR-UHFFFAOYSA-N 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 230000002438 mitochondrial Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 230000000921 morphogenic Effects 0.000 description 1
- 101700019200 mrp4 Proteins 0.000 description 1
- 201000010927 mucositis Diseases 0.000 description 1
- 108010066416 multidrug resistance-associated protein 3 Proteins 0.000 description 1
- BSOQXXWZTUDTEL-ZUYCGGNHSA-N muramyl dipeptide Chemical compound OC(=O)CC[C@H](C(N)=O)NC(=O)[C@H](C)NC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)O[C@@H](O)[C@@H]1NC(C)=O BSOQXXWZTUDTEL-ZUYCGGNHSA-N 0.000 description 1
- 210000002346 musculoskeletal system Anatomy 0.000 description 1
- 230000003505 mutagenic Effects 0.000 description 1
- 231100000243 mutagenic effect Toxicity 0.000 description 1
- 201000005962 mycosis fungoide Diseases 0.000 description 1
- 201000003793 myelodysplastic syndrome Diseases 0.000 description 1
- 230000003039 myelosuppressive Effects 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 230000001613 neoplastic Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 201000011519 neuroendocrine tumor Diseases 0.000 description 1
- 201000007655 neuronal ceroid lipofuscinosis 6 Diseases 0.000 description 1
- 229940097998 neurotrophin 4 Drugs 0.000 description 1
- 108010087335 neurotrophin 5 Proteins 0.000 description 1
- 230000001264 neutralization Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 125000004433 nitrogen atoms Chemical group N* 0.000 description 1
- 108010036112 nuclear matrix protein 22 Proteins 0.000 description 1
- 108010044762 nucleolin Proteins 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 201000005617 ovarian disease Diseases 0.000 description 1
- 201000004535 ovarian dysfunction Diseases 0.000 description 1
- 231100000543 ovarian dysfunction Toxicity 0.000 description 1
- 101700057139 oxyT Proteins 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 229960001218 pegademase Drugs 0.000 description 1
- 108010001564 pegaspargase Proteins 0.000 description 1
- 229960002995 pegvisomant Drugs 0.000 description 1
- 108010043655 penetratin Proteins 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 230000004526 pharmaceutical effect Effects 0.000 description 1
- 239000002831 pharmacologic agent Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 125000005642 phosphothioate group Chemical group 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 108010017992 platelet-derived growth factor C Proteins 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 229920001559 poly(2-methyloxazoline)-block-poly(dimethylsiloxane) Polymers 0.000 description 1
- 108091022174 poly(A) binding proteins Proteins 0.000 description 1
- 102000020437 poly(A) binding proteins Human genes 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 229920000083 poly(allylamine) Polymers 0.000 description 1
- 229920001308 poly(aminoacid) Polymers 0.000 description 1
- 229920002627 poly(phosphazenes) Polymers 0.000 description 1
- 229920000333 poly(propyleneimine) Polymers 0.000 description 1
- 229920003259 poly(silylenemethylene) Polymers 0.000 description 1
- 229920002246 poly[2-(dimethylamino)ethyl methacrylate] polymer Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920002851 polycationic polymer Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920000023 polynucleotide Polymers 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000015323 positive regulation of phagocytosis Effects 0.000 description 1
- 230000002980 postoperative Effects 0.000 description 1
- 229960003611 pramlintide Drugs 0.000 description 1
- 108010029667 pramlintide Proteins 0.000 description 1
- 229960002847 prasterone Drugs 0.000 description 1
- OZAIFHULBGXAKX-UHFFFAOYSA-N precursor Substances N#CC(C)(C)N=NC(C)(C)C#N OZAIFHULBGXAKX-UHFFFAOYSA-N 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 201000009395 primary hyperaldosteronism Diseases 0.000 description 1
- 230000001902 propagating Effects 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 1
- GGHDAUPFEBTORZ-UHFFFAOYSA-N propane-1,1-diamine Chemical compound CCC(N)N GGHDAUPFEBTORZ-UHFFFAOYSA-N 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 229940048914 protamine Drugs 0.000 description 1
- 230000001681 protective Effects 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- 201000001263 psoriatic arthritis Diseases 0.000 description 1
- 239000002213 purine nucleotide Substances 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 108010084837 rasburicase Proteins 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000000306 recurrent Effects 0.000 description 1
- 230000009703 regulation of cell differentiation Effects 0.000 description 1
- 230000021014 regulation of cell growth Effects 0.000 description 1
- 230000025053 regulation of cell proliferation Effects 0.000 description 1
- 201000002793 renal fibrosis Diseases 0.000 description 1
- 230000000268 renotropic Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 201000007048 respiratory system cancer Diseases 0.000 description 1
- 201000003085 respiratory system disease Diseases 0.000 description 1
- 108010051412 reteplase Proteins 0.000 description 1
- 230000002441 reversible Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 101710029131 rpsA Proteins 0.000 description 1
- 101710029126 rpsG1 Proteins 0.000 description 1
- 101710004856 rpsU2 Proteins 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 239000001296 salvia officinalis l. Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003248 secreting Effects 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-K selenophosphate Chemical class [O-]P([O-])([O-])=[Se] JRPHGDYSKGJTKZ-UHFFFAOYSA-K 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- BLRPTPMANUNPDV-UHFFFAOYSA-N silane Chemical group [SiH4] BLRPTPMANUNPDV-UHFFFAOYSA-N 0.000 description 1
- 231100000019 skin ulcer Toxicity 0.000 description 1
- 101710044770 sll1951 Proteins 0.000 description 1
- 201000011683 small cell sarcoma Diseases 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000392 somatic Effects 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229940063673 spermidine Drugs 0.000 description 1
- 229940063675 spermine Drugs 0.000 description 1
- 230000002269 spontaneous Effects 0.000 description 1
- 229940032094 squalane Drugs 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000009168 stem cell therapy Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical compound OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 230000003319 supportive Effects 0.000 description 1
- 230000004083 survival Effects 0.000 description 1
- 238000002636 symptomatic treatment Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960005460 teriparatide Drugs 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 230000002537 thrombolytic Effects 0.000 description 1
- 229960004231 thymalfasin Drugs 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 108020003112 toxins Proteins 0.000 description 1
- 230000002103 transcriptional Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000001131 transforming Effects 0.000 description 1
- 230000001052 transient Effects 0.000 description 1
- 108010062760 transportan Proteins 0.000 description 1
- 238000004642 transportation engineering Methods 0.000 description 1
- 108010010447 trophoblastin Proteins 0.000 description 1
- 229960001322 trypsin Drugs 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 210000004881 tumor cells Anatomy 0.000 description 1
- 231100000397 ulcer Toxicity 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 210000002229 urogenital system Anatomy 0.000 description 1
- 201000006266 variola major Diseases 0.000 description 1
- 201000000627 variola minor Diseases 0.000 description 1
- 230000002861 ventricular Effects 0.000 description 1
- 101700009423 ycf24 Proteins 0.000 description 1
- 101700026441 ymel-1 Proteins 0.000 description 1
- JOUZZYMOTNQWPM-SCGRZTRASA-L zinc;(2S)-pyrrolidine-2-carboxylate Chemical compound [Zn+2].[O-]C(=O)[C@@H]1CCCN1.[O-]C(=O)[C@@H]1CCCN1 JOUZZYMOTNQWPM-SCGRZTRASA-L 0.000 description 1
Images
Abstract
Description
Настоящее изобретение относится к искусственным молекулам нуклеиновой кислоты, которые содержат открытую рамку считывания, элемент 3'-нетранслируемой области (3'-UTR-элемент) и необязательно поли(А)-последовательность и/или сигнал полиаденилирования. Изобретение относится также к вектору, содержащему 3'-UTR-элемент, к клетке, содержащей искусственную молекулу нуклеиновой кислоты или вектор, к фармацевтической композиции, содержащей искусственную молекулу нуклеиновой кислоты или вектор, и к набору, содержащему искусственную молекулу нуклеиновой кислоты, вектор и/или фармацевтическую композицию, предпочтительно предназначенным для применения в области генной терапии и/или генетической вакцинации.The present invention relates to artificial nucleic acid molecules that contain an open reading frame, a 3'-untranslated region element (3'-UTR element), and optionally a poly(A) sequence and/or a polyadenylation signal. The invention also relates to a vector containing a 3'-UTR element, to a cell containing an artificial nucleic acid molecule or a vector, to a pharmaceutical composition containing an artificial nucleic acid molecule or a vector, and to a kit containing an artificial nucleic acid molecule, a vector and/ or a pharmaceutical composition, preferably for use in the field of gene therapy and/or genetic vaccination.
Генная терапия и генетическая вакцинация относятся к наиболее перспективным и быстро развивающимся методам современной медицины. Они позволяют разрабатывать высокоспецифические и индивидуальные подходы для терапии широкого разнообразия заболеваний. Мишенью для таких подходов к лечению могут являться, прежде всего, врожденные генетические заболевания, злокачественные или связанные с опухолью заболевания, а также воспалительные заболевания. Подразумевается, что с помощью указанных подходов можно предупреждать раннее начало таких заболеваний.Gene therapy and genetic vaccination are among the most promising and rapidly developing methods of modern medicine. They allow the development of highly specific and individual approaches for the treatment of a wide variety of diseases. Such treatment approaches may primarily target congenital genetic diseases, malignant or tumor-related diseases, and inflammatory diseases. It is understood that these approaches can prevent the early onset of such diseases.
Основная концептуальная идея генной терапии заключается в осуществлении соответствующей модуляции нарушенной генной экспрессии, ассоциированной с патологическими состояниями при конкретных заболеваниях. Патологически измененная генная экспрессия может приводить к недостатку или сверхпродуцированию имеющих важное значение генных продуктов, например, сигнальных факторов, таких как гормоны, факторы, обусловленные генами «домашнего хозяйства», метаболические ферменты, структурные белки или т.п. Измененная генная экспрессия может быть обусловлена не только нарушением регуляции транскрипции и/или трансляции, но также и мутациями в ОРС, кодирующей конкретный белок. Патологические мутации могут вызываться, например, хромосомной аберрацией или более специфическими мутациями, такими как точечные мутации или мутации, приводящие к сдвигу рамки считывания, которые все приводят к ограничению функциональности и возможно к полной потере функции генного продукта. Однако нарушение регуляции транскрипции или трансляции может иметь место также в том случае, если мутации воздействуют на гены, кодирующие белки, которые участвуют в механизме транскрипции или трансляции в клетке. Такие мутации могут приводить к патологической повышающей или понижающей регуляции генов, которые сами по себе являются функциональными. Гены, кодирующие генные продукты, которые обладают такими регуляторными функциями, могут представлять собой, например, факторы транскрипции, сигнальные рецепторы, белки-мессенджеры или т.п. Однако, потеря функции таких генов, кодирующих регуляторные белки, при определенных обстоятельствах может быть восстановлена путем искусственной интродукции других факторов, функционирующих в прямом направлении относительно нарушенного генного продукта. Такие дефекты генов можно компенсировать также с помощью генной терапии посредством замены самого поврежденного гена.The main conceptual idea of gene therapy is the implementation of appropriate modulation of impaired gene expression associated with pathological conditions in specific diseases. Pathologically altered gene expression may result in a deficiency or overproduction of important gene products, for example, signaling factors such as hormones, housekeeping gene factors, metabolic enzymes, structural proteins, or the like. Altered gene expression may be due not only to dysregulation of transcription and/or translation, but also to mutations in the ORF encoding a particular protein. Pathological mutations can be caused, for example, by a chromosomal aberration or by more specific mutations such as point or frameshift mutations, all of which result in limited functionality and possibly complete loss of function of the gene product. However, dysregulation of transcription or translation can also occur if mutations affect genes encoding proteins that are involved in the mechanism of transcription or translation in the cell. Such mutations can lead to abnormal up- or down-regulation of genes that are themselves functional. Genes encoding gene products that have such regulatory functions may be, for example, transcription factors, signal receptors, messenger proteins, or the like. However, the loss of function of such genes encoding regulatory proteins can, under certain circumstances, be restored by the artificial introduction of other factors that function in a forward direction relative to the disturbed gene product. Such gene defects can also be compensated by gene therapy by replacing the damaged gene itself.
Генетическая вакцинация позволяет вызывать требуемый иммунный ответ на выбранные антигены, такие как обладающие определенными характеристиками компоненты бактериальных поверхностей, вирусные частицы, опухолевые антигены или т.п. В целом, вакцинация представляет собой одно из наиболее важных достижений современной медицины. Однако в настоящее время эффективные вакцины доступны только для ограниченного количества заболеваний. Поэтому инфекции, которые нельзя предупреждать путем вакцинации, все еще поражают каждый год миллионы людей.Genetic vaccination makes it possible to induce the desired immune response to selected antigens, such as characteristic components of bacterial surfaces, viral particles, tumor antigens, or the like. In general, vaccination represents one of the most important achievements of modern medicine. However, effective vaccines are currently only available for a limited number of diseases. Therefore, infections that cannot be prevented by vaccination still affect millions of people every year.
Обычно вакцины можно подразделять на вакцины «первого», «второго» и «третьего» поколения. Вакцины «первого поколения», как правило, представляют собой вакцины, содержащие цельные организмы. Они основаны либо на живых и ослабленных, либо на убитых патогенах, например, вирусах, бактериях или т.п. Основным недостатком живых и ослабленных вакцин является риск реверсии с образованием угрожающих жизни вариантов. Таким образом, указанные патогены, хотя они и являются ослабленными, все еще могут нести присущие им непредсказуемые риски. Убитые патогены могут не являться достаточно эффективными для создания специфического иммунного ответа. Для того чтобы минимизировать указанные риски, были разработаны вакцины «второго поколения». Как правило, они представляют собой субъединичные вакцины, состоящие из компонентов определенных антигенов или рекомбинантных белков, происходящих из патогенов.In general, vaccines can be classified into "first", "second" and "third" generation vaccines. "First generation" vaccines are generally vaccines containing whole organisms. They are based either on live and attenuated or killed pathogens such as viruses, bacteria or the like. The main disadvantage of live and attenuated vaccines is the risk of reversion to form life-threatening variants. Thus, these pathogens, although attenuated, may still carry inherent unpredictable risks. Killed pathogens may not be effective enough to create a specific immune response. In order to minimize these risks, "second generation" vaccines have been developed. As a rule, they are subunit vaccines, consisting of components of certain antigens or recombinant proteins derived from pathogens.
Генетические вакцины, т.е. вакцины для генетической вакцинации, как правило, называют вакцинами «третьего поколения». Они, как правило, состоят из созданных методами генной инженерии молекул нуклеиновой кислоты, которые обеспечивают экспрессию in vivo фрагментов пептида или белка (антигена), характерных для патогена или опухолевого антигена. При введении пациенту экспрессия генетических вакцин происходит после поглощения клетками-мишенями. Экспрессия введенных нуклеиновых кислот приводит к производству кодируемых белков. В том случае, когда эти белки распознаются иммунной системой пациента как чужие, запускается иммунный ответ.Genetic vaccines, i.e. vaccines for genetic vaccination are generally referred to as "third generation" vaccines. They typically consist of genetically engineered nucleic acid molecules that provide in vivo expression of peptide or protein (antigen) fragments characteristic of a pathogen or tumor antigen. When administered to a patient, expression of genetic vaccines occurs after uptake by target cells. Expression of the introduced nucleic acids results in the production of encoded proteins. When these proteins are recognized by the patient's immune system as foreign, an immune response is triggered.
Как следует из вышеизложенного, оба метода, и генная терапия, и генетическая вакцинация, по существу основаны на введении молекул нуклеиновой кислоты пациенту и последующей транскрипции и/или трансляции кодируемой генетической информации. Альтернативно этому, генетическая вакцинация или генная терапия может включать также методы, которые предусматривают выделение специфических клеток из организма пациента, подлежащего лечению, последующую трансфекцию ex vivo указанных клеток и повторное введение обработанных клеток пациенту.As follows from the above, both methods, and gene therapy, and genetic vaccination, essentially based on the introduction of nucleic acid molecules to the patient and subsequent transcription and/or translation of encoded genetic information. Alternatively, genetic vaccination or gene therapy may also include methods that involve the isolation of specific cells from the body of the patient to be treated, the subsequent ex vivo transfection of these cells and reintroduction of the treated cells to the patient.
В контексте генной терапии или генетической вакцинации в качестве молекул нуклеиновой кислоты можно вводить как ДНК, так и РНК. Известно, что ДНК является относительно стабильной и с ней проще манипулировать. Однако применение ДНК сопряжено с риском нежелательного встраивания введенных ДНК-фрагментов в геном пациента, что может приводить к мутагенным действиям, таким как потеря функции нарушенных генов. Другим риском является то, что происходит нежелательное возникновение антител к ДНК. Еще одним недостатком является ограниченный уровень экспрессии кодируемого пептида или белка, достигаемый при введении ДНК, поскольку ДНК должна проникнуть в ядро для того, чтобы произошла ее транскрипция перед тем, как могла осуществляться трансляция полученной в результате этого мРНК. Уровень экспрессии введенной ДНК может зависеть, среди прочего, от присутствия специфических факторов транскрипции, которые регулируют транскрипцию ДНК. В случае отсутствия таких факторов транскрипция ДНК не приводит к получению ДНК в достаточных количествах. В результате достигаемый уровень транслированного пептида или белка является ограниченным.In the context of gene therapy or genetic vaccination, both DNA and RNA can be administered as nucleic acid molecules. DNA is known to be relatively stable and easier to manipulate. However, the use of DNA carries the risk of undesirably inserting the introduced DNA fragments into the patient's genome, which can lead to mutagenic effects such as loss of function of the disrupted genes. Another risk is that an undesirable occurrence of antibodies to DNA occurs. Another disadvantage is the limited level of expression of the encoded peptide or protein achievable with the introduction of DNA, since the DNA must enter the nucleus in order for it to be transcribed before the resulting mRNA can be translated. The level of expression of the introduced DNA may depend, inter alia, on the presence of specific transcription factors that regulate DNA transcription. In the absence of such factors, DNA transcription does not result in DNA in sufficient quantities. As a result, the level of translated peptide or protein achievable is limited.
При использовании РНК вместо ДНК для генной терапии или генетической вакцинации риск нежелательной интеграции в геном и образования антител к ДНК сводится к минимуму или устраняется. Однако считается, что РНК являться относительно нестабильной молекулой, которая может легко расщепляться под действием повсеместно присутствующих РНКаз.When using RNA instead of DNA for gene therapy or genetic vaccination, the risk of unwanted integration into the genome and the formation of antibodies to DNA is minimized or eliminated. However, RNA is considered to be a relatively unstable molecule that can be easily cleaved by the ubiquitous RNases.
Расщепление РНК in vivo вносит вклад в регулирование времени полужизни РНК. Этот эффект был изучен и было установлено, что он строго регулирует экспрессию эукариотических генов (Friedel и др., Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17), 2009, cc. 1-12). Таким образом, каждая встречающаяся в естественных условиях мРНК имеет свое индивидуальное время полужизни, зависящее от гена, из которого происходит мРНК, и от типа клетки, в которой происходит экспрессия. Оно вносит вклад в регуляцию уровня экспрессии рассматриваемого гена. Нестабильные РНК важны для реализации кратковременной генной экспрессии в определенные моменты времени. Однако РНК с продолжительным временем жизни могут ассоциироваться с накоплением различных белков или с непрерывной экспрессией генов. Время полужизни мРНК in vivo может зависеть также от факторов окружающей среды, таких как обработка гормонами, что продемонстрировано, например, для мРНК инсулин-подобного фактора роста I, актина, и альбумина (Johnson и др., Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., Vol. 88, 1991, cc. 5287-5291).Cleavage of RNA in vivo contributes to the regulation of RNA half-life. This effect has been studied and found to strongly regulate eukaryotic gene expression (Friedel et al., Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17), 2009, pp. 1-12) . Thus, each naturally occurring mRNA has its own individual half-life, depending on the gene from which the mRNA originates and on the type of cell in which expression occurs. It contributes to the regulation of the level of expression of the gene in question. Unstable RNAs are important for transient gene expression at specific time points. However, long-lived RNAs may be associated with the accumulation of various proteins or with continuous gene expression. The in vivo half-life of mRNAs may also depend on environmental factors such as hormone treatment, as demonstrated for example for mRNAs of insulin-like growth factor I, actin, and albumin (Johnson et al., Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., Vol. 88, 1991, pp. 5287-5291).
Для генной терапии и генетической вакцинации, как правило, требуется стабильная РНК. Это обусловлено, с одной стороны, тем фактом, что, как правило, требуется, чтобы in vivo происходило накопление продукта, кодируемого последовательностью РНК. С другой стороны, РНК должна сохранять свою структурную и функциональную целостность при приготовлении пригодной лекарственной формы, в процессе ее хранения и при введении. Таким образом, предпринимались усилия для создания стабильных молекул РНК для генной терапии или генетической вакцинации с целью предупреждения их от раннего разложения или расщепления.Gene therapy and genetic vaccination generally require stable RNA. This is due, on the one hand, to the fact that, as a rule, it is required that in vivo accumulation of the product encoded by the RNA sequence takes place. On the other hand, RNA must maintain its structural and functional integrity during the preparation of a suitable dosage form, during its storage and administration. Thus, efforts have been made to create stable RNA molecules for gene therapy or genetic vaccination in order to prevent them from early degradation or cleavage.
Опубликованы данные о том, что содержание G/C в молекулах нуклеиновой кислоты может оказывать влияние на ее стабильность. Так, нуклеиновые кислоты, содержащие в большем количестве остатки гуанина (G) и/или цитозина (С), могут быть функционально более стабильными, чем нуклеиновые кислоты, содержащие большое количество адениновых (А) и тиминовых (Т) или урациловых (U) нуклеотидов. В этом контексте в WO 02/098443 предложена фармацевтическая композиция, содержащая мРНК, которая стабилизирована посредством модификаций последовательности в кодирующей области. Такая модификация является возможной благодаря вырожденности генетического кода. В соответствии с этим кодоны, содержащие менее предпочтительную комбинацию нуклеотидов (менее предпочтительную с точки зрения стабильности РНК), быть заменены на альтернативные кодоны без изменения кодируемой аминокислотной последовательности. Такой метод стабилизации РНК ограничен тем, что для каждой отдельной молекулы РНК нужно получать конкретную нуклеотидную последовательность, которая не приводит к получению аминокислотной последовательности, отклоняющейся от требуемой. Указанный подход ограничен также тем, что его применяют к кодирующим областям РНК.Data have been published that the content of G/C in nucleic acid molecules can affect its stability. Thus, nucleic acids containing a greater amount of guanine (G) and/or cytosine (C) residues may be functionally more stable than nucleic acids containing a large number of adenine (A) and thymine (T) or uracil (U) nucleotides. . In this context, WO 02/098443 proposes a pharmaceutical composition containing mRNA that is stabilized by sequence modifications in the coding region. Such modification is possible due to the degeneracy of the genetic code. Accordingly, codons containing a less preferred combination of nucleotides (less preferred in terms of RNA stability) can be replaced with alternative codons without changing the encoded amino acid sequence. This method of RNA stabilization is limited by the fact that for each individual RNA molecule it is necessary to obtain a specific nucleotide sequence that does not lead to an amino acid sequence that deviates from the required one. This approach is also limited in that it is applied to RNA coding regions.
При поиске альтернативного подхода к стабилизации мРНК было установлено, что встречающиеся в естественных условиях молекулы эукариотической мРНК содержат характерные стабилизирующие элементы. Например, они могут содержать так называемые нетранслируемые области (UTR) на своем 5'-конце (5'-UTR) и/или на своем 3'-конце (3'-UTR), а также другие структурные особенности, такие как 5'-кэп-структура или 3'-поли(А)-хвост. Как 5'-UTR, так и 3'-UTR, как правило, транскрибируются с геномной ДНК и, следовательно, представляют собой элемент незрелой мРНК. Характерные структурные особенности зрелой мРНК, такие как 5'-кэп и 3'-поли(А)-хвост (которые обозначают также, как поли(А)-хвост или поли(А)-последовательность), как правило, добавляют к транскрибированной (незрелой) мРНК в ходе процессинга мРНК.In the search for an alternative approach to mRNA stabilization, it was found that naturally occurring eukaryotic mRNA molecules contain characteristic stabilizing elements. For example, they may contain so-called untranslated regions (UTRs) at their 5' end (5'-UTR) and/or at their 3' end (3'-UTR), as well as other structural features such as 5' -cap-structure or 3'-poly(A)-tail. Both the 5'-UTR and the 3'-UTR are typically transcribed from genomic DNA and are therefore an immature mRNA element. Structural features of the mature mRNA, such as a 5' cap and a 3' poly(A) tail (also referred to as the poly(A) tail or poly(A) sequence), are usually added to the transcribed ( immature) mRNA during mRNA processing.
3'-поли(А)-хвост, как правило, представляет собой монотонный участок последовательности, который состоит из аденозиновых нуклеотидов, добавленный к 3'-концу транскрибированной мРНК. Он может содержать вплоть до примерно 400 аденозиновых нуклеотидов. Установлено, что длина такого 3'-поли(А)-хвоста может являться элементом, имеющим решающее значение для стабильности индивидуальной мРНК.The 3'-poly(A) tail is typically a monotonic stretch of sequence that consists of adenosine nucleotides added to the 3' end of the transcribed mRNA. It may contain up to about 400 adenosine nucleotides. It has been found that the length of such a 3'-poly(A)-tail may be an element of decisive importance for the stability of an individual mRNA.
Было продемонстрировано также, что 3'-UTR мРНК α-глобина может являться важным фактором, обеспечивающим хорошо известную стабильность мРНК α-глобина (Rodgers и др., Regulated α-globin mRNA decay is a cytoplasmic event proceeding through 3'-to-5' exosome-dependent decapping, RNA, 8, 2002, cc. 1526-1537). 3'-UTR мРНК α-глобина, по-видимому, участвует в формировании специфического рибонуклеопротеинового комплекса, α-комплекса, присутствие которого коррелирует со стабильностью мРНК in vitro (Wang и др., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro, Molecular and Cellular biology, том 19, №7, июль 1999 г., cc. 4552-4560).It has also been demonstrated that the 3'-UTR of α-globin mRNA may be an important contributor to the well-known stability of α-globin mRNA (Rodgers et al., Regulated α-globin mRNA decay is a cytoplasmic event proceeding through 3'-to-5 'exosome-dependent decapping, RNA, 8, 2002, pp. 1526-1537). The 3'-UTR of α-globin mRNA appears to be involved in the formation of a specific ribonucleoprotein complex, the α-complex, whose presence correlates with in vitro mRNA stability (Wang et al., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro, Molecular and Cellular Biology, Volume 19, No. 7, July 1999, pp. 4552-4560).
Кроме того, для UTR в мРНК рибосомального белка была выявлена важная регуляторная функция: хотя 5'-UTR мРНК рибосомального белка контролирует ассоциированную с ростом трансляцию мРНК, строгость указанной регулировки обеспечивается соответствующей 3'-UTR в мРНК рибосомального белка (Ledda и др., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, том 344, 2005, cc. 213-220). Этот механизм оказывает влияние на специфическую схему экспрессии рибосомальных белков, которые, как правило, транскрибируются постоянным образом, вследствие чего мРНК некоторых рибосомальных белков, таких как рибосомальный белок S9 или рибосомальный белок L32, называют генами «домашнего хозяйства» (Janovick-Guretzky и др., Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., том 90, 2007, cc. 2246-2252). Таким образом, ассоциированная с ростом схема экспрессии рибосомальных белков в основном обусловлена регуляцией на уровне трансляции.In addition, an important regulatory function has been identified for the UTR in ribosomal protein mRNA: although the 5'-UTR of ribosomal protein mRNA controls growth-associated mRNA translation, the rigor of this regulation is provided by the corresponding 3'-UTR in ribosomal protein mRNA (Ledda et al., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, Volume 344, 2005, pp. 213-220). This mechanism affects the specific expression pattern of ribosomal proteins, which are usually transcribed in a constant manner, as a result of which the mRNA of some ribosomal proteins, such as the S9 ribosomal protein or the L32 ribosomal protein, are called housekeeping genes (Janovick-Guretzky et al. , Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., Volume 90, 2007, pp. 2246-2252). Thus, the expression pattern of ribosomal proteins associated with growth is mainly due to regulation at the level of translation.
Вне зависимости от факторов, влияющих на стабильность мРНК, эффективность трансляции введенных молекул нуклеиновой кислоты клетками-мишенями или тканью имеет решающее значение для любого подхода с использованием молекул нуклеиновой кислоты для генной терапии или генетической вакцинации. Как следует из процитированных выше примеров, структурные особенности, такие как UTR, 5'-кэп и 3'-поли(А)-хвост, наряду с регуляцией стабильности, регулируют также трансляцию большинства мРНК. В этом контексте, опубликованы данные о том, что длина поли(А)-хвоста может играть важную роль также и для эффективности трансляции. Однако стабилизирующие 3'-элементы могут оказывать также ослабляющее действие на трансляцию.Regardless of the factors affecting mRNA stability, the efficiency of translation of the introduced nucleic acid molecules by the target cells or tissue is critical to any approach using nucleic acid molecules for gene therapy or genetic vaccination. As follows from the examples cited above, structural features such as UTR, 5'-cap and 3'-poly(A)-tail, along with the regulation of stability, also regulate the translation of most mRNA. In this context, published data suggest that the length of the poly(A) tail may also play an important role in the efficiency of translation. However, 3' stabilizing elements can also have a translational dampening effect.
В основу настоящего изобретения была положена задача создать молекулы нуклеиновой кислоты, которые можно применять для генной терапии и/или генетической вакцинации. Задача изобретения заключалась, прежде всего, в том, чтобы создать виды мРНК, которые стабилизированы для защиты от преждевременного разложения или расщепления, но которые не характеризуются значительной функциональной потерей с точки зрения эффективности трансляции. Задачей изобретения являлось также создание искусственной молекулы нуклеиновой кислоты, предпочтительно мРНК, отличающейся повышенной экспрессией соответствующего белка, кодируемого указанной молекулой нуклеиновой кислоты. Одна из конкретных задач изобретения заключалась в создании мРНК, позволяющей повышать эффективность трансляции соответствующего кодируемого белка. Другая задача настоящего изобретения заключалась в том, чтобы создать молекулы нуклеиновой кислоты, кодирующие такие обладающие преимуществами виды мРНК, которые могут быть пригодными для применения в генной терапии и/или генетической вакцинации. Следующая задача настоящего изобретения заключалась в том, чтобы создать фармацевтическую композицию для применения в генной терапии и/или генетической вакцинации. В целом, задача настоящего изобретения заключалась в создании усовершенствованных видов нуклеиновой кислоты, которые позволяют преодолевать указанные выше недостатки существующего уровня техники с использованием экономичного и простого подхода.The present invention was based on the task of creating nucleic acid molecules that can be used for gene therapy and/or genetic vaccination. The objective of the invention was primarily to create mRNA species that are stabilized to protect against premature degradation or cleavage, but which do not suffer from a significant functional loss in terms of translation efficiency. It was also an object of the invention to provide an artificial nucleic acid molecule, preferably an mRNA, characterized by increased expression of the corresponding protein encoded by said nucleic acid molecule. One of the specific objectives of the invention was to create mRNA, allowing to increase the efficiency of translation of the corresponding encoded protein. Another object of the present invention was to provide nucleic acid molecules encoding advantageous mRNA species that may be suitable for use in gene therapy and/or genetic vaccination. A further object of the present invention was to provide a pharmaceutical composition for use in gene therapy and/or genetic vaccination. In general, the aim of the present invention was to provide improved nucleic acid species that overcome the above disadvantages of the prior art using an economical and simple approach.
Задачи, положенные в основу настоящего изобретения, решаются с помощью объектов изобретения, представленных в формуле изобретения.The problems underlying the present invention are solved with the help of the objects of the invention presented in the claims.
Настоящее изобретение было создано при поддержке правительства в рамках соглашения № HR0011-11-3-0001, подписанного DARPA (Агентство передовых оборонных исследовательских проектов). Правительство обладает определенными правами на изобретение.The present invention was made with government support under Agreement No. HR0011-11-3-0001 signed by DARPA (Defense Advanced Research Projects Agency). The government has certain rights to the invention.
Для целей ясности и удобочитаемости ниже даны следующие определения. Все технические характеристики, указанные в этих определениях, применимы к каждому и всем вариантам осуществления изобретения. В контексте этих вариантов осуществления изобретения могут быть даны дополнительные определения и пояснения.For purposes of clarity and readability, the following definitions are given below. All specifications specified in these definitions apply to each and all embodiments of the invention. In the context of these embodiments, further definitions and explanations may be given.
Адаптивный иммунный ответ: Как правило, под адаптивным иммунным ответом понимают антигенспецифический ответ иммунной системы. Специфичность в отношении антигена позволяет вырабатывать ответы, приспособленные к специфическим патогенам или инфицированным патогеном клеткам. Способность создавать такие приспособленные ответы, как правило, поддерживается в организме «клетками памяти». Если патоген инфицирует организм более одного раза, то указанные специфические клетки памяти используются для его быстрой элиминации. В этом контексте первая стадия адаптивного иммунного ответа представляет собой активацию наивных антигенспецифических Т-клеток или других иммунных клеток, способных индуцировать антигенспецифический иммунный ответ, антигенпрезентирующими клетками. Это происходит в лимфоидных тканях и органах, через которые постоянно проходят наивные Т-клетки. Три типа клеток, которые могут служить в качестве антигенпрезентирующих клеток, представляют собой дендритные клетки, макрофаги и В-клетки. Каждая из указанных клеток выполняет отдельную функцию при вызывании иммунных ответов. Дендритные клетки могут поглощать антигены посредством фагоцитоза и макропиноцитоза, и они могут стимулироваться при контакте, например, с чужим антигеном, к миграции в местную лимфоидную ткань, где может происходить их дифференцировка в зрелые дендритные клетки. Макрофаги поглощают находящиеся в форме частиц антигены, такие как бактерии, и могут индуцироваться инфекционными агентами или другими соответствующими стимулами и экспрессировать в результате этого молекулы ГКГС. Уникальная способность В-клеток к связыванию и интернализации растворимых белковых антигенов посредством своих рецепторов также может иметь важное значение для индукции Т-клеток. ГКГС-молекулы, как правило, ответственны за презентацию антигена Т-клеткам. При этом презентация антигена на молекулах ГКГС приводит к активации Т-клеток, что индуцирует их пролиферацию и дифференцировку в «вооруженные» эффекторные Т-клетки. Наиболее важной функцией эффекторных Т-клеток является уничтожение (цитолиз) инфицированных клеток цитотоксическими CD8+-T-клетками и активация макрофагов Th1-клетками, что в совокупности создает опосредованный клетками (клеточный) иммунитет, а активация В-клеток как Th2-, так и Th1-клетками, приводящая к образованию различных классов антител, запускает гуморальный иммунный ответ. Т-клетки распознают антиген посредством своих Т-клеточных рецепторов, которые не распознают антиген и не связываются с ним непосредственно, но вместо этого распознают короткие пептидные фрагменты, например, выведенных из патогена белковых антигенов, например, так называемые эпитопы, которые связываются с молекулами ГКГС на поверхностях других клеток.Adaptive immune response: Typically, adaptive immune response refers to an antigen-specific response of the immune system. Antigen specificity allows for responses tailored to specific pathogens or pathogen-infected cells. The ability to create such adapted responses is usually maintained in the body by "memory cells". If the pathogen infects the body more than once, then these specific memory cells are used for its rapid elimination. In this context, the first stage of an adaptive immune response is the activation of naïve antigen-specific T cells or other immune cells capable of inducing an antigen-specific immune response by antigen-presenting cells. This occurs in lymphoid tissues and organs through which naive T cells constantly pass. Three cell types that can serve as antigen presenting cells are dendritic cells, macrophages, and B cells. Each of these cells performs a separate function in inducing immune responses. Dendritic cells can take up antigens via phagocytosis and macropinocytosis, and they can be stimulated upon contact with, for example, a foreign antigen, to migrate to the local lymphoid tissue where they can differentiate into mature dendritic cells. Macrophages engulf particulate antigens such as bacteria and can be induced by infectious agents or other appropriate stimuli and thereby express MHC molecules. The unique ability of B cells to bind and internalize soluble protein antigens through their receptors may also be important for T cell induction. MHC molecules are generally responsible for antigen presentation to T cells. At the same time, antigen presentation on MHC molecules leads to the activation of T cells, which induces their proliferation and differentiation into “armed” effector T cells. The most important function of effector T cells is the destruction (cytolysis) of infected cells by cytotoxic CD8 + -T cells and the activation of macrophages by Th1 cells, which together creates cell-mediated (cellular) immunity, and the activation of B cells by both Th2- and Th1 cells, leading to the formation of various classes of antibodies, triggers a humoral immune response. T cells recognize an antigen through their T cell receptors, which do not recognize the antigen and do not bind to it directly, but instead recognize short peptide fragments, such as pathogen-derived protein antigens, such as so-called epitopes, which bind to MHC molecules on the surfaces of other cells.
Адаптивная иммунная система: Адаптивная иммунная система в основном предназначена для устранения или предупреждения роста патогенов. Как правило, она регулирует адаптивный иммунный ответ, придавая иммунной системе позвоночных способность распознавать и запоминать специфические патогены (для создания иммунитета) и организовывать более сильную атаку в каждом случае при обнаружении патогена. Система обладает высокой способностью к адаптации вследствие соматической гипермутации (процесс ускоренных соматических мутаций) и V(D)J-рекомбинации (необратимая генетическая рекомбинация сегментов гена рецептора антигена). Этот механизм позволяет небольшому количеству генов создавать огромное количество различных рецепторов антигенов, которые затем уникальным образом экспрессируются на каждом индивидуальном лимфоците. Поскольку реаранжировка гена приводит к необратимому изменению ДНК каждой клетки, то все потомство такой клетки должно затем наследовать гены, кодирующие ту же самую рецепторную специфичность, включая В-клетки памяти и Т-клетки памяти, которые имеют решающее значение для долговременного специфического иммунитета.Adaptive immune system: The adaptive immune system is primarily designed to eliminate or prevent the growth of pathogens. Typically, it regulates the adaptive immune response, giving the vertebrate immune system the ability to recognize and remember specific pathogens (to build immunity) and mount a stronger attack each time a pathogen is detected. The system is highly adaptable due to somatic hypermutation (a process of accelerated somatic mutations) and V(D)J recombination (irreversible genetic recombination of antigen receptor gene segments). This mechanism allows a small number of genes to create a huge number of different antigen receptors, which are then uniquely expressed on each individual lymphocyte. Since the rearrangement of a gene results in an irreversible change in the DNA of each cell, then all progeny of such a cell must then inherit genes encoding the same receptor specificity, including memory B cells and memory T cells, which are critical for long-term specific immunity.
Адъювант/адъювантный компонент: Адъювант или адъювантный компонент в наиболее широком смысле, как правило, представляет собой фармакологический и/или иммунологический агент, который может модифицировать, например, усиливать, действие других агентов, таких как лекарственное средство или вакцина. Это понятие следует рассматривать в широком смысле, и оно относится к широкому спектру субстанций. Как правило, указанные субстанции обладают способностью повышать иммуногенность антигенов. Например, адъюванты могут распознаваться врожденными иммунными системами и, например, могут вызывать врожденный иммунный ответ.«Адъюванты», как правило, не вызывают адаптивный иммунный ответ. Таким образом, «адъюванты» нельзя классифицировать как антигены. Механизм их действия отличен от механизма действий, запускаемых антигенами, которые приводят к адаптивному иммунному ответу.Adjuvant/Adjuvant Component: An adjuvant, or adjuvant component in the broadest sense, is generally a pharmacological and/or immunological agent that can modify, for example enhance, the effect of other agents such as a drug or vaccine. This concept should be considered in a broad sense, and it refers to a wide range of substances. As a rule, these substances have the ability to increase the immunogenicity of antigens. For example, adjuvants may be recognized by innate immune systems and, for example, may elicit an innate immune response. "Adjuvants" generally do not elicit an adaptive immune response. Thus, "adjuvants" cannot be classified as antigens. Their mechanism of action is different from that triggered by antigens that lead to an adaptive immune response.
Антиген: В контексте настоящего изобретения понятие «антиген» относится, как правило, к субстанции, которая может распознаваться иммунной системой, предпочтительно адаптивной иммунной системой, и которая обладает способностью запускать антигенспецифический иммунный ответ, например, посредством образования антител и/или антигенспецифических Т-клеток, в качестве компонента адаптивного иммунного ответа. Как правило, антиген может представлять собой или содержать пептид или белок, который может презентоваться ГКГС Т-клеткам. В контексте настоящего изобретения антиген может представлять собой продукт трансляции предложенной молекулы нуклеиновой кислоты, предпочтительно мРНК, представленной в настоящем описании. В этом контексте под антигенами подразумевают также фрагменты, варианты и производные пептидов и белков, содержащие по меньшей мере один эпитоп. В контексте настоящего изобретения наиболее предпочтительными являются опухолевые антигены и патогенные антигены.Antigen: In the context of the present invention, the term "antigen" refers generally to a substance that can be recognized by the immune system, preferably the adaptive immune system, and which has the ability to trigger an antigen-specific immune response, for example, through the formation of antibodies and/or antigen-specific T cells , as a component of the adaptive immune response. Typically, an antigen may be or contain a peptide or protein that can be presented to MHC T cells. In the context of the present invention, the antigen may be a translation product of the proposed nucleic acid molecule, preferably mRNA, presented in the present description. In this context, antigens also include fragments, variants and derivatives of peptides and proteins containing at least one epitope. In the context of the present invention, tumor antigens and pathogenic antigens are most preferred.
Искусственная молекула нуклеиновой кислоты: Под искусственной молекулой нуклеиновой кислоты, как правило, понимают молекулу нуклеиновой кислоты, например, ДНК или РНК, которая не встречается в естественных условиях. Иными словами, искусственную молекулу нуклеиновой кислоты можно рассматривать как молекулу нуклеиновой кислоты, не встречающуюся в естественных условиях. Такая молекула нуклеиновой кислоты может не встречаться в естественных условиях из-за своей индивидуальной последовательности (которая не встречается в естественных условиях) и/или из-за других модификаций, например, структурных модификаций нуклеотидов, которые не встречаются в естественных условиях. Искусственная молекула нуклеиновой кислоты может представлять собой молекулу ДНК, молекулу РНК или гибридную молекулу, содержащую участки ДНК и РНК. Как правило, искусственные молекулы нуклеиновой кислоты можно конструировать и/или создавать методами генетической инженерии так, чтобы они соответствовали требуемой искусственной последовательности нуклеотидов (гетерологичной последовательности). В этом контексте искусственная последовательность, как правило, представляет собой последовательность, которая не может встречаться в естественных условиях, т.е. отличается от последовательности дикого типа по меньшей мере одним нуклеотидом. Можно считать, что понятие «дикий тип» относится к последовательности, встречающейся в природе. Кроме того, не следует понимать, что понятие «искусственная молекула нуклеиновой кислоты» обозначает «одну единственную молекулу», как правило, оно включает группу идентичных молекул. Следовательно, оно может относиться к множеству идентичных молекул, содержащихся в аликвоте.Artificial nucleic acid molecule: An artificial nucleic acid molecule is generally understood to mean a nucleic acid molecule, such as DNA or RNA, that does not occur naturally. In other words, an artificial nucleic acid molecule can be considered as a nucleic acid molecule that does not occur naturally. Such a nucleic acid molecule may not occur naturally due to its individual sequence (which does not occur naturally) and/or due to other modifications, such as structural modifications of nucleotides, which do not occur naturally. The artificial nucleic acid molecule may be a DNA molecule, an RNA molecule, or a hybrid molecule containing portions of DNA and RNA. Generally, artificial nucleic acid molecules can be designed and/or genetically engineered to match the desired artificial nucleotide sequence (heterologous sequence). In this context, an artificial sequence is generally one that cannot occur naturally, i.e. differs from the wild-type sequence by at least one nucleotide. We can consider that the concept of "wild type" refers to a sequence found in nature. In addition, it should not be understood that the term "artificial nucleic acid molecule" means "one single molecule", as a rule, it includes a group of identical molecules. Therefore, it may refer to a plurality of identical molecules contained in an aliquot.
Бицистронная РНК, полицистронная РНК: Бицистронная или полицистронная РНК, как правило, представляет собой РНК, предпочтительно мРНК, которая, как правило, может иметь две (бицистронная) или большее количество (полицистронная) открытых рамок считывания (ОРС). В этом контексте открытая рамка считывания представляет собой последовательность, состоящую из нескольких кодонов, которые могут транслироваться в пептид или белок.Bicistronic RNA, Polycistronic RNA: Bicistronic or polycistronic RNA is generally an RNA, preferably an mRNA, which can typically have two (bicistronic) or more (polycistronic) open reading frames (ORFs). In this context, an open reading frame is a sequence of multiple codons that can be translated into a peptide or protein.
Носитель/полимерный носитель: В контексте изобретения носитель, как правило, может представлять собой соединение, которое облегчает транспорт и/или включение в комплекс другого соединения (карго, полезный груз). Полимерный носитель, как правило, представляет собой носитель, образующий полимер. Носитель может быть связан со своим полезным грузом посредством ковалентного или нековалентного взаимодействия. Носитель может транспортировать нуклеиновые кислоты, например, РНК или ДНК, к клеткам-мишеням. Носитель может (в некоторых вариантах осуществления изобретения) представлять собой катионный компонент.Carrier/Polymer Carrier: In the context of the invention, a carrier can generally be a compound that facilitates the transport and/or incorporation of another compound (cargo, payload). The polymeric carrier, as a rule, is a carrier that forms a polymer. The carrier may be associated with its payload through a covalent or non-covalent interaction. The carrier can transport nucleic acids, such as RNA or DNA, to target cells. The carrier may (in some embodiments of the invention) be a cationic component.
Катионный компонент: Понятие «катионный компонент», как правило, относится к заряженной молекуле, которая является положительно заряженной (катион) при значении рН, составляющем, как правило, от 1 до 9, предпочтительно при значении рН, равном или ниже 9 (например, от 5 до 9), равном или ниже 8 (например, от 5 до 8), равном или ниже 7 (например, от 5 до 7), наиболее предпочтительно при физиологическом значении рН, например, от 7,3 до 7.4. Таким образом, катионный компонент может представлять собой любое положительно заряженное соединение или полимер, предпочтительно катионный пептид или белок, который является положительно заряженным в физиологических условиях, прежде всего в физиологических условиях in vivo. «Катионный пептид или белок» может содержать по меньшей мере одну положительно заряженную аминокислоту, или более чем одну положительно заряженную аминокислоту, например, выбранную из Arg, His, Lys или Orn. Следовательно, «поликатионные» соединения также подпадают под указанное определение, если они несут более одного положительного заряда в указанных условиях.Cationic component: The term "cationic component" generally refers to a charged molecule that is positively charged (cation) at a pH value typically between 1 and 9, preferably at or below pH 9 (e.g., 5 to 9) equal to or less than 8 (eg 5 to 8), equal to or less than 7 (eg 5 to 7), most preferably at physiological pH, eg 7.3 to 7.4. Thus, the cationic component may be any positively charged compound or polymer, preferably a cationic peptide or protein, which is positively charged under physiological conditions, especially in vivo physiological conditions. A "cationic peptide or protein" may contain at least one positively charged amino acid, or more than one positively charged amino acid, for example selected from Arg, His, Lys, or Orn. Therefore, "polycationic" compounds also fall under the specified definition if they carry more than one positive charge under the specified conditions.
5'-Кэп: 5'-Кэп представляет собой структуру, как правило, модифицированную нуклеотидную структуру, которая обычно «завершает» 5'-конец зрелой мРНК. 5'-кэп может, как правило, быть образован модифицированным нуклеотидом, прежде всего производным гуанинового нуклеотида. Предпочтительно 5'-кэп связан с 5'-концом через 5'-5'-трифосфатную связь. 5'-кэп может быть метилирован, например, может представлять собой m7GpppN, где N обозначает концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, как правило, 5'-конец РНК. Другими примерами структур 5'-кэпа являются глицерил, инвертированная дезоксигруппа (фрагмент), лишенная азотистого основания, 4',5'-метиленовой нуклеотид, 1-(бета-D-эритрофуранозильный) нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, нуклеотид с модифицированным основанием, треопентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный лишенный азотистого основания фрагмент, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный лишенный азотистого основания фрагмент, 1,4-бутандиолфосфатный, 3'-фосфороамидатный, гексилфосфатный, аминогексилфосфатный, 3'-фосфатный, 3'-фосфоротиоатный, фосфородитиоатный или связанный мостиком или несвязанный мостиком метилфосфонатный фрагмент.5'-Cap: The 5'-Cap is a structure, usually a modified nucleotide structure, that normally "terminates" the 5' end of a mature mRNA. The 5' cap can generally be formed by a modified nucleotide, primarily a derivative of a guanine nucleotide. Preferably the 5' cap is linked to the 5' end via a 5'-5' triphosphate bond. The 5' cap may be methylated, eg m7GpppN, where N is the 5' terminal nucleotide of the nucleic acid carrying the 5' cap, typically the 5' end of the RNA. Other examples of 5'-cap structures are glyceryl, inverted deoxy group (fragment) devoid of a nitrogenous base, 4',5'-methylene nucleotide, 1-(beta-D-erythrofuranosyl) nucleotide, 4'-thionucleotide, carbocyclic nucleotide, 1, 5-anhydrohexitol nucleotide, L-nucleotides, alpha-nucleotide, base-modified nucleotide, treopentofuranosyl nucleotide, acyclic 3',4'-seconucleotide, acyclic 3,4-dihydroxybutyl nucleotide, acyclic 3,5-dihydroxypentyl nucleotide, 3'-3 '-Inverted Nucleotide Fragment, 3'-3'-Inverted Nucleotide Fragment, 3'-2'-Inverted Nucleotide Fragment, 3'-2'-Inverted Nucleotide Fragment, 1,4-Butanediol Phosphate, 3'-Phosphoramidate , hexylphosphate, aminohexylphosphate, 3'-phosphate, 3'-phosphorothioate, phosphorodithioate, or a bridged or unbridged methylphosphonate moiety.
Клеточный иммунитет/клеточный иммунный ответ: Клеточный иммунитет относится, как правило, к активации макрофагов, естественных клеток-киллеров (NK), антигенспецифических цитотоксических Т-лимфоцитов и высвобождению различных цитокинов в ответ на антиген. В более общем смысле клеточный иммунитет основан не на антителах, а на активации клеток иммунной системы. Как правило, клеточный иммунный ответ может характеризоваться, например, активацией антигенспецифических цитотоксических Т-лимфоцитов, которые способны индуцировать апоптоз клеток, например, специфических иммунных клеток типа дендритных клеток или других клеток, экспонирующих эпитопы чужих генов на своей поверхности. Такие клетки могут представлять собой инфицированные вирусом или инфицированные внутриклеточными бактериями, или раковые клетки, экспонирующие опухолевые антигены. Другими характеристиками могут являться активация макрофагов и естественных клеток-киллеров, позволяющая им разрушать патогены, и стимуляция клеток к секреции различных цитокинов, которые влияют на функцию других клеток, участвующих в адаптивных иммунных ответах и врожденных иммунных ответах.Cellular Immunity/Cellular Immune Response: Cellular immunity generally refers to the activation of macrophages, natural killer (NK) cells, antigen-specific cytotoxic T lymphocytes, and the release of various cytokines in response to an antigen. In a more general sense, cellular immunity is not based on antibodies, but on the activation of cells of the immune system. Typically, a cellular immune response may be characterized, for example, by the activation of antigen-specific cytotoxic T-lymphocytes that are capable of inducing cell apoptosis, for example, specific immune cells such as dendritic cells or other cells displaying foreign gene epitopes on their surface. Such cells may be virus-infected or intracellular bacteria-infected, or cancer cells displaying tumor antigens. Other characteristics may be the activation of macrophages and natural killer cells, allowing them to destroy pathogens, and the stimulation of cells to secrete various cytokines that affect the function of other cells involved in adaptive immune responses and innate immune responses.
ДНК: ДНК является общепринятым сокращением дезоксирибонуклеиновой кислоты. Она представляет собой молекулу нуклеиновой кислоты, т.е. полимер, состоящий из нуклеотидов. Указанные нуклеотиды, как правило, представляют собой мономеры дезоксиаденозинмонофосфата, дезокситимидинмонофосфата, дезоксигуанозинмонофосфата и дезоксицитидинмонофосфата, которые сами состоят из сахарного фрагмента (дезоксирибоза), фрагмента, представляющего собой основание, и фосфатного фрагмента, и образуют полимеры с характерной каркасной структурой. Каркасная структура, как правило, образована с помощью фосфодиэфирных связей между сахарным фрагментом нуклеотида, т.е. дезоксирибозы, первого мономера и фосфатным фрагментом второго смежного мономера. Специфический порядок мономеров, т.е. порядок оснований, сцепленных с сахарным/фосфатным каркасом, называют ДНК-последовательностью. ДНК может быть одноцепочечной или двухцепочечной. В двухцепочечной форме нуклеотиды первой цепи, как правило, гибридизуются с нуклеотидами второй цепи, например, путем спаривания оснований А/Т и спаривания оснований G/C.DNA: DNA is the common abbreviation for deoxyribonucleic acid. It is a nucleic acid molecule, i.e. a polymer made up of nucleotides. These nucleotides are typically deoxyadenosine monophosphate, deoxythymidine monophosphate, deoxyguanosine monophosphate and deoxycytidine monophosphate monomers, which themselves consist of a sugar moiety (deoxyribose), a base moiety and a phosphate moiety, and form polymers with a characteristic backbone structure. The framework structure, as a rule, is formed by phosphodiester bonds between the sugar fragment of the nucleotide, i.e. deoxyribose, the first monomer and a phosphate fragment of the second adjacent monomer. The specific order of the monomers, i.e. the order of bases linked to the sugar/phosphate backbone is called the DNA sequence. DNA can be single stranded or double stranded. In the double stranded form, first strand nucleotides typically hybridize to second strand nucleotides, for example, by A/T base pairing and G/C base pairing.
Эпитоп: Эпитопы (которые называют также «антигенными детерминантами») можно подразделить на Т-клеточные эпитопы и В-клеточные эпитопы. В контексте настоящего изобретения Т-клеточные эпитопы или части белков могут содержать фрагменты, предпочтительно имеющие длину от примерно 6 до примерно 20 аминокислот или даже более, например, фрагменты, процессируемые и презентируемые молекулами ГКГС класса I, предпочтительно имеют длину от примерно 8 до примерно 10 аминокислот, например, 8, 9 или 10, (или даже 11 или 12 аминокислот), или фрагменты, процессируемые и презентируемые молекулами ГКГС класса II, предпочтительно имеют длину примерно 13 аминокислот или более, например, 13, 14, 15, 16, 17, 18, 19, 20 или даже большее количество аминокислот, при этом указанные фрагменты можно выбирать из любой части аминокислотной последовательности. Указанные фрагменты, как правило, распознаются Т-клетками в форме комплекса, состоящего из пептидного фрагмента и молекулы ГКГС, т.е. фрагменты, как правило, не распознаются в их нативной форме. В-клеточные эпитопы, как правило, представляют собой фрагменты, локализованные на внешней поверхности (нативных) белковых или пептидных антигенов, указанных в настоящем описании, предпочтительно состоящих из 5-15 аминокислот, более предпочтительно состоящих из 5-12 аминокислот, еще более предпочтительно состоящих из 6-9 аминокислот, которые могут распознаваться антителами, т.е. в их нативной форме.Epitope: Epitopes (also referred to as "antigenic determinants") can be divided into T-cell epitopes and B-cell epitopes. In the context of the present invention, T-cell epitopes or portions of proteins may contain fragments, preferably having a length of from about 6 to about 20 amino acids or even more, for example, fragments processed and presented by MHC class I molecules, preferably have a length of from about 8 to about 10 amino acids, e.g. 8, 9 or 10, (or even 11 or 12 amino acids), or fragments processed and presented by MHC class II molecules are preferably about 13 amino acids or more in length, e.g. 13, 14, 15, 16, 17 , 18, 19, 20, or even more amino acids, and these fragments can be selected from any part of the amino acid sequence. These fragments are usually recognized by T cells in the form of a complex consisting of a peptide fragment and an MHC molecule, i.e. fragments are generally not recognized in their native form. B-cell epitopes are typically fragments located on the outer surface of the (native) protein or peptide antigens described herein, preferably consisting of 5-15 amino acids, more preferably consisting of 5-12 amino acids, even more preferably consisting of of 6-9 amino acids that can be recognized by antibodies, i.e. in their native form.
Такие эпитопы белков или пептидов можно, кроме того, выбирать из любых указанных вариантов таких белков или пептидов. В этом контексте антигенные детерминанты могут представлять собой конформационные или прерывистые эпитопы, состоящие из сегментов указанных в настоящем описании белков или пептидов, которые расположены с перерывами в аминокислотной последовательности белков или пептидов, указанных в настоящем описании, но которые находятся вблизи друг от друга в трехмерной структуре, или непрерывные или линейные эпитопы, состоящие из одной полипептидной цепи.Such protein or peptide epitopes may furthermore be selected from any of the recited variants of such proteins or peptides. In this context, antigenic determinants may be conformational or discontinuous epitopes consisting of segments of proteins or peptides as defined herein that are located at intervals in the amino acid sequence of proteins or peptides as described herein, but which are close to each other in a three-dimensional structure. , or continuous or linear epitopes consisting of a single polypeptide chain.
Фрагмент последовательности: фрагмент последовательности, как правило, представляет собой укороченный участок полноразмерной последовательности, например, молекулы нуклеиновой кислоты или аминокислотной последовательности. Следовательно, фрагмент, как правило, состоит из последовательности, которая идентична соответствующему сегменту полноразмерной последовательности. В контексте настоящего изобретения предпочтительный фрагмент последовательности состоит из непрерывного сегмента, содержащего такие элементы, как нуклеотиды или аминокислоты, который соответствует непрерывному состоящему из указанных элементов сегменту молекулы, из которой происходит фрагмент, длина которого составляет по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, и наиболее предпочтительно по меньшей мере 80% от всей (т.е. полноразмерной) молекулы, из которой происходит фрагмент.Sequence Fragment: A sequence fragment is typically a shortened portion of a full-length sequence, such as a nucleic acid molecule or an amino acid sequence. Therefore, a fragment typically consists of a sequence that is identical to the corresponding segment of the full-length sequence. In the context of the present invention, a preferred sequence fragment consists of a contiguous segment containing elements such as nucleotides or amino acids, which corresponds to a contiguous segment of these elements of the molecule from which the fragment is derived, the length of which is at least 30%, more preferably at least 40%, more preferably at least 50%, even more preferably at least 60%, even more preferably at least 70%, and most preferably at least 80% of the total (i.e. full length) molecule from which fragment occurs.
G/C-модифицированная: G/C-модифицированная нуклеиновая кислота, как правило, может представлять собой нуклеиновую кислоту, предпочтительно молекулу РНК, указанную в настоящем описании, созданную на основе модифицированной последовательности дикого типа, которая содержит предпочтительно повышенное количество гуанозиновых и/или цитозиновых нуклеотидов по сравнению с последовательностью дикого типа. Для получения указанного повышенного количества можно осуществлять замену кодонов, содержащих аденозиновые или тимидиновые нуклеотиды, на кодоны, содержащие гуанозиновые или цитозиновые нуклеотиды. При повышенном содержании G/C в кодирующей области ДНК или РНК, при заменах можно использовать вырожденность генетического кода. Таким образом, замены кодонов предпочтительно не изменяют кодируемые аминокислотные остатки, но исключительно увеличивают содержание G/C в молекуле нуклеиновой кислоты.G/C-modified: G/C-modified nucleic acid, as a rule, can be a nucleic acid, preferably an RNA molecule, specified in the present description, created on the basis of a modified wild-type sequence, which preferably contains an increased amount of guanosine and/or cytosine nucleotides compared to the wild type sequence. To obtain this increased number, it is possible to carry out the replacement of codons containing adenosine or thymidine nucleotides with codons containing guanosine or cytosine nucleotides. With an increased content of G / C in the coding region of DNA or RNA, the degeneracy of the genetic code can be used for substitutions. Thus, codon changes preferably do not change the encoded amino acid residues, but only increase the G/C content of the nucleic acid molecule.
Генная терапия: Генная терапия, как правило, может представлять собой лечение организма пациента или выделенных элементов организма пациента, например, выделенных тканей/клеток, с помощью нуклеиновых кислот, кодирующих пептид или белок. Как правило, она может включать по меньшей мере одну из следующих стадий а) введение нуклеиновой кислоты, предпочтительно молекулы РНК, указанной в настоящем описании, непосредственно пациенту - любым путем введения - либо in vitro в выделенные клетки/ткани пациента, что приводит к трансфекции клеток пациента, либо in vivo/ex vivo, либо in vitro; б) транскрипция и/или трансляция интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных трансфектированных клеток пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.Gene Therapy: Gene therapy can generally be the treatment of a patient's body or isolated elements of the patient's body, eg, isolated tissues/cells, with nucleic acids encoding a peptide or protein. Typically, it may include at least one of the following steps a) introducing a nucleic acid, preferably an RNA molecule, as defined herein, directly to a patient - by any route of administration - or in vitro into isolated cells/tissues of a patient, resulting in transfection of the cells patient, either in vivo/ex vivo or in vitro; b) transcription and/or translation of the introduced nucleic acid molecule; and optionally c) re-administering the isolated transfected cells to the patient if the nucleic acid was not administered directly to the patient.
Генетическая вакцинация: Генетическая вакцинация, как правило, может представлять собой вакцинацию, осуществляемую путем введения молекулы нуклеиновой кислоты, кодирующей антиген или иммуноген или его фрагмент. Молекулу нуклеиновой кислоты можно вводить в организм индивидуума или в выделенные клетки индивидуума. После трансфекции определенных клеток организма или после трансфекции выделенных клеток антиген или иммуноген может экспрессироваться указанными клетками и затем презентоваться иммунной системе, вызывая адаптивный, т.е. антигенспецифический иммунный ответ. Таким образом, генетическая вакцинация, как правило, включает по меньшей мере одну из следующих стадий: а) введение нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании, индивидууму, предпочтительно пациенту, или в выделенные клетки индивидуума, предпочтительно пациента, что обычно приводит к трансфекции клеток индивидуума in vivo или in vitro; б) транскрипцию и/или трансляцию интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных трансфектированных клеток индивидууму, предпочтительно пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.Genetic vaccination: Genetic vaccination, as a rule, can be a vaccination carried out by introducing a nucleic acid molecule encoding an antigen or immunogen, or a fragment thereof. The nucleic acid molecule can be introduced into the body of an individual or into isolated cells of an individual. After transfection of certain cells of the body or after transfection of isolated cells, the antigen or immunogen can be expressed by these cells and then presented to the immune system, causing an adaptive, i. antigen-specific immune response. Thus, genetic vaccination typically comprises at least one of the following steps: a) introducing a nucleic acid, preferably an artificial nucleic acid molecule as defined herein, into an individual, preferably a patient, or into isolated cells of an individual, preferably a patient, which usually results in transfection of the individual's cells in vivo or in vitro; b) transcription and/or translation of the introduced nucleic acid molecule; and optionally c) re-administering the isolated transfected cells to an individual, preferably a patient, if the nucleic acid was not administered directly to the patient.
Гетерологичная последовательность: Как правило, считается, что две последовательности являются «гетерологичными», если они не происходят из одного и того же гена. Это означает, что, хотя гетерологичные последовательности могут происходить из одного и того же организма, они в естественных условиях (в природе) не встречаются в одной и той же молекуле, например, в одной и той же мРНК.Heterologous sequence: Generally, two sequences are considered to be "heterologous" if they do not come from the same gene. This means that although heterologous sequences may originate from the same organism, they do not naturally occur in the same molecule, for example, in the same mRNA.
Гуморальный иммунитет/гуморальный иммунный ответ: Гуморальный иммунитет, как правило, относится к производству антител и необязательно к второстепенным процессам, которые могут сопровождать его. Гуморальный иммунный ответ, как правило, может характеризоваться, например, активацией Th2 и производством цитокинов, образованием зародышевого центра и переключением изотипа, созреванием аффинности и образованием клеток памяти. Гуморальный иммунитет, как правило, может относиться также к эффекторным функциям антител, включая нейтрализацию патогенов и токсинов, классическую активацию комплемента и стимулирование опсонинами фагоцитоза и элиминации патогенов.Humoral Immunity/Humoral Immune Response: Humoral immunity generally refers to the production of antibodies and not necessarily the secondary processes that may accompany it. The humoral immune response can typically be characterized by, for example, Th2 activation and cytokine production, germinal center formation and isotype switching, affinity maturation, and memory cell formation. Humoral immunity, as a rule, can also refer to the effector functions of antibodies, including the neutralization of pathogens and toxins, classical complement activation, and the stimulation of phagocytosis and elimination of pathogens by opsonins.
Иммуноген: В контексте настоящего изобретения под иммуногеном, как правило, понимают соединение, которое обладает способностью стимулировать иммунный ответ. Предпочтительно иммуноген представляет собой пептид, полипептид или белок. В наиболее предпочтительном варианте осуществления изобретения иммуноген в контексте настоящего изобретения представляет собой продукт трансляции применяемой молекулы нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании. Как правило, иммуноген вызывает по меньшей мере адаптивный иммунный ответ.Immunogen: In the context of the present invention, an immunogen is generally understood to mean a compound that has the ability to stimulate an immune response. Preferably the immunogen is a peptide, polypeptide or protein. In the most preferred embodiment of the invention, the immunogen in the context of the present invention is a translation product of the nucleic acid molecule used, preferably the artificial nucleic acid molecule referred to in the present description. Typically, the immunogen elicits at least an adaptive immune response.
Иммуностимулирующая композиция: В контексте изобретения иммуностимулирующая композиция, как правило, может представлять собой композицию, содержащую по меньшей мере один компонент, который обладает способностью индуцировать иммунный ответ или из которого может происходить компонент, обладающий способностью индуцировать иммунный ответ. Такой иммунный ответ предпочтительно может представлять собой врожденный иммунный ответ или комбинацию адаптивного и врожденного иммунного ответа. В контексте настоящего описания иммуностимулирующая композиция предпочтительно содержит по меньшей мере одну искусственную молекулу нуклеиновой кислоты, более предпочтительно РНК, например, молекулу мРНК. Иммуностимулирующий компонент, такой как мРНК, может находиться в составе комплекса с пригодным носителем. Таким образом, иммуностимулирующая композиция может содержать комплекс мРНК/носитель. Кроме того, иммуностимулирующая композиция может содержать адъювант и/или пригодный наполнитель для иммуностимулирующего компонента, такого как мРНК.Immunostimulatory composition: In the context of the invention, an immunostimulatory composition can generally be a composition containing at least one component that has the ability to induce an immune response or from which a component that has the ability to induce an immune response can be derived. Such an immune response may preferably be an innate immune response or a combination of an adaptive and an innate immune response. In the context of the present description, the immunostimulatory composition preferably contains at least one artificial nucleic acid molecule, more preferably RNA, for example, an mRNA molecule. An immunostimulatory component, such as mRNA, may be complexed with a suitable carrier. Thus, the immunostimulatory composition may comprise an mRNA/carrier complex. In addition, the immunostimulatory composition may contain an adjuvant and/or a suitable excipient for the immunostimulatory component, such as mRNA.
Иммунный ответ: Иммунный ответ может, как правило, представлять собой либо специфическую реакцию адаптивной иммунной системы на конкретный антиген (так называемый специфический или адаптивный иммунный ответ), либо неспецифическую реакцию врожденной иммунной системы (так называемый неспецифический или врожденный иммунный ответ).Immune Response: An immune response can generally be either a specific reaction of the adaptive immune system to a particular antigen (so-called specific or adaptive immune response) or a non-specific reaction of the innate immune system (so-called non-specific or innate immune response).
Иммунная система: Иммунная система может защищать организмы от инфекции. Если патогену удалось преодолеть физический барьер организма и попасть в указанный организм, то врожденная иммунная система обеспечивает немедленный, но неспецифический ответ. Если патоген ускользает от этого врожденного ответа, у позвоночных имеется второй уровень защиты, представляющий собой адаптивную иммунную систему. В этом случае иммунная система адаптирует свой ответ в процессе инфекции для улучшения распознавания патогена. Затем этот улучшенный ответ сохраняется после элиминации патогена в форме иммунологической памяти и позволяет адаптивной иммунной системе организовывать более быстрые и сильные атаки каждый раз при проникновении указанного патогена. Таким образом, иммунная система включает врожденную и адаптивную иммунную систему. Каждая из этих двух частей, как правило, включает так называемые гуморальный и клеточный компоненты.Immune System: The immune system can protect organisms from infection. If the pathogen has managed to overcome the physical barrier of the organism and enter the specified organism, then the innate immune system provides an immediate, but non-specific response. If the pathogen eludes this innate response, vertebrates have a second layer of defense, which is the adaptive immune system. In this case, the immune system adapts its response during infection to improve recognition of the pathogen. This improved response is then stored after elimination of the pathogen in the form of an immunological memory and allows the adaptive immune system to mount faster and stronger attacks each time that pathogen enters. Thus, the immune system includes the innate and adaptive immune systems. Each of these two parts, as a rule, includes the so-called humoral and cellular components.
Иммуностимулирующая РНК: Иммуностимулирующая РНК (isPHK) в контексте изобретения, как правило, может представлять собой РНК, которая обладает способностью индуцировать врожденный иммунный ответ. Обычно она не имеет открытой рамки считывания и, таким образом, не кодирует пептид-антиген или иммуноген, но вызывает иммунный ответ, например, посредством связывания со специфическим типом Толл-подобного рецептора (TLR) или другими приемлемыми рецепторами. Однако, естественно, также и мРНК, имеющие открытую рамку считывания и кодирующие пептид/белок, могут индуцировать врожденный иммунный ответ и, следовательно, могут являться иммуностимулирующими РНК.Immunostimulatory RNA: Immunostimulatory RNA (isRNA) in the context of the invention, as a rule, can be an RNA that has the ability to induce an innate immune response. It usually does not have an open reading frame and thus does not encode an antigen peptide or immunogen, but elicits an immune response, for example by binding to a specific type of Toll-like receptor (TLR) or other suitable receptors. However, of course, also mRNAs having an open reading frame and encoding a peptide/protein can induce an innate immune response and can therefore be immunostimulatory RNAs.
Врожденная иммунная система: Врожденная иммунная система, которую называют также неспецифической иммунной системой, как правило, включает клетки и механизмы, которые неспецифически защищают хозяина от заражения другими организмами. Это означает, что клетки врожденной системы могут распознавать патогены и реагировать на них обычным путем, но, в отличие от адаптивной иммунной системы, она не обеспечивает долговременный или защитный иммунитет хозяину. Врожденная иммунная система может, например, активироваться лигандами патоген-ассоциированных распознающих молекулярные паттерны (РАМР) рецепторов, например, Толл-подобных рецепторов (TLR), или другими вспомогательными субстанциями, такими как липополисахариды, TNF-альфа, лиганд CD40 или цитокины, монокины, лимфокины, интерлейкины или хемокины, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-альфа, IFN-бета, IFN-гамма, GM-CSF, G-CSF, M-CSF, LT-бета, TNF-альфа, факторы роста и hGH, лиганд человеческого Толл-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, лиганд мышиного Толл-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 или TLR13, лиганд NOD-подобного рецептора, лиганд RIG-I-подобного рецептора, иммуностимулирующая нуклеиновая кислота, иммуностимулирующая РНК (isPHK), CpG-ДНК, антибактериальный агент или противовирусный агент. Как правило, ответ врожденной иммунной системы включает рекрутинг иммунных клеток к областям заражения посредством производства химических факторов, включая специализированные химические медиаторы, которые называют цитокинами; активацию каскада комплемента; идентификацию и удаление чужих субстанций, присутствующих в органах, тканях, крови и лимфе, специализированными лейкоцитами; активацию адаптивной иммунной системы посредством процесса, известного как презентация антигена; и/или функционирование в качестве физического и химического барьера для инфекционных агентов.Innate immune system: The innate immune system, also referred to as the non-specific immune system, typically includes cells and mechanisms that non-specifically protect the host from infection by other organisms. This means that the cells of the innate system can recognize and respond to pathogens in the usual way, but, unlike the adaptive immune system, it does not provide long-term or protective immunity to the host. The innate immune system can, for example, be activated by ligands of pathogen-associated molecular pattern recognition (PAMP) receptors, such as Toll-like receptors (TLRs), or other accessory substances such as lipopolysaccharides, TNF-alpha, CD40 ligand, or cytokines, monokines, lymphokines, interleukins or chemokines, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL- 24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-alpha, IFN-beta, IFN-gamma, GM-CSF, G-CSF, M-CSF, LT-beta, TNF-alpha, growth factors and hGH, human Toll-like receptor ligand TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10 , mouse Toll-like receptor ligand TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12, or TLR13, NOD-like receptor ligand, RIG-I-like receptor ligand, immunostimulatory nucleic acid that is, an immunostimulatory RNA (isRNA), CpG DNA, an antibacterial agent, or an antiviral agent. Typically, the response of the innate immune system involves the recruitment of immune cells to areas of infection through the production of chemical factors, including specialized chemical mediators called cytokines; activation of the complement cascade; identification and removal of foreign substances present in organs, tissues, blood and lymph by specialized leukocytes; activation of the adaptive immune system through a process known as antigen presentation; and/or functioning as a physical and chemical barrier to infectious agents.
Сайт клонирования: Под сайтом клонирования, как правило, понимают сегмент молекулы нуклеиновой кислоты, пригодный для встраивания нуклеотидной последовательности, например, нуклеотидной последовательности, содержащей открытую рамку считывания. Встраивание можно осуществлять с помощью любого метода молекулярной биологии, известного специалисту в данной области, например, посредством рестрикции и лигирования. Сайт клонирования, как правило, содержит один или несколько сайтов, распознаваемых рестриктазами (сайты рестрикции). Указанные один или несколько сайтов рестрикции могут распознаваться рестриктазами, расщепляющими ДНК в этих сайтах. Сайт клонирования, который содержит более одного сайта рестрикции, можно обозначать также как множественный сайт клонирования (MCS) или полилинкер.Cloning site: A cloning site is generally understood to mean a segment of a nucleic acid molecule suitable for insertion of a nucleotide sequence, for example a nucleotide sequence containing an open reading frame. Insertion can be accomplished by any molecular biology technique known to one of skill in the art, such as restriction and ligation. The cloning site typically contains one or more sites recognized by restriction enzymes (restriction sites). These one or more restriction sites can be recognized by restriction enzymes that cleave DNA at these sites. A cloning site that contains more than one restriction site may also be referred to as a multiple cloning site (MCS) or polylinker.
Молекула нуклеиновой кислоты: Молекула нуклеиновой кислоты представляет собой молекулу, которая содержит, предпочтительно состоит из компонентов нуклеиновой кислоты. Понятие «молекула нуклеиновой кислоты» предпочтительно относится к молекулам ДНК или РНК. Его предпочтительно применяют в качестве синонима понятия «полинуклеотид». Предпочтительно молекула нуклеиновой кислоты представляет собой полимер, содержащий или состоящий из нуклеотидных мономеров, которые ковалентно связаны друг с другом фосфодиэфирными связями сахарного/фосфатного каркаса. Понятие «нуклеиновая кислота» включает также модифицированные молекулы нуклеиновой кислоты, такие как молекулы ДНК или РНК с модифицированным основанием, модифицированным сахарным фрагментом или модифицированным каркасом.Nucleic acid molecule: A nucleic acid molecule is a molecule that contains, preferably consists of nucleic acid components. The term "nucleic acid molecule" preferably refers to DNA or RNA molecules. It is preferably used as a synonym for the term "polynucleotide". Preferably, the nucleic acid molecule is a polymer containing or consisting of nucleotide monomers that are covalently linked to each other by sugar/phosphate backbone phosphodiester bonds. The term "nucleic acid" also includes modified nucleic acid molecules, such as DNA or RNA molecules with a modified base, a modified sugar moiety, or a modified backbone.
Открытая рамка считывания: Открытая рамка считывания (ОРС) в контексте изобретения, как правило, может представлять собой состоящую из нескольких нуклеотидных триплетов последовательность, которая может транслироваться в пептид или белок. Открытая рамка считывания предпочтительно содержит на своем 5'-конце стартовый кодон, т.е. комбинацию трех последовательно расположенных нуклеотидов, кодирующих, как правило, аминокислоту метионин (ATG или AUG), и следующую за ним область, длина которой, как правило, кратна 3 нуклеотидам. ОРС предпочтительно оканчивается стоп-кодоном (например, ТАА, TAG, TGA). Как правило, в открытой рамке считывания присутствует только один стоп-кодон. Таким образом, открытая рамка считывания в контексте настоящего изобретения предпочтительно представляет собой нуклеотидную последовательность, состоящую из кратного трем количества нуклеотидов, которая начинается стартовым кодоном (например, ATG или AUG), и которая предпочтительно заканчивается стоп-кодоном (например, ТАА, TGA или TAG, или UAA, UAG, UGA соответственно). Открытая рамка считывания может быть выделена или она может быть встроена в более длинную нуклеотидную последовательность, например, в вектор или мРНК. Открытую рамку считывания можно называть также «кодирующей белок областью».Open Reading Frame: An Open Reading Frame (ORF) in the context of the invention can typically be a multiple nucleotide triplet sequence that can be translated into a peptide or protein. The open reading frame preferably contains a start codon at its 5' end, i. e. a combination of three consecutive nucleotides encoding, as a rule, the amino acid methionine (ATG or AUG), and the region following it, the length of which, as a rule, is a multiple of 3 nucleotides. The ORF preferably ends with a stop codon (eg TAA, TAG, TGA). Typically, there is only one stop codon in an open reading frame. Thus, an open reading frame in the context of the present invention is preferably a nucleotide sequence consisting of a multiple of three nucleotides, which begins with a start codon (for example, ATG or AUG), and which preferably ends with a stop codon (for example, TAA, TGA or TAG , or UAA, UAG, UGA respectively). The open reading frame may be isolated or inserted into a longer nucleotide sequence, such as a vector or mRNA. An open reading frame may also be referred to as a "protein coding region".
Пептид: Пептид или полипептид, как правило, представляет собой полимер, состоящий из аминокислотных мономеров, связанных пептидными связями. Он, как правило, содержит менее 50 мономерных звеньев. Однако понятие «пептид» не исключает молекулы, имеющие более 50 мономерных звеньев. Длинные пептиды называют также полипептидами, как правило, они имеют от 50 до 600 мономерных звеньев.Peptide: A peptide or polypeptide is typically a polymer of amino acid monomers linked by peptide bonds. It usually contains less than 50 monomeric units. However, the term "peptide" does not exclude molecules having more than 50 monomeric units. Long peptides are also called polypeptides, as a rule, they have from 50 to 600 monomer units.
Фармацевтически эффективное количество: В контексте изобретения под фармацевтически эффективным количеством, как правило, понимают количество, достаточное для того, чтобы индуцировать фармацевтическое действие, такое как иммунный ответ, измененный патологический уровень экспрессируемого пептида или белка, или замену недостающего генного продукта, например, в случае наличия патологической ситуации.Pharmaceutically effective amount: In the context of the invention, a pharmaceutically effective amount is generally understood to mean an amount sufficient to induce a pharmaceutical effect, such as an immune response, an altered abnormal level of an expressed peptide or protein, or a replacement of a missing gene product, for example, in the case of the presence of a pathological situation.
Белок: Белок, как правило, содержит один или несколько пептидов или полипептидов. Белок, как правило, уложен с образованием 3-мерной структуры, которая может требоваться для проявления биологической функции белка.Protein: A protein typically contains one or more peptides or polypeptides. The protein is typically folded into a 3-dimensional structure, which may be required for the biological function of the protein.
Поли(А)-последовательность: Поли(А)-последовательность, которую называют также поли(А)-хвостом или 3'-поли(А)-хвостом, как правило, представляет собой последовательность адениновых нуклеотидов, содержащую, например, вплоть до примерно 400 аденозиновых нуклеотидов, например, от примерно 25 до примерно 400, предпочтительно от примерно 50 до примерно 400, более предпочтительно от примерно 50 до примерно 300, еще более предпочтительно от примерно 50 до примерно 250, наиболее предпочтительно от примерно 60 до примерно 250 аденозиновых нуклеотидов. Поли(А)-последовательность, как правило, локализована на 3'-конце мРНК. В контексте настоящего изобретения поли(А)-последовательность может быть локализована внутри мРНК или любой другой молекулы нуклеиновой кислоты, например, внутри вектора, например, вектора, служащего в качестве матрицы для создания РНК, предпочтительно мРНК, например, при транскрипции вектора.Poly(A) sequence: A poly(A) sequence, also referred to as a poly(A) tail or 3' poly(A) tail, is generally an adenine nucleotide sequence containing, for example, up to about 400 adenosine nucleotides, e.g., from about 25 to about 400, preferably from about 50 to about 400, more preferably from about 50 to about 300, even more preferably from about 50 to about 250, most preferably from about 60 to about 250 adenosine nucleotides . The poly(A) sequence is typically located at the 3' end of the mRNA. In the context of the present invention, the poly(A) sequence may be located within an mRNA or any other nucleic acid molecule, for example within a vector, for example a vector serving as a template for making an RNA, preferably an mRNA, for example, when the vector is transcribed.
Полиаденилирование: Под полиаденилированием, как правило, понимают добавление поли(А)-последовательности к молекуле нуклеиновой кислоты, такой как молекула РНК, например, незрелая мРНК. Полиаденилирование может индуцироваться так называемым сигналом полиаденилирования. Указанный сигнал предпочтительно локализован в сегменте нуклеотидов на 3'-конце молекулы нуклеиновой кислоты, такой как молекула РНК, подлежащая полиаденилированию. Сигнал полиаденилирования, как правило, содержит гексамер, состоящий из адениновых и/или урациловых/тиминовых нуклеотидов, предпочтительно последовательность гексамера AAUAAA. Также возможны другие последовательности, предпочтительно гексамерные последовательности. Полиаденилирование, как правило, имеет место во время процессинга пре-мРНК (которую называют также незрелой мРНК). Как правило, созревание РНК (превращение пре-мРНК в зрелую мРНК) включает стадию полиаденилирования.Polyadenylation: By polyadenylation is generally meant the addition of a poly(A) sequence to a nucleic acid molecule, such as an RNA molecule, eg immature mRNA. Polyadenylation can be induced by the so-called polyadenylation signal. Said signal is preferably located in a segment of nucleotides at the 3' end of the nucleic acid molecule, such as the RNA molecule to be polyadenylated. The polyadenylation signal typically contains a hexamer consisting of adenine and/or uracil/thymine nucleotides, preferably the hexamer sequence AAUAAA. Other sequences are also possible, preferably hexameric sequences. Polyadenylation typically takes place during the processing of pre-mRNA (also referred to as immature mRNA). Typically, RNA maturation (conversion of pre-mRNA to mature mRNA) includes a polyadenylation step.
Сайт рестрикции: Сайт рестрикции, который называют также как сайт, распознаваемый рестриктазой, представляет собой нуклеотидную последовательность, распознаваемую рестрктазой. Сайт рестрикции, как правило, представляет собой короткую, предпочтительно палиндромную нуклеотидную последовательность, например, последовательность, содержащую от 4 до 8 нуклеотидов. Сайт рестрикции предпочтительно специфически распознается рестриктазой. Рестриктаза, как правило, расщепляет нуклеотидную последовательность, содержащую сайт рестрикции, в этом сайте. В двухцепочечной нуклеотидной последовательности, такой как двухцепочечная последовательность ДНК, рестриктаза, как правило, расщепляет обе цепи нуклеотидной последовательности.Restriction site: A restriction site, also referred to as a restriction enzyme recognition site, is a nucleotide sequence recognized by a restriction enzyme. The restriction site is typically a short, preferably palindromic, nucleotide sequence, such as a sequence of 4 to 8 nucleotides. The restriction site is preferably specifically recognized by the restriction enzyme. The restriction enzyme typically cleaves a nucleotide sequence containing a restriction site at that site. In a double-stranded nucleotide sequence, such as a double-stranded DNA sequence, the restriction enzyme typically cleaves both strands of the nucleotide sequence.
РНК. мРНК: РНК является общепринятым сокращением для рибонуклеиновой кислоты. Она представляет собой молекулу нуклеиновой кислоты, т.е. полимер, состоящий из нуклеотидов. Указанные нуклеотиды представляют собой, как правило, мономеры аденозинмонофосфата, уридинмонофосфата, гуанозинмонофосфата и цитидинмонофосфата, соединенные друг с другом вдоль так называемого каркаса. Каркас формируется с помощью фосфодиэфирных связей между сахаром, т.е. рибозой, первого мономера и фосфатным фрагментом второго смежного мономера. Конкретную последовательность мономеров называют РНК-последовательностью. Как правило, РНК можно получать путем транскрипции ДНК-последовательности, например, внутри клетки. В эукариотических клетках транскрипция, как правило, происходит в ядре или в митохондрии. In vivo транскрипция ДНК, как правило, приводит к образованию так называемой незрелой РНК, которая в результате процессинга должна превратиться в так называемую матричную (информационную) РНК, которую сокращенно обозначают как мРНК. Процессинг незрелой РНК, например, в эукариотических организмах, включает ряд различных пост-транскрипционных модификаций, таких как сплайсинг, 5'-кэпирование, полиаденилирование, экспорт из ядра или митохондрии и т.п. Совокупность указанных процессов называют также созреванием РНК. Зрелая матричная РНК, как правило, представляет собой нуклеотидную последовательность, которая может транслироваться в аминокислотную последовательность конкретного пептида или белка. Как правило, зрелая мРНК содержит 5'-кэп, 5'UTR, открытую рамку считывания, необязательно 3'UTR и поли(А)-последовательность. Помимо матричной РНК существует несколько некодирующих типов РНК, которые могут участвовать в регуляции транскрипции и/или трансляции.RNA. mRNA: RNA is the common abbreviation for ribonucleic acid. It is a nucleic acid molecule, i.e. a polymer made up of nucleotides. Said nucleotides are, as a rule, monomers of adenosine monophosphate, uridine monophosphate, guanosine monophosphate and cytidine monophosphate, connected to each other along the so-called backbone. The framework is formed with the help of phosphodiester bonds between sugars, i.e. ribose, the first monomer and the phosphate fragment of the second adjacent monomer. A particular sequence of monomers is called an RNA sequence. Typically, RNA can be obtained by transcription of a DNA sequence, for example, within a cell. In eukaryotic cells, transcription usually occurs in the nucleus or mitochondria. In vivo transcription of DNA, as a rule, leads to the formation of the so-called immature RNA, which, as a result of processing, must turn into the so-called messenger (messenger) RNA, which is abbreviated as mRNA. Processing of immature RNA, for example in eukaryotic organisms, involves a number of different post-transcriptional modifications such as splicing, 5' capping, polyadenylation, nuclear or mitochondrial export, and the like. The combination of these processes is also called RNA maturation. Mature messenger RNA is typically a nucleotide sequence that can be translated into the amino acid sequence of a particular peptide or protein. Typically, the mature mRNA contains a 5'cap, a 5'UTR, an open reading frame, optionally a 3'UTR, and a poly(A) sequence. In addition to messenger RNA, there are several non-coding types of RNA that may be involved in the regulation of transcription and/or translation.
Последовательность молекулы нуклеиновой кислоты: Под последовательностью молекулы нуклеиновой кислоты, как правило, понимают конкретный и индивидуальный порядок расположения, т.е. последовательный ряд входящих в нее нуклеотидов. Под последовательностью белка или пептида, как правило, понимают порядок расположения, т.е. последовательный ряд входящих в него аминокислот.Sequence of a Nucleic Acid Molecule: Sequence of a nucleic acid molecule is generally understood to mean a specific and individual arrangement, i. a series of nucleotides in it. By the sequence of a protein or peptide, as a rule, is understood the order of arrangement, i. consecutive series of amino acids included in it.
Идентичность последовательности: Две или большее количество последовательностей являются идентичными, если они имеют одинаковую длину и порядок расположения нуклеотидов или аминокислот. Процент идентичности, как правило, характеризует степень идентичности двух последовательностей, т.е. он, как правило, характеризует процент нуклеотидов, которые соответствуют по своему положению идентичным нуклеотидам референс-последовательности. При определении степени идентичности считается, что подлежащие сравнению последовательности имеют одну и ту же длину, т.е. длину наиболее длинной последовательности из подлежащих сравнению последовательностей. Это означает, что первая последовательность, состоящая из 8 нуклеотидов, идентична на 80% второй последовательности, состоящей из 10 нуклеотидов, которая содержит первую последовательность. Другими словами, в контексте настоящего изобретения идентичность последовательностей предпочтительно относится к проценту нуклеотидов в последовательности, которые находятся в одних и тех же положениях в двух или большем количестве последовательностей, имеющих одинаковую длину. При сравнительном анализе первичной структуры последовательностей бреши обычно рассматривают как неидентичные положения безотносительно к их действительному положению.Sequence Identity: Two or more sequences are identical if they are the same length and nucleotide or amino acid order. Percent identity generally characterizes the degree of identity between two sequences, i.e. it usually characterizes the percentage of nucleotides that correspond in position to identical nucleotides in the reference sequence. When determining the degree of identity, the sequences to be compared are considered to be of the same length, i.e. the length of the longest sequence of the sequences to be compared. This means that the first 8 nucleotide sequence is 80% identical to the second 10 nucleotide sequence that contains the first sequence. In other words, in the context of the present invention, sequence identity preferably refers to the percentage of nucleotides in a sequence that are in the same positions in two or more sequences that are the same length. In a comparative analysis of the primary structure of sequences, gaps are usually considered as non-identical positions, regardless of their actual position.
Стабилизированная молекула нуклеиновой кислоты: Стабилизированная молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, предпочтительно молекулу ДНК или РНК, модифицированную таким образом, чтобы она обладала большей стабильностью к расщеплению или разрушению, например, факторами окружающей среды, или ферментативному расщеплению, такому как расщепление экзо- или эндонуклеазами, чем молекула нуклеиновой кислоты без модификации. Предпочтительно стабилизированная молекула нуклеиновой кислоты в контексте настоящего изобретения является стабилизированной в клетке, такой как прокариотическая или эукариотическая клетка, предпочтительно в клетке млекопитающего, такой как человеческая клетка. Стабилизирующее действие можно оказывать также вне клеток, например, в буферном растворе и т.д., например, в процессе производства фармацевтической композиции, которая содержит стабилизированную молекулу нуклеиновой кислоты.Stabilized Nucleic Acid Molecule: A stabilized nucleic acid molecule is a nucleic acid molecule, preferably a DNA or RNA molecule, modified to be more resistant to cleavage or degradation, for example by environmental factors, or to enzymatic cleavage, such as cleavage of exo- or endonucleases than the nucleic acid molecule without modification. Preferably, the stabilized nucleic acid molecule in the context of the present invention is stabilized in a cell, such as a prokaryotic or eukaryotic cell, preferably in a mammalian cell, such as a human cell. The stabilizing effect can also be exerted outside the cells, for example in a buffer solution, etc., for example during the production of a pharmaceutical composition which contains a stabilized nucleic acid molecule.
Трансфекция: Понятие «трансфекция» относится к интродукции молекул нуклеиновой кислоты, таких как молекулы ДНК или РНК (например, мРНК), в клетки, предпочтительно в эукариотические клетки. В контексте настоящего изобретения под понятие «трансфекция» подпадает любой известный специалисту в данной области метод интродукции молекул нуклеиновой кислоты в клетки, предпочтительно в эукариотические клетки, такие как клетки млекопитающих. Такие методы включают, например, электропорацию, липофекцию, например, на основе катионных липидов и/или липосом, осаждение фосфатом кальция, трансфекцию на основе наночастиц, трансфекцию на основе вирусов или трансфекцию на основе катионных полимеров, таких как ДЭАЭ-декстран или полиэтиленимин, и т.д. Предпочтительно интродукцию осуществляют без использования вирусов.Transfection: The term "transfection" refers to the introduction of nucleic acid molecules, such as DNA or RNA (eg mRNA) molecules, into cells, preferably eukaryotic cells. In the context of the present invention, "transfection" refers to any method known to the person skilled in the art for introducing nucleic acid molecules into cells, preferably eukaryotic cells, such as mammalian cells. Such methods include, for example, electroporation, lipofection, for example, based on cationic lipids and/or liposomes, calcium phosphate precipitation, nanoparticle-based transfection, virus-based transfection, or transfection based on cationic polymers, such as DEAE-dextran or polyethyleneimine, and etc. Preferably, the introduction is carried out without the use of viruses.
Вакцина: Под вакциной, как правило, понимают предназначенный для профилактики или терапии продукт, содержащий по меньшей мере один антиген, предпочтительно иммуноген. Антиген или иммуноген может иметь происхождение из любого материала, пригодного для вакцинации. Например, антиген или иммуноген может происходить из патогена, такого как бактерии или вирусные частицы и т.д., или из опухолевой или раковой ткани. Антиген или иммуноген стимулирует адаптивную иммунную систему организма вырабатывать адаптивный иммунный ответ.Vaccine: A vaccine is generally understood to mean a prophylactic or therapeutic product containing at least one antigen, preferably an immunogen. The antigen or immunogen may be derived from any material suitable for vaccination. For example, the antigen or immunogen may be derived from a pathogen such as bacteria or viral particles, etc., or from a tumor or cancer tissue. The antigen or immunogen stimulates the body's adaptive immune system to produce an adaptive immune response.
Вектор: Понятие «вектор» относится к молекуле нуклеиновой кислоты, предпочтительно к искусственной молекуле нуклеиновой кислоты. В контексте настоящего изобретения вектор можно применять для встраивания или хранения требуемой нуклеотидной последовательности, такой как нуклеотидная последовательность, содержащая открытую рамку считывания. Таким векторы могут представлять собой векторы для хранения, экспрессионные векторы, клонирующие векторы, векторы для переноса и т.д. Вектор для хранения представляет собой вектор, который позволяет удобно хранить молекулу нуклеиновой кислоты, например, молекулу мРНК. Так, вектор может содержать последовательность, соответствующую, например, требуемой последовательности мРНК или ее части, такой как последовательность, соответствующая открытой рамке считывания и 3'-UTR мРНК. Экспрессионный вектор можно применять для производства продуктов экспрессии, таких как РНК, например, мРНК, или пептиды, полипептиды или белки. Например, экспрессионный вектор может содержать последовательности, необходимые для транскрипции сегмента последовательности вектора, такой как промоторная последовательность, например, промоторная последовательность РНК-полимеразы. Клонирующий вектор, как правило, представляет собой вектор, который содержит сайт клонирования, который можно применять для встраивания нуклеотидных последовательностей в вектор. Клонирующий вектор может представлять собой, например, плазмидный вектор или вектор на основе бактериофага. Вектор для переноса может представлять собой вектор, который пригоден для переноса молекул нуклеиновой кислоты в клетки или организмы, например, вирусные векторы. В контексте настоящего изобретения вектор может представлять собой, например, РНК-вектор или ДНК-вектор. Предпочтительно вектор представляет собой молекулу ДНК. В контексте настоящего описания предпочтительно вектор содержит сайт клонирования, маркер для селекции, такой как фактор, обусловливающий устойчивость к антибиотикам, и последовательность, пригодную для размножения вектора, такую как сайт инициации репликации. В контексте настоящего описания предпочтительно вектор представляет собой плазмидный вектор.Vector: The term "vector" refers to a nucleic acid molecule, preferably an artificial nucleic acid molecule. In the context of the present invention, a vector can be used to insert or store a desired nucleotide sequence, such as a nucleotide sequence containing an open reading frame. Such vectors may be storage vectors, expression vectors, cloning vectors, transfer vectors, and the like. A storage vector is a vector that allows convenient storage of a nucleic acid molecule, such as an mRNA molecule. Thus, the vector may contain a sequence corresponding to, for example, the desired mRNA sequence or a portion thereof, such as the sequence corresponding to the open reading frame and 3' UTR of the mRNA. An expression vector can be used to produce expression products such as RNA, eg mRNA, or peptides, polypeptides or proteins. For example, the expression vector may contain sequences necessary for transcription of a segment of the vector's sequence, such as a promoter sequence, such as an RNA polymerase promoter sequence. A cloning vector is typically a vector that contains a cloning site that can be used to insert nucleotide sequences into the vector. The cloning vector may be, for example, a plasmid vector or a bacteriophage-based vector. The transfer vector may be a vector that is suitable for transferring nucleic acid molecules into cells or organisms, such as viral vectors. In the context of the present invention, the vector may be, for example, an RNA vector or a DNA vector. Preferably the vector is a DNA molecule. In the context of the present description, preferably the vector contains a cloning site, a selection marker, such as an antibiotic resistance factor, and a sequence suitable for propagating the vector, such as an origin of replication. In the context of the present description, preferably the vector is a plasmid vector.
Наполнитель: Под наполнителем, как правило, понимают материал, пригодный для хранения, транспортирования и/или введения соединения, такого как фармацевтически активное соединение. Он может представлять собой, например, физиологически приемлемую жидкость, пригодную для хранения, транспортирования и/или введения соединения, такого как фармацевтически активное соединение.Excipient: An excipient is generally understood to mean a material suitable for storing, transporting and/or administering a compound, such as a pharmaceutically active compound. It may be, for example, a physiologically acceptable liquid suitable for storing, transporting and/or administering a compound, such as a pharmaceutically active compound.
3'-нетранслируемая область (3'UTR): 3'UTR, как правило, является частью искусственной молекулы нуклеиновой кислоты, которая локализована с 3'-стороны (т.е. в прямом направлении) относительно открытой рамки считывания и которая не транслируется в белок. Как правило, 3'UTR представляет собой часть мРНК, которая локализована между кодирующей белок областью (открытой рамкой считывания (ОРС) или кодирующей последовательностью (CDS)) и поли(А)-последовательностью мРНК. В контексте изобретения понятие «3 'UTR» может включать также элементы, которые не кодируются в матрице, с которой транскрибируется РНК, но которые добавляются после транскрипции в процессе созревания, например, поли(А)-последовательность. 3'UTR мРНК не транслируется в аминокислотную последовательность. Последовательность 3'UTR, как правило, кодируется геном, который транскрибируется в соответствующую мРНК в процессе экспрессии гена. Геномная последовательность сначала транскрибируется в незрелую мРНК, которая содержит необязательные интроны. Незрелая мРНК затем дополнительно процессируется с образованием зрелой мРНК в процессе созревания. Указанный процесс созревания включает стадии 5'-кэпирования, сплайсинга незрелой мРНК с вырезанием необязательных интронов и модификаций 3'-конца, таких как полиаденилирование 3'-конца незрелой мРНК, и необязательные расщепления эндо-/или экзонуклеазами и т.д. В контексте настоящего изобретения 3'UTR соответствует последовательности зрелой мРНК, которая локализована между стоп-кодоном кодирующей области белка, предпочтительно непосредственно примыкает с 3'-стороны к стоп-кодону кодирующей белок области, и поли(А)-последовательностью мРНК. Понятие «соответствует» означает, что последовательность 3'UTR может представлять собой последовательность РНК, такую как в последовательности мРНК, указанной в определении последовательности 3'UTR, или последовательность ДНК, которая соответствует указанной последовательности РНК. В контексте настоящего изобретения понятие «3'UTR гена», например, «3'UTR гена рибосомального белка», означает последовательность, которая соответствует 3'UTR зрелой мРНК, полученной из указанного гена, т.е. мРНК, полученной путем транскрипции гена и созревания незрелой мРНК. Понятие «3'UTR гена» включает последовательность ДНК и последовательность РНК (как смысловую, так и антисмысловую цепи и как зрелые, так и незрелые последовательности) 3'UTR.3'-Untranslated Region (3'UTR): The 3'UTR is typically the portion of an artificial nucleic acid molecule that is located 3'-side (i.e., forward) of the open reading frame and that is not translated into protein. Typically, the 3'UTR is the portion of the mRNA that is located between the protein coding region (open reading frame (ORF) or coding sequence (CDS)) and the mRNA poly(A) sequence. In the context of the invention, the term "3 'UTR" may also include elements that are not encoded in the template from which the RNA is transcribed, but which are added after transcription during maturation, for example, a poly(A) sequence. The 3'UTR mRNA is not translated into an amino acid sequence. The 3'UTR sequence is typically encoded by a gene that is transcribed into the corresponding mRNA during gene expression. The genomic sequence is first transcribed into immature mRNA, which contains optional introns. The immature mRNA is then further processed into mature mRNA during maturation. Said maturation process includes the steps of 5' capping, splicing of the immature mRNA with excision of optional introns and 3' end modifications such as polyadenylation of the 3' end of the immature mRNA, and optional endo-/or exonuclease cleavages, etc. In the context of the present invention, the 3'UTR corresponds to a mature mRNA sequence that is located between the stop codon of the protein coding region, preferably immediately adjacent 3' to the stop codon of the protein coding region, and the mRNA poly(A) sequence. The term "corresponds" means that the 3'UTR sequence may be an RNA sequence, such as in the mRNA sequence specified in the definition of the 3'UTR sequence, or a DNA sequence that corresponds to the specified RNA sequence. In the context of the present invention, the term "3'UTR of a gene", for example, "3'UTR of a ribosomal protein gene", means a sequence that corresponds to the 3'UTR of a mature mRNA derived from said gene, i.e. mRNA obtained by transcription of a gene and maturation of immature mRNA. The term "3'UTR of a gene" includes a DNA sequence and an RNA sequence (both sense and antisense strands and both mature and immature sequences) 3'UTR.
5'-нетранслируемая область (5'UTR): Под 5'UTR, как правило, понимают конкретный сегмент матричной РНК (мРНК). Она локализована с 5'-стороны относительно открытой рамки считывания мРНК. Как правило, 5'UTR начинается с сайта инициации транскрипции и заканчивается за один нуклеотид до стартового кодона открытой рамки считывания. 5'UTR может содержать элементы, предназначенные для контроля генной экспрессии, так называемые регуляторные элементы. Указанные регуляторные элементы могут представлять собой, например, сайты связывания рибосом. 5'UTR может подвергаться посттранскрипционным модификациям, например, путем добавления 5'-кэпа. В контексте настоящего изобретения 5'UTR соответствует последовательности зрелой мРНК, локализованной между 5'-кэпом и стартовым кодоном. Предпочтительно 5'UTR соответствует последовательности, которая простирается от нуклеотида, расположенного с 3'-стороны 5'-кэпа, предпочтительно от расположенного с 3'-стороны нуклеотида, непосредственно примыкающего к 5'-кэпу, до нуклеотида, расположенного с 5'-стороны стартового кодона кодирующей белок области, предпочтительно до нуклеотида, непосредственно примыкающего с 5'-стороны к стартовому кодону кодирующей белок области. Нуклеотид, непосредственно примыкающий с 3'-стороны к 5'-кэпу зрелой мРНК, как правило, соответствует сайту инициации транскрипции. Понятие «соответствует» означает, что последовательность 5'UTR может представлять собой последовательность РНК, такую как в последовательности мРНК, указанной при определении последовательности 5'UTR, или последовательность ДНК, которая соответствует указанной последовательности РНК. В контексте настоящего изобретения понятие «5'UTR гена», например, «5'UTR ТОР-гена», обозначает последовательность, которая соответствует 5'UTR зрелой мРНК, полученной из этого гена, т.е. мРНК, полученной путем транскрипции гена и созревания незрелой мРНК. Понятие «5'UTR гена» включает последовательность ДНК и последовательность РНК 5'UTR. В вариантах осуществления изобретения указанная 5'-UTR может находиться на 5'-конце ОРС. Ее длина, как правило, составляет менее 500, 400, 300, 250 или менее 200 нуклеотидов. В других вариантах осуществления изобретения ее длина может находиться в пределах по меньшей мере от 10, 20, 30 или 40, предпочтительно вплоть до 100 или 150 нуклеотидов.5'-untranslated region (5'UTR): By 5'UTR, as a rule, understand a specific segment of messenger RNA (mRNA). It is located on the 5' side of the mRNA open reading frame. Typically, the 5'UTR starts at the site of transcription initiation and ends one nucleotide before the start codon of the open reading frame. The 5'UTR may contain elements designed to control gene expression, so-called regulatory elements. Said regulatory elements may be, for example, ribosome binding sites. The 5'UTR may be subject to post-transcriptional modifications, for example by adding a 5' cap. In the context of the present invention, the 5'UTR corresponds to the mature mRNA sequence located between the 5' cap and the start codon. Preferably, the 5'UTR corresponds to a sequence that extends from the nucleotide located on the 3' side of the 5' cap, preferably from the 3' side of the nucleotide immediately adjacent to the 5' cap, to the nucleotide located on the 5' side start codon of the protein coding region, preferably up to the nucleotide immediately adjacent on the 5' side of the start codon of the protein coding region. The nucleotide immediately adjacent on the 3' side to the 5' cap of the mature mRNA usually corresponds to the site of transcription initiation. The term "corresponds" means that the 5'UTR sequence may be an RNA sequence, such as in the mRNA sequence specified when determining the 5'UTR sequence, or a DNA sequence that corresponds to the specified RNA sequence. In the context of the present invention, the term "5'UTR of a gene", for example, "5'UTR of the TOP gene", means a sequence that corresponds to the 5'UTR of the mature mRNA derived from this gene, i.e. mRNA obtained by transcription of a gene and maturation of immature mRNA. The term "5'UTR of a gene" includes a DNA sequence and an RNA 5'UTR sequence. In embodiments of the invention, the specified 5'-UTR may be at the 5'end of the ORF. Its length is usually less than 500, 400, 300, 250 or less than 200 nucleotides. In other embodiments of the invention, its length may be in the range of at least 10, 20, 30 or 40, preferably up to 100 or 150 nucleotides.
5'-концевой олигопиримидиновый тракт (ТОР): 5'-концевой олигопиримидиновый тракт (ТОР), как правило, обозначает сегмент пиримидиновых нуклеотидов, локализованный в 5'-концевой области молекулы нуклеиновой кислоты, например, в 5'-концевой области некоторых молекул мРНК или в 5'-концевой области функционального элемента, например, транскрибируемой области некоторых генов. Последовательность начинается с цитидина, который, как правило, соответствует сайту инициации транскрипции, и за которым следует сегмент, как правило, состоящий примерно из 3-30 пиримидиновых нуклеотидов. Например, ТОР может содержать 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или даже большее количество нуклеотидов. Пиримидиновый сегмент и, следовательно, 5'-ТОР, заканчивается одним нуклеотидом, расположенным в 5'-направлении относительно первого пуринового нуклеотида, локализованного в прямом направлении относительно ТОР. Матричную РНК, которая содержит 5'-концевой олигопиримидиновый тракт, часто обозначают как ТОР-мРНК. Таким образом, гены, из которых получают указанные матричные РНК, обозначают как ТОР-гены. Последовательности ТОР, например, обнаружены в генах и мРНК, кодирующих пептидные факторы элонгации и рибосомальные белки.5' oligopyrimidine tract (TOR): The 5' oligopyrimidine tract (TOR) generally refers to a segment of pyrimidine nucleotides located at the 5' end of a nucleic acid molecule, such as the 5' end of some mRNA molecules. or in the 5'-terminal region of a functional element, for example, the transcribed region of some genes. The sequence begins with a cytidine, which typically corresponds to the site of transcription initiation, and is followed by a segment typically consisting of about 3-30 pyrimidine nucleotides. For example, TOP can contain 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 , 26, 27, 28, 29, 30 or even more nucleotides. The pyrimidine segment, and hence the 5'-TOP, terminates at one nucleotide located 5'-direction relative to the first purine nucleotide located upstream of the TOP. Messenger RNA that contains the 5' oligopyrimidine tract is often referred to as TOP mRNA. Thus, the genes from which these messenger RNAs are derived are referred to as TOP genes. TOP sequences, for example, are found in genes and mRNAs encoding peptide elongation factors and ribosomal proteins.
ТОР-мотив: В контексте настоящего изобретения ТОР-мотив обозначает нуклеотидную последовательность, которая соответствует 5'-ТОР, описанному выше. Таким образом, ТОР-мотив в контексте настоящего изобретения предпочтительно обозначает состоящий из пиримидиновых нуклеотидов сегмент длиной 3-30 нуклеотидов. Предпочтительно ТОР-мотив состоит по меньшей мере из 3 пиримидиновых нуклеотидов, предпочтительно по меньшей мере 4 пиримидиновых нуклеотидов, предпочтительно по меньшей мере 5 пиримидиновых нуклеотидов, более предпочтительно по меньшей мере 6 нуклеотидов, более предпочтительно по меньшей мере 7 нуклеотидов, наиболее предпочтительно по меньшей мере 8 пиримидиновых нуклеотидов, при этом сегмент пиримидиновых нуклеотидов предпочтительно начинается на его 5'-конце с цитозинового нуклеотида. В ТОР-генах и ТОР-мРНК ТОР-мотив предпочтительно начинается на его 5'-конце с сайта инициации транскрипции и заканчивается на расстоянии одного нуклеотида в 5'-направлении относительно первого пуринового остатка в указанном гене или мРНК. В контексте настоящего изобретения ТОР-мотив предпочтительно локализован на 5'-конце последовательности, которая представляет собой 5'UTR, или на 5'-конце последовательности, которая кодирует 5'UTR. Таким образом, в контексте настоящего изобретения сегмент из 3 или большего количества пиримидиновых нуклеотидов предпочтительно называют «ТОР-мотивом», если сегмент локализован на 5'-конце соответствующей последовательности, такой как мРНК, предлагаемая в изобретении, 5'UTR-элемент мРНК, предлагаемой в изобретении, или нуклеотидная последовательность, которая происходит из 5'UTR ТОР-гена, указанного в настоящем описании. Другими словами, сегмент, состоящий из 3 или большего количества пиримидиновых нуклеотидов, который не локализован на 5'-конце 5'UTR или 5'UTR-элемента, но локализован где-либо внутри 5'UTR или 5'UTR-элемента, предпочтительно не обозначают как «ТОР-мотив».TOP motif: In the context of the present invention, the TOP motif refers to a nucleotide sequence that corresponds to the 5'-TOP described above. Thus, the TOP motif in the context of the present invention preferably denotes a segment consisting of pyrimidine nucleotides of 3-30 nucleotides in length. Preferably the TOP motif consists of at least 3 pyrimidine nucleotides, preferably at least 4 pyrimidine nucleotides, preferably at least 5 pyrimidine nucleotides, more preferably at least 6 nucleotides, more preferably at least 7 nucleotides, most preferably at least 8 pyrimidine nucleotides, with the pyrimidine nucleotide segment preferably beginning at its 5' end with a cytosine nucleotide. In TOP genes and TOP mRNA, the TOP motif preferably starts at its 5' end from the site of transcription initiation and ends one nucleotide away in the 5' direction from the first purine residue in said gene or mRNA. In the context of the present invention, the TOP motif is preferably located at the 5'end of the sequence which is the 5'UTR or at the 5'end of the sequence which encodes the 5'UTR. Thus, in the context of the present invention, a segment of 3 or more pyrimidine nucleotides is preferably referred to as a "TOP motif" if the segment is located at the 5' end of an appropriate sequence such as an mRNA of the invention, the 5'UTR element of an mRNA of the invention in the invention, or a nucleotide sequence that is derived from the 5'UTR of the TOP gene as defined herein. In other words, a segment of 3 or more pyrimidine nucleotides that is not located at the 5' end of the 5'UTR or 5'UTR element, but is located somewhere within the 5'UTR or 5'UTR element, preferably not referred to as "TOP-motive".
ТОР-ген: ТОР-гены. как правило, характеризуются присутствием 5'-концевого олигопримидинового тракта. Кроме того, большинство ТОР-генов характеризуются связанной с ростом регуляцией трансляции. Однако известны также ТОР-гены с тканеспецифической регуляцией трансляции. Как указано выше, 5'UTR ТОР-гена соответствует последовательности 5'UTR зрелой мРНК, происходящей из ТОР-гена, которая предпочтительно простирается от нуклеотида, примыкающего с 3'-стороны к 5'-кэпу, до нуклеотида, примыкающего с 5'-стороны к стартовому кодону. 5'UTR ТОР-гена, как правило, не содержит никаких стартовых кодонов, предпочтительно не содержит расположенных в обратном направлении AUG (uAUG) или расположенных в обратном направлении открытых рамок считывания (uOPC). В данном контексте под расположенными в обратном направлении AUG и расположенными в обратном направлении открытыми рамками считывания, как правило, понимают AUG и открытые рамки считывания, которые находятся в 5'-направлении относительно стартового кодона (AUG) открытой рамки считывания, которая должна транслироваться. 5'UTR ТОР-генов, как правило, являются относительно короткими. Длины 5'UTR ТОР-генов могут варьироваться от 20 нуклеотидов вплоть до 500 нуклеотидов и, как правило, они содержат менее чем примерно 200 нуклеотидов, предпочтительно менее чем примерно 150 нуклеотидов, более предпочтительно менее чем примерно 100 нуклеотидов. Примерами 5'UTR ТОР-генов в контексте настоящего изобретения являются нуклеотидные последовательности, простирающиеся от нуклеотида в положении 5 до нуклеотида, непосредственно примыкающего к 5'-концу стартового кодона (например, ATG), указанные последовательности представлены в SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 14221-1363 заявки на патент PCT/EP 2012/002448 WO 2013/143700 или представляют собой их гомологи или варианты, описание указанных документов включено в настоящее описание в качестве ссылки. В этом контексте наиболее предпочтительным фрагментом 5'UTR ТОР-гена является 5'UTR ТОР-гена без 5'ТОР-мотива. Понятие «5'UTR ТОР-гена» предпочтительно относится к 5'UTR встречающегося в естественных условиях ТОР-гена.TOR gene: TOR genes. typically characterized by the presence of a 5'-terminal oligoprimidine tract. In addition, most TOP genes are characterized by growth-related regulation of translation. However, TOP genes with tissue-specific regulation of translation are also known. As indicated above, the 5'UTR of the TOP gene corresponds to the 5'UTR sequence of the mature mRNA derived from the TOP gene, which preferably extends from the nucleotide adjacent 3'-side of the 5'-cap to the nucleotide adjacent 5'- side to the start codon. The 5'UTR of the TOP gene generally does not contain any start codons, preferably no upstream AUG (uAUG) or upstream open reading frames (uOPC). In this context, reversed AUGs and reversed open reading frames are generally understood to mean AUGs and open reading frames that are 5' from the start codon (AUG) of the open reading frame to be translated. The 5'UTRs of TOP genes tend to be relatively short. The 5'UTR lengths of TOP genes can range from 20 nucleotides up to 500 nucleotides and are typically less than about 200 nucleotides, preferably less than about 150 nucleotides, more preferably less than about 100 nucleotides. Examples of the 5'UTR of TOP genes in the context of the present invention are nucleotide sequences extending from the nucleotide at position 5 to the nucleotide immediately adjacent to the 5' end of the start codon (e.g. ATG), these sequences are shown in SEQ ID NO: 1-1363 , SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 14221-1363 patent applications PCT/EP 2012/002448 WO 2013/143700 or are homologues or variants thereof, the description of these documents is included in this description as links. In this context, the most preferred fragment of the 5'UTR of the TOP gene is the 5'UTR of the TOP gene without the 5'TOP motif. The term "5'UTR of the TOP gene" preferably refers to the 5'UTR of the naturally occurring TOP gene.
Первый объект настоящего изобретения относится к искусственной молекуле нуклеиновой кислоты, содержащейThe first object of the present invention relates to an artificial nucleic acid molecule containing
а. по меньшей мере одну открытую рамку считывания (ОРС); иa. at least one open reading frame (ORF); and
б. по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент), содержащий или состоящий из нуклеотидной последовательности, которая происходит из 3'-UTR гена рибосомального белка.b. at least one element of the 3'-untranslated region (3'-UTR element) containing or consisting of a nucleotide sequence that is derived from the 3'-UTR of the ribosomal protein gene.
Понятие «3'-UTR-элемент» относится к нуклеотидной последовательности, которая содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR или из варианта 3'-UTR. Понятие «3'-UTR-элемент» предпочтительно относится к нуклеотидной последовательности, которая представляет собой 3'-UTR искусственной нуклеотидной последовательности, такой как искусственная мРНК, или которая кодирует 3'-UTR искусственной молекулы нуклеиновой кислоты. Следовательно, в контексте настоящего изобретения 3'-UTR-элемент предпочтительно может представлять собой 3'-UTR мРНК, предпочтительно искусственной мРНК, или может представлять собой матрицу для транскрипции 3'-UTR мРНК. Так, 3'-UTR-элемент предпочтительно представляет собой нуклеотидную последовательность, которая соответствует 3'-UTR мРНК, предпочтительно 3'-UTR искусственной мРНК, такой как мРНК, полученная в результате транскрипции созданной генетическими методами векторной конструкции. Предпочтительно 3'-UTR-элемент в контексте настоящего изобретения функционирует в качестве 3'-UTR или кодирует нуклеотидную последовательность, которая выполняет функцию 3'-UTR.The term "3'-UTR element" refers to a nucleotide sequence that contains or consists of a nucleotide sequence derived from a 3'-UTR or from a 3'-UTR variant. The term "3'UTR element" preferably refers to a nucleotide sequence which is the 3'UTR of an artificial nucleotide sequence, such as an artificial mRNA, or which encodes the 3'UTR of an artificial nucleic acid molecule. Therefore, in the context of the present invention, the 3'-UTR element may preferably be the 3'-UTR of an mRNA, preferably an artificial mRNA, or may be a template for transcription of the 3'-UTR of an mRNA. Thus, the 3'UTR element is preferably a nucleotide sequence that corresponds to the 3'UTR of an mRNA, preferably the 3'UTR of an artificial mRNA, such as an mRNA obtained by transcription of a genetically engineered vector construct. Preferably, the 3'UTR element in the context of the present invention functions as a 3'UTR or encodes a nucleotide sequence that functions as a 3'UTR.
Понятие «ген рибосомального белка», как правило, относится к гену, кодирующему рибосомальный белок. В контексте настоящего описания это понятие относится к любому гену рибосомального белка независимо от вида, из которого он происходит. Конкретно, понятие относится к гену эукариотического рибосомального белка. Кроме того, в контексте изобретения понятие «ген рибосомального белка» может относиться также к гену, сходному с геном рибосомального белка либо с точки зрения структуры, либо с точки зрения функции. В частности, понятие включает «подобные гену рибосомального белка», псевдогены и гены, обладающие характеристиками последовательности или структуры, прежде всего в их 3'-UTR-области, присущими гену рибосомального белка. Предпочтительно понятие относится к гену рибосомального белка позвоночных, более предпочтительно к гену рибосомального белка млекопитающих, еще более предпочтительно к гену рибосомального белка приматов, прежде всего к гену рибосомального белка человека. Кроме того, понятие «ген рибосомального белка» включает также ген рибосомального белка грызунов, прежде всего ген мышиного рибосомального белка. Примерами генов рибосомального белка в контексте изобретения являются (но, не ограничиваясь только ими) гены рибосомального белка L9 (RPL9), рибосомального белка L3 (RPL3), рибосомального белка L4 (RPL4), рибосомального белка L5 (RPL5), рибосомального белка L6 (RPL6), рибосомального белка L7 (RPL7), рибосомального белка L7a (RPL7A), рибосомального белка L11 (RPL11), рибосомального белка L12 (RPL12), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L18 (RPL18), рибосомального белка L18a (RPL18A), рибосомального белка L19 (RPL19), рибосомального белка L21 (RPL21), рибосомального белка L22 (RPL22), рибосомального белка L23a (RPL23A), рибосомального белка L17 (RPL17), рибосомального белка L24 (RPL24), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L30 (RPL30), рибосомального белка L27a (RPL27A), рибосомального белка L28 (RPL28), рибосомального белка L29 (RPL29), рибосомального белка L31 (RPL31), рибосомального белка L32 (RPL32), рибосомального белка L35a (RPL35A), рибосомального белка L37 (RPL37), рибосомального белка L37a (RPL37A), рибосомального белка L38 (RPL38), рибосомального белка L39 (RPL39), рибосомального белка большой субъединицы, Р0 (RPLP0), рибосомального белка большой субъединицы, Р1 (RPLP1), рибосомального белка, большой субъединицы, Р2 (RPLP2), рибосомального белка S3 (RPS3), рибосомального белка S3A (RPS3A), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S4, Y-сцепленного 1 (RPS4Y1), рибосомального белка S5 (RPS5), рибосомального белка S6 (RPS6), рибосомального белка S7 (RPS7), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S10 (RPS10), рибосомального белка S11 (RPS11), рибосомального белка S12 (RPS12), рибосомального белка S13 (RPS13), рибосомального белка S15 (RPS15), рибосомального белка S15a (RPS15A), рибосомального белка S16 (RPS16), рибосомального белка S19 (RPS19), рибосомального белка S20 (RPS20), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S25 (RPS25), рибосомального белка S26 (RPS26), рибосомального белка S27 (RPS27), рибосомального белка S27a (RPS27a), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L15 (RPL15), рибосомального белка S2 (RPS2), рибосомального белка L14 (RPL14), рибосомального белка S14 (RPS14), рибосомального белка L10 (RPL10), рибосомального белка L10a (RPL10A), рибосомального белка L35 (RPL35), рибосомального белка L13a (RPL13A), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка L41 (RPL41), рибосомального белка S18 (RPS18), рибосомального белка S24 (RPS24), рибосомального белка L8 (RPL8), рибосомального белка L34 (RPL34), рибосомального белка S17 (RPS17), рибосомального белка SA (RPSA), продукта 1 слияния: остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемому гену (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли (FBR-MuSV), гену рибосомального белка L22-подобного 1 (RPL22L1), рибосомального белка S17 (RPS17), рибосомального белка L39-подобного (RPL39L), рибосомального белкаL10-подобного (RPL10L), рибосомального белка L36a-подобного (RPL36AL), рибосомального белка L3-подобного (RPL3L), рибосомального белка S27-подобного (RPS27L), рибосомального белка L26-подобного 1 (RPL26L1), рибосомального белка L7-подобного 1 (RPL7L1), псевдогена рибосомального белка L13a (RPL13AP), псевдогена 8 рибосомального белка L37a (RPL37AP8), псевдогена 5 рибосомального белка S10 (RPS10P5), псевдогена рибосомального белка 11 S26 (RPS26P11), псевдогена 5 рибосомального белка L39 (RPL39P5), псевдогена 6 рибосомального белка большой субъединицы Р0 (RPLP0P6) и псевдогена 14 рибосомального белка L36 (RPL36P14). Предпочтительно понятие «ген рибосомального белка» относится к одному из вышеуказанных генов, которые происходят из млекопитающих, предпочтительно из Homo sapiens или Mus musculus.The term "ribosomal protein gene" generally refers to a gene encoding a ribosomal protein. In the context of the present description, this concept refers to any ribosomal protein gene, regardless of the species from which it originates. Specifically, the term refers to a eukaryotic ribosomal protein gene. In addition, in the context of the invention, the term "ribosomal protein gene" can also refer to a gene similar to the ribosomal protein gene, either in terms of structure or in terms of function. In particular, the term includes "ribosomal protein gene-like", pseudogenes, and genes having sequence or structure characteristics, primarily in their 3'-UTR region, of a ribosomal protein gene. Preferably, the term refers to a vertebrate ribosomal protein gene, more preferably a mammalian ribosomal protein gene, even more preferably a primate ribosomal protein gene, especially a human ribosomal protein gene. In addition, the term "ribosomal protein gene" also includes a rodent ribosomal protein gene, especially a mouse ribosomal protein gene. Examples of ribosomal protein genes in the context of the invention are (but not limited to) ribosomal protein L9 (RPL9), ribosomal protein L3 (RPL3), ribosomal protein L4 (RPL4), ribosomal protein L5 (RPL5), ribosomal protein L6 (RPL6) genes. ), ribosomal protein L7 (RPL7), ribosomal protein L7a (RPL7A), ribosomal protein L11 (RPL11), ribosomal protein L12 (RPL12), ribosomal protein L13 (RPL13), ribosomal protein L23 (RPL23), ribosomal protein L18 (RPL18) , ribosomal protein L18a (RPL18A), ribosomal protein L19 (RPL19), ribosomal protein L21 (RPL21), ribosomal protein L22 (RPL22), ribosomal protein L23a (RPL23A), ribosomal protein L17 (RPL17), ribosomal protein L24 (RPL24), ribosomal protein L26 (RPL26), ribosomal protein L27 (RPL27), ribosomal protein L30 (RPL30), ribosomal protein L27a (RPL27A), ribosomal protein L28 (RPL28), ribosomal protein L29 (RPL29), ribosomal protein L31 (RPL31), ribosomal o protein L32 (RPL32), ribosomal protein L35a (RPL35A), ribosomal protein L37 (RPL37), ribosomal protein L37a (RPL37A), ribosomal protein L38 (RPL38), ribosomal protein L39 (RPL39), ribosomal protein large subunit, P0 (RPLP0 ), ribosomal large subunit protein, P1 (RPLP1), ribosomal protein, large subunit, P2 (RPLP2), ribosomal protein S3 (RPS3), ribosomal protein S3A (RPS3A), ribosomal protein S4, X-linked (RPS4X), ribosomal protein S4, Y-linked 1 (RPS4Y1), ribosomal protein S5 (RPS5), ribosomal protein S6 (RPS6), ribosomal protein S7 (RPS7), ribosomal protein S8 (RPS8), ribosomal protein S9 (RPS9), ribosomal protein S10 (RPS10) ), ribosomal protein S11 (RPS11), ribosomal protein S12 (RPS12), ribosomal protein S13 (RPS13), ribosomal protein S15 (RPS15), ribosomal protein S15a (RPS15A), ribosomal protein S16 (RPS16), ribosomal protein S19 (RPS19) , ribosomal protein S20 (RPS20), ribosomal ribosomal protein S21 (RPS21), ribosomal protein S23 (RPS23), ribosomal protein S25 (RPS25), ribosomal protein S26 (RPS26), ribosomal protein S27 (RPS27), ribosomal protein S27a (RPS27a), ribosomal protein S28 (RPS28), ribosomal ribosomal protein S29 (RPS29), ribosomal protein L15 (RPL15), ribosomal protein S2 (RPS2), ribosomal protein L14 (RPL14), ribosomal protein S14 (RPS14), ribosomal protein L10 (RPL10), ribosomal protein L10a (RPL10A), ribosomal protein L35 (RPL35), ribosomal protein L13a (RPL13A), ribosomal protein L36 (RPL36), ribosomal protein L36a (RPL36A), ribosomal protein L41 (RPL41), ribosomal protein S18 (RPS18), ribosomal protein S24 (RPS24), ribosomal protein L8 (RPL8), ribosomal protein L34 (RPL34), ribosomal protein S17 (RPS17), ribosomal protein SA (RPSA), fusion product 1: ubiquitin residue A-52-ribosomal protein (UBA52), ubiquitously expressed gene (FAU) of mouse sarcoma virus Finkel-Biskis-Reilly (FBR-MuSV), ribosomal protein L22-like 1 (RPL22L1), ribosomal protein S17 (RPS17), ribosomal protein L39-like (RPL39L), ribosomal protein L10-like (RPL10L), ribosomal protein L36a-like (RPL36AL), ribosomal protein L3-like (RPL3L), ribosomal protein S27-like (RPS27L), ribosomal protein L26-like 1 (RPL26L1), ribosomal protein L7-like 1 (RPL7L1), ribosomal protein L13a pseudogene (RPL13AP), ribosomal protein pseudogene 8 L37a (RPL37AP8), ribosomal protein S10 pseudogene 5 (RPS10P5), ribosomal protein 11 S26 pseudogene (RPS26P11), ribosomal protein L39 pseudogene 5 (RPL39P5), ribosomal protein P0 large subunit pseudogene 6 (RPLP0P6), and ribosomal protein L36 pseudogene 14 (RPL36P14) ). Preferably, the term "ribosomal protein gene" refers to one of the above genes that is derived from mammals, preferably from Homo sapiens or Mus musculus.
Предпочтительно по меньшей мере одна открытая рамка считывания и по меньше мере один 3'-UTR-элемент являются гетерологичными. В контексте настоящего описания понятие «гетерологичный» означает, что два элемента последовательности, содержащиеся в искусственной молекуле нуклеиновой кислоты, такие как открытая рамка считывания и 3'-UTR-элемент, не встречаются в естественных условиях (в природе) в рассматриваемой комбинации. Предпочтительно 3'-UTR-элемент происходит из гена, отличного от гена, из которого происходит открытая рамка считывания. Например, ОРС может происходить из гена, отличного от гена, из которого происходит 3'-UTR-элемент, например, кодирующего другой белок или такой же белок, но из другого вида, и т.д. Предпочтительно открытая рамка считывания не кодирует рибосомальный белок. В предпочтительном варианте осуществления изобретения ОРС не кодирует человеческий рибосомальный белок или растительный рибосомальный белок (прежде всего, из Arabidopsis), прежде всего человеческий рибосомальный белок S6 (RPS6), белок, подобный человеческому рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 Arabidopsis (RPS16). В другом предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует рибосомальный белок S6 (RPS6), белок, подобный рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 (RPS16).Preferably, at least one open reading frame and at least one 3'UTR element are heterologous. In the context of the present description, the term "heterologous" means that two sequence elements contained in an artificial nucleic acid molecule, such as an open reading frame and a 3'-UTR element, do not occur naturally (in nature) in the considered combination. Preferably the 3'-UTR element is from a different gene from the gene from which the open reading frame is derived. For example, the ORF may be derived from a gene other than the gene from which the 3'UTR element is derived, such as encoding a different protein or the same protein but from a different species, and so on. Preferably, the open reading frame does not encode a ribosomal protein. In a preferred embodiment, the ORF does not encode a human ribosomal protein or a plant ribosomal protein (primarily from Arabidopsis), especially human ribosomal protein S6 (RPS6), human ribosomal protein L36a-like protein (RPL36AL) or Arabidopsis ribosomal protein S16 (RPS16). ). In another preferred embodiment of the invention, the open reading frame (ORF) does not encode ribosomal S6 protein (RPS6), ribosomal protein L36a like protein (RPL36AL) or ribosomal protein S16 (RPS16).
В конкретных вариантах осуществления изобретения предпочтительно открытая рамка считывания не кодирует репортерный белок, например, выбранный из группы, состоящей из глобиновых белков (прежде всего, бета-глобина), белка люциферазы, белков GFP или их вариантов, например, вариантов, последовательности которых идентичны по меньшей мере на 70% последовательности белка глобина, белка люциферазы или белка GFP. В наиболее предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует репортерный ген или не происходит из репортерного гена, где репортерный ген предпочтительно не выбирают из группы, состоящей из (генов) глобиновых белков (прежде всего бета-глобина), белка люциферазы, бета-глюкуронидазы (GUS) и белков GFP или их вариантов, предпочтительно не выбирают из EGFP или из вариантов любого из вышеуказанных генов, последовательности которых, как правило, идентичны по меньшей мере на 70% последовательности любого из вышеуказанных репортерных генов, предпочтительно генов белка глобина, белка люциферазы или белка GFP.In specific embodiments of the invention, preferably the open reading frame does not encode a reporter protein, for example, selected from the group consisting of globin proteins (primarily beta-globin), luciferase protein, GFP proteins, or variants thereof, for example, variants whose sequences are identical in at least 70% of the globin protein, luciferase protein or GFP protein sequence. In the most preferred embodiment of the invention, the open reading frame (ORF) does not encode a reporter gene or is not derived from a reporter gene, where the reporter gene is preferably not selected from the group consisting of (genes) globin proteins (primarily beta-globin), luciferase protein, beta-glucuronidase (GUS) and GFP proteins or variants thereof, preferably not selected from EGFP or from variants of any of the above genes, the sequences of which are generally at least 70% identical to the sequence of any of the above reporter genes, preferably globin protein genes , luciferase protein or GFP protein.
Еще более предпочтительно 3'-UTR-элемент является гетерологичным любому другому элементу, содержащемуся в искусственной нуклеиновой кислоте, представленной в настоящем описании. Например, если искусственная нуклеиновая кислота, предлагаемая в изобретении, содержит 3'-UTR-элемент из рассматриваемого гена, то она предпочтительно не содержит никакой другой нуклеотидной последовательности, прежде всего никакой функциональной нуклеотидной последовательности (например, элемента кодирующей или регуляторной последовательности) из этого же гена, включая его регуляторные последовательности на 5'- и 3'-конце ОРС гена. В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит ОРС, 3'-UTR и 5'-UTR, которые все являются гетерологичными друг другу, например, они являются рекомбинантными, поскольку каждый из указанных элементов происходит из различных генов (и их 5'- и 3'-UTR). В другом предпочтительном варианте осуществления изобретения 3'-UTR не происходит из 3'-UTR вирусного гена или происходит не из вируса.Even more preferably, the 3'-UTR element is heterologous to any other element contained in the artificial nucleic acid provided herein. For example, if an artificial nucleic acid according to the invention contains a 3'-UTR element from the gene in question, then it preferably does not contain any other nucleotide sequence, in particular any functional nucleotide sequence (for example, a coding or regulatory sequence element) from the same gene, including its regulatory sequences at the 5'- and 3'-end of the ORF gene. In the most preferred embodiment of the invention, the artificial nucleic acid molecule contains an ORF, a 3'-UTR and a 5'-UTR, which are all heterologous to each other, for example, they are recombinant, since each of these elements comes from different genes (and their 5' - and 3'-UTR). In another preferred embodiment of the invention, the 3'UTR is not derived from a 3'UTR of a viral gene or is not derived from a virus.
Предпочтительно по меньшей мере один 3'-UTR-элемент функционально связан с ОРС. Это означает, что предпочтительно 3'-UTR-элемент ассоциирован с ОРС таким образом, что он может осуществлять функцию, такую как функция повышения или стабилизации экспрессии кодируемого пептида или белка, или функцию стабилизации искусственной молекулы нуклеиновой кислоты. Предпочтительно ОРС и 3'-UTR-элемент ассоциированы в направлении 5'→3'. Таким образом, предпочтительно искусственная молекула нуклеиновой кислоты содержит структуру 5'-ОРС-(необязательно)-линкер-3'-UTR-элемент-3', в которой линкер может присутствовать или отсутствовать. Например, линкер может состоять из одного или нескольких нуклеотидов, например, представлять собой сегмент, состоящий из 1-50 или 1-20 нуклеотидов, например, содержащий или состоящий из одного или нескольких сайтов, распознаваемых рестриктазами (сайтов рестрикции).Preferably, at least one 3'UTR element is operably linked to the ORF. This means that preferably the 3'-UTR element is associated with the ORF in such a way that it can perform a function such as the function of increasing or stabilizing the expression of an encoded peptide or protein, or the function of stabilizing an artificial nucleic acid molecule. Preferably, the ORF and the 3'UTR element are associated in the 5'→3' direction. Thus, preferably, the artificial nucleic acid molecule contains the structure 5'-ORC-(optional)-linker-3'-UTR-element-3', in which the linker may or may not be present. For example, the linker may consist of one or more nucleotides, for example, be a segment consisting of 1-50 or 1-20 nucleotides, for example, containing or consisting of one or more sites recognized by restriction enzymes (restriction sites).
Предпочтительно по меньшей мере один 3'-UTR-элемент содержит нуклеотидную последовательность, происходящую из 3'-UTR гена эукариотического рибосомального белка, предпочтительно из 3'-UTR гена рибосомального белка позвоночных, более предпочтительно из 3'-UTR гена рибосомального белка млекопитающих, еще более предпочтительно из 3'-UTR гена рибосомального белка приматов, прежде всего гена рибосомального белка человека, или из 3'-UTR гена рибосомального белка грызунов, прежде всего гена мышиного рибосомального белка.Preferably, at least one 3'-UTR element contains a nucleotide sequence derived from a 3'-UTR of a eukaryotic ribosomal protein gene, preferably from a 3'-UTR of a vertebrate ribosomal protein gene, more preferably from a 3'-UTR of a mammalian ribosomal protein gene, still more preferably from a 3'UTR of a primate ribosomal protein gene, especially a human ribosomal protein gene, or from a 3'UTR of a rodent ribosomal protein gene, especially a mouse ribosomal protein gene.
В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элемент содержит или соответствует нуклеотидной последовательности, которая происходит из последовательности 3'-UTR транскрипта, выбранного из группы, состоящей из In a preferred embodiment of the invention, at least one 3'-UTR element contains or corresponds to a nucleotide sequence that is derived from the 3'-UTR sequence of a transcript selected from the group consisting of
Фраза «нуклеотидная последовательность, которая происходит из 3'-UTR гена рибосомального белка» предпочтительно относится к нуклеотидной последовательности, основой которой является последовательность 3'-UTR гена рибосомального белка или ее фрагмент или участок. Указанная фраза включает последовательности, соответствующие полной последовательности 3'-UTR, т.е. полноразмерной последовательности 3'-UTR гена рибосомального белка, и последовательности, соответствующие фрагменту последовательности 3'-UTR гена рибосомального белка. Предпочтительно фрагмент 3'-UTR гена рибосомального белка состоит из непрерывного сегмента нуклеотидов, соответствующего непрерывному сегменту нуклеотидов полноразмерной последовательности 3'-UTR гена рибосомального белка, который включает по меньшей мере 5%, 10%, 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90% полноразмерной последовательности 3'-UTR гена рибосомального белка. В контексте настоящего изобретения такой фрагмент предпочтительно представляет собой функциональный фрагмент, представленный в настоящем описании. Предпочтительно фрагмент сохраняет функцию регулирования трансляции ОРС, сцепленной с 3'-UTR или его фрагментом. Понятие «3'-UTR гена рибосомального белка» предпочтительно относится к 3'-UTR встречающегося в естественных условиях гена рибосомального белка.The phrase "a nucleotide sequence which is derived from the 3'UTR of a ribosomal protein gene" preferably refers to a nucleotide sequence based on the 3'UTR of a ribosomal protein gene or a fragment or region thereof. Said phrase includes sequences corresponding to the entire 3'-UTR sequence, i.e. the full-length sequence of the 3'-UTR of the ribosomal protein gene, and sequences corresponding to a fragment of the sequence of the 3'-UTR of the ribosomal protein gene. Preferably, the 3'UTR fragment of the ribosomal protein gene consists of a contiguous segment of nucleotides corresponding to the contiguous segment of nucleotides of the full-length 3'UTR of the ribosomal protein gene, which comprises at least 5%, 10%, 20%, preferably at least 30%, more preferably at least 40%, more preferably at least 50%, even more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80% and most preferably at least 90% full-length sequence of the 3'-UTR of the ribosomal protein gene. In the context of the present invention, such a fragment is preferably a functional fragment presented in the present description. Preferably, the fragment retains the function of regulating the translation of the ORF linked to the 3'UTR or a fragment thereof. The term "3'UTR of a ribosomal protein gene" preferably refers to the 3'UTR of a naturally occurring ribosomal protein gene.
Понятия «вариант 3'-UTR гена рибосомального белка» и «его вариант» в контексте 3'-UTR гена рибосомального белка относятся к варианту 3'-UTR встречающегося в естественных условиях гена рибосомального белка, предпочтительно к варианту 3'-UTR гена рибосомального белка позвоночных, более предпочтительно к варианту 3'-UTR гена рибосомального белка млекопитающих, еще более предпочтительно к варианту 3'-UTR варианту 3'-UTR гена рибосомального белка приматов, прежде всего гена рибосомального белка человека, представленного выше. Такой вариант может представлять собой модифицированный 3'-UTR гена рибосомального белка. Например, вариант 3'-UTR может иметь одну или несколько делеций, инсерций, добавлений и/или замен нуклеотидов по сравнению с встречающейся в естественных условиях 3'-UTR, из которой происходит вариант. Предпочтительно вариант 3'-UTR гена рибосомального белка по меньшей мере на 40%, предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, более предпочтительно по меньшей мере на 70%, еще более предпочтительно по меньшей мере на 80%, еще более предпочтительно по меньшей мере на 90%, наиболее предпочтительно по меньшей мере на 95% идентичен встречающейся в естественных условиях 3'-UTR, из которой происходит вариант. Предпочтительно вариант представляет собой функциональный вариант, представленный в настоящем описании.The terms "variant 3'-UTR of the ribosomal protein gene" and "variant thereof" in the context of the 3'-UTR of the ribosomal protein gene refer to the 3'-UTR variant of the naturally occurring ribosomal protein gene, preferably the 3'-UTR variant of the ribosomal protein gene vertebrates, more preferably the 3'UTR variant of the mammalian ribosomal protein gene, even more preferably the 3'UTR variant of the 3'UTR variant of the primate ribosomal protein gene, especially the human ribosomal protein gene shown above. Such a variant may be a modified 3'-UTR of a ribosomal protein gene. For example, a variant 3'-UTR may have one or more deletions, insertions, additions, and/or substitutions of nucleotides compared to the naturally occurring 3'-UTR from which the variant is derived. Preferably the variant 3'-UTR of the ribosomal protein gene is at least 40%, preferably at least 50%, more preferably at least 60%, more preferably at least 70%, even more preferably at least 80% %, even more preferably at least 90%, most preferably at least 95% identical to the naturally occurring 3'-UTR from which the variant originates. Preferably the variant is a functional variant presented in the present description.
Фраза «нуклеотидная последовательность, которая происходит из варианта 3'-UTR гена рибосомального белка» предпочтительно относится к нуклеотидной последовательности, основой которой является вариант последовательности 3'-UTR гена рибосомального белка или его фрагмент или участок, представленный выше. Фраза включает последовательности, соответствующие полной последовательности варианта 3'-UTR гена рибосомального белка, т.е. полноразмерной последовательности варианта 3'-UTR гена рибосомального белка, и последовательности, соответствующие фрагменту варианта последовательности 3'-UTR гена рибосомального белка. Предпочтительно фрагмент варианта 3'-UTR гена рибосомального белка состоит из непрерывного сегмента нуклеотидов, соответствующего непрерывному сегменту нуклеотидов полноразмерного варианта последовательности 3'-UTR гена рибосомального белка, который включает по меньшей мере 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, и наиболее предпочтительно по меньшей мере 90% полноразмерного варианта 3'-UTR гена рибосомального белка. В контексте настоящего изобретения такой фрагмент варианта предпочтительно представляет собой функциональный фрагмент варианта, представленного в настоящем описании.The phrase "a nucleotide sequence which is derived from a ribosomal protein gene 3'-UTR variant" preferably refers to a nucleotide sequence based on a ribosomal protein gene 3'-UTR sequence variant or a fragment or region thereof as shown above. The phrase includes sequences corresponding to the complete sequence of the 3'-UTR variant of the ribosomal protein gene, i.e. the full-length sequence of the 3'-UTR variant of the ribosomal protein gene, and sequences corresponding to a fragment of the 3'-UTR sequence variant of the ribosomal protein gene. Preferably, the ribosomal protein gene variant 3'-UTR fragment consists of a contiguous segment of nucleotides corresponding to the contiguous nucleotide segment of the full-length ribosomal protein 3'-UTR gene sequence variant, which comprises at least 20%, preferably at least 30%, more preferably at least at least 40%, more preferably at least 50%, even more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80%, and most preferably at least 90% of the full size option 3 '-UTR of the ribosomal protein gene. In the context of the present invention, such a variant fragment is preferably a functional fragment of the variant presented in the present description.
В контексте настоящего описания понятия «функциональный вариант» «функциональный фрагмент» и «функциональный фрагмент варианта» (который обозначают также как «функциональный вариантный фрагмент») означают, что фрагмент 3'-UTR, вариант 3'-UTR или фрагмент варианта 3'-UTR гена рибосомального белка выполняет по меньшей мере одну, предпочтительно более чем одну функцию встречающейся в естественных условиях 3'-UTR гена рибосомального белка, из которой происходит вариант, фрагмента или фрагмент варианта. Такая функция может заключаться, например, в стабилизации мРНК и/или увеличении, стабилизации и/или пролонгировании производства белка с мРНК, и/или увеличении экспрессии белка или общего производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка. Предпочтительно функция 3'-UTR касается трансляции белка, кодируемого ОРС. Более предпочтительно функция включает повышение эффективности трансляции ОРС, связанной с 3'-UTR или ее фрагментом или вариантом. В контексте настоящего изобретения наиболее предпочтительно, чтобы вариант, фрагмент и вариант фрагмента выполнял функцию стабилизации мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, и/или функцию увеличения, стабилизации и/или пролонгирования производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, и/или функцию увеличения производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Референс-3'-UTR может представлять собой, например, 3'-UTR, встречающуюся в естественных условиях в комбинации с ОРС. Кроме того, функциональный вариант, функциональный фрагмент или функциональный вариант фрагмента 3'-UTR гена рибосомального белка предпочтительно не оказывает существенного понижающего действия на эффективность трансляции мРНК, которая содержит такой вариант, фрагмент или вариант фрагмента 3'-UTR, по сравнению с 3'-UTR дикого типа, из которой происходит вариант, фрагмент или вариант фрагмента. В контексте настоящего изобретения наиболее предпочтительная функция «функционального варианта», «функционального фрагмента» или «функционального варианта фрагмента» 3'-UTR гена рибосомального белка заключается в увеличении, стабилизации и/или пролонгировании производства белка посредством экспрессии мРНК, несущей функциональный вариант, функциональный фрагмент или функциональный вариант фрагмента, представленный выше.In the context of the present description, the terms "functional variant" "functional fragment" and "functional fragment of the variant" (which is also referred to as "functional variant fragment") mean that a 3'-UTR fragment, a 3'-UTR variant, or a 3'-variant fragment The UTR of the ribosomal protein gene performs at least one, preferably more than one, function of the naturally occurring 3' UTR of the ribosomal protein gene from which the variant, fragment, or fragment of the variant is derived. Such a function may be, for example, to stabilize the mRNA and/or increase, stabilize and/or prolong protein production from mRNA and/or increase protein expression or total protein production from mRNA, preferably in a mammalian cell such as a human cell. Preferably, the function of the 3'UTR is to translate the protein encoded by the ORF. More preferably, the function includes increasing the efficiency of translation of the ORF associated with the 3'UTR or a fragment or variant thereof. In the context of the present invention, it is most preferred that the variant, fragment, and fragment variant have the function of stabilizing the mRNA, preferably in a mammalian cell such as a human cell, compared to an mRNA that contains a reference 3'-UTR or lacks a 3'-UTR. , and/or the function of increasing, stabilizing and/or prolonging the production of a protein from an mRNA, preferably in a mammalian cell, such as a human cell, compared to an mRNA that contains a reference 3'-UTR or lacks a 3'-UTR, and /or the function of increasing protein production from an mRNA, preferably in a mammalian cell such as a human cell, compared to an mRNA that contains a reference 3'-UTR or lacks a 3'-UTR. The reference 3'-UTR may be, for example, the naturally occurring 3'-UTR in combination with the ORF. In addition, the functional variant, functional fragment or functional variant of the 3'-UTR fragment of the ribosomal protein gene preferably does not significantly reduce the efficiency of translation of mRNA that contains such a variant, fragment or variant of the 3'-UTR fragment, compared to the 3'- The wild-type UTR from which the variant, fragment, or fragment variant is derived. In the context of the present invention, the most preferred function of a "functional variant", "functional fragment" or "functional fragment variant" of the 3'-UTR of a ribosomal protein gene is to increase, stabilize and/or prolong protein production by expression of an mRNA carrying a functional variant, a functional fragment or the functional version of the snippet presented above.
Предпочтительно эффективность одной или нескольких функций, осуществляемых функциональным вариантом, функциональным фрагментом или функциональным вариантом фрагмента, такую как эффективность стабилизации производства мРНК и/или белка, и/или эффективность увеличения производства белка, повышают по меньшей мере на 5%, более предпочтительно по меньшей мере на 10%, более предпочтительно по меньшей мере на 20%, более предпочтительно по меньшей мере на 30%, более предпочтительно по меньшей мере на 40%, более предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере на 90% по сравнению с эффективностью стабилизации производства мРНК и/или белка, и/или эффективностью увеличения производства белка, обеспечиваемой встречающейся в естественных условиях 3'-UTR гена рибосомального белка, из которого происходит вариант, фрагмент или вариант фрагмента.Preferably, the efficiency of one or more functions performed by the functional variant, functional fragment, or functional fragment variant, such as the efficiency of stabilizing mRNA and/or protein production and/or the efficiency of increasing protein production, is increased by at least 5%, more preferably at least 10%, more preferably at least 20%, more preferably at least 30%, more preferably at least 40%, more preferably at least 50%, more preferably at least 60%, more more preferably at least 70%, even more preferably at least 80%, most preferably at least 90% compared to the mRNA and/or protein production stabilization efficiency and/or protein production enhancement efficiency provided by naturally occurring 3'-UTR of the ribosomal protein gene from which the variant, fragment, or variant is derived t fragment.
В контексте настоящего изобретения фрагмент 3'-UTR гена рибосомального белка или вариант 3'-UTR гена рибосомального белка предпочтительно имеет длину по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидов, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. Предпочтительно такой фрагмент 3'-UTR гена рибосомального белка или вариант 3'-UTR гена рибосомального белка представляет собой функциональный фрагмент, описанный выше. В предпочтительном варианте осуществления изобретения 3'-UTR гена рибосомального белка или его фрагмент или вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.In the context of the present invention, a 3'-UTR fragment of a ribosomal protein gene or a 3'-UTR variant of a ribosomal protein gene is preferably at least about 3 nucleotides in length, preferably at least about 5 nucleotides, more preferably at least about 10, 15, 20 , 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. Preferably, such a ribosomal protein 3'UTR gene fragment or ribosomal protein 3'UTR gene variant is a functional fragment as described above. In a preferred embodiment, the 3'-UTR of the ribosomal protein gene, or fragment or variant thereof, is from 3 to about 500 nucleotides in length, preferably from 5 to about 150 nucleotides, more preferably from 10 to 100 nucleotides, even more preferably from 15 to 90, most preferably 20 to 70 nucleotides.
Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из «функционального фрагмента», «функционального варианта» или «функционального фрагмента варианта» 3'-UTR гена рибосомального белка.Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a "functional fragment", "functional variant", or "functional fragment of the variant" 3'-UTR of the ribosomal protein gene.
В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает стабильность искусственной молекулы нуклеиновой кислоты, например, повышает стабильность мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой нуклеиновой референс-кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно, по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает стабильность производства белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, пролонгирует производство белка из искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает экспрессию белка и/или общее производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, не оказывает отрицательного влияния на эффективность трансляции нуклеиновой кислоты по сравнению с эффективностью трансляции соответствующей нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Еще более предпочтительно с помощью 3'-UTR повышают эффективность трансляции по сравнению с эффективностью трансляции белка, кодируемого соответствующей ОРС в естественных условиях.In a preferred embodiment of the invention, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention improves the stability of the artificial nucleic acid molecule, for example, increases the stability of the mRNA of the present invention, compared with the corresponding nucleic nucleic reference -acid lacking a 3'UTR or containing a reference 3'UTR, such as the naturally occurring 3'UTR in combination with an ORF. Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention improves the stability of protein production from the artificial nucleic acid molecule of the present invention, for example, mRNA of the present invention, compared with an appropriate nucleic acid that lacks a 3'UTR or that contains a reference 3'UTR, such as a naturally occurring 3'UTR in combination with an ORF. Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention prolongs the production of protein from the artificial nucleic acid molecule of the present invention, for example, with the mRNA of the present invention, compared with the corresponding nucleic acid an acid that lacks a 3'UTR or that contains a reference 3'UTR, such as a naturally occurring 3'UTR in combination with an ORF. Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention increases protein expression and/or overall protein production from the artificial nucleic acid molecule of the present invention, for example, mRNA of the present invention , compared to a corresponding nucleic acid that lacks a 3'UTR or that contains a reference 3'UTR, such as a naturally occurring 3'UTR in combination with an ORF. Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention does not adversely affect the translation efficiency of the nucleic acid compared to the translation efficiency of the corresponding nucleic acid that lacks the 3'-UTR or contains the reference -3'UTR, such as the naturally occurring 3'UTR in combination with ORF. Even more preferably, the 3'-UTR increases the efficiency of translation compared to the efficiency of translation of the protein encoded by the corresponding ORF in natural conditions.
Понятие «соответствующая молекула нуклеиновой кислоты» или «референс-молекула нуклеиновой кислоты» в указанном контексте означает, что референс-молекула нуклеиновой кислоты, за исключением различий в 3'-UTR, сопоставима, предпочтительно идентична предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, содержащей 3'-UTR-элемент.The term "corresponding nucleic acid molecule" or "reference nucleic acid molecule" in this context means that the reference nucleic acid molecule, except for differences in the 3'-UTR, is comparable, preferably identical to the artificial nucleic acid molecule proposed in the present invention containing 3'-UTR element.
Понятие «стабилизирует и/или пролонгирует производство белка» с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, предпочтительно означает, что производство белка с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, стабилизируется и/или пролонгируется по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, например, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, предпочтительно в экспрессионной системе млекопитающих, такой как HeLa- или HDF-клетки. Так, белок, продуцируемый с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, поддается обнаружению в течение более длительного периода времени, чем время, в течение которого его можно обнаружить в случае белка, продуцируемого с референс-молекулы нуклеиновой кислоты. Иными словами, количество белка, продуцированного с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, измеряемое в зависимости от времени, снижается до уровня, находящегося ниже порогового значения, в более поздний момент времени, чем количество белка, продуцированного с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, измеряемое в зависимости от времени. Такое пороговое значение может представлять собой, например, количество белка, измеренное на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты.The term "stabilizes and/or prolongs the production of a protein" from an artificial nucleic acid molecule, such as an artificial mRNA, preferably means that the production of a protein from an artificial nucleic acid molecule, such as an artificial mRNA, is stabilized and/or prolonged compared to the production of a reference protein. a nucleic acid molecule, such as a reference mRNA, for example, which contains a reference 3'UTR or lacks a 3'UTR, preferably in a mammalian expression system such as HeLa or HDF cells. Thus, a protein produced from an artificial nucleic acid molecule, such as an artificial mRNA, is detectable for a longer period of time than the time during which it can be detected in the case of a protein produced from a reference nucleic acid molecule. In other words, the amount of protein produced from an artificial nucleic acid molecule, such as an artificial mRNA, measured as a function of time, falls below a threshold value at a later point in time than the amount of protein produced from a reference nucleic acid molecule. , such as a reference mRNA measured over time. Such a threshold value can be, for example, the amount of protein measured at the initial phase of expression, for example, 1, 2, 3, 4, 5 or 6 hours after the initiation of expression, for example, after transfection with a nucleic acid molecule.
Например, производство белка с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, в количествах, равных по меньшей мере количеству, обнаруженному на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты, пролонгируется по меньшей мере примерно на 5 ч, предпочтительно по меньшей мере примерно на 10 ч, более предпочтительно по меньшей мере примерно на 24 ч по сравнении с производством белка с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, в экспрессионной системе, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках. Так, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, предпочтительно позволяет пролонгировать производство белка в количестве, которое по меньшей мере равно количеству, обнаруженному на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты, по меньшей мере примерно на 5 ч, предпочтительно по меньшей мере примерно на 10 ч, более предпочтительно по меньшей мере примерно на 24 ч по сравнении с производством белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.For example, the production of a protein from an artificial nucleic acid molecule, such as an artificial mRNA, in amounts equal to at least the amount found in the initial phase of expression, for example, 1, 2, 3, 4, 5, or 6 hours after initiation of expression, for example , after transfection with a nucleic acid molecule, is prolonged by at least about 5 hours, preferably at least about 10 hours, more preferably at least about 24 hours compared with the production of protein from a reference nucleic acid molecule, such as a reference mRNA, in an expression system such as in mammalian cells, for example in HeLa or HDF cells. Thus, the artificial nucleic acid molecule of the present invention preferably allows the prolongation of protein production in an amount that is at least equal to the amount found in the initial phase of expression, for example, 1, 2, 3, 4, 5 or 6 hours after initiation expression, e.g., after transfection with a nucleic acid molecule, for at least about 5 hours, preferably at least about 10 hours, more preferably at least about 24 hours, compared with the production of a protein from a reference nucleic acid molecule in which missing 3'-UTR or which contains a reference 3'-UTR.
В предпочтительных вариантах осуществления изобретения период производства белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, удлиняют по меньшей мере в 1,5 раза, предпочтительно по меньшей мере в 2 раза, более предпочтительно по меньшей мере в 2,5 раза по сравнению с периодом производства белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.In preferred embodiments of the invention, the period of production of a protein from an artificial nucleic acid molecule of the present invention is extended by at least 1.5 times, preferably at least 2 times, more preferably at least 2.5 times compared to a period of protein production from a reference nucleic acid molecule that lacks a 3'-UTR or contains a reference 3'-UTR.
Указанный эффект пролонгирования производства белка можно оценивать на основе (I) измерения количеств белка, например, полученных в результате экспрессии кодируемого репортерного белка, такого как люцифераза, предпочтительно в экспрессионной системе млекопитающих, такой как HeLa-или HDF-клетки, в зависимости от времени, (II) определения момента времени, в который количество белка становится ниже количества белка, обнаруженного, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после трансфекции искусственной молекулой нуклеиновой кислоты, и (III) сравнения момента времени, который количество белка становится ниже количества белка, обнаруженного, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, с указанным моментом времени, определенным для молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.Said effect of prolonging protein production can be assessed based on (i) measuring the amounts of protein, for example, obtained from the expression of an encoded reporter protein such as luciferase, preferably in a mammalian expression system such as HeLa or HDF cells, as a function of time, (II) determining the point in time at which the amount of protein falls below the amount of protein detected, for example, 1, 2, 3, 4, 5, or 6 hours after initiation of expression, for example, 1, 2, 3, 4, 5 or 6 hours after transfection with the artificial nucleic acid molecule, and (iii) comparing the time point at which the amount of protein falls below the amount of protein detected, e.g. 1, 2, 3, 4, 5, or 6 hours after initiation of expression, with the indicated time point defined for a nucleic acid molecule that lacks a 3'-UTR or contains a reference 3'-UTR.
Предпочтительно указанное стабилизирующее и/или пролонгирующее действие на производство белка достигают, когда общее количество белка, продуцированное с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, в течение периода времени, составляющего 48 или 72 ч, по меньшей мере равно количеству белка, продуцированного с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты. Так, в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, которая обеспечивает пролонгированное и/или стабилизированное производство белка в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках, как указано выше, при этом общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 48 или 72 ч, по меньшей мере равно общему количеству белка, продуцированного, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ORF искусственной молекулы нуклеиновой кислоты.Preferably, said stabilizing and/or prolonging effect on protein production is achieved when the total amount of protein produced from the artificial nucleic acid molecule of the present invention, for example, over a period of 48 or 72 hours, is at least equal to the amount of protein, produced from a reference nucleic acid molecule that lacks a 3'-UTR or that contains a reference 3'-UTR, such as a 3'-UTR that occurs naturally with the ORF of the artificial nucleic acid molecule. Thus, the present invention provides an artificial nucleic acid molecule that provides prolonged and/or stabilized protein production in a mammalian expression system, such as mammalian cells, for example, in HeLa or HDF cells, as described above, while the total amount of protein, produced from said artificial nucleic acid molecule, for example, over a period of 48 or 72 hours, is at least equal to the total amount of protein produced, for example, over a specified period of time, from a reference nucleic acid molecule that lacks 3 '-UTR or which contains a reference 3'-UTR, such as the 3'-UTR naturally occurring with the ORF of an artificial nucleic acid molecule.
Так, «стабилизированная экспрессия белка» предпочтительно означает, что имеет место более равномерное производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, в течение заранее определенного периода времени, например, в течение 24 ч, более предпочтительно в течение 48 ч, еще более предпочтительно в течение 72 ч, по сравнению с референс-молекулой нуклеиновой кислоты, например, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Следовательно, уровень производства белка, например, в системе млекопитающих, с искусственной молекулы нуклеиновой кислоты, содержащей 3'-UTR-элемент, предлагаемый в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, предпочтительно не снижается до уровня, обнаруженного для референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, указанная выше. Например, количество белка (кодируемого ОРС), обнаруженное через 6 ч после инициации экспрессии, например, через 6 ч после трансфекции искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, клетки, такой как клетка млекопитающего, может быть сопоставимым с количеством белка, обнаруженного через 48 ч после инициации экспрессии, например, через 48 ч после трансфекции. Так, отношение количества белка, кодируемого ОРС, такого как репортерный белок, например, люцифераза, обнаруженное через 48 ч после инициации экспрессии, например, через 48 после трансфекции, к количеству белка, обнаруженному через 6 ч после инициации экспрессии, например, через 6 ч после трансфекции, предпочтительно составляет по меньшей мере примерно 0,4, более предпочтительно по меньшей мере примерно 0,5, более предпочтительно по меньшей мере примерно 0,6, еще более предпочтительно по меньшей мере примерно 0,7. Для молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении отношение предпочтительно составляет от примерно 0,4 до примерно 4, предпочтительно от примерно 0,65 до примерно 3, более предпочтительно от примерно 0,7 до 2. Для соответствующей референс-молекулы нуклеиновой кислоты, например, мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, указанное отношение может составлять, например, от примерно 0,05 до примерно 0,3.Thus, "stabilized protein expression" preferably means that there is a more uniform production of protein from the artificial nucleic acid molecule of the present invention over a predetermined period of time, for example within 24 hours, more preferably within 48 hours, yet more preferably within 72 hours, compared to a reference nucleic acid molecule, for example, which contains a reference 3'-UTR or lacks a 3'-UTR. Therefore, the level of protein production, for example, in a mammalian system, from an artificial nucleic acid molecule containing a 3'-UTR element of the present invention, for example, from an mRNA of the present invention, preferably does not decrease to the level found for the reference a nucleic acid molecule, such as the reference mRNA mentioned above. For example, the amount of protein (encoded by ORF) detected 6 hours after initiation of expression, for example 6 hours after transfection of a cell, such as a mammalian cell, with an artificial nucleic acid molecule of the present invention, may be comparable to the amount of protein detected through 48 hours after initiation of expression, eg 48 hours after transfection. Thus, the ratio of the amount of a protein encoded by an ORF, such as a reporter protein, for example, luciferase, detected 48 hours after initiation of expression, for example, 48 hours after transfection, to the amount of protein detected 6 hours after initiation of expression, for example, after 6 hours after transfection, preferably at least about 0.4, more preferably at least about 0.5, more preferably at least about 0.6, even more preferably at least about 0.7. For a nucleic acid molecule of the present invention, the ratio is preferably from about 0.4 to about 4, preferably from about 0.65 to about 3, more preferably from about 0.7 to 2. For a corresponding reference nucleic acid molecule, for example , mRNA that contains a reference 3'-UTR or lacks a 3'-UTR, said ratio may be, for example, from about 0.05 to about 0.3.
Так, в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, содержащая ОРС и 3'-UTR-элемент, описанный выше, при этом отношение количества (репортерного) белка, например, количество люциферазы, обнаруженное через 48 ч после инициации экспрессии, к количеству (репортерного) белка, обнаруженному через 6 ч после инициации экспрессии, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa-клетках, предпочтительно превышает примерно 0,4, более предпочтительно превышает примерно 0,5, более предпочтительно превышает примерно 0,6, еще более предпочтительно превышает примерно 0,7, например, составляет от примерно 0,4 до примерно 4, предпочтительно от примерно 0,65 до примерно 3, более предпочтительно от примерно 0,7 до 2, при этом предпочтительно общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 48 ч, по меньшей мере равно общему количеству белка, продуцированного, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты. В предпочтительном варианте осуществления настоящего изобретения предложена искусственная молекула нуклеиновой кислоты, содержащая ОРС и 3'-UTR-элемент, описанный выше, при этом отношение количества (репортерного) белка, например, количество люциферазы, обнаруженное через 72 ч после инициации экспрессии, к количеству (репортерного) белка, обнаруженному через 6 ч после инициации экспрессии, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa-клетках, предпочтительно превышает примерно 0,4, более предпочтительно превышает примерно 0,5, более предпочтительно превышает примерно 0,6, еще более предпочтительно превышает примерно 0,7, например, составляет от примерно 0,4 до 1,5, предпочтительно от примерно 0,65 до примерно 1,15, более предпочтительно от примерно 0,7 до 1.0, при этом предпочтительно общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 72 ч, по меньшей мере равно общему количеству белка, продуцированному, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит 3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты.Thus, the present invention provides an artificial nucleic acid molecule containing an ORF and a 3'-UTR element as described above, wherein the ratio of the amount of (reporter) protein, for example, the amount of luciferase detected 48 hours after initiation of expression, to the amount of (reporter) ) protein detected 6 hours after initiation of expression, preferably in a mammalian expression system such as mammalian cells, for example in HeLa cells, preferably greater than about 0.4, more preferably greater than about 0.5, more preferably greater than about 0, 6, even more preferably greater than about 0.7, for example, from about 0.4 to about 4, preferably from about 0.65 to about 3, more preferably from about 0.7 to 2, with the total amount of protein being preferred, produced from said artificial nucleic acid molecule, for example, over a period of 48 hours, at least equal to the total amount of protein produced, for example, during a specified period of time, from a reference nucleic acid molecule that lacks a 3'-UTR or that contains a reference 3'-UTR, such as a 3'-UTR naturally occurring with ORF of an artificial nucleic acid molecule. In a preferred embodiment, the present invention provides an artificial nucleic acid molecule comprising an ORF and a 3'-UTR element as described above, wherein the ratio of the amount of (reporter) protein, e.g., the amount of luciferase detected 72 hours after initiation of expression, to the amount reporter) protein detected 6 hours after initiation of expression, preferably in a mammalian expression system such as mammalian cells, e.g. in HeLa cells, preferably greater than about 0.4, more preferably greater than about 0.5, more preferably greater than about 0 ,6, even more preferably greater than about 0.7, for example, from about 0.4 to 1.5, preferably from about 0.65 to about 1.15, more preferably from about 0.7 to 1.0, with the total amount of protein produced from said artificial nucleic acid molecule, for example, over a period of time its 72 hours is at least equal to the total amount of protein produced, for example, during the specified time period, from a reference nucleic acid molecule that lacks a 3'-UTR or that contains a 3'-UTR, such as a 3'-UTR , which occurs naturally with the ORF of an artificial nucleic acid molecule.
«Увеличенная экспрессия белка» или «повышенная экспрессия белка» в контексте настоящего изобретения предпочтительно обозначает увеличенную/повышенную экспрессию белка в один из моментов времени после инициации экспрессии или увеличенное/повышенное общее количество экспрессированного белка, по сравнению с экспрессией, индуцированной референс-молекулой нуклеиновой кислоты. Так, уровень белка, обнаруженный в определенный момент времени после инициации экспрессии, например, после трансфекции искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, после трансфекции мРНК, предлагаемой в настоящем изобретении, например, через 6, 12, 24, 48 или 72 ч после трансфекции, предпочтительно превышает уровень белка, обнаруженный в этот же самый момент времени после инициации экспрессии, например, после трансфекции референс-молекулой нуклеиновой кислоты, такой как референс-мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. В предпочтительном варианте осуществления изобретения максимальное количество белка (определенное, например, по активности или массе белка), экспрессированного с искусственной молекулы нуклеиновой кислоты, увеличивают по сравнению с количеством белка, экспрессированного с нуклеиновой референс-кислоты, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Пиковые уровни экспрессии предпочтительно достигаются в пределах 48 ч, более предпочтительно в пределах 24 ч и еще более предпочтительно в пределах 12 ч после, например, трансфекции."Increased protein expression" or "increased protein expression" in the context of the present invention preferably means increased/increased protein expression at one of the time points after initiation of expression, or increased/increased total protein expressed, compared to expression induced by a reference nucleic acid molecule. . Thus, the level of protein detected at a certain point in time after the initiation of expression, for example, after transfection with an artificial nucleic acid molecule of the present invention, for example, after transfection of an mRNA of the present invention, for example, after 6, 12, 24, 48 or 72 hours after transfection, preferably greater than the level of protein found at the same time point after initiation of expression, e.g. after transfection with a nucleic acid reference molecule, such as a reference mRNA that contains or lacks a reference 3'-UTR 3 '-UTR. In a preferred embodiment of the invention, the maximum amount of protein (determined, for example, by activity or protein weight) expressed from an artificial nucleic acid molecule is increased compared to the amount of protein expressed from a reference nucleic acid that contains a reference 3'-UTR or in which there is no 3'-UTR. Peak expression levels are preferably reached within 48 hours, more preferably within 24 hours and even more preferably within 12 hours after, for example, transfection.
В одном из вариантов осуществления изобретения «увеличенное общее производство белка» или «повышенное общее производство белка» с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, относится к увеличенному/повышенному производству белка за период времени, в течение которого белок продуцируется с искусственной молекулы нуклеиновой кислоты, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках, по сравнению с референс-молекулой нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR. Согласно предпочтительному варианту осуществления изобретения кумулятивное количество белка, экспрессированного в течение периода времени, увеличивается, если применяют искусственную молекулу нуклеиновой кислоты, предлагаемую в изобретении.In one embodiment, "increased total protein production" or "increased total protein production" from an artificial nucleic acid molecule of the invention refers to increased/increased protein production over the period of time that protein is produced from an artificial nucleic acid molecule. , preferably in a mammalian expression system such as mammalian cells, eg HeLa or HDF cells, compared to a reference nucleic acid molecule lacking a 3'-UTR or containing a reference 3'-UTR. According to a preferred embodiment of the invention, the cumulative amount of protein expressed over a period of time is increased if an artificial nucleic acid molecule according to the invention is used.
В изобретении предложена искусственная молекула нуклеиновой кислоты, которая отличается увеличенной экспрессией кодируемого белка по сравнению с соответствующей молекулой нуклеиновой кислоты, в которой отсутствует по меньшей мере один 3'-UTR-элемент или которая содержит 3'-UTR («нуклеиновая референс-кислота»), содержащую нуклеотидную последовательность, происходящую из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка. Для оценки in vivo производства белка с предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, определяют экспрессию кодируемого белка после инъекции/трансфекции предлагаемой в изобретении искусственной молекулой нуклеиновой кислоты клеток-/ткани-мишени и сравнивают с экспрессией белка, индуцированной нуклеиновой референс-кислотой. В данной области известны количественные методы определения экспрессии белка (например, вестерн-блоттинг, FACS, ELISA, масс-спектрометрия). В рассматриваемом контексте наиболее пригодным является определение экспрессии репортерных белков типа люциферазы, зеленого флуоресцентного белка (GFP) или секретированной щелочной фосфатазы (SEAP). Для этого искусственную нуклеиновую кислоту, предлагаемую в изобретении, или нуклеиновую референс-кислоту интродуцируют в ткань-мишень или клетку-мишень, например, посредством трансфекции или инъекции. Через несколько часов или несколько дней (например, через 6, 12, 24, 48 или 72 ч) после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты берут образец клеток-мишеней и проводят измерения с помощью FACS и/или лизируют. После этого лизаты можно использовать для обнаружения экспрессированного белка (и определения тем самым эффективности экспрессии белка) с помощью нескольких методов, например, вестерн-блоттинга, FACS, ELISA, масс-спектрометрии или путем измерения флуоресценции или люминесценции.The invention provides an artificial nucleic acid molecule that is characterized by increased expression of the encoded protein compared to the corresponding nucleic acid molecule that lacks at least one 3'-UTR element or that contains a 3'-UTR ("nucleic reference acid") containing a nucleotide sequence derived from the 3'-UTR of the ribosomal protein gene or from the variant 3'-UTR of the ribosomal protein gene. To evaluate in vivo protein production from the artificial nucleic acid molecule of the invention, the expression of the encoded protein after injection/transfection of the target cell/tissue with the artificial nucleic acid molecule of the invention is determined and compared with protein expression induced by the reference nucleic acid. Quantitative methods for determining protein expression are known in the art (eg Western blotting, FACS, ELISA, mass spectrometry). In this context, the most suitable is the determination of the expression of reporter proteins such as luciferase, green fluorescent protein (GFP) or secreted alkaline phosphatase (SEAP). To do this, an artificial nucleic acid according to the invention or a reference nucleic acid is introduced into the target tissue or target cell, for example by transfection or injection. A few hours or a few days (eg, 6, 12, 24, 48, or 72 hours) after initiation of expression or after the introduction of the nucleic acid molecule, a sample of target cells is taken and measured by FACS and/or lysed. The lysates can then be used to detect the expressed protein (and thereby determine the efficiency of protein expression) by several methods, such as Western blotting, FACS, ELISA, mass spectrometry, or by measuring fluorescence or luminescence.
Следовательно, если экспрессию белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, сравнивают с экспрессией белка с референс-молекулы нуклеиновой кислоты в определенные моменты времени (например, через 6, 12, 24, 48 или 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты), то обе молекулы нуклеиновой кислоты интродуцируют по отдельности в ткани-/клетки-мишени, берут образец ткани/клеток в определенный момент времени, приготавливают белковые лизаты согласно конкретному протоколу, скорректированному для конкретного метода обнаружения (например, для вестерн-блоттинга, ELISA и т.д., как это известно в данной области) и проводят обнаружение белка с помощью выбранного метода обнаружения. В качестве альтернативы измерениям количеств экспрессируемого белка в клеточных лизатах, или в дополнение к измерениям количеств экспрессируемого белка в клеточных лизатах, с помощью FACS-анализа можно определять количества белка также до лизиса собранных клеток или параллельно с использованием аликвот.Therefore, if the expression of a protein from an artificial nucleic acid molecule of the invention is compared with the expression of a protein from a reference nucleic acid molecule at certain time points (for example, 6, 12, 24, 48, or 72 hours after the initiation of expression or after the introduction of the molecule nucleic acid), then both nucleic acid molecules are introduced separately into target tissues/cells, a sample of tissue/cells is taken at a certain point in time, protein lysates are prepared according to a specific protocol adjusted for a specific detection method (for example, for Western blotting, ELISA, etc., as is known in the art) and carry out protein detection using the selected detection method. As an alternative to measuring the amounts of expressed protein in cell lysates, or in addition to measuring the amounts of expressed protein in cell lysates, FACS analysis can also determine the amount of protein prior to lysis of harvested cells or in parallel using aliquots.
Если нужно измерять общее количество белка в течение определенного периода времени, то можно собирать ткань или клетки в несколько моментов времени после интродукции искусственной молекулы нуклеиновой кислоты (например, через 6, 12, 24, 48 и 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты; как правило, взятой из организма других подопытных животных), и определять количество белка в каждый момент времени как описано выше. Для расчета кумулятивного количества белка можно применять математический метод определения общего количества белка, например, можно определять площадь под кривой (AUC) согласно следующей формуле:If you want to measure the total amount of protein over a certain period of time, then you can collect tissue or cells at several points in time after the introduction of an artificial nucleic acid molecule (for example, 6, 12, 24, 48 and 72 hours after the initiation of expression or after the introduction of the nucleic acid molecule acid; usually taken from the body of other experimental animals), and determine the amount of protein at each time point as described above. To calculate the cumulative amount of protein, a mathematical method for determining the total amount of protein can be used, for example, you can determine the area under the curve (AUC) according to the following formula:
Для расчета площади под кривой для общего количества белка вычисляют интеграл уравнения кривой экспрессии между каждыми конечными точками (а и b).To calculate the area under the curve for total protein, the integral of the equation of the expression curve between each endpoints (a and b) is calculated.
Таким образом, понятие «общее производство белка» предпочтительно относится к площади под кривой (AUC), описывающей производство белка в зависимости от времени.Thus, the term "total protein production" preferably refers to the area under the curve (AUC) describing protein production as a function of time.
Указанное увеличение стабильности искусственной молекулы нуклеиновой кислоты, указанное увеличение стабильности производства белка, указанное пролонгирование производства белка и/или указанное увеличение/повышение экспрессии белка и/или общего производства белка предпочтительно определяют путем сравнения с соответствующей референс-молекулой нуклеиновой кислоты, в которой отсутствует 3'-UTR, например, мРНК, в которой отсутствует 3'-UTR, или референс-молекулой нуклеиновой кислоты, которая содержит референс-3'-UTR, такую как 3'-UTR, встречающуюся в естественных условиях с ОРС, как описано выше.Said increase in the stability of the artificial nucleic acid molecule, said increase in protein production stability, said prolongation of protein production and/or said increase/increase in protein expression and/or total protein production are preferably determined by comparison with a corresponding reference nucleic acid molecule lacking the 3' -UTR, for example, an mRNA that lacks a 3'UTR, or a reference nucleic acid molecule that contains a reference 3'UTR, such as a naturally occurring 3'UTR with an ORF as described above.
Стабилизирующее действие на мРНК и/или производство белка и эффективность, и/или повышающее производство белка действие и эффективность вариантов, фрагментов и/или фрагментов вариантов 3'-UTR гена рибосомального белка, а также стабилизирующее действие на мРНК и/или производство белка и эффективность, и/или повышающее производство белка действие и эффективность по меньшей мере одного 3'-UTR-элемента искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно определять с помощью любого пригодного для этой цели метода, известного специалисту в данной области. Например, можно создавать искусственные молекулы мРНК, содержащие кодирующую последовательность/открытую рамку считывания (ОРС) для репортерного белка, такого как люцифераза, и не содержащие 3'-UTR, содержащие 3'-UTR, происходящую из встречающегося в естественных условиях гена рибосомального белка, 3'-UTR, происходящую из референс-гена (т.е. референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС), в качестве 3'-UTR вариант 3'-UTR гена рибосомального белка, в качестве 3'-UTR фрагмент гена встречающегося в естественных условиях рибосомального белка, или в качестве 3'-UTR фрагмент варианта 3'-UTR гена рибосомального белка. Такие мРНК можно создавать, например, путем транскрипции in vitro соответствующих векторов, таких как плазмидные векторы, например, содержащие промотор Т7 и последовательность, кодирующую соответствующие последовательности мРНК. Созданными молекулами мРНК можно трансфектировать клетки с помощью метода трансфекции, пригодного для трансфекции мРНК, например, их можно интродуцировать путем электропорации в клетки млекопитающих, такие как HELA-клетки, и можно анализировать образцы в определенные моменты времени после трансфекции, например, через 6, 24, 48 и 72 ч после трансфекции. Указанные образцы можно анализировать для оценки количеств мРНК и/или количеств белка с помощью методов, хорошо известных специалистам в данной области. Например, количества репортерной мРНК, присутствующей в клетках в моменты времени взятия образцов, можно определять с помощью методов количественной ПЦР. Количества репортерного белка, кодируемого соответствующими мРНК, можно определять, например, с помощью вестерн-блоттинга, ELISA, FACS-анализа или репортерных анализов, таких как анализы люциферазы, в зависимости от используемого репортерного белка. Эффект стабилизации экспрессии белка и/или пролонгирования экспрессии белка можно анализировать, например, путем определения отношения уровня белка, обнаруженного через 48 ч после трансфекции и уровня белка, обнаруженного через 6 ч после трансфекции. Предпочтительно величина такого отношения превышает 1, т.е. экспрессия белка в более поздний момент времени больше, чем экспрессия белка в более ранний момент времени. Если величина такого отношения меньше 1, то белок тем более стабилен, чем ближе указанная величина к 1. Такие измерения можно, конечно, проводить также и через 72 ч или более, и для определения стабильности экспрессии белка можно определять отношение уровня белка, обнаруженного через 72 ч после трансфекции к уровню белка, обнаруженному через 6 ч после трансфекции.Stabilizing effect on mRNA and/or protein production and efficiency, and/or increasing protein production effect and efficiency of variants, fragments and/or fragments of variants of the 3'-UTR gene of the ribosomal protein, as well as stabilizing effect on mRNA and/or protein production and efficiency , and/or the protein production-enhancing activity and potency of at least one 3'UTR element of the artificial nucleic acid molecule of the present invention can be determined by any suitable method known to one skilled in the art. For example, one can create artificial mRNA molecules containing the coding sequence/open reading frame (ORF) for a reporter protein such as luciferase and not containing a 3'-UTR, containing a 3'-UTR derived from a naturally occurring ribosomal protein gene, 3'-UTR derived from a reference gene (i.e., a reference 3'-UTR, such as the naturally occurring 3'-UTR with ORF), as a 3'-UTR variant of the 3'-UTR of the ribosomal gene protein, as a 3'-UTR fragment of a naturally occurring ribosomal protein gene, or as a 3'-UTR fragment of a 3'-UTR variant of a ribosomal protein gene. Such mRNAs can be generated, for example, by in vitro transcription of appropriate vectors, such as plasmid vectors, for example, containing the T7 promoter and a sequence encoding the corresponding mRNA sequences. The generated mRNA molecules can be transfected into cells using a transfection method suitable for mRNA transfection, for example, they can be introduced by electroporation into mammalian cells such as HELA cells, and samples can be analyzed at certain time points after transfection, for example, after 6, 24 , 48 and 72 h after transfection. These samples can be analyzed to estimate mRNA amounts and/or protein amounts using methods well known to those skilled in the art. For example, the amount of reporter mRNA present in the cells at the sampling times can be determined using quantitative PCR methods. The amounts of reporter protein encoded by the respective mRNAs can be determined, for example, by Western blotting, ELISA, FACS analysis, or reporter assays such as luciferase assays, depending on the reporter protein used. The effect of stabilizing protein expression and/or prolonging protein expression can be analyzed, for example, by determining the ratio of the protein level detected 48 hours after transfection to the protein level detected 6 hours after transfection. Preferably, the value of such a ratio is greater than 1, i. e. protein expression at a later time point is greater than protein expression at an earlier time point. If the value of this ratio is less than 1, then the protein is more stable the closer the indicated value is to 1. Such measurements can, of course, also be carried out after 72 hours or more, and to determine the stability of protein expression, the ratio of the protein level detected after 72 h after transfection to the protein level detected 6 h after transfection.
В предпочтительном варианте осуществления изобретения 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, происходит из 3'-UTR-области гена, кодирующего рибосомальный белок, предпочтительно из 3'-UTR-области гена рибосомального белка L9 (RPL9), рибосомального белка L3 (RPL3), рибосомального белка L4 (RPL4), рибосомального белка L5 (RPL5), рибосомального белка L6 (RPL6), рибосомального белка L7 (RPL7), рибосомального белка L7a (RPL7A), рибосомального белка L11 (RPL11), рибосомального белка L12 (RPL12), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L18 (RPL18), рибосомального белка L18a (RPL18A), рибосомального белка L19 (RPL19), рибосомального белка L21 (RPL21), рибосомального белка L22 (RPL22), рибосомального белка L23a (RPL23A), рибосомального белка L17 (RPL17), рибосомального белка L24 (RPL24), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L30 (RPL30), рибосомального белка L27a (RPL27A), рибосомального белка L28 (RPL28), рибосомального белка L29 (RPL29), рибосомального белка L31 (RPL31), рибосомального белка L32 (RPL32), рибосомального белка L35a (RPL35A), рибосомального белка L37 (RPL37), рибосомального белка L37a (RPL37A), рибосомального белка L38 (RPL38), рибосомального белка L39 (RPL39), рибосомального белка, большой субъединицы, РО (RPLP0), рибосомального белка, большой субъединицы, Р1 (RPLP1), рибосомального белка, большой субъединицы, Р2 (RPLP2), рибосомального белка S3 (RPS3), рибосомального белка S3A (RPS3A), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S4, Y-сцепленного 1 (RPS4Y1), рибосомального белка S5 (RPS5), рибосомального белка S6 (RPS6), рибосомального белка S7 (RPS7), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S10 (RPS10), рибосомального белка S11 (RPS11), рибосомального белка S12 (RPS12), рибосомального белка S13 (RPS13), рибосомального белка S15 (RPS15), рибосомального белка S15a (RPS15A), рибосомального белка S16 (RPS16), рибосомального белка S19 (RPS19), рибосомального белка S20 (RPS20), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S25 (RPS25), рибосомального белка S26 (RPS26), рибосомального белка S27 (RPS27), рибосомального белка S27a (RPS27a), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L15 (RPL15), рибосомального белка S2 (RPS2), рибосомального белка L14 (RPL14), рибосомального белка S14 (RPS14), рибосомального белка L10 (RPL10), рибосомального белка LlOa (RPL10A), рибосомального белка L35 (RPL35), рибосомального белка L13a (RPL13A), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка L41 (RPL41), рибосомального белка S18 (RPS18), рибосомального белка S24 (RPS24), рибосомального белка L8 (RPL8), рибосомального белка L34 (RPL34), рибосомального белка S17 (RPS17), рибосомального белка SA (RPSA) или рибосомального белка S17 (RPS17). В альтернативном варианте осуществления изобретения 3'-UTR-элемент может происходить из гена, кодирующего рибосомальный белок, или из гена, выбранного из генов продукта 1 слияния остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли, белка 1, подобного рибосомальному белку L22 (RPL22L1), белка, подобного рибосомальному белку L39 (RPL39L), белка, подобного рибосомальному белку L10 (RPL10L), белка, подобного рибосомальному белку L36a (RPL36AL), белка, подобного рибосомальному белку L3 (RPL3L), белка, подобного рибосомальному белку S27 (RPS27L), белка 1, подобного рибосомальному белку L26 1 (RPL26L1), белка 1, подобного рибосомальному белку L7 (RPL7L1), псевдогена рибосомального белка ЫЗа (RPL13AP), псевдогена 8 рибосомального белка L37a (RPL37AP8), псевдогена 5 рибосомального белка S10 (RPS10P5), псевдогена 11 рибосомального белка S26 (RPS26P11), псевдогена 5 рибосомального белка L39 (RPL39P5), псевдогена 6 рибосомального белка, большой субъединицы, РО (RPLP0P6) и псевдогена 14 рибосомального белка L36 (RPL36P14). Кроме того, 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно происходит из 3'-UTR-области гена, выбранного из группы, состоящей из генов белка, подобного рибосомальному белку S4 (RPS41), предполагаемой субъединицы 60S рибосомального белка L13a, предполагаемой субъединицы 60S белка, подобного рибосомальному белку L37a, предполагаемой субъединицы 40S белка, подобного рибосомальному белку S10, предполагаемой субъединицы 40S белка 1, подобного рибосомальному белку S26, предполагаемой субъединицы 60S белка 5, подобного рибосомальному белку L39, или субъединицы 60S белка, подобного кислому рибосомальному белку Р0.In a preferred embodiment, the 3'UTR element of the artificial nucleic acid molecule of the present invention is derived from the 3'UTR region of a gene encoding a ribosomal protein, preferably from the 3'UTR region of a ribosomal protein L9 (RPL9) gene. , ribosomal protein L3 (RPL3), ribosomal protein L4 (RPL4), ribosomal protein L5 (RPL5), ribosomal protein L6 (RPL6), ribosomal protein L7 (RPL7), ribosomal protein L7a (RPL7A), ribosomal protein L11 (RPL11), ribosomal protein L12 (RPL12), ribosomal protein L13 (RPL13), ribosomal protein L23 (RPL23), ribosomal protein L18 (RPL18), ribosomal protein L18a (RPL18A), ribosomal protein L19 (RPL19), ribosomal protein L21 (RPL21), ribosomal protein L22 (RPL22), ribosomal protein L23a (RPL23A), ribosomal protein L17 (RPL17), ribosomal protein L24 (RPL24), ribosomal protein L26 (RPL26), ribosomal protein L27 (RPL27), ribosomal protein L30 (RPL30), ri bosomal protein L27a (RPL27A), ribosomal protein L28 (RPL28), ribosomal protein L29 (RPL29), ribosomal protein L31 (RPL31), ribosomal protein L32 (RPL32), ribosomal protein L35a (RPL35A), ribosomal protein L37 (RPL37), ribosomal protein L37a (RPL37A), ribosomal protein L38 (RPL38), ribosomal protein L39 (RPL39), ribosomal protein, large subunit, PO (RPLP0), ribosomal protein, large subunit, P1 (RPLP1), ribosomal protein, large subunit, P2 ( RPLP2), ribosomal protein S3 (RPS3), ribosomal protein S3A (RPS3A), ribosomal protein S4, X-linked (RPS4X), ribosomal protein S4, Y-linked 1 (RPS4Y1), ribosomal protein S5 (RPS5), ribosomal protein S6 (RPS6), ribosomal protein S7 (RPS7), ribosomal protein S8 (RPS8), ribosomal protein S9 (RPS9), ribosomal protein S10 (RPS10), ribosomal protein S11 (RPS11), ribosomal protein S12 (RPS12), ribosomal protein S13 ( RPS13), ribosomal protein S15 (RPS1 5), ribosomal protein S15a (RPS15A), ribosomal protein S16 (RPS16), ribosomal protein S19 (RPS19), ribosomal protein S20 (RPS20), ribosomal protein S21 (RPS21), ribosomal protein S23 (RPS23), ribosomal protein S25 (RPS25 ), ribosomal protein S26 (RPS26), ribosomal protein S27 (RPS27), ribosomal protein S27a (RPS27a), ribosomal protein S28 (RPS28), ribosomal protein S29 (RPS29), ribosomal protein L15 (RPL15), ribosomal protein S2 (RPS2) , ribosomal protein L14 (RPL14), ribosomal protein S14 (RPS14), ribosomal protein L10 (RPL10), ribosomal protein LlOa (RPL10A), ribosomal protein L35 (RPL35), ribosomal protein L13a (RPL13A), ribosomal protein L36 (RPL36), ribosomal protein L36a (RPL36A), ribosomal protein L41 (RPL41), ribosomal protein S18 (RPS18), ribosomal protein S24 (RPS24), ribosomal protein L8 (RPL8), ribosomal protein L34 (RPL34), ribosomal protein S17 (RPS17), ribosomal protein SA (RPSA) or rib osomal protein S17 (RPS17). In an alternative embodiment, the 3'-UTR element may be derived from a gene encoding a ribosomal protein or from a gene selected from the fusion product 1 genes of ubiquitin residue A-52-ribosomal protein (UBA52), a ubiquitously expressed (FAU) mouse sarcoma virus Finkel-Bisquis-Reilly protein 1, ribosomal protein L22 like (RPL22L1), ribosomal protein L39 like protein (RPL39L), ribosomal protein L10 like protein (RPL10L), ribosomal protein L36a like protein (RPL36AL), protein like ribosomal protein L3 (RPL3L), ribosomal protein S27 like protein (RPS27L), ribosomal protein L26 like protein 1 1 (RPL26L1), ribosomal protein 1 like protein L7 (RPL7L1), ribosomal protein n3a pseudogene (RPL13AP), pseudogene 8 ribosomal protein L37a (RPL37AP8), ribosomal protein S10 pseudogene 5 (RPS10P5), ribosomal protein S26 pseudogene 11 (RPS26P11), ribosomal protein L39 pseudogene 5 (RPL39P5), ri pseudogene 6 bosomal protein, large subunit, PO (RPLP0P6); and ribosomal protein L36 pseudogene 14 (RPL36P14). In addition, the 3'UTR element of the artificial nucleic acid molecule of the present invention is preferably derived from the 3'UTR region of a gene selected from the group consisting of genes for a protein like ribosomal protein S4 (RPS41), a putative 60S subunit. ribosomal protein L13a, putative subunit of the 60S protein like ribosomal protein L37a, putative subunit of the 40S protein like ribosomal protein S10, putative subunit of the 40S protein 1 like ribosomal protein S26, putative subunit of the 60S protein 5 like ribosomal protein L39, or subunit of the 60S protein , similar to the acidic ribosomal protein P0.
В наиболее предпочтительном варианте осуществления изобретения 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, происходит из 3'-UTR-области гена, кодирующего рибосомальный белок, предпочтительно из 3'-UTR-области гена рибосомального белка L3 (RPL3), рибосомального белка L11 (RPL11), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L23a (RPL23A), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L35a (RPL35A), рибосомального белка L38 (RPL38), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S13 (RPS13), рибосомального белка S19 (RPS19), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S27 (RPS27), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка S18 (RPS18) или рибосомального белка S17 (RPS17). В другом предпочтительном варианте осуществления изобретения 3'-UTR-элемент может происходить из гена, кодирующего рибосомальный белок, или из гена, выбранного из генов продукта 1 слияния остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли или белка 1, подобного рибосомальному белку L22 (RPL22L1).In the most preferred embodiment of the invention, the 3'UTR element of the artificial nucleic acid molecule of the present invention is derived from the 3'UTR region of the gene encoding the ribosomal protein, preferably from the 3'UTR region of the ribosomal protein L3 gene (RPL3 ), ribosomal protein L11 (RPL11), ribosomal protein L13 (RPL13), ribosomal protein L23 (RPL23), ribosomal protein L23a (RPL23A), ribosomal protein L26 (RPL26), ribosomal protein L27 (RPL27), ribosomal protein L35a (RPL35A) , ribosomal protein L38 (RPL38), ribosomal protein S4, X-linked (RPS4X), ribosomal protein S8 (RPS8), ribosomal protein S9 (RPS9), ribosomal protein S13 (RPS13), ribosomal protein S19 (RPS19), ribosomal protein S21 (RPS21), ribosomal protein S23 (RPS23), ribosomal protein S27 (RPS27), ribosomal protein S28 (RPS28), ribosomal protein S29 (RPS29), ribosomal protein L36 (RPL36), ribosomal protein L36a (RPL36A), ribosome omal protein S18 (RPS18) or ribosomal protein S17 (RPS17). In another preferred embodiment of the invention, the 3'-UTR element may be derived from a gene encoding a ribosomal protein or from a gene selected from the fusion product 1 genes of the ubiquitin residue A-52-ribosomal protein (UBA52), a ubiquitously expressed (FAU) mouse virus Finkel-Biskis-Reilly sarcoma or protein 1 like ribosomal protein L22 (RPL22L1).
Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 10-115 или соответствующей последовательности РНК:Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15, 20, 30% or 40%, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90% %, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'-UTR of the ribosomal protein gene, such as the nucleotide sequence shown in SEQ ID NO: 10-115 or the corresponding RNA sequence:
Кроме того, предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 116-205 или соответствующей последовательности РНК:Further preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15%, 20%, 30% or 40%, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'-UTR of a ribosomal protein gene, such as the nucleotide sequence shown in SEQ ID NO: 116-205 or corresponding RNA sequence:
В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% последовательности 3'-UTR гена рибосомального белка малой субъединицы 9 (RPS9). Наиболее предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% SEQ ID NO: 1 или SEQ ID NO: 2:In a preferred embodiment of the invention, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 40%, preferably at least about 50% identical , preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the 3'-UTR sequence of the ribosomal small subunit protein 9 (RPS9) gene. Most preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% SEQ ID NO: 1 or SEQ ID NO: 2:
По меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, может также содержать или состоять из фрагмента нуклеотидной последовательности, который идентичен по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как 3'-UTR, имеющая последовательность, представленную в SEQ ID NO: 10-205, где фрагмент предпочтительно представляет собой функциональный фрагмент или функциональный фрагмент варианта, описанный выше. Такой фрагмент предпочтительно имеет длину, составляющую по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотида, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. В предпочтительном варианте осуществления изобретения фрагмент или его вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.At least one 3'-UTR element of the artificial nucleic acid molecule of the present invention may also contain or consist of a nucleotide sequence fragment that is at least about 40% identical, preferably at least about 50% identical, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'UTR of a ribosomal protein gene, such as the 3'UTR having the sequence shown in SEQ ID NOs: 10-205, where the fragment is preferably functional fragment or functional fragment of the variant described above. Such a fragment is preferably at least about 3 nucleotides in length, preferably at least about 5 nucleotides, more preferably at least about 10, 15, 20, 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. In a preferred embodiment, the fragment or variant thereof is 3 to about 500 nucleotides in length, preferably 5 to about 150 nucleotides, more preferably 10 to 100 nucleotides, even more preferably 15 to 90, most preferably 20 to 70 nucleotides.
Предпочтительно указанные варианты, фрагменты или фрагменты вариантов представляют собой функциональные варианты, функциональные фрагменты или функциональные фрагменты вариантов, описанные выше, которые обладают по меньшей мере одной функцией, присущей нуклеотидной последовательности, представленной в SEQ ID NO: 10-205, такой как стабилизация искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, стабилизация и/или пролонгирование экспрессии белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, и/или увеличение производства белка, предпочтительно с эффективностью, составляющей по меньшей мере 40%, более предпочтительно по меньшей мере 50%, более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере 90% от эффективности стабилизации и/или эффективности увеличения производства белка с искусственной молекулы нуклеиновой кислоты, содержащей нуклеотидную последовательность, представленную в SEQ ID NO: 1 или SEQ ID NO: 2.Preferably, said variants, fragments or fragments of variants are functional variants, functional fragments or functional fragments of the variants described above, which have at least one function inherent in the nucleotide sequence shown in SEQ ID NO: 10-205, such as stabilization of an artificial molecule nucleic acid according to the invention, stabilization and/or prolongation of protein expression from an artificial nucleic acid molecule according to the invention, and/or increase in protein production, preferably with an efficiency of at least 40%, more preferably at least 50%, more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80%, most preferably at least 90% of the stabilization efficiency and/or the efficiency of increasing protein production from the artificial nucleic acid molecule, with containing the nucleotide sequence shown in SEQ ID NO: 1 or SEQ ID NO: 2.
Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, имеет длину, составляющую по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотида, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. Верхний предел длины 3'-UTR-элемента может составлять 500 нуклеотидов или менее, например, 400, 300, 200, 150 или 100 нуклеотидов. В других вариантах осуществления изобретения верхний предел может быть выбран из диапазона от 50 до 100 нуклеотидов. Например, фрагмент или вариант может иметь длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention is at least about 3 nucleotides in length, preferably at least about 5 nucleotides, more preferably at least about 10, 15, 20, 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. The upper limit of the length of the 3'UTR element may be 500 nucleotides or less, such as 400, 300, 200, 150 or 100 nucleotides. In other embodiments, the upper limit may be selected from the range of 50 to 100 nucleotides. For example, a fragment or variant may be from 3 to about 500 nucleotides in length, preferably from 5 to about 150 nucleotides, more preferably from 10 to 100 nucleotides, even more preferably from 15 to 90, most preferably from 20 to 70 nucleotides.
Кроме того, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать более одного 3'-UTR-элемента, описанного выше. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать один, два, три четыре или большее количество 3'-UTR-элементов, при этом индивидуальные 3'-UTR-элементы могут быть одинаковыми или могут быть различными. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать два практически идентичных 3'-UTR-элемента, описанных выше, например, два 3'-UTR-элемента, содержащих или состоящих из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка, например, из последовательности, представленной в SEQ ID NO: 10-205, или из фрагмента или варианта 3'-UTR гена рибосомального белка, имеющего нуклеотидную последовательность, представленную в SEQ ID NO: 1 или 2, его функциональных вариантов, его функциональных фрагментов или функциональных фрагментов вариантов, описанных выше.In addition, the artificial nucleic acid molecule of the present invention may contain more than one 3'-UTR element as described above. For example, an artificial nucleic acid molecule of the present invention may contain one, two, three, four or more 3'-UTR elements, and the individual 3'-UTR elements may be the same or may be different. For example, an artificial nucleic acid molecule of the present invention may contain two substantially identical 3'-UTR elements as described above, for example, two 3'-UTR elements containing or consisting of a nucleotide sequence derived from the 3'-UTR a ribosomal protein gene, for example, from the sequence shown in SEQ ID NO: 10-205, or from a fragment or variant of the 3'-UTR of the ribosomal protein gene having the nucleotide sequence shown in SEQ ID NO: 1 or 2, its functional variants, its functional fragments or functional fragments of the variants described above.
При создании изобретения неожиданно было установлено, что искусственная молекула нуклеиновой кислоты, содержащая 3'-UTR-элемент, описанный выше, может представлять собой или позволяет создавать молекулу мРНК, которая обеспечивает повышенное, пролонгированное и/или стабилизированное производство белка. Так, 3'-UTR-элемент, представленный в настоящем описании, может повышать стабильность экспрессии белка с молекулы мРНК и/или повышать эффективность трансляции.The invention has surprisingly found that an artificial nucleic acid molecule containing the 3'-UTR element described above can be or allows the creation of an mRNA molecule that provides increased, prolonged and/or stabilized protein production. Thus, the 3'-UTR element provided herein can increase the stability of protein expression from an mRNA molecule and/or increase translation efficiency.
Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может представлять собой РНК, такую как мРНК, ДНК, такую как векторная ДНК, или может представлять собой модифицированную молекулу РНК или ДНК. Она может находиться в виде двухцепочечной молекулы, имеющей смысловую цепь и антисмысловую цепь, например, в виде молекулы ДНК, имеющей смысловую цепь и антисмысловую цепь.The artificial nucleic acid molecule of the present invention may be RNA such as mRNA, DNA such as vector DNA, or may be a modified RNA or DNA molecule. It may be in the form of a double-stranded molecule having a sense strand and an antisense strand, such as a DNA molecule having a sense strand and an antisense strand.
Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, кроме того, может необязательно содержать 5'-UTR и/или 5'-кэп. Необязательные 5'-кэп и/или 5'-UTR предпочтительно расположены с 5'-стороны относительно ОРС в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении.The artificial nucleic acid molecule of the present invention may also optionally contain a 5'-UTR and/or a 5'-cap. The optional 5' cap and/or 5' UTR are preferably located 5' to the ORF in the artificial nucleic acid molecule of the present invention.
Предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит также поли(А)-последовательность и/или сигнал полиаденилирования. Предпочтительно необязательная поли(А)-последовательность расположена с 3'-стороны относительно по меньшей мере одного 3'-UTR-элемента, предпочтительно необязательная поли(А)-последовательность присоединена к 3'-концу 3'-UTR-элемента. Соединение может осуществляться непосредственно или косвенным образом посредством сегмента, состоящего из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, такой как линкер, состоящий из 1-50, предпочтительно из 1-20 нуклеотидов, например, содержащий или состоящий из одного или нескольких сайтов рестрикции.Preferably, the artificial nucleic acid molecule of the present invention also contains a poly(A) sequence and/or a polyadenylation signal. Preferably the optional poly(A) sequence is located 3' to the at least one 3' UTR element, preferably the optional poly(A) sequence is attached to the 3' end of the 3' UTR element. The connection may be made directly or indirectly by means of a segment consisting of 2, 4, 6, 8, 10, 20, etc. nucleotides, such as a linker consisting of 1-50, preferably 1-20 nucleotides, for example containing or consisting of one or more restriction sites.
В одном из вариантов осуществления изобретения необязательный сигнал полиаденилирования расположен в прямом направлении с 3'-стороны 3'-UTR-элемента. Предпочтительно сигнал полиаденилирования содержит консенсусную последовательность NN(U/T)ANA, в которой N обозначает А или U, предпочтительно AA(U/T)AAA или A(U/T)(U/T)AAA. Такая консенсусная последовательность может распознаваться большинством систем на основе клеток животных и бактериальных клеток, например, факторами полиаденилирования, такими как фактор специфичности расщепления/полиаденилирования (CPSF), в сочетании с CstF, PAP, РАВ2, CFI и/или CFII. Предпочтительно сигнал полиаденилирования, предпочтительно представляющий собой консенсусную последовательность NNUANA, расположен на расстоянии менее чем примерно 50 нуклеотидов, более предпочтительно менее чем примерно 30 оснований, наиболее предпочтительно менее чем примерно 25 оснований, например, на расстоянии 21 основания, в прямом направлении относительно 3'-конца 3'-UTR-элемента.In one embodiment, the optional polyadenylation signal is located downstream of the 3' side of the 3' UTR element. Preferably, the polyadenylation signal contains the NN(U/T)ANA consensus sequence in which N is A or U, preferably AA(U/T)AAA or A(U/T)(U/T)AAA. Such a consensus sequence can be recognized by most animal and bacterial cell systems, for example, polyadenylation factors such as cleavage/polyadenylation specificity factor (CPSF) in combination with CstF, PAP, PAB2, CFI and/or CFII. Preferably, the polyadenylation signal, preferably the NNUANA consensus sequence, is less than about 50 nucleotides away, more preferably less than about 30 bases, most preferably less than about 25 bases, e.g., 21 bases away, in the forward direction from 3'- end of the 3'-UTR element.
Транскрипция искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, искусственной молекулы ДНК, содержащей сигнал полиаденилирования, расположенный в прямом направлении относительно 3'-UTR-элемента, должна приводить к получению незрелой РНК, содержащей сигнал полиаденилирования, в прямом направлении относительно ее 3'-UTR-элемента. Например, транскрипция молекулы ДНК, содержащей 3'-UTR-элемент, имеющий SEQ ID NO: 1, должна приводить к получению РНК, несущей 3'-UTR-элемент, имеющий последовательность SEQ ID NO: 2.Transcription of an artificial nucleic acid molecule of the present invention, for example, an artificial DNA molecule containing a polyadenylation signal located in the forward direction relative to the 3'-UTR element, should result in an immature RNA containing a polyadenylation signal in the forward direction relative to its 3 '-UTR of element. For example, transcription of a DNA molecule containing a 3'UTR element having SEQ ID NO: 1 should result in an RNA carrying a 3'UTR element having the sequence of SEQ ID NO: 2.
Затем при использовании соответствующей системы транскрипции должно происходить присоединение поли(А)-последовательности к незрелой РНК. Например, предлагаемая в изобретении искусственная молекула нуклеиновой кислоты может представлять собой молекулу ДНК, содержащую 3'-UTR-элемент, описанный выше, и сигнал полиаденилирования, который может приводить к полиаденилированию РНК после транскрипции указанной молекулы ДНК. Следовательно, образовавшаяся РНК может содержать комбинацию предлагаемого в изобретении 3'-UTR-элемента, за которым располагается поли(А)-последовательность.The addition of the poly(A) sequence to the immature RNA must then occur using an appropriate transcription system. For example, an artificial nucleic acid molecule according to the invention may be a DNA molecule containing a 3'-UTR element as described above and a polyadenylation signal that can lead to RNA polyadenylation after transcription of said DNA molecule. Therefore, the resulting RNA may contain a combination of the 3'UTR element of the invention followed by the poly(A) sequence.
Возможными системами транскрипции являются системы транскрипции in vitro или клеточные системы транскрипции и т.д. Таким образом, транскрипция искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, например, транскрипции искусственной молекулы нуклеиновой кислоты, содержащей открытую рамку считывания, 3'-UTR-элемент и сигнал полиаденилирования, может приводить к получению молекулы мРНК, содержащей открытую рамку считывания, 3'-UTR-элемент и поли(А)-последовательность.Possible transcription systems are in vitro transcription systems or cellular transcription systems, etc. Thus, transcription of an artificial nucleic acid molecule of the invention, for example, transcription of an artificial nucleic acid molecule containing an open reading frame, a 3'-UTR element and a polyadenylation signal, can result in an mRNA molecule containing an open reading frame, 3' -UTR element and poly(A) sequence.
Таким образом, в изобретении предложена также искусственная молекула нуклеиновой кислоты, которая представляет собой молекулу мРНК, содержащую открытую рамку считывания, 3'-UTR-элемент, описанный выше, и поли(А)-последовательность.Thus, the invention also provides an artificial nucleic acid molecule, which is an mRNA molecule containing an open reading frame, a 3'-UTR element as described above, and a poly(A) sequence.
Один из вариантов осуществления изобретения относится к искусственной молекуле нуклеиновой кислоты, которая представляет собой искусственную молекулу ДНК, содержащую открытую рамку считывания и последовательность, представленную в SEQ ID NO: 1 или последовательность, идентичную по меньшей мере примерно на 40% или более SEQ ID NO: 1, или ее фрагмент, описанный выше. Кроме того, в изобретении предложена искусственная молекула нуклеиновой кислоты, которая представляет собой искусственную молекулу РНК, содержащую открытую рамку считывания и последовательность, представленную в SEQ ID NO: 2 или последовательность, идентичную по меньшей мере примерно на 40% или более SEQ ID NO: 2, или ее фрагмент, описанный выше.One embodiment of the invention relates to an artificial nucleic acid molecule, which is an artificial DNA molecule containing an open reading frame and a sequence shown in SEQ ID NO: 1 or a sequence that is at least about 40% or more identical to SEQ ID NO: 1, or its fragment described above. In addition, the invention provides an artificial nucleic acid molecule, which is an artificial RNA molecule containing an open reading frame and a sequence shown in SEQ ID NO: 2 or a sequence that is at least about 40% or more identical to SEQ ID NO: 2 , or its fragment described above.
Таким образом, в изобретении предложена также искусственная молекула нуклеиновой кислоты, которая может служить в качестве матрицы для молекулы РНК, предпочтительно для молекулы мРНК, которая стабилизирована и оптимизирована в отношении эффективности трансляции. Иными словами, искусственная молекула нуклеиновой кислоты может представлять собой ДНК, которую можно применять в качестве матрицы для получения мРНК. мРНК, которую можно получать таким путем, может, в свою очередь, транслироваться с получением требуемого пептида или белка, кодируемого открытой рамкой считывания. Если искусственная молекула нуклеиновой кислоты представляет собой ДНК, то ее можно, например, использовать в качестве двухцепочечной формы хранения для продолжения и повторения производства мРНК in vitro или in vivo.Thus, the invention also provides an artificial nucleic acid molecule that can serve as a template for an RNA molecule, preferably an mRNA molecule, which is stabilized and optimized for translation efficiency. In other words, the artificial nucleic acid molecule may be DNA, which can be used as a template to obtain mRNA. mRNA that can be obtained in this way can, in turn, be translated to obtain the desired peptide or protein encoded by the open reading frame. If the artificial nucleic acid molecule is DNA, then it can, for example, be used as a double-stranded storage form to continue and repeat the production of mRNA in vitro or in vivo.
В другом варианте осуществления изобретения 3'-UTR искусственной молекулы нуклеиновой кислоты, предлагаемая в изобретении, не содержит сигнал полиаденилирования или поли(А)-последовательность. Кроме того, предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, не содержит сигнал полиаденилирования или поли(А)-последовательность. Более предпочтительно 3'-UTR искусственной молекулы нуклеиновой кислоты или сама предлагаемая в изобретении искусственная молекула нуклеиновой кислоты не содержит сигнал полиаденилирования, прежде всего не содержит сигнал полиаденилирования AAU/TAAA.In another embodiment, the 3'UTR of the artificial nucleic acid molecule of the invention does not contain a polyadenylation signal or poly(A) sequence. In addition, preferably the artificial nucleic acid molecule of the invention does not contain a polyadenylation signal or a poly(A) sequence. More preferably, the 3'-UTR of the artificial nucleic acid molecule, or the artificial nucleic acid molecule itself according to the invention, does not contain a polyadenylation signal, in particular does not contain an AAU/TAAA polyadenylation signal.
В одном из вариантов осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит также поли(А)-последовательность. Например, молекула ДНК, содержащая ОРС, за которой следует рибосомальная 3'-UTR, может содержать состоящий из тимидиновых нуклеотидов сегмент, который может транскрибироваться в поли(А)-последовательность в образующейся мРНК. Длина поли(А)-последовательности может варьироваться. Например, поли(А)-последовательность может иметь длину от примерно 20 адениновых нуклеотидов вплоть до 300 адениновых нуклеотидов, предпочтительно от примерно 40 до примерно 200 адениновых нуклеотидов, более предпочтительно от примерно 50 до примерно 100 адениновых нуклеотидов, например, примерно 60, 70, 80, 90 или 100 адениновых нуклеотидов. Наиболее предпочтительно предлагаемая в изобретении нуклеиновая кислота содержит поли(А)-последовательность, содержащую от примерно 60 до примерно 70 нуклеотидов, наиболее предпочтительно 64 адениновых нуклеотида.In one embodiment, the artificial nucleic acid molecule of the present invention also contains a poly(A) sequence. For example, a DNA molecule containing an ORF followed by a ribosomal 3'-UTR may contain a thymidine nucleotide segment that can be transcribed into a poly(A) sequence in the resulting mRNA. The length of the poly(A) sequence may vary. For example, the poly(A) sequence may be from about 20 adenine nucleotides up to 300 adenine nucleotides in length, preferably from about 40 to about 200 adenine nucleotides, more preferably from about 50 to about 100 adenine nucleotides, for example, about 60, 70, 80, 90 or 100 adenine nucleotides. Most preferably, the inventive nucleic acid comprises a poly(A) sequence of about 60 to about 70 nucleotides, most preferably 64 adenine nucleotides.
Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать нуклеотидную последовательность, соответствующую последовательности ДНК:For example, an artificial nucleic acid molecule of the present invention may contain a nucleotide sequence corresponding to a DNA sequence:
Транскрипция указанных последовательностей может приводить к получению искусственных молекул нуклеиновой кислоты, содержащих последовательность:Transcription of these sequences can lead to the production of artificial nucleic acid molecules containing the sequence:
Такие искусственные молекулы РНК, т.е. искусственные молекулы нуклеиновой кислоты, содержащие последовательность, представленную в SEQ ID NO: 4, можно также получать in vitro с помощью обычных методов химического синтеза, при этом не требуется осуществлять транскрипцию с ДНК-предшественника.Such artificial RNA molecules, i.e. artificial nucleic acid molecules containing the sequence shown in SEQ ID NO: 4, can also be obtained in vitro using conventional methods of chemical synthesis, and it is not necessary to carry out transcription from the precursor DNA.
В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, представляет собой молекулу РНК, предпочтительно молекулу РНК, содержащую в 5'→3'-направлении открытую рамку считывания, 3'-UTR-элемент, описанный выше, и поли(А)-последовательность.In the most preferred embodiment of the invention, the artificial nucleic acid molecule of the present invention is an RNA molecule, preferably an RNA molecule containing in the 5'→3' direction an open reading frame, a 3'-UTR element as described above, and a poly (A)-sequence.
Предпочтительно открытая рамка считывания не кодирует рибосомальный белок. В предпочтительном варианте осуществления изобретения открытая рамка считывания не кодирует рибосомальный белок, из которого происходит 3'-UTR-элемент предлагаемой в изобретении нуклеиновой кислоты, прежде всего не кодирует рибосомальный белок млекопитающих, при условии, что 3'-UTR-элемент идентичен 3'-UTR гена рибосомального белка млекопитающих. В некоторых других вариантах осуществления изобретения открытая рамка считывания не кодирует RPS9 или его варианты, при условии, что 3'-UTR-элемент имеет последовательность, идентичную SEQ ID NO: 1 или SEQ ID NO: 2.Preferably, the open reading frame does not encode a ribosomal protein. In a preferred embodiment of the invention, the open reading frame does not encode the ribosomal protein from which the 3'-UTR element of the inventive nucleic acid is derived, primarily does not encode the mammalian ribosomal protein, provided that the 3'-UTR element is identical to the 3'- Mammalian ribosomal protein UTR. In some other embodiments, the open reading frame does not encode RPS9 or variants thereof, provided that the 3'-UTR element has a sequence identical to SEQ ID NO: 1 or SEQ ID NO: 2.
В предпочтительном варианте осуществления изобретения ОРС не кодирует рибосомальные белки человека или растения, прежде всего Arabidopsis, прежде всего не кодирует человеческий рибосомальный белок S6 (RPS6), белок, подобный человеческому рибосомальному белку L36a (RPL36AL), или рибосомальный белок Arabidopsis S16 (RPS16). В другом предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует рибосомальный белок S6 (RPS6), белок, подобный рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 (RPS16) вне зависимости от его происхождения.In a preferred embodiment of the invention, the ORF does not encode human or plant ribosomal proteins, especially Arabidopsis, primarily does not encode human ribosomal protein S6 (RPS6), human ribosomal protein L36a like protein (RPL36AL), or Arabidopsis ribosomal protein S16 (RPS16). In another preferred embodiment, the open reading frame (ORF) does not encode ribosomal protein S6 (RPS6), ribosomal protein L36a (RPL36AL) or ribosomal protein S16 (RPS16), regardless of its origin.
Один из вариантов осуществления изобретения относится к искусственной молекул ДНК, содержащей открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элемент, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 1; сигнал полиаденилирования и/или поли(А)-последовательность. Кроме того, в изобретении предложена искусственная молекула ДНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует любой пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элемент, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 3.One embodiment of the invention relates to artificial DNA molecules containing an open reading frame, preferably an open reading frame, which encodes a peptide or protein other than the ribosomal protein from which the 3'-UTR is derived; 3'UTR element containing or consisting of at least about 60% sequence identity, preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity , even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of the sequence shown in SEQ ID NO: 1; polyadenylation signal and/or poly(A) sequence. In addition, the invention provides an artificial DNA molecule comprising an open reading frame, preferably an open reading frame, which encodes any peptide or protein other than the ribosomal protein from which the 3'-UTR is derived; 3'UTR element containing or consisting of at least about 60% sequence identity, preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity , even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of the sequence shown in SEQ ID NO: 3.
Кроме того, в изобретении предложена искусственная молекула РНК, предпочтительно искусственная молекула мРНК или искусственная вирусная молекула РНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элемент, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 2; и сигнал полиаденилирования и/или поли(А)-последовательность. Кроме того, искусственная молекула РНК, предпочтительно искусственная молекула мРНК или искусственная вирусная молекула РНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элемент, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 4.In addition, the invention provides an artificial RNA molecule, preferably an artificial mRNA molecule or an artificial viral RNA molecule, comprising an open reading frame, preferably an open reading frame, which encodes a peptide or protein other than the ribosomal protein from which the 3'-UTR is derived; 3'UTR element containing or consisting of at least about 60% sequence identity, preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity , even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of the sequence shown in SEQ ID NO: 2; and a polyadenylation signal and/or a poly(A) sequence. In addition, an artificial RNA molecule, preferably an artificial mRNA molecule or an artificial viral RNA molecule, comprising an open reading frame, preferably an open reading frame, which encodes a peptide or protein other than the ribosomal protein from which the 3'-UTR is derived; 3'UTR element containing or consisting of at least about 60% sequence identity, preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity , even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of the sequence shown in SEQ ID NO: 4.
В изобретении предложена искусственная молекула нуклеиновой кислоты, предпочтительно искусственная мРНК, которая может отличаться тем, что обеспечивает повышенную стабильность и пролонгирование экспрессии кодируемого пептида или белка. Не выдаваясь в какую-либо конкретную теорию, можно считать, что повышенная стабильность экспрессии белка и также пролонгированная экспрессия белка могут быть обусловлены уменьшением разложения искусственной молекулы нуклеиновой кислоты, такой как искусственная молекула мРНК, предлагаемая в настоящем изобретении. Таким образом, предлагаемый в изобретении 3'-UTR-элемент может предупреждать разложение и расщепление искусственной нуклеиновой кислоты.The invention provides an artificial nucleic acid molecule, preferably an artificial mRNA, which may be characterized in that it provides increased stability and prolongation of the expression of the encoded peptide or protein. Without wishing to be bound by any particular theory, it is believed that the increased stability of protein expression and also prolonged protein expression may be due to reduced degradation of an artificial nucleic acid molecule, such as an artificial mRNA molecule of the present invention. Thus, the 3'UTR element of the invention can prevent degradation and cleavage of the artificial nucleic acid.
В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты может содержать гистоновую структуру типа «стебель-петля» в дополнение к нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка. Такая искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать, например, расположенные в 5'→3'-направлении ОРС, 3'-UTR-элемент, необязательную последовательность гистоновой структуры типа «стебель-петля», необязательную поли(А)-последовательность или сигнал полиаденилирования и необязательную поли(С)-последовательность. Она может содержать также расположенные в 5'→3'-направлении ОРС, 3'-UTR-элемент, необязательную поли(А)-последовательность, необязательную поли(С)-последовательность и необязательную последовательность гистоновой структуры типа «стебель-петля».In some embodiments, the artificial nucleic acid molecule may contain a histone stem-loop structure in addition to a nucleotide sequence derived from the 3'-UTR of the ribosomal protein gene. Such an artificial nucleic acid molecule of the present invention may contain, for example, 5'→3' ORFs, a 3'UTR element, an optional stem-loop histone sequence, an optional poly(A) a polyadenylation sequence or signal; and an optional poly(C) sequence. It may also contain a 5'→3' ORF, a 3'UTR element, an optional poly(A) sequence, an optional poly(C) sequence, and an optional stem-loop histone sequence.
В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемой в изобретении, содержит по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля».In a preferred embodiment of the invention, the artificial nucleic acid molecule of the invention contains at least one stem-loop histone sequence.
Последовательность гистоновой структуры типа «стебель-петля», которую можно применять в настоящем изобретении, предпочтительно выбирают по меньшей мере из одной из следующих формул (I) или (II):The stem-loop histone sequence that can be used in the present invention is preferably selected from at least one of the following formulas (I) or (II):
формула (I) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (I) (stem-loop structure sequence without stem boundary elements):
формула (II) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (II) (stem-loop structure sequence with stem boundary elements):
в которых:in which:
пограничные элементы «стебель1 или стебель2» N1-6 обозначают непрерывную последовательность, состоящую из 1-6, предпочтительно 2-6, более предпочтительно 2-5, еще более предпочтительно 3-5, наиболее предпочтительно 4-5 или 5 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или их нуклеотидного аналога;stem1 or stem2 boundary elements N 1-6 denote a continuous sequence consisting of 1-6, preferably 2-6, more preferably 2-5, even more preferably 3-5, most preferably 4-5 or 5 N, where N each independently selected from a nucleotide selected from A, U, T, G, and C, or a nucleotide analogue thereof;
«стебель1» [n0-2GN3-5] обозначает последовательность, обратно комплементарную или частично обратно комплементарную элементу «стебель2», и представляет собой непрерывную последовательность, состоящую из 5-7 нуклеотидов;"stem1" [n 0-2 GN 3-5 ] denotes a sequence reversely complementary or partially reversely complementary to the element "stem2" and is a contiguous sequence of 5-7 nucleotides;
в которой N0-2 обозначает непрерывную последовательность, состоящую из 0-2, предпочтительно 0-1, более предпочтительно 1 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; в которой N3-5 обозначает непрерывную последовательность, состоящую из 3-5, предпочтительно 4-5, более предпочтительно 4 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога, и в которой G обозначает гуанозин или его аналог и необязательно может быть заменен на цитидин или его аналог при условии, что комплементарный ему нуклеотид цитидин в «стебель2» заменен на гуанозин;in which N 0-2 denotes a contiguous sequence consisting of 0-2, preferably 0-1, more preferably 1 N, where N is each independently selected from a nucleotide selected from A, U, T, G and C or its nucleotide analog; in which N 3-5 denotes a contiguous sequence consisting of 3-5, preferably 4-5, more preferably 4 N, where N is each independently selected from a nucleotide selected from A, U, T, G and C or its a nucleotide analog, and in which G is guanosine or an analog thereof and may optionally be replaced by cytidine or an analog thereof, provided that its complementary nucleotide cytidine in stem2 is replaced by guanosine;
последовательность «петли» [N0-4(U/T)N0-4] локализована между элементами «стебель1» и «стебель2» и обозначает непрерывную последовательность, состоящую из 3-5 нуклеотидов, более предпочтительно 4 нуклеотидов;the sequence "loop" [N 0-4 (U/T)N 0-4 ] is located between the elements "stem1" and "stem2" and denotes a continuous sequence of 3-5 nucleotides, more preferably 4 nucleotides;
в которой N0-4 каждый независимо друг от друга обозначает непрерывную последовательность, состоящую из 0-4, предпочтительно 1-3, более предпочтительно 1-2 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; и в которой U/T обозначает уридин или необязательно тимидин;in which N 0-4 each independently of the other denotes a continuous sequence consisting of 0-4, preferably 1-3, more preferably 1-2 N, where N is each independently selected from a nucleotide selected from A, U, T, G and C or its nucleotide analogue; and wherein U/T is uridine or optionally thymidine;
«стебель2» [N3-5CN0-2] обозначает последовательность, обратно комплементарную или частично обратно комплементарную элементу «стебель1», и представляет собой непрерывную последовательность, состоящую из 5-7 нуклеотидов;"stem2" [N 3-5 CN 0-2 ] denotes a sequence reversely complementary or partially reversely complementary to the element "stem1" and is a contiguous sequence of 5-7 nucleotides;
в которой N3-5 обозначает непрерывную последовательность, состоящую из 3-5, предпочтительно 4-5, более предпочтительно 4 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; в которой N0-2 обозначает непрерывную последовательность, состоящую из 0-2, предпочтительно 0-1, более предпочтительно 1 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G или С или его нуклеотидного аналога; иin which N 3-5 denotes a contiguous sequence consisting of 3-5, preferably 4-5, more preferably 4 N, where N is each independently selected from a nucleotide selected from A, U, T, G and C or its nucleotide analog; in which N 0-2 denotes a contiguous sequence consisting of 0-2, preferably 0-1, more preferably 1 N, where N is each independently selected from a nucleotide selected from A, U, T, G or C or its nucleotide analog; and
в которой С обозначает цитидин или его аналог и необязательно может быть заменен на гуанозин или его аналог при условии, что комплементарный ему нуклеотид гуанозин в «стебель1.» заменен на цитидин;in which C denotes cytidine or its analogue and may optionally be replaced by guanosine or its analogue, provided that its complementary nucleotide guanosine in "stem1." replaced by cytidine;
гдеwhere
у элементов «стебель1» и «стебель2» может происходить спаривание оснований друг с другом с образованием обратно комплементарной последовательности, где спаривание оснований может иметь место между «стебель1» и «стебель2», например, посредством спаривания оснований по Уотсону-Крику нуклеотидов А и U/T или G и С, или посредством спаривания оснований не по Уотсону-Крику, например, посредством спаривания «качающихся» оснований («качающегося» спаривания оснований), обратного спариванию оснований по Уотсону-Крику, посредством хугстиновского спаривания оснований, посредством обратного хугстиновскому спаривания оснований, или у них может происходить спаривание оснований друг с другом с образованием частично обратно комплементарной последовательности, при этом неполное спаривание оснований может иметь место между «стебель1» и «стебель2», вследствие того, что для одного или нескольких оснований в одном стебле не имеется комплементарного основания в обратно комплементарной последовательности другого стебля.stem1 and stem2 elements can base-pair with each other to form a reverse complementary sequence, where base-pairing can take place between stem1 and stem2, for example, by Watson-Crick base-pairing of nucleotides A and U /T or G and C, or by non-Watson-Crick base-pairing, e.g., by "wobble" base-pairing ("wobble" base-pairing), the reverse of Watson-Crick base-pairing, by Hoogsteen base-pairing, by the reverse of Hoogsteen base-pairing bases, or they may base-pair with each other to form a partially reversed complementary sequence, with incomplete base-pairing occurring between stem1 and stem2, due to the fact that one or more bases in one stem do not have complementary base in the reverse complementary sequence of each oh stem.
Согласно другому предпочтительному варианту осуществления изобретения мРНК, предлагаемая в настоящем изобретении, может содержать или кодировать по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля», соответствующую по меньшей мере одной из следующих конкретных формул (Ia) или (IIa):According to another preferred embodiment of the invention, the mRNA of the present invention may contain or encode at least one stem-loop histone sequence corresponding to at least one of the following specific formulas (Ia) or (IIa):
формула (Ia) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (Ia) (stem-loop structure sequence without stem boundary elements):
формула (IIa) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (IIa) (stem-loop structure sequence with stem boundary elements):
в которой:wherein:
имеют указанные выше значения. have the above meanings.
Согласно другому предпочтительному варианту осуществления изобретения мРНК, предлагаемая в настоящем изобретении, может содержать или кодировать по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля», соответствующую по меньшей мере одной из следующих конкретных формул (Ib) или (IIb):According to another preferred embodiment of the invention, the mRNA of the present invention may contain or encode at least one stem-loop histone sequence corresponding to at least one of the following specific formulas (Ib) or (IIb):
формула (Ib) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (Ib) (stem-loop structure sequence without stem boundary elements):
формула (IIb) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (IIb) (stem-loop structure sequence with stem boundary elements):
в которой:wherein:
имеют указанные выше значения. have the above meanings.
Наиболее предпочтительной последовательностью гистоновой структуры типа «стебель-петля» является последовательность, представленная в SEQ ID NO: 5 CAAAGGCTCTTTTCAGAGCCACCA, или более предпочтительно последовательность РНК, соответствующая нуклеотидной последовательности, представленной в SEQ ID NO: 5.The most preferred stem-loop histone sequence is that shown in SEQ ID NO: 5 CAAAGGCTCTTTTCAGAGCCACCA, or more preferably the RNA sequence corresponding to the nucleotide sequence shown in SEQ ID NO: 5.
Например, отдельные элементы могут присутствовать в искусственной молекуле нуклеиновой кислоты в следующем порядке:For example, individual elements may be present in an artificial nucleic acid molecule in the following order:
5'-кэп 5'-UTR - ОРС - 3'-UTR-элемент гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap 5'-UTR - ORF - 3'-UTR-element histone stem-loop structure - poly(A)/(C)-sequence;
5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C) sequence - histone stem-loop structure;
5'-кэп - 5'-UTR - ОРС - IRES - ОРС 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - IRES - ORF 3'-UTR element - histone stem-loop structure - poly(A)/(C)-sequence;
5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - histone stem-loop structure - poly(A)/(C) sequence - poly(A)/(C )-subsequence;
5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - poly(A)/(C) sequence - histone stem-loop structure;
5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence - histone stem structure -the loop";
5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence poly(A)/(C)-sequence;
5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»; и т.д.5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence - histone stem-loop structure; etc.
В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты содержит дополнительные элементы, такие как 5'-кэп, поли(С)-последовательность и/или IRES-мотив. 5'-кэп может быть добавлен в процессе транскрипции или после транскрипции к 5'-концу РНК. Кроме того, предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты, прежде всего в том случае, когда нуклеиновая кислота находится в форме мРНК или кодирует мРНК, можно модифицировать с помощью последовательности, состоящей по меньшей мере из 10 цитозинов, предпочтительно по меньшей мере из 20 цитозинов, более предпочтительно по меньшей мере из 30 цитозинов (так называемая «поли(С)-последовательность»). В частности, предлагаемая в изобретении искусственная молекула нуклеиновой кислоты может содержать, прежде всего в том случае, когда нуклеиновая кислота находится в форме мРНК или кодирует мРНК, поли(С)-последовательность которая, как правило, содержит примерно от 10 до 200 цитозиновых нуклеотидов, предпочтительно примерно от 10 до 100 цитидиновых нуклеотидов, более предпочтительно примерно от 10 до 70 цитидиновых нуклеотидов или еще более предпочтительно примерно от 20 до 50 или даже от 20 до 30 цитидиновых нуклеотидов. Наиболее предпочтительно, предлагаемая в изобретении нуклеиновая кислота содержит поли(С)-последовательность, состоящую из 30 цитидиновых оснований. Так, предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит, предпочтительно в 5'→3' направлении ОРС, по меньшей мере один 3'-UTR-элемент, описанный выше, поли(А)-последовательность или сигнал полиаденилирования и поли(С)-последовательность.In some embodiments, the artificial nucleic acid molecule contains additional elements such as a 5' cap, a poly(C) sequence, and/or an IRES motif. The 5' cap can be added during or after transcription to the 5' end of the RNA. In addition, the artificial nucleic acid molecule according to the invention, especially in the case when the nucleic acid is in the form of mRNA or encodes mRNA, can be modified with a sequence consisting of at least 10 cytosines, preferably at least 20 cytosines, more preferably at least 30 cytosines (the so-called "poly(C)-sequence"). In particular, the artificial nucleic acid molecule according to the invention may contain, especially when the nucleic acid is in the form of an mRNA or encodes an mRNA, a poly(C)-sequence which, as a rule, contains from about 10 to 200 cytosine nucleotides, preferably about 10 to 100 cytidine nucleotides, more preferably about 10 to 70 cytidine nucleotides, or even more preferably about 20 to 50 or even 20 to 30 cytidine nucleotides. Most preferably, the inventive nucleic acid contains a poly(C) sequence consisting of 30 cytidine bases. Thus, preferably, the artificial nucleic acid molecule of the present invention contains, preferably in the 5'→3' direction of the ORF, at least one 3'-UTR element as described above, a poly(A) sequence or polyadenylation signal, and a poly (C)-sequence.
Последовательность внутреннего сайта связывания рибосом (IRES) или IRES-мотив может разделять несколько открытых рамок считывания, например в том случае, когда искусственная молекула нуклеиновой кислоты кодирует два или большее количество пептидов или белков. IRES-последовательность может быть наиболее полезной в том случае, когда искусственная молекула нуклеиновой кислоты представляет собой би- или полицистронную молекулу нуклеиновой кислоты.An internal ribosome binding site (IRES) sequence or IRES motif may share multiple open reading frames, such as when an artificial nucleic acid molecule encodes two or more peptides or proteins. The IRES sequence may be most useful when the artificial nucleic acid molecule is a bi- or polycistronic nucleic acid molecule.
Кроме того, искусственная молекула нуклеиновой кислоты может содержать дополнительные 5'-элементы, предпочтительно 5'-UTR, промотор или последовательность, содержащую 5'-UTR и промотор. Промотор может управлять транскрипцией или регулировать транскрипцию искусственной молекулы нуклеиновой кислоты предлагаемой в настоящем изобретении, например, искусственной молекулы ДНК, предлагаемой в настоящем изобретении. Кроме того, 5'-UTR может состоять или содержать 5'-UTR гена, представленную в настоящем описании. Кроме того, 5'-UTR может взаимодействовать с предлагаемым в изобретении 3,-UTR-элементом и тем самым может поддерживать стабилизирующее действие предлагаемого в изобретении 3'-UTR-элемента. Такие элементы могут дополнительно поддерживать стабильность и эффективность трансляции. Следовательно, в некоторых вариантах осуществления изобретения предложены искусственные молекулы нуклеиновой кислоты, предпочтительно молекулы мРНК, содержащие в 5'→3'-направлении по меньшей мере одну из следующих структурIn addition, the artificial nucleic acid molecule may contain additional 5'-elements, preferably a 5'-UTR, a promoter or a sequence containing a 5'-UTR and a promoter. A promoter may direct or regulate transcription of an artificial nucleic acid molecule of the present invention, such as an artificial DNA molecule of the present invention. In addition, the 5'-UTR may consist of or contain the 5'-UTR of the gene presented in the present description. In addition, the 5'-UTR can interact with the inventive 3,-UTR element and thus can support the stabilizing effect of the inventive 3'-UTR element. Such elements can further support the stability and efficiency of translation. Therefore, in some embodiments, the invention provides artificial nucleic acid molecules, preferably mRNA molecules, containing in the 5'→3' direction at least one of the following structures
5'-кэп - 5'-UTR - ORF - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - 3'-UTR element - histone stem-loop structure - poly(A)/(C)-sequence;
5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence histone stem-loop structure;
5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - histone stem-loop structure - poly(A)/(C)-sequence;
5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3,-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - IRES - ORF - 3,-UTR element - histone stem-loop structure - poly(A)/(C) sequence - poly(A)/(C )-subsequence;
5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - poly(A)/(C)-sequence histone stem-loop structure;
5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence - histone stem structure -the loop";
5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence;
5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля».5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence - stem-loop histone structure.
В наиболее предпочтительном варианте осуществления настоящего изобретения искусственная молекула нуклеиновой кислоты содержит по меньшей мере один элемент 5'-нетранслируемой области (5'UTR-элемент) длиной менее чем 500, 400, 300, 250, 200, 150 или 100 нуклеотидов и/или более чем 20, 30, 40, 50 или 60 нуклеотидов, который предпочтительно содержит или состоит из нуклеотидной последовательности, которая происходит из 5'UTR ТОР-гена, или которая происходит из фрагмента, гомолога или варианта 5'UTR ТОР-гена.In the most preferred embodiment of the present invention, the artificial nucleic acid molecule contains at least one element of the 5'-untranslated region (5'UTR element) with a length of less than 500, 400, 300, 250, 200, 150 or 100 nucleotides and/or more than 20, 30, 40, 50 or 60 nucleotides, which preferably contains or consists of a nucleotide sequence which is derived from the 5'UTR of the TOP gene, or which is derived from a fragment, homologue or variant of the 5'UTR of the TOP gene.
Наиболее предпочтительно 5'UTR-элемент не содержит ТОР-мотив или 5'-ТОР, указанный выше.Most preferably, the 5'UTR element does not contain the TOP motif or 5'TOP as defined above.
Нуклеотидная последовательность, которая происходит из 5'UTR ТОР-гена, происходит из эукараотического ТОР-гена, предпочтительно ТОР-гена растения или животного, более предпочтительно ТОР-гена хордовых, еще более предпочтительно ТОР-гена позвоночных, наиболее предпочтительно ТОР-гена млекопитающих, такого как ТОР-ген человека.The nucleotide sequence which is derived from the 5'UTR of the TOP gene is derived from a eukaraotic TOP gene, preferably a plant or animal TOP gene, more preferably a chordate TOP gene, even more preferably a vertebrate TOP gene, most preferably a mammalian TOP gene, such as the human TOP gene.
Например, 5'UTR-элемент предпочтительно выбирают из 5'-UTR-элементов, содержащих или состоящих из нуклеотидной последовательности, которая происходит из нуклеотидной последовательности, выбранной из группы, состоящей из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, описание которой включено в настоящее описание в качестве ссылки, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта или предпочтительно из соответствующей последовательности РНК. Понятие «гомологи SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленные в заявке на патент WO 2013/143700» относится к последовательностям из видов кроме человека, которые гомологичны последовательностям SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленным в заявке на патент WO 2013/143700.For example, the 5'UTR element is preferably selected from 5'UTR elements containing or consisting of a nucleotide sequence that is derived from a nucleotide sequence selected from the group consisting of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700, the description of which is incorporated herein by reference, from the homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700, from a variant thereof, or preferably from the corresponding RNA sequence. The term "homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700" refers to sequences from non-human species that are homologous to sequences SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700.
В предпочтительном варианте осуществления изобретения S'UTR-элемент содержит или состоит из нуклеотидной последовательности, которая происходит из нуклеотидной последовательности, простирающейся от нуклеотидного положения 5 (т.е. нуклеотида, находящегося в последовательности в положении 5) до нуклеотида, непосредственно примыкающего с 5'-стороны к стартовому кодону (находящемуся на 3'-конце последовательностей), например, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к последовательности ATG нуклеотидной последовательности, выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта, или соответствующей последовательности РНК. Наиболее предпочтительно 5' UTR-элемент происходит из нуклеотидной последовательности, простирающейся от нуклеотидного положения, непосредственно примыкающего с 3'-стороны к 5'-ТОР, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к стартовому кодону (находящемуся на 3'-конце последовательностей), например, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к последовательности ATG нуклеотидной последовательности выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта, или соответствующей последовательности РНК.In a preferred embodiment of the invention, the S'UTR element contains or consists of a nucleotide sequence that is derived from a nucleotide sequence extending from nucleotide position 5 (i.e., the nucleotide located in position 5 in the sequence) to the nucleotide immediately adjacent to 5' - side to the start codon (located at the 3' end of the sequences), for example, to the nucleotide position immediately adjacent on the 5' side to the ATG sequence of the nucleotide sequence selected from SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 of patent application WO 2013/143700 from homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from its variant, or the corresponding RNA sequence. Most preferably, the 5' UTR element is derived from a nucleotide sequence extending from the nucleotide position immediately 3'-side adjacent to the 5'-TOP to the nucleotide position immediately adjacent 5'-side to the start codon (located on the 3'- the end of the sequences), for example, up to the nucleotide position immediately adjacent on the 5' side to the ATG sequence of the nucleotide sequence selected from SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from the homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from its variant, or the corresponding RNA sequence.
В наиболее предпочтительном варианте осуществления изобретения 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR ТОР-гена, кодирующего рибосомальный белок, или из варианта 5'-UTR ТОР-гена, кодирующего рибосомальный белок. Например, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR нуклеотидной последовательности, представленной в любой из SEQ ID NO: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359 или 1360, представленных в заявке на патент WO 2013/143700, соответствующей последовательности РНК, ее гомолога или ее варианта, представленного в настоящем описании, предпочтительно без 5'-ТОР-мотива. Как описано выше, последовательность, простирающаяся от положения 5 до нуклеотида, непосредственно примыкающего с 5'-стороны к ATG (который находится на 3'-конце последовательностей), соответствует 5'-UTR указанных последовательностей.In the most preferred embodiment of the invention, the 5'UTR element contains or consists of a nucleotide sequence derived from the 5'UTR of the TOP gene encoding the ribosomal protein or from the variant 5'UTR of the TOP gene encoding the ribosomal protein. For example, the 5'-UTR element contains or consists of a nucleotide sequence derived from the 5'-UTR nucleotide sequence shown in any of SEQ ID NOs: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1313, 1313. 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1338, 1338, 1338. 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359 or 1360 pending in WO2 143700 corresponding to the RNA sequence, its homologue or its variant presented in the present description, preferably without the 5'-TOP motif. As described above, the sequence extending from position 5 to the nucleotide immediately adjacent 5' to the ATG (which is at the 3' end of the sequences) corresponds to the 5' UTR of the indicated sequences.
Предпочтительно 5'UTR-элемент содержит или состоит из нуклеотидной последовательности, которая происходит из 5'-UTR ТОР-гена, кодирующего рибосомальный белок большой субъединицы (RPL), или из гомолога или варианта 5'-UTR ТОР-гена, кодирующего рибосомальный белок большой субъединицы (RPL). Например, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR нуклеотидной последовательности, представленной в любой из SEQ ID NO: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 и 1422, описанных в заявке на патент WO 2013/143700, соответствующей последовательности РНК, ее гомолога или ее варианта, представленного в настоящем описании, предпочтительно без 5'-ТОР-мотива.Preferably, the 5'UTR element contains or consists of a nucleotide sequence that is derived from the 5'UTR of the TOP gene encoding the ribosomal large subunit protein (RPL) or from a homologue or variant of the 5'UTR of the TOP gene encoding the ribosomal large subunit protein. subunits (RPL). For example, the 5'-UTR element contains or consists of a nucleotide sequence derived from the 5'-UTR nucleotide sequence shown in any of SEQ ID NOs: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 and 1422 described in patent application WO 2013/143700 corresponding to the RNA sequence, its homologue or its variant presented in the present description, preferably without a 5'-TOP motif.
В наиболее предпочтительном варианте осуществления изобретения 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR гена рибосомального белка большой субъединицы 32, предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) позвоночных, более предпочтительно гена рибосомального белка большой субъединицы 32 (L32) млекопитающих, наиболее предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) человека, или из варианта 5'-UTR гена рибосомального белка большой субъединицы 32, предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) позвоночных, более предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) млекопитающих, наиболее предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) человека, где предпочтительно 5'-UTR-элемент не содержит 5'-ТОР указанного гена.In a most preferred embodiment, the 5'-UTR element comprises or consists of a nucleotide sequence derived from the 5'-UTR of the large subunit 32 ribosomal protein gene, preferably from the vertebrate large subunit 32 ribosomal protein (L32) gene, more preferably the ribosomal protein gene mammalian 32 large subunit (L32) ribosomal protein gene, most preferably from the human 32 large subunit ribosomal protein (L32) protein gene, or from the 5'-UTR variant of the 32 large subunit ribosomal protein gene, preferably from the vertebrate 32 large subunit ribosomal protein (L32) protein gene, more preferably from a mammalian ribosomal large subunit 32 (L32) protein gene, most preferably from a human ribosomal large subunit 32 (L32) protein gene, where preferably the 5'-UTR element does not contain the 5'-TOP of said gene.
Следовательно, в наиболее предпочтительном варианте осуществления изобретения, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 6 (5'-UTR рибосомального белка большой субъединицы 32 человека без 5'-концевого олигопиримидинового тракта:Therefore, in the most preferred embodiment of the invention, the 5'-UTR element contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide sequence shown in SEQ ID NO: 6 (5'-UTR of the human large subunit 32 ribosomal protein without the 5'-oligopyrimidine tract:
GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC; соответствующая SEQ ID NO: 1368, представленной в заявке на патент WO 2013/143700) или предпочтительно соответствующей последовательности РНК, или где по меньшей мере один 5'UTR-элемент содержит или состоит из фрагмента нуклеотидной последовательности, идентичного по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 6, или более предпочтительно соответствующей последовательности РНК, где предпочтительно фрагмент представляет собой описанный выше фрагмент, непрерывный сегмент нуклеотидов, представляющий собой по меньшей мере 20% и т.д. полноразмерной 5'-UTR. Предпочтительно фрагмент имеет длину по меньшей мере примерно 20 нуклеотидов или более, предпочтительно по меньшей мере примерно 30 нуклеотидов или более, более предпочтительно по меньшей мере примерно 40 нуклеотидов или более. Предпочтительно фрагмент представляет собой функциональный фрагмент, представленный в настоящем описании.GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC; corresponding to SEQ ID NO: 1368 presented in patent application WO 2013/143700) or preferably the corresponding RNA sequence, or where at least one 5'UTR element contains or consists of a fragment of a nucleotide sequence that is at least about 40% identical , preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide sequence shown in SEQ ID NO: 6, or more preferably the corresponding RNA sequence, where preferably the fragment is the fragment described above, a continuous segment of nucleotides, representing at least 20%, etc. full-length 5'-UTR. Preferably, the fragment is at least about 20 nucleotides or more in length, preferably at least about 30 nucleotides or more, more preferably at least about 40 nucleotides or more. Preferably the fragment is a functional fragment, presented in the present description.
В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты содержит S'-UTR-элемент, который содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR ТОР-гена позвоночных, например, млекопитающих, например, ТОР-гена человека, выбранного из RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLPO, RPLP1, RPLP2, RPLP3, RPLPO, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, РАВРС1, HNRNPA1, ТРТ1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB или из его гомолога или варианта, где предпочтительно 5'-UTR-элемент не содержит ТОР-мотив или 5'-ТОР указанных генов, и где необязательно 5'-UTR-элемент начинается на его 5'-конце с нуклеотида, находящегося в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 в прямом направлении относительно 5'-концевого олигопиримидинового тракта (ТОР) и где необязательно также 5'-UTR-элемент, происходящий из 5'-UTR ТОР-гена, заканчивается на его 3'-конце нуклеотидом, находящимся в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 в обратном направлении относительно стартового кодона (A(U/T)G) гена, из которого он происходит.In some embodiments, the artificial nucleic acid molecule comprises an S'-UTR element that contains or consists of a nucleotide sequence derived from the 5'-UTR of a vertebrate, e.g., mammalian TOP gene, e.g., a human TOP gene, selected from RPSA , RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25 , RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A RPL27 , RPLPO, RPLP1, RPLP2, RPLP3, RPLPO, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, PABPC1, HNRNPA1, TPT1, 2TUBB1, UBA5 , NPM1, ATP5G2, GNB2L1, NME2, UQCRB, or from a homologue or variant thereof, where preferably the 5'-UTR element does not contain the TOP motif or 5'-TOP of said genes, and where optionally the 5'-UTR element begins with it 5'-end from the nucleotide located at position 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 forward relative to the 5'-oligopyrimidine tract (TOP) and where optionally also the 5'-UTR -element derived from the 5'-UTR of the TOP gene ends at its 3'-end with a nucleotide located at position 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 in the opposite direction from the start codon (A(U/T)G) of the gene from which it comes.
Предпочтительно в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно в открытой рамке считывания, модифицируют по меньшей мере содержание G/C. Так, предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты можно стабилизировать с точки зрения ее термодинамических характеристик путем модификации содержания G (гуанозин)/С (цитидин) в молекуле. Содержание G/C в открытой рамке считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно повышать по сравнению с содержанием G/C в открытой рамке считывания соответствующей последовательности дикого типа, предпочтительно на основе вырожденности генетического кода. Так, аминокислотную последовательность, кодируемую искусственной молекулой нуклеиновой кислоты, предпочтительно не модифицируют посредством модификации содержания G/C по сравнению с конкретной кодируемой аминокислотной последовательностью дикого типа. Таким образом, можно варьировать кодоны кодирующей последовательности или всей искусственной молекулы нуклеиновой кислоты, например, мРНК, по сравнению с кодирующей последовательностью дикого типа таким образом, чтобы они содержали большее количество G/C-нуклеотидов, сохраняя при этом транслируемую аминокислотную последовательность. Благодаря тому факту, что несколько кодонов кодируют одну и ту же аминокислоту (так называемая вырожденность генетического кода), можно изменять кодоны, не изменяя кодируемую последовательность пептида/белка (использование так называемых альтернативных кодонов). Следовательно, можно специально интродуцировать определенные кодоны (осуществляя обмен соответствующих кодонов дикого типа, кодирующих ту же самую аминокислоту), которые являются более предпочтительными с точки зрения стабильности РНК и/или наиболее часто встречающихся кодонов в организме индивидуума (так называемая оптимизация кодонов).Preferably, at least the G/C content is modified in the artificial nucleic acid molecule of the present invention, preferably in the open reading frame. Thus, the artificial nucleic acid molecule according to the invention can be stabilized in terms of its thermodynamic characteristics by modifying the content of G (guanosine)/C (cytidine) in the molecule. The G/C content in the open reading frame of the artificial nucleic acid molecule of the present invention can be increased compared to the G/C content in the open reading frame of the corresponding wild-type sequence, preferably based on the degeneracy of the genetic code. Thus, the amino acid sequence encoded by the artificial nucleic acid molecule is preferably not modified by modifying the G/C content as compared to the particular wild type encoded amino acid sequence. Thus, it is possible to vary the codons of a coding sequence or of an entire artificial nucleic acid molecule, e.g. mRNA, compared to the wild-type coding sequence so that they contain more G/C nucleotides while maintaining the translated amino acid sequence. Due to the fact that several codons code for the same amino acid (so-called degeneracy of the genetic code), it is possible to change codons without changing the encoded sequence of the peptide/protein (use of so-called alternative codons). Therefore, it is possible to specifically introduce certain codons (by exchanging the corresponding wild-type codons encoding the same amino acid) that are more favorable in terms of RNA stability and/or the most frequently occurring codons in the individual's body (so-called codon optimization).
В зависимости от аминокислоты, которая должна кодироваться кодирующей областью предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, представленной в настоящем описании, существуют различные возможности для модификации нуклеотидной последовательности, например, открытой рамки считывания, по сравнению с ее кодирующей областью дикого типа. В случае аминокислот, которые кодируются кодонами, содержащими только нуклеотиды G или С, модификации кодонов не требуется. Таким образом, кодоны для Pro (ССС или CCG), Arg (CGC или CGG), Ala (GCC или GCG) и Gly (GGC или GGG) не требуют модификации, поскольку в них отсутствуют А или U/T.Depending on the amino acid to be encoded by the coding region of the artificial nucleic acid molecule of the invention provided herein, there are different possibilities for modifying the nucleotide sequence, such as the open reading frame, compared to its wild-type coding region. In the case of amino acids that are encoded by codons containing only G or C nucleotides, codon modification is not required. Thus, the codons for Pro (CCC or CCG), Arg (CGC or CGG), Ala (GCC or GCG), and Gly (GGC or GGG) do not require modification because they lack A or U/T.
В противоположность этому, кодоны, которые содержат нуклеотиды А и/или U, можно модифицировать путем замены на другие кодоны, которые кодируют эти же аминокислоты, но не содержат А и/или U.In contrast, codons that contain A and/or U nucleotides can be modified by substitution with other codons that code for the same amino acids but do not contain A and/or U.
Например,For example,
кодирующие Pro кодоны CC(U/T) или ССА можно модифицировать на ССС или CCG;encoding Pro codons CC(U/T) or CCA can be modified to CCC or CCG;
кодирующие Arg кодоны CG(U/T) или CGA, или AGA, или AGG можно модифицировать на CGC или CGG;Arg-coding codons CG(U/T) or CGA or AGA or AGG can be modified to CGC or CGG;
кодирующие Ala кодоны GC(U/T) или GCA можно модифицировать на GCC или GCG;Ala encoding GC(U/T) or GCA codons can be modified to GCC or GCG;
кодирующие Gly кодоны GG(U/T) или GGA можно модифицировать на GGC или GGG.codons encoding Gly GG(U/T) or GGA can be modified to GGC or GGG.
В других случаях, когда нуклеотиды А или U нельзя элиминировать из кодонов, можно снижать содержание А и U с использованием кодонов, которые содержат нуклеотиды А и/или U в более низком количестве. Примерами указанных колонов являются:In other cases where A or U nucleotides cannot be eliminated from codons, A and U content can be reduced by using codons that contain A and/or U nucleotides in a lower amount. Examples of said columns are:
кодирующие Phe кодоны (U/T)(U/T)(U/T) можно модифицировать на (U/T) (U/T)C;Phe encoding codons (U/T)(U/T)(U/T) can be modified to (U/T)(U/T)C;
кодирующие Leu кодоны (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) или C(U/T)A можно модифицировать на C(U/T)C или C(U/T)G;codons encoding Leu (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) or C(U/T)A can be modified to C (U/T)C or C(U/T)G;
кодирующие Ser кодоны (U/T)C(U/T) или (U/T)CA, или AG(U/T) можно модифицировать на (U/T)CC, (U/T)CG или AGC;Ser encoding codons (U/T)C(U/T) or (U/T)CA or AG(U/T) can be modified to (U/T)CC, (U/T)CG or AGC;
кодирующий Tyr кодон (U/T)A(U/T) можно модифицировать на (U/T)AC;Tyr encoding codon (U/T)A(U/T) can be modified to (U/T)AC;
кодирующий Cys кодон (U/T)G(U/T) можно модифицировать на (U/T)GC;the Cys coding codon (U/T)G(U/T) can be modified to (U/T)GC;
кодирующий His кодон CA(U/T) можно модифицировать на САС;His coding codon CA(U/T) can be modified to CAC;
кодирующий Gln кодон САА можно модифицировать на CAG;the Gln coding codon CAA can be modified to CAG;
кодирующие Ile кодоны A(U/T)(U/T) или A(U/T)A можно модифицировать на A(U/T)Ccodons encoding Ile A(U/T)(U/T) or A(U/T)A can be modified to A(U/T)C
кодирующие Thr кодоны AC(U/T) или АСА можно модифицировать на АСС или ACGcodons encoding Thr AC(U/T) or ACA can be modified to ACC or ACG
кодирующий Asn кодон AA(U/T) можно модифицировать на ААС;the Asn encoding codon AA(U/T) can be modified to AAC;
кодирующий Lys кодоны AAA можно модифицировать на AAG;Lys encoding AAA codons can be modified to AAG;
кодирующие Val кодоны G(U/T)(U/T) или G(U/T)A можно модифицировать на G(U/T)C или G(U/T)G;codons encoding Val G(U/T)(U/T) or G(U/T)A can be modified to G(U/T)C or G(U/T)G;
кодирующий Asp кодон GA(U/T) можно модифицировать на GAC;the Asp encoding codon GA(U/T) can be modified to GAC;
кодирующий Glu кодон GAA можно модифицировать на GAG;the Glu coding codon GAA can be modified to GAG;
стоп-кодон (U/T)AA можно модифицировать на (U/T)AG или (U/T)GA.the stop codon (U/T)AA can be modified to either (U/T)AG or (U/T)GA.
С другой стороны, в случае кодонов Met (AUG) и Trp (UGG), отсутствует возможность модификации последовательности без изменения кодируемой аминокислотной последовательности.On the other hand, in the case of Met (AUG) and Trp (UGG) codons, there is no possibility of modifying the sequence without changing the encoded amino acid sequence.
Перечисленные выше замены можно использовать либо индивидуально, либо в любых возможных комбинациях для повышения содержания G/C в открытой рамке считывания в предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, по сравнению с конкретной открытой рамкой считывания дикого типа (т.е. исходной последовательности). Так, например, все кодоны Thr, встречающиеся в последовательности дикого типа, можно модифицировать на АСС (или ACG).The substitutions listed above can be used either alone or in any possible combination to increase the G/C content in the open reading frame of the inventive artificial nucleic acid molecule provided herein, compared to a specific wild-type open reading frame (i.e., e. the original sequence). Thus, for example, all Thr codons occurring in the wild-type sequence can be modified to ACC (or ACG).
Предпочтительно содержание G/C в открытой рамке считывания в предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, повышают по меньшей мере на 7%, более предпочтительно по меньшей мере на 15%, наиболее предпочтительно по меньшей мере на 20%, по сравнению с содержанием G/C в кодирующей области мРНК дикого типа без изменения кодируемой аминокислотной последовательности, т.е. используя вырожденность генетического кода. В конкретном варианте осуществления изобретения заменяют по меньшей мере 5%, 10%, 20%, 30%, 40%, 50%, 60%, более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90%, 95% или даже 100% пригодных для замены кодонов в открытой рамке считывания в предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты или ее фрагменте, варианте или производном, повышая тем самым содержание G/C в указанной открытой рамке считывания.Preferably, the open reading frame G/C content of the inventive artificial nucleic acid molecule described herein is increased by at least 7%, more preferably by at least 15%, most preferably by at least 20%, compared to the content of G/C in the coding region of the wild-type mRNA without changing the encoded amino acid sequence, i.e. using the degeneracy of the genetic code. In a particular embodiment of the invention, at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, more preferably at least 70%, even more preferably at least 80%, and most preferably at least at least 90%, 95%, or even 100% of codon substitutions in the open reading frame of the inventive artificial nucleic acid molecule or fragment, variant or derivative thereof, thereby increasing the G/C content in said open reading frame.
В этом контексте наиболее предпочтительно повышать содержание G/C в открытая рамке считывания в предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, до максимума (т.е. до 100% пригодных для замещения кодонов) по сравнению с открытой рамкой считывания дикого типа без изменения кодируемой аминокислотной последовательности.In this context, it is most preferable to increase the content of G/C in the open reading frame of the inventive artificial nucleic acid molecule presented herein to a maximum (i.e. up to 100% usable codons) compared to the open reading frame of the wild type without changing the encoded amino acid sequence.
Кроме того, в открытой рамке считывания предпочтительно осуществляют по меньшей мере частично оптимизацию кодонов. Оптимизация кодонов основана на открытии того факта, что эффективность трансляции может определяться также различной частотой встречаемости транспортных РНК (тРНК) в клетках. Таким образом, если в кодирующей области, предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, присутствуют в повышенном количестве так называемые «редкие кодоны», то уровень трансляции соответствующей модифицированной нуклеотидной последовательности является более низким, чем в том случае, когда присутствуют кодоны, кодирующие относительно «часто встречающуюся» тРНК.In addition, the open reading frame preferably performs at least partially codon optimization. Codon optimization is based on the discovery that the efficiency of translation can also be determined by the different frequencies of transfer RNAs (tRNAs) in cells. Thus, if the so-called "rare codons" are present in the coding region of the artificial nucleic acid molecule according to the invention, the level of translation of the corresponding modified nucleotide sequence is lower than when there are codons that code for a relatively "frequent" tRNA.
Так, открытую рамку считывания предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты предпочтительно модифицируют по сравнению с соответствующей кодирующей областью дикого типа таким образом, чтобы по меньшей мере один кодон в последовательности дикого типа, который кодирует тРНК, которая является относительно редкой в клетке, был заменен на кодон, который кодирует тРНК, которая встречается в клетке относительно часто и «несет» такую же аминокислоту, что и относительно редко встречающаяся тРНК. Посредством такой модификации открытую рамку считывания предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, представленной в настоящем описании, модифицируют таким образом, чтобы кодонами, для которых доступны часто встречающиеся тРНК, заменять кодоны, которые соответствуют редким тРНК. Другими словами, согласно изобретению с помощью такой модификации все кодоны в открытой рамке считывания дикого типа, которые кодируют тРНК, являющуюся относительно редкой в клетке, можно заменять на кодоны, которые кодируют тРНК, относительно часто встречающуюся в клетке, и которая в каждом случае «несет» такую же аминокислоту, что и относительно редкая тРНК. тРНК, встречающиеся относительно часто в клетке, и наоборот, встречающиеся относительно редко, известны специалистам в данной области, см., например, Akashi, Curr. Opin. Genet. Dev., 11(6), 2001, cc. 660-666. Таким образом, предпочтительно открытая рамка считывания имеет оптимизированные кодоны, предпочтительно применительно к системе, в которой должна экспрессироваться искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, предпочтительно применительно к системе, в которой должна транслироваться искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении. Предпочтительно, оптимизацию кодонов для наиболее часто встречающихся кодонов в открытой рамке считывания осуществляют в соответствии с наиболее часто встречающимися кодонами млекопитающих, более предпочтительно в соответствии с наиболее часто встречающимися кодонами человека. Предпочтительно, в открытой рамке считывания осуществляют и оптимизацию кодонов, и модификацию содержания G/C.Thus, the open reading frame of the artificial nucleic acid molecule according to the invention is preferably modified in comparison with the corresponding wild-type coding region so that at least one codon in the wild-type sequence that codes for a tRNA that is relatively rare in the cell is changed to a codon that codes for a tRNA that is relatively common in the cell and "carries" the same amino acid as a relatively rare tRNA. By such modification, the open reading frame of the artificial nucleic acid molecule of the invention described herein is modified so that codons for which frequently occurring tRNAs are available are replaced with codons that correspond to rare tRNAs. In other words, according to the invention, with such a modification, all codons in the wild-type open reading frame that encode a tRNA that is relatively rare in the cell can be replaced with codons that encode a tRNA that is relatively common in the cell, and which in each case "carries » the same amino acid as a relatively rare tRNA. tRNAs that are relatively common in a cell, and vice versa, that are relatively rare, are known to those skilled in the art, see, for example, Akashi, Curr. Opin. Genet. Dev., 11(6), 2001, pp. 660-666. Thus, preferably the open reading frame has optimized codons, preferably in relation to the system in which the artificial nucleic acid molecule of the present invention is to be expressed, preferably in relation to the system in which the artificial nucleic acid molecule of the present invention is to be translated. Preferably, codon optimization for the most frequently occurring codons in the open reading frame is performed according to the most frequently occurring mammalian codons, more preferably according to the most frequently occurring human codons. Preferably, both codon optimization and G/C content modification are performed in the open reading frame.
Для дополнительного повышения устойчивости к расщеплению, например, устойчивости к расщеплению in vivo экзо- или эндонуклеазой, и/или для дополнительного повышения стабильности экспрессии белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно осуществлять дополнительные модификации искусственной молекулы нуклеиновой кислоты, такие как модификации каркаса, модификации сахаров и/или модификации оснований, например, липидные модификации или т.п. Предпочтительно, такие модификации не приводят к значимому ухудшению транскрипции и/или трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.Further modifications to the artificial nucleic acid molecule can be made to further enhance resistance to cleavage, such as resistance to in vivo cleavage by exo- or endonuclease, and/or to further improve the stability of protein expression from the artificial nucleic acid molecule of the present invention, further modifications to the artificial nucleic acid molecule can be made, such as backbone modifications, sugar modifications and/or base modifications, eg lipid modifications or the like. Preferably, such modifications do not significantly impair transcription and/or translation of the artificial nucleic acid molecule of the present invention.
Как правило, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать любой нативный (встречающийся в естественных условиях) нуклеотид, например, гуанозин, урацил, аденозин и/или цитозин, или их аналоги. В этом контексте нуклеотидные аналоги классифицируют как встречающиеся в естественных условиях и не встречающиеся в естественных условиях варианта встречающихся в естественных условиях нуклеотидов аденозина, цитозина, тимидина, гуанозина и уридина. Таким образом, аналоги представляют собой, например, химически модифицированные нуклеотиды, несущие не встречающиеся в естественных условиях функциональные группы, которые предпочтительно добавляют или изымают путем делеции из встречающегося в естественных условиях нуклеотида, или которыми заменяют встречающиеся в естественных условиях функциональные группы нуклеотида. Следовательно, можно модифицировать каждый компонент встречающегося в естественных условиях нуклеотида, а именно, компонент, представляющий собой основание, компонент, представляющий собой сахар (рибоза) компонент и/или компонент, представляющий собой фосфат, формирующий каркас (см. выше) последовательности РНК. Аналоги гуанозина, урацила, аденозина и цитозина включают (но, не ограничиваясь только ими) любой встречающийся в естественных условиях или не встречающийся в естественных условиях гуанозин, урацил, аденозин, тимидин или цитозин, который был изменен химически, например, ацетилированием, метилированием, гидроксилированием и т.д., включая, например, 1-метиладенозин, 1-метилгуанозин, 1-метилинозин, 2,2-диметилгуанозин, 2,6-диаминопурин, 2'-амино-2'-дезоксиаденозин, 2'-амино-2'-дезоксицитидин, 2'-амино-2'-дезоксигуанозин, 2'-амино-2'-дезоксиуридин, 2-амино-6-хлорпуринорибозид, 2-аминопуринрибозид, 2'-арааденозин, 2'-арацитидин, 2'-арауридин, 2'-азидо-2'-дезоксиаденозин, 2'-азидо-2'-дезоксицитидин, 2'-азидо-2'-дезоксигуанозин, 2'-азидо-2'-дезоксиуридин, 2-хлораденозин, 2'-фтор-2'-дезоксиаденозин, 2'-фтор-2'-дезоксицитидин, 2'-фтор-2'-дезоксигуанозин, 2'-фтор-2'-дезоксиуридин, 2'-фтортимидин, 2-метиладенозин, 2-метилгуанозин, 2-метилтио-N6-изопенениладенозин, 2'-O-метил-2-аминоаденозин, 2'-O-метил-2'-дезоксиаденозин, 2'-O-метил-2'-дезоксицитидин, 2'-O-метил-2'-дезоксигуанозин, 2'-O-метил-2'-дезоксиуридин, 2'-O-метил-5-метилуридин, 2'-O-метилинозин, 2'-O-метилпсевдоуридин, 2-тиоцитидин, 2-тиоцитозин, 3-метилцитозин, 4-ацетилцитозин, 4-тиоуридин, 5-(карбоксигидроксиметил)урацил, 5,6-дигидроуридин, 5-аминоаллилцитидин, 5-аминоаллилдезоксиуридин, 5-бромуридин, 5-карбоксиметиламинометил-2-тиоурацил, 5-карбоксиметиламинометилурацил, 5-хлор арацитозин, 5-фторуридин, 5-йодуридин, 5-метоксикарбонилметилуридин, 5-метоксиуридин, 5-метил-2-тиоуридин, 6-азацитидин, 6-азауридин, 6-хлор-7-деазагуанозин, 6-хлорпуринорибозид, 6-меркаптогуанозин, 6-метилмеркаптопуринрибозид, 7-деаза-2'-дезоксигуанозин, 7-деазааденозин, 7-метилгуанозин, 8-азааденозин, 8-броаденозин, 8-бромгуанозин, 8-меркапторгуанозин, 8-оксогуанозин, бензимидазолрибозид, бета-D-маннозилквеозин, дигидроурацил, инозин, N1-метиладенозин, N6-([6-аминогексил]карбамоилметил)аденозин, N6-изопентениладенозин, N6-метиладенозин, N7-метилксантозин, метиловый эфир N-урацил-5-оксиуксусной кислоты, пуромицин, квеозин, урацил-5-оксиуксусная кислота, метиловый эфир урацил-5-оксиуксусной кислоты, вибутоксозин, ксантозин и ксилоаденозин. Получение таких аналогов известно специалисту в данной области, например, описано в US 4373071, US 4401796, US 4415732, US 4458066, US 4500707, US 4668777, US 4973679, US 5047524, US 5132418, US 5153319, US 5262530 и 5700642. Касательно аналогов, описанных выше, наиболее предпочтительными согласно некоторым вариантам осуществления изобретения могут быть те аналоги, которые увеличивают белковую экспрессию кодируемого пептида или белка, или повышают иммуногенность искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, и/или не взаимодействуют с другой интродуцированной модификацией мРНК.Typically, the artificial nucleic acid molecule of the present invention may contain any native (naturally occurring) nucleotide, such as guanosine, uracil, adenosine and/or cytosine, or their analogues. In this context, nucleotide analogs are classified as naturally occurring and non-naturally occurring variants of the naturally occurring nucleotides of adenosine, cytosine, thymidine, guanosine, and uridine. Thus, analogs are, for example, chemically modified nucleotides bearing non-naturally occurring functional groups, which are preferably added or removed by deletion from a naturally occurring nucleotide, or by which a naturally occurring functional group of a nucleotide is substituted. Therefore, it is possible to modify each component of a naturally occurring nucleotide, namely the base component, the sugar (ribose) component, and/or the phosphate component forming the backbone (see above) of the RNA sequence. Guanosine, uracil, adenosine, and cytosine analogs include, but are not limited to, any naturally occurring or non-naturally occurring guanosine, uracil, adenosine, thymidine, or cytosine that has been altered chemically, e.g., by acetylation, methylation, hydroxylation etc., including, for example, 1-methyladenosine, 1-methylguanosine, 1-methylinosine, 2,2-dimethylguanosine, 2,6-diaminopurine, 2'-amino-2'-deoxyadenosine, 2'-amino-2 '-deoxycytidine, 2'-amino-2'-deoxyguanosine, 2'-amino-2'-deoxyuridine, 2-amino-6-chloropurine riboside, 2-aminopurine riboside, 2'-araadenosine, 2'-aracitidine, 2'-arauridine , 2'-azido-2'-deoxyadenosine, 2'-azido-2'-deoxycytidine, 2'-azido-2'-deoxyguanosine, 2'-azido-2'-deoxyuridine, 2-chloradenosine, 2'-fluoro- 2'-deoxyadenosine, 2'-fluoro-2'-deoxycytidine, 2'-fluoro-2'-deoxyguanosine, 2'-fluoro-2'-deoxyuridine, 2'-fluorothymidine, 2-methyladenosine, 2-methylguanosine, 2- methylthio-N6-isopenenyladenosine, 2'-O-methyl-2-aminoadenosine, 2'-O -methyl-2'-deoxyadenosine, 2'-O-methyl-2'-deoxycytidine, 2'-O-methyl-2'-deoxyguanosine, 2'-O-methyl-2'-deoxyuridine, 2'-O-methyl -5-methyluridine, 2'-O-methylinosine, 2'-O-methylpseudouridine, 2-thiocytidine, 2-thiocytosine, 3-methylcytosine, 4-acetylcytosine, 4-thiouridine, 5-(carboxyhydroxymethyl)uracil, 5,6- dihydrouridine, 5-aminoallylcytidine, 5-aminoallyldeoxyuridine, 5-bromuridine, 5-carboxymethylaminomethyl-2-thiouracil, 5-carboxymethylaminomethyluracil, 5-chloroaracytosine, 5-fluorouridine, 5-yoduridine, 5-methoxycarbonylmethyluridine, 5-methoxyuridine, 5-methyl -2-thiouridine, 6-azacytidine, 6-azauridine, 6-chloro-7-deazaguanosine, 6-chloropurinoribozide, 6-mercaptoguanosine, 6-methylmercaptopurine riboside, 7-deaza-2'-deoxyguanosine, 7-deazaadenosine, 7-methylguanosine, 8-azaadenosine, 8-broadenosine, 8-bromoguanosine, 8-mercaptorguanosine, 8-oxoguanosine, benzimidazole riboside, beta-D-mannosylqueosine, dihydrouracil, inosine, N1-methyladenosine, N6-([6-aminohexyl]carbamoylmethyl)adenosine, N6- isopentenyladenosine, N6-methyladenosine, N7- methylxanthosine, N-uracil-5-hydroxyacetic acid methyl ester, puromycin, queosin, uracil-5-hydroxyacetic acid, uracil-5-hydroxyacetic acid methyl ester, vibutoxosine, xanthosine, and xyladenosine. The preparation of such analogues is known to the person skilled in the art, for example, described in US 4373071, US 4401796, US 4415732, US 4458066, US 4500707, US 4668777, US 4973679, US 5047524, US 5132418, US 5153319, US 5262530 and 27 described above, most preferred analogs according to some embodiments of the invention may be those analogs that increase the protein expression of the encoded peptide or protein, or increase the immunogenicity of the artificial nucleic acid molecule of the invention, and/or do not interact with another introduced mRNA modification.
Согласно конкретному варианту осуществления изобретения мРНК в композиции, предлагаемой в настоящем изобретении, может содержать липидную модификацию.According to a specific embodiment of the invention, the mRNA in the composition of the present invention may contain a lipid modification.
В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит, предпочтительно в 5'→3'-направлении, следующие элементы:In a preferred embodiment of the invention, the artificial nucleic acid molecule contains, preferably in the 5'→3' direction, the following elements:
5'-UTR;5'-UTR;
по меньшей мере одну открытую рамку считывания (ОРС), где ОРС предпочтительно содержит по меньшей мере одну модификацию по сравнению с последовательностью дикого типа;at least one open reading frame (ORF), where the ORF preferably contains at least one modification compared to the wild-type sequence;
3'-UTR, происходящую из 3'-UTR рибосомального белка, предпочтительно из нуклеотидной последовательности, представленной в любой из SEQ ID NO: 10-115, более предпочтительно 3'-UTR RPS9, более предпочтительно 3'-UTR RPS9 человека;a 3'-UTR derived from a ribosomal protein 3'-UTR, preferably from the nucleotide sequence shown in any of SEQ ID NOs: 10-115, more preferably RPS9 3'-UTR, more preferably human RPS9 3'-UTR;
поли(А)-последовательность, предпочтительно содержащую 64 аденилата;poly(A)-sequence, preferably containing 64 adenylate;
поли(С)-последовательность, предпочтительно содержащую 30 цитидилатов;poly(C)-sequence, preferably containing 30 cytidylates;
гистоновую структуру типа «стебель-петля».histone stem-loop structure.
В другом предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит или состоит из нуклеотидной последовательности, представленной в SEQ ID NO: 7 (см. фиг.3) или комплементарной последовательности ДНК.In another preferred embodiment of the invention, the artificial nucleic acid molecule comprises or consists of the nucleotide sequence shown in SEQ ID NO: 7 (see FIG. 3) or a complementary DNA sequence.
В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, может содержать также одну или несколько описанных ниже модификаций:In the most preferred embodiment of the invention, the artificial nucleic acid molecule of the invention may also contain one or more of the following modifications:
Химические модификации:Chemical modifications:
В контексте настоящего описания понятие «модификация» применительно к искусственной молекуле нуклеиновой кислоты может относиться к химическим модификациям, включающим модификации каркаса, а также модификации сахара или модификации основания.In the context of the present description, the term "modification" in relation to an artificial nucleic acid molecule can refer to chemical modifications, including modifications of the backbone, as well as modifications of the sugar or modification of the base.
В этом контексте искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, представленная в настоящем описании, может содержать нуклеотидные аналоги/модификации, например, модификации каркаса, модификации сахара или модификации основания. Модификация каркаса согласно настоящему изобретению представляет собой модификацию, при которой химически модифицируют фосфаты каркаса нуклеотидов, содержащихся в молекуле нуклеиновой кислоты, представленной в настоящем описании. Модификация сахара согласно настоящему изобретению представляет собой химическую модификацию сахара нуклеотида в молекуле нуклеиновой кислоты, представленной в настоящем описании. Кроме того, модификация основания согласно настоящему изобретению представляет собой химическую модификацию основного фрагмента нуклеотидов в молекуле нуклеиновой кислоты. В этом контексте нуклеотидные аналоги или модификации предпочтительно выбирают из нуклеотидных аналогов, пригодных для транскрипции и/или трансляции.In this context, an artificial nucleic acid molecule, preferably an RNA molecule, as described herein, may contain nucleotide analogs/modifications, for example backbone modifications, sugar modifications, or base modifications. The backbone modification according to the present invention is a modification in which backbone phosphates of the nucleotides contained in the nucleic acid molecule described herein are chemically modified. A sugar modification according to the present invention is a chemical modification of the sugar of a nucleotide in a nucleic acid molecule as described herein. In addition, the modification of the base according to the present invention is a chemical modification of the main fragment of the nucleotides in the nucleic acid molecule. In this context, nucleotide analogs or modifications are preferably selected from nucleotide analogs suitable for transcription and/or translation.
Модификации сахара:Sugar modifications:
Модифицированные нуклеозиды и нуклеотиды, которые могут быть включены в искусственную молекулу нуклеиновой кислоты, предпочтительно РНК, представленную в настоящем описании, могут быть модифицированы в сахарном фрагменте. Например, 2'-гидроксигруппу (ОН) в молекуле РНК можно модифицировать или заменять многочисленными «окси»- или «дезокси»-заместителями. Примерами модификаций, включающих «окси»-2'-гидроксигруппы, являются (но, не ограничиваясь только ими) алкоксигруппы или арилоксигруппы (-OR, например, R=Н, алкил, циклоалкил, арил, аралкил, гетероарил или сахар); полиэтиленгликоли (PEG), -O(CH2CH2O)nCH2CH2OR; «замкнутые» нуклеиновые кислоты (LNA), в которых 2'-гидроксил присоединен, например, с помощью метиленового мостика к 4'-углероду в том же самом сахарном фрагменте, представляющем собой рибозу; и аминогруппы (-О-аминогруппы, в которых аминогруппа, например, NRR, может представлять собой алкиламиногруппу, диалкиламиногруппу, гетероциклил, ариламиногруппу, диариламиногруппу, гетероариламиногруппу или дигетероариламиногруппу, этилендиамин, полиаминогруппу) или алкоксигруппу.Modified nucleosides and nucleotides that can be included in an artificial nucleic acid molecule, preferably RNA, as described herein, can be modified in the sugar moiety. For example, the 2'-hydroxy group (OH) in an RNA molecule can be modified or replaced by numerous "oxy" or "deoxy" substituents. Examples of modifications that include "oxy"-2'-hydroxy groups are (but not limited to) alkoxy or aryloxy groups (-OR, for example, R=H, alkyl, cycloalkyl, aryl, aralkyl, heteroaryl, or sugar); polyethylene glycols (PEG), -O(CH 2 CH 2 O) n CH 2 CH 2 OR; "closed" nucleic acids (LNA), in which the 2'-hydroxyl is attached, for example, via a methylene bridge to the 4'-carbon in the same ribose sugar moiety; and amino groups (-O-amino groups, in which the amino group, for example, NRR, may be an alkylamino group, a dialkylamino group, a heterocyclyl, an arylamino group, a diarylamino group, a heteroarylamino group or a diheteroarylamino group, an ethylenediamine, a polyamino group) or an alkoxy group.
«Дезокси»-модификация включает водород, аминогруппу (например, NH2; алкиламиногруппу, диалкиламиногруппу, гетероциклил, ариламиногруппу, диариламиногруппу, гетероариламиногруппу, дигетероариламиногруппу или аминокислоту); или аминогруппу можно присоединять к сахару через линкер, где линкер содержит один или несколько атомов С, N и О.The "deoxy" modification includes hydrogen, an amino group (eg, NH 2 ; an alkylamino group, a dialkylamino group, a heterocyclyl, an arylamino group, a diarylamino group, a heteroarylamino group, a diheteroarylamino group, or an amino acid); or an amino group can be attached to the sugar through a linker, where the linker contains one or more C, N and O atoms.
Сахарная группа может содержать также один или несколько атомов углерода, которые могут находиться в стереохимической конфигурации, отличной от конфигурации соответствующего атома углерода в рибозе. Так, модифицированная молекула нуклеиновой кислоты может включать, например, в качестве сахара арабинозу.The sugar group may also contain one or more carbon atoms, which may be in a stereochemical configuration different from that of the corresponding carbon atom in the ribose. Thus, the modified nucleic acid molecule may include, for example, arabinose as a sugar.
Модификации каркаса:Frame mods:
Можно модифицировать также фосфатный каркас в модифицированных нуклеозидах и нуклеотидах, которые могут быть встроены в искусственную молекулу нуклеиновой кислоты, предпочтительно РНК, представленную в настоящем описании. Фосфатные группы в каркасе можно модифицировать посредством замены одного или нескольких атомов кислорода на различные заместители. Кроме того, в модифицированных нуклеозидах и нуклеотидах немодифицированный фосфатный фрагмент может быть полностью заменен на модифицированный фосфат, представленный в настоящем описании. Примеры модифицированных фосфатных групп включают (но, не ограничиваясь только ими) фосфоротиоаты, фосфороселенаты, боранофосфаты, сложные боранофосфатные эфиры, первичные фосфонаты, фосфороамидаты, алкил- или арилфосфонаты и сложные фосфотриэфиры. В фосфородитиоатах оба несвязывающих атома кислорода заменены серой. Фосфатный линкер также можно модифицировать путем замены связывающего атома кислорода на азот (мостиковые фосфороамидаты), серу (мостиковые фосфоротиоаты) и углерод (мостиковые метиленфосфонаты).It is also possible to modify the phosphate backbone in modified nucleosides and nucleotides, which can be inserted into an artificial nucleic acid molecule, preferably RNA, as described herein. Phosphate groups in the framework can be modified by replacing one or more oxygen atoms with various substituents. In addition, in modified nucleosides and nucleotides, the unmodified phosphate moiety can be completely replaced by a modified phosphate as described herein. Examples of modified phosphate groups include, but are not limited to, phosphorothioates, phosphoroselenates, boranophosphates, boranophosphate esters, primary phosphonates, phosphoramidates, alkyl or aryl phosphonates, and phosphotriesters. In phosphorodithioates, both non-bonding oxygen atoms are replaced by sulfur. The phosphate linker can also be modified by replacing the bonding oxygen atom with nitrogen (bridged phosphoroamidates), sulfur (bridged phosphorothioates), and carbon (bridged methylenephosphonates).
Модификации основания:Base modifications:
Модифицированные нуклеозиды и нуклеотиды, которые можно встраивать в искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, представленную в настоящем описании, можно модифицировать также в фрагменте, представляющем собой нуклеооснование. Примерами нуклеооснований, входящих в РНК, являются (но, не ограничиваясь только ими) аденин, гуанин, цитозин и урацил. Например, нуклеозиды и нуклеотиды, представленные в настоящем описании, можно химически модифицировать на поверхности большой бороздки. В некоторых вариантах осуществления изобретения химические модификации главной бороздки включают аминогруппу, тиольную групп алкильную группу или галогруппу.Modified nucleosides and nucleotides that can be inserted into an artificial nucleic acid molecule, preferably an RNA molecule as described herein, can also be modified in a nucleobase moiety. Examples of nucleobases included in RNA are (but not limited to) adenine, guanine, cytosine and uracil. For example, the nucleosides and nucleotides provided herein can be chemically modified on the surface of the major groove. In some embodiments, the major groove chemical modifications include an amino group, a thiol group, an alkyl group, or a halo group.
В наиболее предпочтительных вариантах осуществления настоящего изобретения нуклеотидные аналоги/модификации выбирают из модификаций основания, которые предпочтительно выбирают из 2-амино-6-хлорпуринрибозид-5'-трифосфат, 2-аминоаденозин-5'-трифосфат, 2-тиоцитидин-5'-трифосфат, 2-тиоуридин-5'-трифосфат, 4-тиоуридин-5'-трифосфат, 5-аминоаллилцитидин-5'-трифосфат, 5-аминоаллилуридин-5'-трифосфат, 5-бромцитидин-5'-трифосфат, 5-бромуридин-5'-трифосфат, 5-йодцитидин-5'-трифосфат, 5-йодуридин-5'-трифосфат, 5-метилцитидин-5'-трифосфат, 5-метилуридин-5'-трифосфат, 6-азацитидин-5'-трифосфат, 6-азауридин-5'-трифосфат, 6-хлорпуринрибозид-5'-трифосфат, 7-деазааденозин-5'-трифосфат, 7-деазагуанозин-5'-трифосфат, 8-азааденозин-5'-трифосфат, 8-азидоаденозин-5'-трифосфат, бензимидазолрибозид-5'-трифосфат, N1-метиладенозин-5'-трифосфат, N1-метилгуанозин-5'-трифосфат, N6-метиладенозин-5'-трифосфат, О6-метилгуанозин-5'-трифосфат, псевдоуридин-5'-трифосфат или пуромицин-5'-трифосфат, ксантозин-5'-трифосфат. Наиболее предпочтительные нуклеотиды для модификаций оснований выбирают из группы нуклеотидов с модифицированными основаниями, включающей 5-метилцитидин-5'-трифосфат, 7-деазагуанозин-5'-трифосфат, 5-бромцитидин-5'-трифосфат и псевдоуридин-5'-трифосфат.In the most preferred embodiments of the present invention, the nucleotide analogs/modifications are selected from base modifications, which are preferably selected from 2-amino-6-chloropurine riboside-5'-triphosphate, 2-aminoadenosine-5'-triphosphate, 2-thiocytidine-5'-triphosphate , 2-thiouridine-5'-triphosphate, 4-thiouridine-5'-triphosphate, 5-aminoallylcytidine-5'-triphosphate, 5-aminoallyluridine-5'-triphosphate, 5-bromocytidine-5'-triphosphate, 5-bromouridine- 5'-triphosphate, 5-iodcytidine-5'-triphosphate, 5-ioduridine-5'-triphosphate, 5-methylcytidine-5'-triphosphate, 5-methyluridine-5'-triphosphate, 6-azacytidine-5'-triphosphate, 6-azauridine-5'-triphosphate, 6-chloropurine riboside-5'-triphosphate, 7-deazaadenosine-5'-triphosphate, 7-deazaguanosine-5'-triphosphate, 8-azaadenosine-5'-triphosphate, 8-azidoadenosine-5 '-triphosphate, benzimidazole riboside-5'-triphosphate, N1-methyladenosine-5'-triphosphate, N1-methylguanosine-5'-triphosphate, N6-methyladenosine-5'-triphosphate, O6-methylguanosine-5'-triphosphate, pseudouridine-5 '-triphosphate or puromycin-5'-triphosphate, xanthosine-5'-triphosphate. The most preferred nucleotides for base modifications are selected from the group of base-modified nucleotides including 5-methylcytidine-5'-triphosphate, 7-deazaguanosine-5'-triphosphate, 5-bromocytidine-5'-triphosphate, and pseudouridine-5'-triphosphate.
В некоторых вариантах осуществления изобретения модифицированные нуклеозиды включают пиридин-4-оновый рибонуклеозид, 5-азауридин, 2-тио-5-азауридин, 2-тиоуридин, 4-тиопсевдоуридин, 2-тиопсевдоуридин, 5-гидроксиуридин,3-метилуридин, 5-карбоксиметилуридин,1-карбоксиметилпсевдоуридин, 5-пропинилуридин, 1-пропинилпсевдоуридин, 5-тауринометилуридин, 1-тауринометилпсевдоуридин, 5-тауринометил-2-тиоуридин, 1-тауринометил-4-тиоуридин, 5-метилуридин, 1-метилпсевдоуридин, 4-тио-1-метилпсевдоуридин, 2-тио- 1-метилпсевдоуридин, 1-метил-1-деазапсевдоуридин, 2-тио-1-метил-1-деазапсевдоуридин, дигидроуридин, дигидропсевдоуридин, 2-тиодигидроуридин, 2-тиодигидропсевдоуридин, 2-метоксиуридин, 2-метокси-4-тиоуридин, 4-метоксипсевдоуридин и 4-метокси-2-тиопсевдоуридин.In some embodiments, the modified nucleosides include pyridin-4-one ribonucleoside, 5-azauridine, 2-thio-5-azauridine, 2-thiouridine, 4-thiopseudouridine, 2-thiopseudouridine, 5-hydroxyuridine, 3-methyluridine, 5-carboxymethyluridine ,1-carboxymethylpseudouridine, 5-propynyluridine, 1-propynylpseudouridine, 5-taurinomethyluridine, 1-taurinomethylpseudouridine, 5-taurinomethyl-2-thiouridine, 1-taurinomethyl-4-thiouridine, 5-methyluridine, 1-methylpseudouridine, 4-thio-1 -methylpseudouridine, 2-thio-1-methylpseudouridine, 1-methyl-1-deazapseudouridine, 2-thio-1-methyl-1-deazapseudouridine, dihydrouridine, dihydropseudouridine, 2-thiodihydrouridine, 2-thiodihydropseudouridine, 2-methoxyuridine, 2-methoxy -4-thiouridine, 4-methoxypseudouridine and 4-methoxy-2-thiopseudouridine.
В некоторых вариантах осуществления изобретения модифицированные нуклеозиды включают 5-азацитидин, псевдоизоцитидин, 3-метилцитидин, N4-ацетилцитидин, 5-формилцитидин, N4-метилцитидин, 5-гидроксиметилцитидин, 1-метилпсевдоизоцитидин, пирролоцитидин, пирролопсевдоизоцитидин, 2-тиоцитидин, 2-тио-5-метилцитидин, 4-тиопсевдоизоцитидин, 4-тио-1-метилпсевдоизоцитидин, 4-тио-1-метил-1-деазапсевдоизоцитидин, 1-метил-1-деазапсевдоизоцитидин, зебуларин, 5-азазебуларин, 5-метилзебуларин, 5-аза-2-тиозебуларин, 2-тиозебуларин, 2-метоксицитидин, 2-метокси-5-метилцитидин, 4-метоксипсевдоизоцитидин и 4-метокси-1-метилпсевдоизоцитидин.In some embodiments, the modified nucleosides include 5-azacytidine, pseudoisocytidine, 3-methylcytidine, N4-acetylcytidine, 5-formylcytidine, N4-methylcytidine, 5-hydroxymethylcytidine, 1-methylpseudoisocytidine, pyrrolocytidine, pyrrolopseudoisocytidine, 2-thiocytidine, 2-thio- 5-methylcytidine, 4-thiopseudisocytidine, 4-thio-1-methylpseudoisocytidine, 4-thio-1-methyl-1-deazapseudoisocytidine, 1-methyl-1-deazapseudoisocytidine, zebularine, 5-azazebularine, 5-methylzebularine, 5-aza- 2-thiozebularine, 2-thiosebularine, 2-methoxycytidine, 2-methoxy-5-methylcytidine, 4-methoxypseudoisocytidine and 4-methoxy-1-methylpseudoisocytidine.
В других вариантах осуществления изобретения модифицированные нуклеозиды включают 2-аминопурин, 2, 6-диаминопурин, 7-деазааденин, 7-деаза-8-азааденин, 7-деаза-2-аминопурин, 7-деаза-8-аза-2-аминопурин, 7-деаза-2,6-диаминопурин, 7-деаза-8-аза-2,6-диаминопурин, 1-метиладенозин, N6-метиладенозин, N6-изопентениладенозин, N6-(цис-гидроксиизопентенил)аденозин, 2-метилтио-N6-(цис-гидроксиизопентенил) аденозин, N6-глицинилкарбомоиладенозин, N6-треонилкарбамоиладенозин, 2-метилтио-N6-треонилкарбамоиладенозин, N6,N6-диметиладенозин, 7-метиладенин, 2-метилтиоаденин и 2-метоксиаденин.In other embodiments, the modified nucleosides include 2-aminopurine, 2,6-diaminopurine, 7-deazaadenine, 7-deaza-8-azaadenine, 7-deaza-2-aminopurine, 7-deaza-8-aza-2-aminopurine, 7-deaza-2,6-diaminopurine, 7-deaza-8-aza-2,6-diaminopurine, 1-methyladenosine, N6-methyladenosine, N6-isopentenyladenosine, N6-(cis-hydroxyisopentenyl)adenosine, 2-methylthio-N6 -(cis-hydroxyisopentenyl)adenosine, N6-glycinylcarbamoyladenosine, N6-threonylcarbamoyladenosine, 2-methylthio-N6-threonylcarbamoyladenosine, N6,N6-dimethyladenosine, 7-methyladenine, 2-methylthioadenine and 2-methoxyadenine.
В других вариантах осуществления изобретения модифицированные нуклеозиды включают инозин, 1-метилинозин, виозин, вибутозин, 7-деазагуанозин, 7-деаза-8-азагуанозин, 6-тиогуанозин, 6-тио-7-деазагуанозин, 6-тио-7-деаза-8-азагуанозин, 7-метилгуанозин, 6-тио-7-метилгуанозин, 7-метилинозин, 6-метоксигуанозин, 1-метилгуанозин, N2-метилгуанозин, N2,N2-диметилгуанозин, 8-оксогуанозин, 7-метил-8-оксогуанозин, 1-метил-6-тиогуанозин, N2-метил-6-тиогуанозин и N2,N2-диметил-6-тиогуанозин.In other embodiments, the modified nucleosides include inosine, 1-methylinosine, viosin, vibutosin, 7-deazaguanosine, 7-deaza-8-azaguanosine, 6-thioguanosine, 6-thio-7-deazaguanosine, 6-thio-7-deaza- 8-azaguanosine, 7-methylguanosine, 6-thio-7-methylguanosine, 7-methylinosine, 6-methoxyguanosine, 1-methylguanosine, N2-methylguanosine, N2,N2-dimethylguanosine, 8-oxoguanosine, 7-methyl-8-oxoguanosine, 1-methyl-6-thioguanosine, N2-methyl-6-thioguanosine and N2,N2-dimethyl-6-thioguanosine.
В некоторых вариантах осуществления изобретения нуклеотид можно модифицировать на поверхности главной бороздки и модификация может включать замену атома водорода на С-5 урацила метальной группой или галогруппой.In some embodiments, the nucleotide may be modified at the surface of the major groove, and the modification may include replacing the hydrogen atom on the C-5 uracil with a methyl group or a halo group.
В конкретных вариантах осуществления изобретения модифицированный нуклеозид представляет собой 5'-O-(1-тиофосфат)-аденозин, 5'-O-(1-тиофосфат)-цитидин, 5'-O-(1-тиофосфат)-гуанозин, 5'-O-(1-тиофосфат)-уридин или 5'-O-(1-тиофосфат)-псевдоуридин.In specific embodiments, the modified nucleoside is 5'-O-(1-thiophosphate)-adenosine, 5'-O-(1-thiophosphate)-cytidine, 5'-O-(1-thiophosphate)-guanosine, 5' -O-(1-thiophosphate)-uridine or 5'-O-(1-thiophosphate)-pseudouridine.
В других конкретных вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, может содержать нуклеозидные модификации, выбранные из 6-азацитидина, 2-тиоцитидина, альфа-тиоцитидина, псевдоизоцитидина, 5-аминоаллилуридина, 5-йодуридина, N1-метилпсевдоуридина, 5,6-дигидроуридина, альфа-тиоуридина, 4-тиоуридина, 6-азауридина, 5-гидроксиуридина, дезокситимидина, 5-метилуридина, пирролоцитидина, инозина, альфа-тиогуанозина, 6-метилгуанозина, 5-метилцитидина, 8-оксогуанозина, 7-деазагуанозина, N1-метиладенозина, 2-амино-6-хлорпурина, N6-метил-2-аминопурина, псевдоизоцитидина, 6-хлорпурина, N6-метиладенозин, альфа-тиоаденозина, 8-азидоаденозина, 7-деазааденозина.In other specific embodiments, the artificial nucleic acid molecule, preferably an RNA molecule, may contain nucleoside modifications selected from 6-azacytidine, 2-thiocytidine, alpha-thiocytidine, pseudoisocytidine, 5-aminoallyluridine, 5-yoduridine, N1-methylpseudouridine, 5, 6-dihydrouridine, alpha-thiouridine, 4-thiouridine, 6-azauridine, 5-hydroxyuridine, deoxythymidine, 5-methyluridine, pyrrolocytidine, inosine, alpha-thioguanosine, 6-methylguanosine, 5-methylcytidine, 8-oxoguanosine, 7-deazaguanosine, N1-methyladenosine, 2-amino-6-chloropurine, N6-methyl-2-aminopurine, pseudoisocytidine, 6-chloropurine, N6-methyladenosine, alpha-thioadenosine, 8-azidoadenosine, 7-deazaadenosine.
Липидная модификация:Lipid modification:
Согласно следующему варианту осуществления изобретения искусственная молекула нуклеиновой кислоты, предпочтительно РНК, представленная в настоящем описании, может содержать липидную модификацию. Такая модифицированная липидами РНК, как правило, содержит РНК, представленную в настоящем описании. Такая модифицированная липидами молекула РНК, представленная в настоящем описании, как правило, дополнительно содержит по меньшей мере один линкер, ковалентно связанный с указанной молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером. Альтернативно этому, модифицированная липидами молекула РНК содержит (по меньшей мере одну) молекулу РНК, указанную в настоящем описании, и по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с указанной молекулой РНК. Согласно третьей альтернативе модифицированная липидами молекула РНК содержит искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, указанную в настоящем описании, по меньшей мере один линкер, ковалентно связанный с указанной молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером, и также по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с указанной мРНК. В этом контексте наиболее предпочтительно липидную модификацию осуществляют на концах линейной последовательности РНК.According to a further embodiment of the invention, the artificial nucleic acid molecule, preferably RNA, provided herein may contain a lipid modification. Such lipid-modified RNA typically contains the RNA described herein. Such a lipid-modified RNA molecule as described herein typically further comprises at least one linker covalently linked to said RNA molecule and at least one lipid covalently linked to the corresponding linker. Alternatively, a lipid-modified RNA molecule comprises (at least one) an RNA molecule as defined herein and at least one (bifunctional) lipid covalently linked (without a linker) to said RNA molecule. In a third alternative, the lipid-modified RNA molecule comprises an artificial nucleic acid molecule, preferably an RNA molecule, as defined herein, at least one linker covalently linked to said RNA molecule, and at least one lipid covalently linked to a corresponding linker, and also at least one (bifunctional) lipid covalently linked (without a linker) to said mRNA. In this context, most preferably the lipid modification is carried out at the ends of the linear RNA sequence.
Модификация 5'-конца модифицированной РНК:Modification of the 5'-end of the modified RNA:
Согласно другому предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, представленную в настоящем описании, можно модифицировать путем добавления так называемой «5'-кэп»-структуры.According to another preferred embodiment of the invention, the artificial nucleic acid molecule, preferably the RNA molecule described herein, can be modified by adding a so-called "5'-cap" structure.
5'-кэп представляет собой структуру, как правило, структуру, состоящую из модифицированных нуклеотидов, которая, как правило, завершает («кэпирует») 5'-конец зрелой мРНК. 5'-кэп, как правило, может быть сформирован модифицированным нуклеотидом, прежде всего производным гуанинового нуклеотида. Предпочтительно 5'-кэп связывают с 5'-концом с помощью 5'-5'-трифосфатной связи. 5'-кэп может быть метилирован, например, m7GpppN), где N представляет собой концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, как правило, 5'-конец РНК. m7GpppN представляет собой 5'-кэп-структуру, которая встречается в естественных условиях в мРНК транскрибируемой полимеразой II, и, следовательно, не рассматривается как модификация, содержащаяся в модифицированной РНК, предлагаемой в изобретении. Это означает, что искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, предлагаемая в настоящем изобретении, может содержать m7GpppN в качестве 5'-кэпа, но при этом дополнительно искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, содержит по меньшей мере одну дополнительную модификацию, представленную в настоящем описании.A 5' cap is a structure, typically a modified nucleotide structure, that typically terminates ("caps") the 5' end of a mature mRNA. The 5' cap can generally be formed by a modified nucleotide, primarily a derivative of a guanine nucleotide. Preferably, the 5' cap is linked to the 5' end via a 5'-5' triphosphate bond. The 5' cap may be methylated, eg m7GpppN), where N is the 5' terminal nucleotide of the nucleic acid bearing the 5' cap, typically the 5' end of the RNA. m7GpppN is a 5' cap structure that occurs naturally in mRNA transcribed by polymerase II and is therefore not considered as a modification contained in the modified RNA of the invention. This means that an artificial nucleic acid molecule, preferably an RNA molecule, according to the present invention may contain m7GpppN as a 5'-cap, but additionally, an artificial nucleic acid molecule, preferably an RNA molecule, contains at least one additional modification represented by in this description.
Другими примерами 5'-кэп-структур являются глицерил, инвертированная дезоксигруппа (фрагмент), лишенная азотистого основания, 4',5'-метиленовой нуклеотид, 1-(бета-D-эритрофуранозильный) нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, нуклеотид с модифицированным основанием, треопентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный лишенный азотистого основания фрагмент, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный лишенный азотистого основания фрагмент, 1,4-бутандиолфосфатный, 3'-фосфороамидатный, гексилфосфатный, аминогексилфосфатный, 3'-фосфатный, 3'-фосфоротиоатный, фосфородитиоатный или связанный мостиком или несвязанный мостиком метилфосфонатный фрагмент. Эти модифицированные 5'-кэп-структуры рассматриваются в качестве по меньшей мере одной модификации, содержащейся в искусственной молекуле нуклеиновой кислоты, предпочтительно в молекуле РНК, предлагаемой в настоящем изобретении.Other examples of 5'-cap structures are glyceryl, inverted deoxy group (fragment) devoid of a nitrogenous base, 4',5'-methylene nucleotide, 1-(beta-D-erythrofuranosyl) nucleotide, 4'-thionucleotide, carbocyclic nucleotide, 1 ,5-anhydrohexitol nucleotide, L-nucleotides, alpha-nucleotide, base-modified nucleotide, treopentofuranosyl nucleotide, acyclic 3',4'-seconucleotide, acyclic 3,4-dihydroxybutyl nucleotide, acyclic 3,5-dihydroxypentyl nucleotide, 3'- 3'-inverted nucleotide fragment, 3'-3'-inverted baseless fragment, 3'-2'-inverted nucleotide fragment, 3'-2'-inverted baseless fragment, 1,4-butanediolphosphate, 3'- a phosphoramidate, hexylphosphate, aminohexylphosphate, 3'-phosphate, 3'-phosphorothioate, phosphorodithioate or bridged or unbridged methylphosphonate moiety. These modified 5' cap structures are considered to be at least one modification contained in an artificial nucleic acid molecule, preferably an RNA molecule, according to the present invention.
Наиболее предпочтительными модифицированными 5'-кэп-структурами являются САР1 (метилирование рибозы соседнего с m7GpppN нуклеотида), САР2 (метилирование рибозы 2-ого нуклеотида, расположенного в прямом направлении относительно m7GpppN), САР3 (метилирование рибозы 3-его нуклеотида, расположенного в прямом направлении относительное m7GpppN), САР4 (метилирование рибозы 4-ого нуклеотида, расположенного в прямом направлении относительно m7GpppN), ARCA (аналог кэп-структуры с правильной ориентацией, модифицированный ARCA (например, модифицированный фосфотиоатом ARCA), инозин, N1-метилгуанозин, 2'-фторгуанозин, 7-деазагуанозин, 8-оксогуанозин, 2-аминогуанозин, ЗНК-гуанозин и 2-азидогуанозин.The most preferred modified 5'-cap structures are CAP1 (ribose methylation of the nucleotide adjacent to m7GpppN), CAP2 (methylation of the 2nd nucleotide ribose upstream of m7GpppN), CAP3 (methylation of the 3rd nucleotide ribose upstream of m7GpppN). relative m7GpppN), CAP4 (methylation of the ribose of the 4th nucleotide located in the forward direction relative to m7GpppN), ARCA (correctly oriented cap analog modified by ARCA (for example, modified by ARCA phosphothioate), inosine, N1-methylguanosine, 2'- fluoroguanosine, 7-deazaguanosine, 8-oxoguanosine, 2-aminoguanosine, LNA-guanosine and 2-azidoguanosine.
В предпочтительном варианте осуществления изобретения по меньшей мере одна открытая рамка считывания кодирует терапевтический белок или пептид. В другом варианте осуществления изобретения по меньшей мере одной открытой рамкой считывания кодируется антиген, такой как патогенный антиген, опухолевый антиген, аллергенный антиген или аутоиммунный антиген. Таким образом, введение искусственной молекулы нуклеиновой кислоты, кодирующей антиген, применяют в подходе, заключающемся в генетической вакцинации против заболевания, в котором участвует указанный антиген.In a preferred embodiment of the invention, at least one open reading frame encodes a therapeutic protein or peptide. In another embodiment, the at least one open reading frame encodes an antigen, such as a pathogenic antigen, a tumor antigen, an allergenic antigen, or an autoimmune antigen. Thus, the introduction of an artificial nucleic acid molecule encoding an antigen is used in the approach of genetic vaccination against a disease in which said antigen is involved.
В альтернативном варианте осуществления изобретения по меньшей мере одной открытой рамкой считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, кодируется антитело.In an alternative embodiment of the invention, at least one open reading frame of an artificial nucleic acid molecule of the invention encodes an antibody.
Антигены:Antigens:
Патогенные антигены:Pathogenic antigens:
Искусственная молекула нуклеиновой кислоты, предлагаемой в настоящем изобретении, может кодировать белок или пептид, который содержит патогенный антиген или его фрагмент, вариант или производное. Такие патогенные антигены происходят из патогенных организмов, прежде всего, бактерий, вирусов или простейших (многоклеточных) патогенных организмов, которые вызывают иммунологическую реакцию у индивидуума, прежде всего у млекопитающего, более предпочтительно у человека. Более конкретно, патогенные антигены предпочтительно представляют собой поверхностные антигены, например, белки (или фрагменты белков, например, находящуюся снаружи часть поверхностного антигена), локализованные на поверхности вируса или бактерии или простейшего.The artificial nucleic acid molecule of the present invention may encode a protein or peptide that contains a pathogenic antigen or fragment, variant or derivative thereof. Such pathogenic antigens are derived from pathogenic organisms, primarily bacteria, viruses or protozoan (multicellular) pathogenic organisms, which elicit an immunological response in an individual, primarily a mammal, more preferably a human. More specifically, pathogenic antigens are preferably surface antigens, eg proteins (or fragments of proteins, eg the exposed portion of a surface antigen) located on the surface of a virus or bacterium or protozoan.
Патогенные антигены представляют собой пептидные или белковые антигены, предпочтительно происходящие из патогенов, ассоциированных с инфекционным заболеванием, которые предпочтительно выбирают из антигенов, происходящих из патогенов Acinetobacter baumannii, рода Anaplasma, Anaplasma phagocytophilum, Ancylostoma braziliense, Ancylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, рода Aspergillus, Astroviridae, рода Babesia, Bacillus anthracis, Bacillus cereus, Bartonella henselae, вируса BK, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, рода Borrelia, Borrelia spp, рода Brucella, Brugia malayi, семейства Bunyaviridae, Burkholderia cepacia и других видов Burkholderia, Burkholderia mallei, Burkholderia pseudomallei, семейства Caliciviridae, рода Campylobacter, Candida albicans, Candida spp, Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, приона CJD, Clonorchis sinensis, Clostridium botulinum, Clostridium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp, Clostridium tetani, Coccidioides spp, коронавирусов, Corynebacterium diphtheriae, Coxiella burnetii, вируса геморрагической лихорадки Крым-Конго, Cryptococcus neoformans, рода Cryptosporidium, Cytomegalovirus (CMV), вирусов Денге (DEN-1, DEN-2, DEN-3 и DEN-4), Dientamoeba fragilis, вируса Эбола (EBOV), рода Echinococcus, Ehrlichia chaffeensis, Ehrlichia ewingii, рода Ehrlichia, Entamoeba histolytica, рода Enterococcus, рода Enterovirus, энтеровирусов, прежде всего вируса Коксаки А и энтеровируса 71 (EV71), Epidermophyton spp, вируса Эпштейна-Барра (EBV), Escherichia coli O157:Н7, О111 и О104:Н4, Fasciola hepatica и Fasciola gigantica, приона FFI, суперсемейства Filarioidea, флавивирусов, Francisella tularensis, рода Fusobacterium, Geotrichum candidum, Giardia intestinalis, Gnathostoma spp, приона GSS, вируса Гуанарито, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, генипавируса (вирус Гендра и вирус Нипа), вируса гепатита А, вируса гепатита В (HBV), вируса гепатита С (HCV), вируса гепатита D, вируса гепатита, вируса герпеса простого 1 и 2 (HSV-1 и HSV-2), Histoplasma capsulatum, HIV (вирус иммунодефицита человека), Hortaea werneckii, человеческого бокавируса (HBoV), человеческого вируса герпеса 6 (HHV-6) и человеческого вируса герпеса 7 (HHV-7), человеческого вируса метапенвмонии (hMPV), вируса папилломы человека (HPV), человеческих вирусов парагриппа (HPIV), вируса японского энцефалита, вируса JC, вируса Джунин, Kingella kingae, Klebsiella granulomatis, приона Куру, вируса Ласса, Legionella pneumophila, рода Leishmania, рода Leptospira, Listeria monocytogenes, вируса лимфоцитарного хориоменингита (LCMV), вируса Мачупо, Malassezia spp, вируса Марбурга, вируса кори, Metagonimus yokagawai, Microsporidia phylum, вируса контагиозного моллюска (MCV), вируса паротита, Mycobacterium leprae и Mycobacterium lepromatosis, Mycobacterium tuberculosis, Mycobacterium ulcerans, Mycoplasma pneumoniae, Naegleria fowleri, Necator americanus, Neisseria gonorrhoeae, Neisseria meningitidis, Nocardia asteroides, Nocardia spp, Onchocerca volvulus, Orientia tsutsugamushi, семейства Orthomyxoviridae (грипп), Paracoccidioides brasiliensis, Paragonimus spp, Paragonimus westermani, парвовируса B19, рода Pasteurella, рода Plasmodium, Pneumocystis jirovecii, полиовируса, вируса бешенства, респираторно-синтициального вируса (RSV), риновируса, риновирусов, Rickettsia akari, рода Rickettsia, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, вируса долины Рифта, ротавируса, вируса краснухи, вируса Сабиа, рода Salmonella, Sarcoptes scabiei, коронавируса SARS, рода Schistosoma, рода Shigella, вируса Син Номбре, хантавируса, Sporothrix schenckii, рода Staphylococcus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stercoralis, рода Taenia, Taenia solium, вируса клещевого энцефалита (TBEV), Toxocara canis или Toxocara cati, Toxoplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp, Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, вируса ветряной оспы (VZV), Variola major или Variola minor, приона vCJD, вируса венесуэльского энцефалита лошадей, Vibrio cholerae, вируса Западного Нила, вируса западного энцефалита лошадей, Wuchereria bancrofti, вируса желтой лихорадки, Yersinia enterocolitica, Yersinia pestis и Yersinia pseudotuberculosis.Pathogenic antigens are peptide or protein antigens, preferably derived from pathogens associated with an infectious disease, which are preferably selected from antigens derived from pathogens Acinetobacter baumannii, genus Anaplasma, Anaplasma phagocytophilum, Ancylostoma braziliense, Ancylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, genus Aspergillus, Astroviridae, Babesia genus, Bacillus anthracis, Bacillus cereus, Bartonella henselae, BK virus, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, Borrelia genus, Borrelia spp, Brucella genus, Brugia malayi, Bunyaviridae family, Burkholderia cepacia and others Burkholderia species, Burkholderia mallei, Burkholderia pseudomallei, Caliciviridae family, Campylobacter genus, Candida albicans, Candida spp, Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, CJD prion, Clonorchis sinensis, Clostridium botulinum, Clostr idium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp, Clostridium tetani, Coccidioides spp, coronaviruses, Corynebacterium diphtheriae, Coxiella burnetii, Crimean Congo hemorrhagic fever virus, Cryptococcus neoformans, Cryptosporidium genus, Cytomegalovirus (CMV), Dengue viruses (DEN-1) , DEN-2, DEN-3 and DEN-4), Dientamoeba fragilis, Ebola virus (EBOV), Echinococcus genus, Ehrlichia chaffeensis, Ehrlichia ewingii, Ehrlichia genus, Entamoeba histolytica, Enterococcus genus, Enterovirus genus, enteroviruses, especially Coxsackievirus A and enterovirus 71 (EV71), Epidermophyton spp, Epstein-Barr virus (EBV), Escherichia coli O157:H7, O111 and O104:H4, Fasciola hepatica and Fasciola gigantica, prion FFI, superfamily Filarioidea, flaviviruses, Francisella tularensis, genus Fusobacterium , Geotrichum candidum, Giardia intestinalis, Gnathostoma spp, GSS prion, Guanarito virus, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, genipavirus (virus Gendra and Nipah virus), hepatitis A virus, hepatitis B virus (HBV), hepatitis C virus (HCV), hepatitis D virus, hepatitis virus, herpes simplex virus 1 and 2 (HSV-1 and HSV-2), Histoplasma capsulatum, HIV (human immunodeficiency virus), Hortaea werneckii, human bocavirus (HBoV), human herpes virus 6 (HHV-6) and human herpes virus 7 (HHV-7), human metapenummonia virus (hMPV), human papillomavirus (HPV), human parainfluenza viruses (HPIV), Japanese encephalitis virus, JC virus, Junin virus, Kingella kingae, Klebsiella granulomatis, Kuru prion, Lassa virus, Legionella pneumophila, Leishmania genus, Leptospira genus, Listeria monocytogenes, Lymphocytic choriomeningitis virus (LCMV), Machupo virus , Malassezia spp, Marburg virus, Measles virus, Metagonimus yokagawai, Microsporidia phylum, Molluscum contagiosum virus (MCV), Mumps virus, Mycobacterium leprae and Mycobacterium lepromatosis, Mycobacterium tuberculosis, Mycobacterium ulcerans, M ycoplasma pneumoniae Naegleria fowleri Necator americanus Neisseria gonorrhoeae Neisseria meningitidis Nocardia asteroides Nocardia spp , Pneumocystis jirovecii, poliovirus, rabies virus, respiratory syncytial virus (RSV), rhinovirus, rhinoviruses, Rickettsia akari, Rickettsia genus, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, Rift Valley virus, rotavirus, rubella virus, Sabia virus, Salmonella genus , Sarcoptes scabiei, SARS coronavirus, Schistosoma genus, Shigella genus, Sin Nombre virus, Hantavirus, Sporothrix schenckii, Staphylococcus genus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stercoralis, Taenia genus, Taenia solium, tick-borne encephalitis virus (TBEV), Toxocara canis or Toxocara cati, Tox oplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp, Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, varicella zoster virus (VZV), Variola major or Variola minor, prion vCJD, Venezuelan equine encephalitis virus, Vibrio cholerae , West Nile virus, Western equine encephalitis virus, Wuchereria bancrofti, yellow fever virus, Yersinia enterocolitica, Yersinia pestis and Yersinia pseudotuberculosis.
В этом контексте наиболее предпочтительными являются антигены из патогенов, выбранных из вируса гриппа, респираторно-синтициального вируса (RSV), вируса герпеса простого (HSV), вируса папилломы человека (HPV), вируса иммунодефицита человека (HIV), Plasmodium, Staphylococcus aureus, вируса Денге, Chlamydia trachomatis, цитомегаловируса (CMV), вируса гепатита В (HBV), Mycobacterium tuberculosis, вируса бешенства и вируса желтой лихорадки.In this context, antigens from pathogens selected from influenza virus, respiratory syncytial virus (RSV), herpes simplex virus (HSV), human papillomavirus (HPV), human immunodeficiency virus (HIV), Plasmodium, Staphylococcus aureus, virus Dengue, Chlamydia trachomatis, cytomegalovirus (CMV), hepatitis B virus (HBV), Mycobacterium tuberculosis, rabies virus and yellow fever virus.
Опухолевые антигены:Tumor antigens:
В другом варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемой в настоящем изобретении, может кодировать белок или пептид, который содержит пептид или белок, содержащий опухолевый антиген, фрагмент, вариант или производное указанного опухолевого антигена, где предпочтительно, опухолевый антиген представляет собой меланоцит-специфический антиген, раково-тестикулярный антиген или опухоль-специфический антиген, предпочтительно СТ-Х-антиген, не-Х-СТ-антиген, партнер, связывающий СТ-Х-антиген или партнер, связывающий не-Х-СТ-антиген, или опухоль-специфический антиген, более предпочтительно СТ-Х-антиген, партнер, связывающий не-Х-СТ-антиген или опухоль-специфический антиген, или фрагмент, вариант или производное указанного опухолевого антигена; и где каждая из нуклеотидных последовательностей кодирует отличный от других пептид или белок; и где по меньшей мере одна из нуклеотидных последовательностей кодирует 5Т4, 707-АР, 9D7, AFP, AlbZIP HPG1, альфа-5-бета-1-интегрин, альфа-5-бета-6-интегрин, альфа-актинин-4/m, альфа-метилацил-кофермент А-рацемазу, ART-4, ARTC1/m, В7Н4, BAGE-1, BCL-2, bcr/abl, бета-катенин/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA27-29, CA19-9, CA72-4, CA125, калретикулин, CAMEL, CASP-8/m, катепсин В, катепсин L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, коактозин-подобный белок, коллаген XXIII, COX-2, CT-9/BRD6, Cten, циклин B1, циклин D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, гепсин, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, гомеобокс NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, незрелый ламининовый рецептор, каллекреин-2, каллекреин-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, маммоглобин A, MART-1/мелан-А, MART-2, MART-2/m, матриксный белок 22, MC1R, M-CSF, ME1/m, мезотелин, MG50/PXDN, MMP11, MN/CA IX-антиген, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, миозин класса I/m, NA88-A, N-ацетилглюкозаминилтрансферазу-V, Neo-PAP, Neo-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, остеокальцин, остеопонтин, p15, p190 минорный bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PART-1, PATE, PDEF, Pim-1-киназу, Pin-1, Pml/PARaльфa, POTE, PRAME, PRDX5/m, простеин, протеиназу-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP, сурвивин, сурвивин-2 В, SYT-SSX-1, SYT-SSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGFбета, TGFбетаRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8, тирозиназу, UPA, VEGF, VEGFR-2/FLK-1, WT1 и иммуноглобулиновый идиотип лимфоидной кровяной клетки или идиотип Т-клеточного рецептора, или фрагмент, вариант или производное указанного опухолевого антигена; предпочтительно сурвивин или его гомолог, антиген семейства MAGE или его связывающий партнер или фрагмент, вариант или производное указанного опухолевого антигена. Наиболее предпочтительными в этом контексте являются опухолевые антигены NY-ESO-1, 5Т4, MAGE-C1, MAGE-C2, сурвивин, Muc-1, PSA, PSMA, PSCA, STEAP и РАР.In another embodiment of the invention, the artificial nucleic acid molecule of the present invention may encode a protein or peptide that contains a peptide or protein containing a tumor antigen, fragment, variant or derivative of said tumor antigen, where preferably the tumor antigen is melanocyte-specific antigen, cancer-testicular antigen or tumor-specific antigen, preferably CT-X antigen, non-X-CT antigen, CT-X antigen binding partner or non-X-CT antigen binding partner, or tumor- a specific antigen, more preferably a CT-X antigen, a non-X-CT antigen binding partner, or a tumor-specific antigen, or a fragment, variant or derivative of said tumor antigen; and where each of the nucleotide sequences encodes a different peptide or protein; and where at least one of the nucleotide sequences encodes 5T4, 707-AP, 9D7, AFP, AlbZIP HPG1, alpha-5-beta-1-integrin, alpha-5-beta-6-integrin, alpha-actinin-4/m , alpha-methylacyl-coenzyme A-racemase, ART-4, ARTC1/m, B7H4, BAGE-1, BCL-2, bcr/abl, beta-catenin/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA27-29, CA19-9, CA72-4, CA125, calreticulin, CAMEL, CASP-8/m, cathepsin B, cathepsin L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52 , CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, coactosin-like protein, collagen XXIII, COX-2, CT-9/BRD6 , Cten, cyclin B1, cyclin D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1 , EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V , gp100, GPC3, GPNMB/m, HAGE, HAST-2, hepsin, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, homeobox NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV -E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, immature laminin receptor, kallecrein-2, kallecrein-4, Ki67, KIAA0205, KIAA0205/m , KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE -A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3 , MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, mammoglobin A, MART-1/melan-A, MART-2, MART-2/ m, matrix protein 22, MC1R, M-CSF, ME1/m, mesothelin, MG50/PXDN, MMP11, MN/CA IX antigen, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM -2/m, MUM-3/m, class I/m myosin, NA88-A, N-acetylglucosaminyltransferase-V, Neo-PAP, Neo-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N -Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, osteocalcin, osteopontin, p15, p190 minor bcr -abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PART-1, PATE, PDEF, Pim-1-kinase, Pin-1, Pml/PARalpha, POTE, PRAME, PRDX5/m , protein, protein azu-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART- 3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP, Survivin, Survivin-2 V, SYT-SSX-1, SYT-SSX -2, TA-90, TAG-72, TARP, TEL-AML1, TGFbeta, TGFbetaRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP -p8, tyrosinase, UPA, VEGF, VEGFR-2/FLK-1, WT1 and an immunoglobulin idiotype of a lymphoid blood cell or an idiotype of a T-cell receptor, or a fragment, variant or derivative of said tumor antigen; preferably survivin or a homologue thereof, a MAGE family antigen or a binding partner or fragment, variant or derivative thereof of said tumor antigen. Most preferred in this context are the tumor antigens NY-ESO-1, 5T4, MAGE-C1, MAGE-C2, survivin, Muc-1, PSA, PSMA, PSCA, STEAP and PAP.
В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты кодирует белок или пептид, который содержит терапевтический белок или его фрагмент, вариант или производное.In a preferred embodiment of the invention, the artificial nucleic acid molecule encodes a protein or peptide that contains a therapeutic protein or a fragment, variant or derivative thereof.
В контексте настоящего описания терапевтические белки представляют собой пептиды или белки, которые оказывают полезное действие при лечении любого врожденного или приобретенного заболевания или которые улучшают состояние индивидуума. В частности, терапевтические белки имеют важное значение для создания терапевтических средств, которые могут помимо осуществления других функций модифицировать и осуществлять репарацию генетических ошибок, разрушать раковые клетки или инфицированные патогеном клетки, лечить нарушения иммунной системы, лечить метаболические или эндокринные нарушения. Например, эритропоэтин (ЕРО), белковый гормон, можно применять для лечения пациентов с дефицитом эритроцитов, который является обычной причиной почечных осложнений. Кроме того, под понятие «терапевтические белки» подпадают адъювантные белки, терапевтические антитела, а также гормонзаместительная терапия, которую применяют, например, при лечении женщин в период менопаузы. В более современных подходах используют соматические клетки пациента для перепрограммирования их в плюрипотентные стволовые клетки, что является заменой спорной терапии на основе стволовых клеток. Такие белки, применяемые для перепрограммирования соматических клеток или применяемые для дифференцировки стволовых клеток, также рассматриваются как терапевтические белки в контексте настоящего описания. Кроме того, терапевтические белки можно применять и для других целей, например, для заживления ран, регенерации тканей, ангиогенеза и т.д. Кроме того, в контексте настоящего описания антигенпрезентирующие В-клеточные рецепторы и их фрагменты и варианты рассматриваются как терапевтические белки.In the context of the present description, therapeutic proteins are peptides or proteins that have a beneficial effect in the treatment of any congenital or acquired disease or that improve the condition of the individual. In particular, therapeutic proteins are important for the development of therapeutic agents that can, among other functions, modify and repair genetic errors, destroy cancer cells or pathogen-infected cells, treat immune system disorders, and treat metabolic or endocrine disorders. For example, erythropoietin (EPO), a protein hormone, can be used to treat patients with red blood cell deficiency, which is a common cause of renal complications. In addition, the term "therapeutic proteins" includes adjuvant proteins, therapeutic antibodies, as well as hormone replacement therapy, which is used, for example, in the treatment of women during menopause. More recent approaches use the patient's somatic cells to reprogram them into pluripotent stem cells, replacing controversial stem cell therapies. Such proteins used for reprogramming somatic cells or used for stem cell differentiation are also considered therapeutic proteins in the context of the present disclosure. In addition, therapeutic proteins can be used for other purposes, such as wound healing, tissue regeneration, angiogenesis, and so on. In addition, in the context of the present description, antigen-presenting B-cell receptors and their fragments and variants are considered as therapeutic proteins.
Таким образом, терапевтические белки можно применять для различных целей, включая лечение различных заболеваний, таких, например, как инфекционные заболевания, неоплазмы (например, раковые или опухолевые заболевания), заболевания крови или кроветворных органов, эндокринных, связанных с питанием или метаболических заболеваний, заболеваний нервной системы, заболеваний системы кровообращения, заболеваний дыхательной системы, заболеваний пищеварительной системы, заболеваний кожи и подкожной ткани, заболеваний скелето-мышечной системы и соединительной ткани, и заболеваний мочеполовой системы, независимо от того, являются ли они врожденными или приобретенными.Thus, therapeutic proteins can be used for various purposes, including the treatment of various diseases, such as, for example, infectious diseases, neoplasms (for example, cancer or tumor diseases), diseases of the blood or blood-forming organs, endocrine, nutritional or metabolic diseases, diseases diseases of the nervous system, diseases of the circulatory system, diseases of the respiratory system, diseases of the digestive system, diseases of the skin and subcutaneous tissue, diseases of the musculoskeletal system and connective tissue, and diseases of the genitourinary system, whether they are congenital or acquired.
В этом контексте наиболее предпочтительными терапевтическими белками, которые можно применять, среди прочего, для лечения метаболических или эндокринных нарушений, являются (в скобках указано конкретное заболевание, для лечения которого применяют терапевтический белок): кислая сфингомиелиназа (болезнь Нимана-Пика), адипотид (ожирение), агалзидаза-бета (человеческая галактозидаза А) (болезнь Фабри; препятствует накоплению липидов, которое может приводить к почечным и сердечно-сосудистым осложнениям), алглукозидаза (болезнь Помпе (гликогеноз (накопление гликогена) типа II)), альфа-галактозидаза А (альфа-GAL А, агалзидаза-альфа) (болезнь Фабри), альфа-глюкозидаза (гликогеноз (GSD), болезнь Помпе), альфа-L-идуронидаза (мукополисахаридоз (MPS), синдром Гурлер, синдром Шейе), альфа-N-ацетилглюкозаминидаза (синдром Санфилиппо), амфирегулин (рак, метаболическое нарушение), ангиопоэтин ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (ангиогенез, стабилизирует сосуды), бетацеллюлин (метаболическое нарушение), бета-глюкуронидаза (синдром Слая), костный морфогенетический белок BMP (ВМР1, ВМР2, ВМР3, ВМР4, ВМР5, ВМР6, ВМР7, ВМР8а, BMP8b, ВМР10, ВМР15) (регенеративное действие, состояния, связанные с костной тканью, хроническое заболевание почек (CKD)), белок CLN6 (болезнь, вызванная мутациями в локусе CLN6 атипичный поздний инфантилизм, вариант с поздним началом, ранний ювенильный, нейрональный цероид-липофусциноз (NCL)), эпидермальный фактор роста (EGF) (заживление ран, регуляция роста, пролиферации и дифференцировки клеток), эпиген (метаболическое нарушение), эпирегулин (метаболическое нарушение), фактор роста фибробластов (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (заживление ран, ангиогенез, эндокринные нарушения, регенерация ткани), галсульфаза (мукополисахаридоз типа VI), грелин (синдром раздраженного кишечника (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет типа II), глюкоцереброзидаза (болезнь Гоше), GM-CSF (регенеративное действие, производство лейкоцитов, рак), гепаринсвязывающий EGF-подобный фактор роста (HB-EGF) (заживление ран, гипертрофия сердца и развитие и функция сердца), фактор роста гепатоцитов HGF (регенеративное действие, заживление ран), гепсидин (нарушения метаболизма железа, бета-талассемия), человеческий альбумин (пониженное производство альбумина (гипопротеинемия), повышенная потеря альбумина (нефротический синдром), гиповолемия, гипербилирубинемия), идурсульфаза (идуронат-2-сульфатаза) (мукополисахаридоз типа II (синдром Хантера)), интегрины αVβ3, αVβ5 и α5β1 (связывают матриксные макромолекулы и протеиназы, ангиогенез), идуронатсульфатаза (синдром Хантера), ларонидаза (мукополисахаридоз типа I, формы Гурлер и Гурлер-Шайе), N-ацетилгалактозамин-4-сульфатаза (rhASB; галсульфаза, арилсульфатаза A (ARSA), арилсульфатаза В (ARSB)) (дефицит арилсульфатазы В, синдром Марото-Лами, мукополисахаридоз типа VI), N-ацетилглюкозамин-6-сульфатаза (синдром Санфилиппо), фактор роста нервов (NGF, мозговой нейротрофический фактор (BDNF), нейротрофин-3 (NT-3) и нейротрофин 4/5 (NT-4/5) (регенеративное действие, сердечно-сосудистые заболевания, коронарный атеросклероз, ожирение, диабет типа 2, метаболический синдром, острые коронарные синдромы, деменция, депрессия, шизофрения, аутизм, синдром Ретта, нервная анорексия, нервная булимия, заживление ран, кожные язвы, изъязвления роговицы, болезнь Альцгеймера), нейрегулин (NRG1, NRG2, NRG3, NRG4) (метаболическое нарушение, шизофрения), нейропилин (NRP-1, NRP-2) (ангиогенез, управление аксонами, выживание, миграция клеток), обестатин (синдром раздраженного кишечника (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет типа II), фактор роста тромбоцитов (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (регенеративное действие, заживление ран, нарушение ангиогенеза, артериосклероз, фиброз, рак), рецепторы TGF-бета (эндоглин, рецептор TGF-бета 1, рецептор TGF-бета 2, рецептор TGF-бета 3) (почечный фиброз, заболевание почек, диабет, терминальная стадия почечной болезни (ESRD), ангиогенез), тромбопоэтин (ТНРО) (фактор роста и развития мегакариоцитов (MGDF)) (тромбоцитарные нарушения, тромбоциты для донорской сдачи, восстановление уровня тромбоцитов после миелосупрессорной химиотерапии), трансформирующий фактор роста (TGF (TGF-альфа, TGF-бета (TGFбета1, TGFбета2 и TGFбета3))) (регенеративное действие, заживление ран, иммунитет, рак, заболевание сердца, диабет, синдром Марфана, синдром Лоеса-Дитца), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F и PIGF) (регенеративное действие, ангиогенез, заживление ран, рак, проницаемость), несритид (острая декомпенсированная застойная сердечная недостаточность), трипсин (декубитальная язва, варикозная язва, санация струпа, спонтанно раскрывающаяся рана, солнечный ожог, мекониевая непроходимость кишечника), адренокортикотропный гормон (АСТН) (болезнь Аддисона, мелкоклеточная саркома, адренолейкодистрофия, врожденная гиперплазия надпочечников, синдром Кушинга, синдром Нельсона, детские спазмы), предсердный натрийуретический пептид (ANP) (эндокринные нарушения), холецистокинин (различной длины), гастрин (гипогастринемия), лептин (диабет, гиперглицинемия, ожирение), окситоцин (стимулирует грудное кормление, ненаступление родов), соматостатин (симптоматическое лечение карционоидного синдрома, острое варикозное кровотечение и акромегалия, поликистозные заболевания печени и почек, акромегалия и симптомы, вызываемые нейроэндокринными опухолями), вазопрессин (антидиуретический гормон) (несахарный диабет), кальцитонин (постменопаузальный остеопороз, гиперкальциемия, болезнь Пэджета, метастазы в костную ткань, фантомная боль к конечностях, спинальный стеноз), экзенатид (диабет типа 2, устойчивый к обработке метформином и сульфонилмочевиной), гормон роста (GH), соматотропин (нарушение роста вследствие дефицита GH или хронической печеночной недостаточности, синдром Прадера-Вилли, синдром Турнера, обусловленное СПИДом истощение или кахексия при осуществлении противовирусной терапии), инсулин (сахарный диабет, диабетический кетоацидоз, гиперкалиемия), инсулиноподобный фактор роста 1 IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мекасермин ринфабат, аналог IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мегасермин, аналог IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), пэгвисомант (акромегалия), прамлинтид (сахарный диабет, в комбинации с инсулином), терипаратид (человеческий паратиреоидный гормон, остатки 1-34) (серьезный остеопороз), бекаплермин (вспомогательное средство при санации диабетических язв), диботермин-альфа (костный морфогенный белок 2) (хирургическая операция по закреплению позвоночника (Spinal Fusion), восстановление кости при повреждении), гистрелина ацетат (гонадотропин-рилизинг гормон; GnRH) (преждевременное половое созревание), октреотид (акромегалия, симптоматическое ослабление VIP-секретирующей аденомы и метастатических карциноидных опухолей) ипалифермин (фактор роста кератиноцитов; KGF) (серьезный оральный мукозит у пациентов, подвергающихся химиотерапии, заживление ран).In this context, the most preferred therapeutic proteins that can be used, among others, for the treatment of metabolic or endocrine disorders are (in brackets the specific disease for which the therapeutic protein is used is indicated): acid sphingomyelinase (Niemann-Pick disease), adipotide (obesity ), agalsidase-beta (human galactosidase A) (Fabry disease; interferes with lipid accumulation, which can lead to kidney and cardiovascular complications), alglucosidase (Pompe disease (glycogenosis (accumulation of glycogen) type II)), alpha-galactosidase A ( alpha-GAL A, agalsidase-alpha) (Fabry disease), alpha-glucosidase (glycogenosis (GSD), Pompe disease), alpha-L-iduronidase (mucopolysaccharidosis (MPS), Hurler syndrome, Scheye syndrome), alpha-N-acetylglucosaminidase (Sanfilippo syndrome), amphiregulin (cancer, metabolic disorder), angiopoietin ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (angiogenesis, stabilizes cos uds), betacellulin (metabolic disorder), beta-glucuronidase (Sly syndrome), bone morphogenetic protein BMP (BMP1, BMP2, BMP3, BMP4, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP10, BMP15) (regenerative action, conditions, bone-related, chronic kidney disease (CKD)), CLN6 protein (disease caused by mutations at the CLN6 locus atypical late infantilism, late-onset variant, early juvenile, neuronal ceroid lipofuscinosis (NCL)), epidermal growth factor (EGF) (wound healing, regulation of cell growth, proliferation and differentiation), epigen (metabolic disorder), epiregulin (metabolic disorder), fibroblast growth factor (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5 , FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF -18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (wound healing, angiogenesis, endocrine disruption, tissue regeneration), galsulfase (mucopolysaccharidosis type VI), ghrelin (irritable bowel syndrome (IBS), obesity, Prader-Willi syndrome, type II diabetes mellitus), glucocerebrosidase (Gaucher disease), GM-CSF (regenerative action, leukocyte production, cancer), heparin-binding EGF-like growth factor (HB-EGF) (healing wounds, cardiac hypertrophy and cardiac development and function), hepatocyte growth factor HGF (regenerative action, wound healing), hepcidin (iron metabolism disorders, beta-thalassemia), human albumin (decreased albumin production (hypoproteinemia), increased albumin loss (nephrotic syndrome ), hypovolemia, hyperbilirubinemia), idursulfase (iduronate-2-sulfatase) (mucopolysaccharidosis type II (Hunter syndrome)), αVβ3, αVβ5 and α5β1 integrins (bind matrix macromolecules and proteinases, angiogenesis), iduronate sulfatase (Hunter syndrome), laronidase (mucopolysaccharidosis type I, Hurler and Hurler-Shaie forms), N-acetylgalactosamine-4-sulfatase (rhASB; galsulfase, arylsulfatase A (ARSA), arylsulfatase B (ARSB)) (arylsulfatase B deficiency, Maroteau-Lami syndrome, mucopolysaccharidosis type VI), N-acetylglucosamine-6-sulfatase (Sanfilippo syndrome), nerve growth factor (NGF, brain-derived neurotrophic factor (BDNF), neurotrophin-3 (NT-3) and neurotrophin 4/5 (NT-4/5) (regenerative action, cardiovascular disease, coronary atherosclerosis, obesity, type 2 diabetes, metabolic syndrome, acute coronary syndromes, dementia , depression, schizophrenia, autism, Rett syndrome, anorexia nervosa, bulimia nervosa, wound healing, skin ulcers, corneal ulceration, Alzheimer's disease), neuregulin (NRG1, NRG2, NRG3, NRG4) (metabolic disorder, schizophrenia), neuropilin (NRP- 1, NRP-2) (angiogenesis, axonal guidance, survival, cell migration), obestatin (irritable bowel syndrome (IBS), obesity, Prader-Willi syndrome, type II diabetes mellitus), platelet growth factor (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (regenerative effect, for wound healing, angiogenesis disorder, arteriosclerosis, fibrosis, cancer), TGF-beta receptors (endoglin, TGF-beta 1 receptor, TGF-beta 2 receptor, TGF-beta 3 receptor) (renal fibrosis, kidney disease, diabetes, end-stage renal diseases (ESRD), angiogenesis), thrombopoietin (THRO) (megakaryocyte growth and development factor (MGDF)) (platelet disorders, platelets for donation, recovery of platelet levels after myelosuppressive chemotherapy), transforming growth factor (TGF (TGF-alpha, TGF -beta (TGFbeta1, TGFbeta2 and TGFbeta3))) (regenerative action, wound healing, immunity, cancer, heart disease, diabetes, Marfan syndrome, Loes-Dietz syndrome), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F and PIGF) (regenerative action, angiogenesis, wound healing, cancer, permeability), nesritide (acute decompensated congestive heart failure), trypsin (decubital ulcer, varicose ulcer, eschar debridement, spontaneous opening wound, sunburn, mek onium ileus), adrenocorticotropic hormone (ACTH) (Addison's disease, small cell sarcoma, adrenoleukodystrophy, congenital adrenal hyperplasia, Cushing's syndrome, Nelson's syndrome, infantile spasms), atrial natriuretic peptide (ANP) (endocrine disorders), cholecystokinin (various lengths), gastrin (hypogastrinemia), leptin (diabetes, hyperglycinemia, obesity), oxytocin (stimulates breastfeeding, non-delivery), somatostatin (symptomatic treatment of carcinoid syndrome, acute variceal bleeding and acromegaly, polycystic liver and kidney disease, acromegaly and symptoms caused by neuroendocrine tumors ), vasopressin (antidiuretic hormone) (diabetes insipidus), calcitonin (postmenopausal osteoporosis, hypercalcemia, Paget's disease, bone metastases, phantom limb pain, spinal stenosis), exenatide (type 2 diabetes resistant to metformin and sulfonylurea treatment), growth hormone (GH), som atotropin (growth failure due to GH deficiency or chronic liver failure, Prader-Willi syndrome, Turner syndrome, AIDS-related wasting or cachexia during antiviral therapy), insulin (diabetes mellitus, diabetic ketoacidosis, hyperkalemia), insulin-like growth factor 1 IGF-1 ( growth retardation in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease, cardiovascular disease, heart failure), mecasermine rinfabate, IGF-1 analogue (growth failure in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease , cardiovascular disease, heart failure), megasermin, IGF-1 analogue (growth failure in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease, cardiovascular disease, heart failure), pegvisomant (acromegaly), pramlintide ( diabetes mellitus, in combination with insulin m), teriparatide (human parathyroid hormone, residues 1-34) (severe osteoporosis), becaplermin (adjuvant in the debridement of diabetic ulcers), dibotermin-alpha (bone morphogenic protein 2) (surgery to fix the spine (Spinal Fusion), recovery bones when damaged), histrelin acetate (gonadotropin-releasing hormone; GnRH) (precocious puberty), octreotide (acromegaly, symptomatic attenuation of VIP-secreting adenoma and metastatic carcinoid tumors) andalifermin (keratinocyte growth factor; KGF) (severe oral mucositis in patients undergoing chemotherapy, wound healing).
Указанные и другие белки рассматриваются как терапевтические, поскольку они предназначены для лечения индивидуума путем возмещения нарушенного эндогенного производства в его организме функционального белка в достаточных количествах. Следовательно, такие терапевтические белки, как правило, представляют собой белки млекопитающих, прежде всего человеческие белки.These and other proteins are considered therapeutic since they are intended to treat the individual by replacing the disturbed endogenous production in his body of a functional protein in sufficient quantities. Therefore, such therapeutic proteins are typically mammalian proteins, especially human proteins.
Для лечения нарушений крови, заболеваний системы кровообращения, заболеваний дыхательной системы, раковых или опухолевых заболеваний, инфекционных заболеваний или иммунодефицитов можно применять следующие терапевтические белки: альтерплаза (активатор тканевого плазминогена; tPA) (легочная эмболия, инфаркт миокарда, острый ишемический инсульт («удар»), окклюзия устройств центрального венозного доступа), анистреплаза (тромболизис), антитромбин III (АТ-III) (наследственный дефицит АТ-III, тромбоэмболия), бивалирудин (снижает риск свертывания крови при коронарной ангиопластике и индуцированной гепарином тромбоцитопении), дарбепоэтин-альфа (лечение анемии у пациентов с хронической почечной недостаточностью и хроническим почечным нарушением (+/- диализ)), дротрекогин-альфа (активированный белок С) (серьезный сепсис с высоким риском смерти), эритропоэтин, эпоэтин-альфа, эритропоэтин, эритропоетин (анемия при хроническом заболевании, миелодисплазия, анемия при почечной недостаточности или при осуществлении химиотерапии, предоперационная подготовка), фактор IX (гемофилия В), фактор VIIa (кровоизлияние у пациентов с гемофилией А или В и при применении ингибиторов фактора VIII или фактора IX), фактор VIII (гемофилия А), лепирудин (индуцируемая гепарином тромбоцитопения), концентрат белка С (венозный тромбоз, молниеносная пурпура), ретеплаза (делеция мутеина в tPA) (лечение острого инфаркта миокарда, улучшение функции желудочков), стрептокиназа (остро развивающийся трансмуральный инфаркт миокарда, легочная эмболия, тромбоз глубоких вен, артериальный тромбоз или эмболия, окклюзия артериовенозной канюли), тенестеплаза (острый инфаркт миокарда), урокиназа (легочная эмболия), ангиостатин (рак), анти-CD22 иммунотоксин (рецидивирующий острый миелоидный CD33+-лейкоз), денилейкин дифтитокс (кожная Т-клеточная лимфома (CTCL)), иммуноцианин (рак мочевого пузыря и предстательной железы), MPS (металлопанстимулин) (рак), афлиберцепт (немелкоклеточный рак легкого (NSCLC), метастатический колоректальный рак (mCRC), гормон-устойчивый метастатический рак предстательной железы, влажная форма дегенерации желтого пятна), эндостатин (рак, воспалительные заболевания типа ревматоидного артрита, а также болезнь Крона, диабетическая ретинопатияпсориаз и эндометриоз), коллагеназа (санация хронических кожных язв и областей серьезных ожогов, контрактура Дюпюитрена, болезнь Пейрони), человеческая дезоксирибонуклеаза I, дорназа (муковисцидоз; уменьшение инфекций респираторного тракта у выбранных пациентов с FVC, превышающим более чем на 40% предсказанную величину), гиалуронидаза (применяется в качестве адъюванта для повышения абсорбции и диспергирования инъецированных лекарственных средств, прежде всего анестезирующих средств при глазной хирургии и определенных визуализирующих агентов), папаин (санация некротической ткани или разжижение отторгающихся некротических масс при острых и хронических повреждениях, таких как пролежни, варикозные и диабетические язвы, ожоги, послеоперационные раны, пилонидальные кистозные раны, карбункулы и другие раны), L-аспарагиназа (острый лимфоцитарный лейкоз, требующий экзогенного аспарагина для пролиферации), пэг-аспарагиназа (острый лимфоцитарный лейкоз, требующий экзогенного аспарагина для пролиферации), расбуриказа (пациенты детского возраста с лейкозом, лимфомой и солидными опухолями, подвергающиеся противораковой терапии, которая может вызывать синдром лизиса опухоли), человеческий хорионный гонадотропин (HCG) (улучшает репродуктивную функцию), человеческий фолликулостимулирующий гормон (FSH) (улучшает репродуктивную функцию), лутропин-альфа (бесплодие, сопровождающееся дефицитом лютениизирующего гормона), пролактин (гипопролактинемия, дефицит сывороточного пролактина, дисфункция яичника у женщин, состояние страха, артериогенная эректильная дисфункция, преждевременное семяизвержение, олигозооспермия, астеноспермия, пониженная функция семенных пузырьков, гипоандрогенизм у мужчин), ингибитор альфа-1-протеиназы (врожденный дефицит антитрипсина), лактаза (газообразование, вздутие, спазмы и диарея вследствие неспособности расщеплять лактозу), панкреатические ферменты (липаза, амилаза, протеиназа) (муковисцидоз, хронический панкреатит, панкреатическая недостаточность, состояние после операции желудочного шунтирования по Билльрот типа II (Billroth II), обструкция протоков поджелудочной железы, стеаторрея, недостаточное пищеварение, газообразование, вздутие), аденозиндеаминаза (бычья пегадемаза, PEG-ADA) (заболевания с серьезным комбинированным иммунодефицитом вследствие дефицита аденозиндеаминазы), абатецепт (ревматоидный артрит (прежде всего, рефракторный в отношении ингибирования TNF-альфа)), алефацепт (бляшковидный псориаз), анакинра (ревматоидный артрит), этанецепт (ревматоидный артрит, многосуставной юношеский ревматоидный артрит, псориатический артрит, анкилоизирующий спондилит, бляшковидный псориаз, анкилоизирующий спондилит), анти\агонист рецептора интерлейкина-1 (IL-1), анакинра (воспаление и деградация хряща, ассоциированная с ревматоидным артритом), тимулин (нейродегенеративные заболевания, ревматизм, нервная анорексия), антагонист TNF-альфа (аутоиммунные заболевания, такие как ревматоидный артрит, анкилоизирующий спондилит, болезнь Крона, псориаз, гнойный гидраденит, рефрактерная астма), энфувиртид (HIV-1-инфекция) и тимозин α1 (гепатит В и С),The following therapeutic proteins can be used to treat blood disorders, circulatory system diseases, respiratory system diseases, cancer or neoplastic diseases, infectious diseases or immunodeficiencies: alterplase (tissue plasminogen activator; tPA) (pulmonary embolism, myocardial infarction, acute ischemic stroke ), occlusion of central venous access devices), anistreplase (thrombolysis), antithrombin III (AT-III) (hereditary deficiency of AT-III, thromboembolism), bivalirudin (reduces the risk of blood clotting in coronary angioplasty and heparin-induced thrombocytopenia), darbepoetin-alpha ( treatment of anemia in patients with chronic renal failure and chronic renal impairment (+/- dialysis)), drotrecogin-alpha (activated protein C) (serious sepsis with high risk of death), erythropoietin, epoetin-alpha, erythropoietin, erythropoietin (anemia in chronic disease, myelodysplasia, anemia in renal failure or in chemotherapy, preoperative preparation), factor IX (hemophilia B), factor VIIa (hemorrhage in patients with hemophilia A or B and the use of factor VIII or factor IX inhibitors), factor VIII (hemophilia A), lepirudin (heparin-induced thrombocytopenia), protein C concentrate (venous thrombosis, fulminant purpura), reteplase (mutein deletion in tPA) (treatment of acute myocardial infarction, improvement of ventricular function), streptokinase (acute transmural myocardial infarction, pulmonary embolism, deep vein thrombosis, arterial thrombosis or embolism, occlusion arteriovenous cannula), tenesteplase (acute myocardial infarction), urokinase (pulmonary embolism), angiostatin (cancer), anti-CD22 immunotoxin (recurrent acute myeloid CD33 + leukemia), denileukin diftitox (cutaneous T-cell lymphoma (CTCL)), immunocyanin (bladder and prostate cancer), MPS (metalopanstimulin) (cancer), aflibercept (non-small cell lung cancer (NSCLC), metastatic to olorectal cancer (mCRC), hormone-resistant metastatic prostate cancer, wet macular degeneration), endostatin (cancer, inflammatory diseases such as rheumatoid arthritis, as well as Crohn's disease, diabetic retinopathy, psoriasis and endometriosis), collagenase (debridement of chronic skin ulcers and areas severe burns, Dupuytren's contracture, Peyronie's disease), human deoxyribonuclease I, dornase (cystic fibrosis; reduction of respiratory tract infections in selected patients with an FVC greater than 40% predicted), hyaluronidase (used as an adjuvant to increase the absorption and dispersion of injected drugs, primarily anesthetics for eye surgery and certain imaging agents), papain ( debridement of necrotic tissue or liquefaction of sloughing necrotic masses in acute and chronic injuries such as bedsores, varicose and diabetic ulcers, burns, postoperative wounds, pilonidal cystic wounds, carbuncles and other wounds), L-asparaginase (acute lymphocytic leukemia requiring exogenous asparagine for proliferation), peg-asparaginase (acute lymphocytic leukemia requiring exogenous asparagine for proliferation), rasburicase (childhood patients with leukemia, lymphoma, and solid tumors undergoing anticancer therapy that can cause tumor lysis syndrome), human chorio gonadotropin (HCG) (improves reproductive function), human follicle stimulating hormone (FSH) (improves reproductive function), lutropin-alpha (infertility accompanied by luteinizing hormone deficiency), prolactin (hypoprolactinemia, serum prolactin deficiency, ovarian dysfunction in women, state of fear , arteriogenic erectile dysfunction, premature ejaculation, oligozoospermia, asthenospermia, reduced function of seminal vesicles, hypoandrogenism in men), alpha-1-proteinase inhibitor (congenital antitrypsin deficiency), lactase (gas formation, bloating, cramps and diarrhea due to inability to break down lactose), pancreatic enzymes (lipase, amylase, proteinase) (cystic fibrosis, chronic pancreatitis, pancreatic insufficiency, post-Billroth II gastric bypass, pancreatic duct obstruction, steatorrhoea, maldigestion, gas, bloating), adenosine deaminases a (bovine pegademase, PEG-ADA) (diseases with severe combined immunodeficiency due to adenosine deaminase deficiency), abathecept (rheumatoid arthritis (primarily refractory to TNF-alpha inhibition)), alefacept (plaque psoriasis), anakinra (rheumatoid arthritis), etanecept (rheumatoid arthritis, polyarticular juvenile rheumatoid arthritis, psoriatic arthritis, ankylosing spondylitis, plaque psoriasis, ankylosing spondylitis), interleukin-1 (IL-1) receptor anti/agonist, anakinra (inflammation and cartilage degradation associated with rheumatoid arthritis), thymulin (neurodegenerative diseases, rheumatism, anorexia nervosa), TNF-alpha antagonist (autoimmune diseases such as rheumatoid arthritis, ankylosing spondylitis, Crohn's disease, psoriasis, hidradenitis suppurativa, refractory asthma), enfuvirtide (HIV-1 infection), and thymosin α1 ( hepatitis B and C)
(в скобках указано конкретное заболевание, для лечения которого применяют терапевтический белок).(in parentheses is the specific disease for which the therapeutic protein is used).
Следующим объектом настоящего изобретения является вектор, содержащийThe next object of the present invention is a vector containing
а. открытую рамку считывания (ОРС) и/или сайт клонирования, например, предназначенный для встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания; иa. an open reading frame (ORF) and/or a cloning site, for example, for inserting an open reading frame or a sequence containing an open reading frame; and
б. по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент), содержащий нуклеотидную последовательность, которая происходит из 3'-UTR гена рибосомального белка.b. at least one element of the 3'-untranslated region (3'-UTR element) containing a nucleotide sequence that is derived from the 3'-UTR of the ribosomal protein gene.
По меньшей мере один 3'-UTR-элемент и ОРС представляют собой конструкции, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении. Сайт клонирования может представлять собой любую последовательность, пригодную для интродукции открытой рамки считывания или последовательности, содержащей открытую рамку считывания, такую как одни или несколько сайтов рестрикции. Так, вектор, содержащий сайт клонирования, предпочтительно является пригодным для встраивания открытой рамки считывания в вектор, предпочтительно для встраивания открытой рамки считывания с 5'-стороны относительно 3'-UTR -элемента. Предпочтительно, сайт клонирования или ОРС располагают с 5'-стороны относительно 3'-UTR-элемента, предпочтительно в непосредственной близости от 5'-конца 3'-UTR-элемента. Например, сайт клонирования или ОРС можно непосредственно присоединять к 5'-концу 3'-UTR-элемента или их можно присоединять посредством сегмента нуклеотидов, например, сегмента, состоящего из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, как описано выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.At least one 3'-UTR element and the ORF are the constructs described above for the artificial nucleic acid molecule of the present invention. The cloning site can be any sequence suitable for the introduction of an open reading frame or a sequence containing an open reading frame, such as one or more restriction sites. Thus, a vector containing a cloning site is preferably suitable for inserting an open reading frame into the vector, preferably for inserting an open reading frame from the 5' side of the 3' UTR element. Preferably, the cloning site or ORF is located 5' to the 3' UTR element, preferably in close proximity to the 5' end of the 3' UTR element. For example, the cloning site or ORF may be directly attached to the 5'end of the 3'UTR element, or they may be attached via a segment of nucleotides, e.g., a segment consisting of 2, 4, 6, 8, 10, 20, etc. nucleotides as described above for the artificial nucleic acid molecule of the present invention.
Предпочтительно вектор, предлагаемой в настоящем изобретении, можно применять для производства искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно производства искусственной мРНК, предлагаемой в настоящем изобретении, например, необязательно путем встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания, в вектор и транскрибирования вектора. Так, предпочтительно вектор содержит элементы, необходимые для транскрипции, такие как промотор, например, промотор РНК-полимеразы. Предпочтительно вектор пригоден для транскрипции с использованием эукариотической, прокариотической, вирусной или фаговой систем транскрипции, таких как эукариотические клетки, прокариотические клетки или эукариотические, прокариотические, вирусные или фаговые системы транскрипции in vitro. Так, например, вектор может содержать промоторную последовательность, которая распознается полимеразой, такой как РНК полимераза, например, эукариотической, прокариотической, вирусной или фаговой РНК-полимеразой. В предпочтительном варианте осуществления изобретения вектор содержит промотор РНК-полимеразы фага, такой как промотор SP6, Т3 или Т7, предпочтительно промотор Т7. Предпочтительно вектор пригоден для транскрипции in vitro с использованием системы транскрипции in vitro на основе фага, такой как система транскрипции in vitro на основе РНК-полимеразы Т7.Preferably, the vector of the present invention can be used to produce an artificial nucleic acid molecule of the present invention, preferably the production of an artificial mRNA of the present invention, for example, optionally by inserting an open reading frame or a sequence containing an open reading frame into the vector and transcribing the vector. Thus, preferably the vector contains elements necessary for transcription, such as a promoter, for example, an RNA polymerase promoter. Preferably, the vector is suitable for transcription using eukaryotic, prokaryotic, viral or phage transcription systems such as eukaryotic cells, prokaryotic cells or in vitro eukaryotic, prokaryotic, viral or phage transcription systems. Thus, for example, the vector may contain a promoter sequence that is recognized by a polymerase, such as an RNA polymerase, for example, a eukaryotic, prokaryotic, viral, or phage RNA polymerase. In a preferred embodiment, the vector contains a phage RNA polymerase promoter such as the SP6, T3 or T7 promoter, preferably the T7 promoter. Preferably, the vector is suitable for in vitro transcription using a phage based in vitro transcription system, such as a T7 RNA polymerase based in vitro transcription system.
В другом предпочтительном варианте осуществления изобретения вектор можно применять непосредственно для экспрессии кодируемого пептида или белка в клетках или ткани. Для этой цели вектор содержит конкретные элементы, необходимые для экспрессии в указанных клетках/ткани, например, конкретные последовательности промотора, такого как промотор CMV.In another preferred embodiment of the invention, the vector can be used directly to express the encoded peptide or protein in cells or tissue. For this purpose, the vector contains specific elements necessary for expression in said cells/tissue, for example specific promoter sequences such as the CMV promoter.
Вектор может содержать также поли(А)-последовательность и/или сигнал полиаденилирования, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.The vector may also contain the poly(A) sequence and/or polyadenylation signal described above for the artificial nucleic acid molecule of the present invention.
Вектор может представлять собой РНК-вектор или ДНК-вектор. Предпочтительно вектор представляет собой ДНК-вектор. Вектор может представлять собой любой вектор, известный специалисту в данной области, такой как вирусный вектор или плазмидный вектор. Предпочтительно вектор представляет собой плазмидный вектор, предпочтительно плазмидный ДНК-вектор.The vector may be an RNA vector or a DNA vector. Preferably the vector is a DNA vector. The vector may be any vector known to the person skilled in the art, such as a viral vector or a plasmid vector. Preferably the vector is a plasmid vector, preferably a plasmid DNA vector.
В предпочтительном варианте осуществления изобретения вектор, предлагаемый в настоящем изобретении, содержит искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении.In a preferred embodiment of the invention, the vector of the present invention contains an artificial nucleic acid molecule of the present invention.
В одном из вариантов осуществления изобретения ДНК-вектор, предлагаемый в изобретении, содержит нуклеотидную последовательность, идентичную по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 10-115.In one embodiment, the DNA vector of the invention contains a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15, 20, 30, or 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'UTR of the ribosomal protein gene, such as the nucleotide sequence shown in SEQ ID NOs: 10-115.
Предпочтительно ДНК-вектор, предлагаемый в настоящем изобретении, содержит последовательность, представленную в SEQ ID NO: 1, SEQ ID NO: 3, последовательность, комплементарную SEQ ID NO: 7 или последовательности, идентичные по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, или ее фрагменту, описанному выше, предпочтительно ее функциональному фрагменту.Preferably, the DNA vector of the present invention contains a sequence shown in SEQ ID NO: 1, SEQ ID NO: 3, a sequence complementary to SEQ ID NO: 7, or sequences that are at least about 40% identical, preferably at least at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least by about 95%; even more preferably at least about 99% of the nucleotide sequence shown in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, or a fragment thereof as described above, preferably a functional fragment thereof.
Предпочтительно РНК-вектор, предлагаемый в настоящем изобретении, содержит последовательность, представленную в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7 или последовательность, идентичную по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7 или ее фрагменту, предпочтительно ее функциональному фрагменту.Preferably, the RNA vector of the present invention contains the sequence shown in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7, or a sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95% %; even more preferably, at least about 99% of the nucleotide sequence shown in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7, or a fragment thereof, preferably a functional fragment thereof.
Предпочтительно вектор представляет собой кольцевую молекулу. Предпочтительно вектор представляет собой двухцепочечную молекулу, такую как двухцепочечная молекула ДНК. Такую кольцевую, предпочтительно двухцепочечную молекулу ДНК можно использовать в качестве удобной формы хранения предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты. Кроме того, ее можно применять для трансфекции клеток, например, культивируемых клеток. Ее можно использовать также для транскрипции in vitro для получения искусственной молекулы РНК, предлагаемой в изобретении.Preferably the vector is a circular molecule. Preferably the vector is a double-stranded molecule, such as a double-stranded DNA molecule. Such a circular, preferably double-stranded, DNA molecule can be used as a convenient storage form for the artificial nucleic acid molecule according to the invention. In addition, it can be used to transfect cells, such as cultured cells. It can also be used for in vitro transcription to produce an artificial RNA molecule according to the invention.
Предпочтительно вектор, предпочтительно кольцевой вектор, можно линеаризовать, например, путем расщепления рестриктазой. В предпочтительном варианте осуществления изобретения вектор содержит сайт расщепления, такой как сайт рестрикции, предпочтительно уникальный сайт расщепления, непосредственно примыкающий с 3'-стороны к 3'-UTR-элементу, или с 3'-стороны к поли(А)-последовательности или сигналу полиаденилирования, если она/он присутствует, или с 3'-стороны к поли(С)-последовательности, если она присутствует, или с 3'-стороны к гистоновой структуре типа «стебель-петля», если она присутствует. Так, предпочтительно продукт, полученный в результате линеаризации вектора, заканчивается на 3'-конце 3'-концом 3'-UTR-элемента или 3'-концом поли(А)-последовательности или сигналом полиаденилирования, если она/он присутствует, или 3'-концом поли(С)-последовательности, если она присутствует. В варианте осуществления изобретения, в котором вектор, предлагаемый в настоящем изобретении, содержит искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, сайт рестрикции, предпочтительно уникальный сайт рестрикции, предпочтительно примыкающий непосредственно с 3'-стороны к 3'-концу искусственной молекулы нуклеиновой кислоты.Preferably the vector, preferably a circular vector, can be linearized, for example by restriction enzyme digestion. In a preferred embodiment of the invention, the vector contains a cleavage site, such as a restriction site, preferably a unique cleavage site immediately adjacent 3' to the 3' UTR element, or 3' to the poly(A) sequence or signal polyadenylation, if present, or 3' to the poly(C) sequence, if present, or 3' to the histone stem-loop structure, if present. Thus, preferably the product resulting from linearization of the vector ends at the 3' end with the 3' end of the 3' UTR element or the 3' end of the poly(A) sequence or polyadenylation signal, if present, or 3 the '-end of the poly(C)-sequence, if present. In an embodiment in which the vector of the present invention comprises the artificial nucleic acid molecule of the present invention, a restriction site, preferably a unique restriction site, preferably directly adjacent 3' to the 3' end of the artificial nucleic acid molecule .
Следующий объект настоящего изобретения относится к клетке, содержащей искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, или вектор, предлагаемый в настоящем изобретении. Клетка может представлять собой любую клетку, такую как бактериальная клетка, клетка насекомого, клетка растения, клетка позвоночного, например, клетка млекопитающего. Такую клетку можно применять, например, для репликации вектора, предлагаемого в настоящем изобретении, например, в клетке бактерии. Кроме того, клетку можно применять для осуществления транскрипции искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении, и/или для трансляции открытой рамки считывания искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении. Например, клетку можно применять для производства рекомбинантного белка.The next object of the present invention relates to a cell containing an artificial nucleic acid molecule of the present invention, or a vector of the present invention. The cell can be any cell, such as a bacterial cell, an insect cell, a plant cell, a vertebrate cell, for example a mammalian cell. Such a cell can be used, for example, to replicate the vector of the present invention, for example, in a bacterial cell. In addition, the cell can be used to transcribe the artificial nucleic acid molecule or vector of the present invention and/or to translate the open reading frame of the artificial nucleic acid molecule or vector of the present invention. For example, the cell can be used to produce a recombinant protein.
Согласно настоящему изобретению клетки можно получать, например, с помощью стандартных методов переноса нуклеиновой кислоты, таких как стандартные методы трансфекции, трансдукции или трансформации. Например, искусственную молекулу нуклеиновой кислоты или вектор, предлагаемую/предлагаемый в настоящем изобретении, можно переносить в клетку путем электропорации, липофекции, например, с использованием катионных липидов и/или липосом, осаждения фосфатом кальция, трансфекции на основе наночастиц, трансфекции, основанной на применении вирусов или на основе катионных полимеров, таких как DEAE-декстран или полиэтиленимин и т.д.According to the present invention, cells can be obtained, for example, using standard nucleic acid transfer methods, such as standard transfection, transduction or transformation methods. For example, an artificial nucleic acid molecule or a vector of the present invention can be transferred into a cell by electroporation, lipofection, for example, using cationic lipids and/or liposomes, calcium phosphate precipitation, nanoparticle-based transfection, transfection based on the use of viruses or based on cationic polymers such as DEAE-dextran or polyethyleneimine, etc.
Предпочтительно клетка представляет собой клетку млекопитающего, такую как клетка человека, домашнего животного, лабораторного животного, такую как клетка мыши или крысы. Предпочтительно клетка представляет собой человеческую клетку. Клетка может представлять собой клетку культивируемой клеточной линии, такой как СНО, BHK, 293Т, COS-7, HELA, HEK и т.д. или клетка может представлять собой первичную клетку, такую как человеческая кожная фибробластная (HDF) клетка и т.д., предпочтительно клетку, выделенную из организма. В предпочтительном варианте осуществления изобретения клетка представляет собой выделенную клетку млекопитающего, предпочтительно человека. Например, клетка может представлять собой иммунную клетку, такую как дендритная клетка, раковую или опухолевую клетку, или любую соматическую клетку и т.д., предпочтительно млекопитающего, предпочтительно человека.Preferably, the cell is a mammalian cell, such as a human cell, a domestic animal cell, a laboratory animal cell, such as a mouse or rat cell. Preferably the cell is a human cell. The cell may be a cell from a cultured cell line such as CHO, BHK, 293T, COS-7, HELA, HEK, etc. or the cell may be a primary cell such as a human dermal fibroblast (HDF) cell, etc., preferably a cell isolated from the body. In a preferred embodiment of the invention, the cell is an isolated cell of a mammal, preferably a human. For example, the cell may be an immune cell such as a dendritic cell, a cancer or tumor cell, or any somatic cell, etc., preferably a mammal, preferably a human.
Следующим объектом настоящего изобретения является фармацевтическая композиция, содержащая искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, или клетку, предлагаемую в настоящем изобретении. Фармацевтическую композицию, предлагаемую в изобретении, можно применять, например, в качестве вакцины, например, для генетической вакцинации. Так, ОРС может, например, кодировать антиген, предназначенный для введения пациенту с цель вакцинации. Так, в предпочтительном варианте осуществления изобретения фармацевтическая композиция, предлагаемая в настоящем изобретении, представляет собой вакцину. Кроме того, фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять, например, для генной терапии.Another object of the present invention is a pharmaceutical composition containing an artificial nucleic acid molecule of the present invention, a vector of the present invention, or a cell of the present invention. The pharmaceutical composition according to the invention can be used, for example, as a vaccine, for example, for genetic vaccination. Thus, the ORF may, for example, encode an antigen to be administered to a patient for the purpose of vaccination. Thus, in a preferred embodiment of the invention, the pharmaceutical composition of the present invention is a vaccine. In addition, the pharmaceutical composition of the present invention can be used, for example, for gene therapy.
Предпочтительно фармацевтическая композиция содержит также один или несколько фармацевтически приемлемых наполнителей, разбавителей и/или эксципиентов и/или один или несколько адъювантов. В контексте настоящего изобретения фармацевтически приемлемый наполнитель, как правило, включает жидкую или нежидкую основу предлагаемой в изобретении фармацевтической композиции. Если предлагаемая в изобретении фармацевтическая композиция находится в жидкой форме, но носитель, как правило, может представлять собой свободную от пирогенов воду; изотонический соляной раствор или забуференные (водные) растворы, например, растворы, забуференные фосфатом, цитратом и т.д. Предназначенный для инъекции буфер может быть гипертоническим, изотоническим или гипотоническим относительно конкретной референс-среды, т.е. содержание в буфере солей может быть выше, идентичным или ниже их содержания в конкретной референс-среде, при этом предпочтительно можно применять такие концентрации вышеуказанных солей, которые не приводят к повреждению клеток в результате осмоса или других связанных с концентрацией воздействий. Референс-среды могут представлять собой, например, жидкости, применяемые в методах «in vivo», такие как кровь, лимфа, цитозольные жидкости или другие жидкости организма, или, например, жидкости, которые можно использовать в качестве референс-сред в методах «in vitro», такие как обычные буферы или жидкости. Указанные обычные буферы или жидкости известны специалисту в данной области. Наиболее предпочтительной жидкой основой является лактированный раствор Рингера.Preferably, the pharmaceutical composition also contains one or more pharmaceutically acceptable excipients, diluents and/or excipients and/or one or more adjuvants. In the context of the present invention, a pharmaceutically acceptable excipient typically includes a liquid or non-liquid base proposed in the invention of the pharmaceutical composition. If the pharmaceutical composition according to the invention is in liquid form, but the carrier, as a rule, can be pyrogen-free water; isotonic saline or buffered (aqueous) solutions, such as solutions buffered with phosphate, citrate, etc. The buffer to be injected may be hypertonic, isotonic, or hypotonic with respect to the particular reference medium, i.e. the salt content of the buffer may be greater than, identical to, or less than that of the particular reference medium, and concentrations of the aforementioned salts may preferably be used which do not result in cell damage due to osmosis or other concentration-related influences. Reference media can be, for example, liquids used in in vivo methods, such as blood, lymph, cytosolic fluids, or other body fluids, or, for example, liquids that can be used as reference media in in vivo methods. vitro" such as conventional buffers or liquids. These conventional buffers or liquids are known to the person skilled in the art. The most preferred liquid base is lactated Ringer's solution.
В предлагаемой в изобретении фармацевтической композиции можно использовать также один или несколько совместимых твердых или жидких наполнителей или разбавителей или капсулирующих соединений, которые можно применять для введения пациенту, подлежащему лечению. Понятие «совместимые» в контексте настоящего описания означает, что указанные компоненты предлагаемой в изобретении фармацевтической композиции можно смешивать с предлагаемой в изобретении нуклеиновой кислотой, указанной в настоящем описании, таким образом, чтобы не происходило взаимодействия, которое могло бы существенно снижать фармацевтическую эффективность предлагаемой в изобретении фармацевтической композиции в обычных условиях применения.One or more compatible solid or liquid excipients or diluents or encapsulating compounds that can be used for administration to the patient to be treated can also be used in the pharmaceutical composition of the invention. The term "compatible" in the context of the present description means that these components of the pharmaceutical composition of the invention can be mixed with the nucleic acid of the invention specified in the present description, so that no interaction occurs that could significantly reduce the pharmaceutical effectiveness of the invention pharmaceutical composition under normal conditions of use.
Фармацевтическая композиция, предлагаемая в настоящем изобретении, может необязательно содержать также один или несколько дополнительных фармацевтически активных компонентов. В данном контексте фармацевтически активный компонент представляет собой соединение, которое обладает терапевтическим действием в отношении лечения, облегчения или предупреждения конкретного показания или заболевания. Такие соединения включают (но, не ограничиваясь только ими) пептиды или белки, нуклеиновые кислоты, (терапевтически активные) низкомолекулярные органические или неорганические соединения (с молекулярной массой менее 5000, предпочтительно менее 1000), сахара, антигены или антитела, терапевтические агенты, уже известные из существующего уровня техники, антигенные клетки, антигенные клеточные фрагменты, клеточные фракции; компоненты клеточной оболочки (например, полисахариды), модифицированные, ослабленные или дезактивированные (например, химическим путем или путем облучения) патогены (вирусы, бактерии и т.д.), адъюванты, предпочтительно указанные в настоящем описании, и т.д.The pharmaceutical composition of the present invention may optionally also contain one or more additional pharmaceutically active ingredients. In this context, a pharmaceutically active ingredient is a compound that has a therapeutic effect in relation to the treatment, alleviation or prevention of a particular indication or disease. Such compounds include, but are not limited to, peptides or proteins, nucleic acids, (therapeutically active) small organic or inorganic compounds (molecular weight less than 5000, preferably less than 1000), sugars, antigens or antibodies, therapeutic agents already known from the existing level of technology, antigenic cells, antigenic cell fragments, cell fractions; cell wall components (eg, polysaccharides), modified, attenuated or inactivated (eg, chemically or by radiation) pathogens (viruses, bacteria, etc.), adjuvants, preferably as described herein, etc.
Кроме того, предлагаемая в изобретении фармацевтическая композиция может содержать носитель для искусственной молекулы нуклеиновой кислоты или вектора. Такой носитель может быть пригоден для облегчения растворения в физиологически приемлемых жидкостях, транспортировки и поглощения клеткой фармацевтически активной искусственной молекулы нуклеиновой кислоты или вектора. Следовательно, такой носитель может представлять собой компонент, который может быть пригоден для хранения и доставки искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в изобретении. Такие компоненты могут представлять собой, например, катионные или поликатионные носители или соединения, которые могут служить в качестве агентов для трансфекции или комплексообразования.In addition, the pharmaceutical composition according to the invention may contain a carrier for an artificial nucleic acid molecule or a vector. Such a carrier may be useful for facilitating dissolution in physiologically acceptable fluids, transport and uptake by the cell of a pharmaceutically active artificial nucleic acid molecule or vector. Therefore, such a carrier may be a component that may be suitable for the storage and delivery of an artificial nucleic acid molecule or vector proposed/proposed in the invention. Such components may be, for example, cationic or polycationic carriers or compounds which may serve as transfection or complexing agents.
В этом контексте наиболее предпочтительными агентами для трансфекции или комплексообразования являются катионные или поликатионные соединения, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, такие как поли-L-лизин (PLL), полиаргинин, полипептиды, обладающие способностью проникать в клетку пептиды (СРР), такие как ВИЧ-связывающие пептиды. Tat ВИЧ-1 (ВИЧ), выведенные из Tat пептиды, пенетратин, полученные из VP22 пептиды или аналоги, VP22 HSV (вирус герпеса простого), MAP, KALA или домены трансдукции белков (PTD), РрТ620, богатые пролином пептиды, богатые аргинином пептиды, богатые лизином пептиды, МРО-пептид(ы), Рер-1, L-олигомеры, пептид(ы) кальцитонина, выведенные из Antennapedia пептиды (прежде всего, выведенные из Drosophila antennapedia), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB(1), pVEC, выведенные из hCT пептиды, SAP или гистоны.In this context, the most preferred transfection or complexation agents are cationic or polycationic compounds including protamine, nucleolin, spermine or spermidine, or other cationic peptides or proteins such as poly-L-lysine (PLL), polyarginine, cell-penetrating peptide (CPP) polypeptides, such as HIV-binding peptides. Tat HIV-1 (HIV), Tat-derived peptides, penetratin, VP22-derived peptides or analogs, VP22 HSV (herpes simplex virus), MAP, KALA or protein transduction domains (PTDs), PpT620, proline-rich peptides, arginine-rich peptides , lysine-rich peptides, MPO peptide(s), Pep-1, L-oligomers, calcitonin peptide(s), Antennapedia derived peptides (primarily derived from Drosophila antennapedia), pAntp, pIsl, FGF, lactoferrin, transportan, buforin-2, Vas715-24, SynB, SynB(1), pVEC, hCT derived peptides, SAP or histones.
Кроме того, такие катионные или поликатионные соединения могут представлять собой катионные или поликатионные пептиды или белки, которые предпочтительно содержат или дополнительно модифицированы так, чтобы они содержали по меньшей мере одну SH-группу. Предпочтительно катионный или поликатионный носитель выбирают из катионных пептидов, имеющих следующую общую формулу (I):In addition, such cationic or polycationic compounds may be cationic or polycationic peptides or proteins that preferably contain or are further modified to contain at least one SH group. Preferably the cationic or polycationic carrier is selected from cationic peptides having the following general formula (I):
в которой l+m+n+0+x- 3-100 и l, m, n или о независимо друг от друга обозначают любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 и 91-100, при условии, общее содержание Arg (аргинин), Lys (лизин), His (гистидин) и Orn (орнитин) составляет по меньшей мере 10% от общего содержания аминокислот в олигопептиде; а Хаа может обозначать любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или не встречающихся в естественных условиях аминокислот за исключением Arg, Lys, His или Orn; и х может обозначать любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, при условии, что общее содержание Хаа не превышает 90% от общего содержания аминокислот в олигопептиде. Любую из аминокислот Arg, Lys, His, Orn и Хаа можно помещать в любое положение пептида. В этом контексте наиболее предпочтительными являются катионные пептиды или белки, содержащие 7-30 аминокислот.in which l+m+n+0+x- 3-100 and l, m, n or o independently of each other denote any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81 -90 and 91-100, provided that the total content of Arg (arginine), Lys (lysine), His (histidine) and Orn (ornithine) is at least 10% of the total amino acid content of the oligopeptide; and Xaa can be any amino acid selected from native (ie, naturally occurring) or non-naturally occurring amino acids with the exception of Arg, Lys, His, or Orn; and x can be any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13.14, 15, 16, 17, 18, 19, 20 , 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, provided that the total Xaa content does not exceed 90% of the total amino acid content in the oligopeptide. Any of the amino acids Arg, Lys, His, Orn and Xaa can be placed at any position in the peptide. In this context, cationic peptides or proteins containing 7-30 amino acids are most preferred.
Кроме того, катионный или поликатионный пептид или белок, определяемый формулой {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (формула (I)), представленной выше, который содержит или дополнительно модифицирован так, что он содержал по меньшей мере одну SH-группу, можно выбирать (но, не ограничиваясь только этим) из соединений подформулы (Ia):In addition, a cationic or polycationic peptide or protein defined by the formula {(Arg) l ;(Lys) m ;(His) n ;(Orn) o ;(Xaa) x } (formula (I)) presented above, which contains or further modified such that it contains at least one SH group, may be selected from (but not limited to) compounds of subformula (Ia):
в которой (Arg)l;(Lys)m;(His)n;(Orn)o; и х имеют указанные выше значения, Хаа' обозначает любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или не встречающихся в естественных условиях аминокислот за исключением Arg, Lys, His, Orn или Cys, и у обозначает любое число, выбранное из 0, 1, 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80 и 81-90, условии, что общее содержание Arg (аргинин), Lys (лизин). His (гистидин) и Orn (оринитин) составляет по меньшей мере 10% от общего содержания аминокислот в олигопептиде. Кроме того, катионный или поликатионный пептид можно выбирать из соединений подформулы (1б):in which (Arg) l ;(Lys) m ;(His) n ;(Orn) o ; and x are as defined above, Xaa' is any amino acid selected from native (i.e., naturally occurring) or non-naturally occurring amino acids with the exception of Arg, Lys, His, Orn, or Cys, and y is any number , selected from 0, 1, 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31 -40, 41-50, 51-60, 61-70, 71-80 and 81-90, provided that the total content of Arg (arginine), Lys (lysine). His (histidine) and Orn (orinithine) make up at least 10% of the total amino acid content of the oligopeptide. In addition, the cationic or polycationic peptide can be selected from compounds of subformula (1b):
в которой эмпирическая формула {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (формула (III)) представлена в настоящем описании и образует ядро аминокислотной последовательности, представленной (полуэмприрической) формулой (III), и в которой Cys1 и Cys2 обозначают остатки цистеина, расположенные проксимально или терминально относительно (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x.in which the empirical formula {(Arg) l ;(Lys) m ;(His) n ;(Orn) o ;(Xaa) x } (formula (III)) is presented in the present description and forms the core of the amino acid sequence represented by the (semi-empirical) formula (III), and in which Cys 1 and Cys 2 denote cysteine residues located proximal or terminal relative to (Arg) l ;(Lys) m ;(His) n ;(Orn) o ;(Xaa) x .
Другие предпочтительные катионные или поликатионные соединения, которые можно применять в качестве агентов для трансфекции, могут представлять собой катионные полисахариды, например, хитозан, полибрен, катионные полимеры, например, полиэтиленимин (PEI), катионные липиды, например, DOTMA: хлорид [1-(2,3-сиолеилокси)пропил)]-N,N,N-триметиламмония, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI: бромид димиристооксипропилдиметилгидроксиэтиламмония, DOTAP: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: хлорид O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламина, CLIP1: хлорид рац-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмония, CLIP6: рац-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: рац-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные полиаминокислоты, такие как полимеры β-аминокислот, или обратимые полиамиды и т.д., модифицированные полиэтилены, такие как PVP (бромид поли(N-этил-4-винилпиридиния)) и т.д. модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, такие как рАМАМ (поли(амидоамин)) и т.д., модифицированный сложный полибетааминоэфир (РВАЕ), например, с модифицированным диаминовым концом сополимеры 1,4-бутандиолдиакрилата и 5-амино-1-пентанола, и т.д. дендримеры, например, дендримеры полипропиламина или дендримеры на основе рАМАМ, и т.д. полиимин(ы), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахарного каркаса, такие как полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозан и т.д. полимеры на основе силанового каркаса, например, сополимеры PMOXA-PDMS и т.д., блок-сополимеры, состоящие из комбинации одного или несколько катионных блоков (например, выбранных из катионного полимера, указанного выше) и одного или нескольких гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.д.Other preferred cationic or polycationic compounds that can be used as transfection agents may be cationic polysaccharides, eg chitosan, polybrene, cationic polymers, eg polyethyleneimine (PEI), cationic lipids, eg DOTMA:chloride [1-( 2,3-sioleyloxy)propyl)]-N,N,N-trimethylammonium, DMRIE, di-C14-amidine, DOTIM, SAINT, DC-Chol, BGTC, STAR, DOPC, DODAP, DOPE: dioleylphosphatidylethanolamine, DOSPA, DODAB, DOIC, DMEPC, DOGS: dioctadecylamidoglycylspermine, DIMRI: dimyristooxypropyldimethylhydroxyethylammonium bromide, DOTAP: dioleoyloxy-3-(trimethylammonio)propane, DC-6-14: O,O-ditradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride, CLIP1: rac chloride -[(2,3-dioctadecyloxypropyl)(2-hydroxyethyl)]dimethylammonium, CLIP6: rac-[2(2,3-dihexadecyloxypropyloxymethyloxy)ethyl]trimethylammonium, CLIP9: rac-[2(2,3-dihexadecyloxypropyloxysuccinyloxy)ethyl]trimethylammonium , oligofectamine, or cationic or polycationic polymers, e.g. ep, modified polyamino acids such as β-amino acid polymers or reversible polyamides, etc., modified polyethylenes such as PVP (poly(N-ethyl-4-vinylpyridinium) bromide), etc. modified acrylates such as pDMAEMA (poly(dimethylaminoethyl methyl acrylate)) etc. modified amidoamines such as pAMAM (poly(amidoamine)) etc. modified polybetaaminoester (PBAE) e.g. modified diamine terminus copolymers 1,4-butanediol diacrylate and 5-amino-1-pentanol, etc. dendrimers, for example polypropylamine dendrimers or pAMAM based dendrimers, etc. polyimine(s), e.g. PEI: poly(ethyleneimine), poly(propyleneimine), etc., polyallylamine, sugar backbone polymers such as cyclodextrin-based polymers, dextran-based polymers, chitosan, etc. silane backbone polymers, e.g. PMOXA-PDMS copolymers, etc., block copolymers consisting of a combination of one or more cationic blocks (e.g. selected from the cationic polymer above) and one or more hydrophilic or hydrophobic blocks ( e.g. polyethylene glycol); etc.
Согласно другому варианту осуществления изобретения фармацевтическая композиция, предлагаемая в изобретении, может содержать адъювант для повышения иммуностимулирующих свойств фармацевтической композиции. В данном контексте под адъювантом можно понимать любое соединение, которое пригодно для облегчения введения и доставки компонентов, таких как искусственная молекула нуклеиновой кислоты или вектор, которая/который содержится в фармацевтической композиции, предлагаемой в изобретении. Кроме того, такой адъювант может (но, не ограничиваясь только этим) инициировать или усиливать иммунный ответ врожденной иммунной системы, т.е. неспецифический иммунный ответ. Иными словами, после введения фармацевтическая композиция, предлагаемая в изобретении, как правило, инициирует адаптивный иммунный ответ, направленный на антиген, кодируемый искусственной молекулой нуклеиновой кислоты. Кроме того, фармацевтическая композиция, предлагаемая в изобретении, может вызывать (поддерживающий) врожденный иммунный ответ благодаря добавлению адъюванта, указанного в настоящем описании, к фармацевтической композиции, предлагаемой в изобретении.According to another embodiment of the invention, the pharmaceutical composition according to the invention may contain an adjuvant to enhance the immunostimulatory properties of the pharmaceutical composition. In this context, an adjuvant can be understood to mean any compound that is suitable for facilitating the administration and delivery of components, such as an artificial nucleic acid molecule or a vector, which/which is contained in the pharmaceutical composition of the invention. In addition, such an adjuvant may (but not limited to) initiate or enhance the immune response of the innate immune system, i. nonspecific immune response. In other words, upon administration, the pharmaceutical composition of the invention typically initiates an adaptive immune response directed to the antigen encoded by the artificial nucleic acid molecule. In addition, the pharmaceutical composition of the invention can elicit a (supportive) innate immune response by adding an adjuvant as described herein to the pharmaceutical composition of the invention.
Такой адъювант можно выбирать из любого адъюванта, известного специалисту в данной области и пригодного для рассматриваемого случая, т.е. для поддержания индукции иммунного ответа у млекопитающего. Предпочтительно адъювант можно выбирать из группы, включающей (но, не ограничиваясь только ими) TDM, MDP, мурамилдипептид, плюроники, раствор квасцов, гидроксид алюминия, ADJUMER™ (полифосфазен); гель фосфата алюминия; глюканы, выделенные из водорослей; алгаммулин; гель гидроксид а алюминия (квасцы); высокоадсорбирующий белки гель гидроксида алюминия; обладающий низкой вязкостью гель гидроксида алюминия; AF или SPT (эмульсия, содержащая сквалан (5%), Твин 80 (0.2%), плюроник L121 (1,25%), забуференный фосфатом физиологический раствор, рН 7,4); AVRIDINE™ (пропандиамин); BAY R1005™ ((N-(2-дезокси-2-L-леуциламиноб-D-глюкопиранозил)-N-октадециламида гидроацетат); CALCITRIOL™ (1-альфа,25-дигидрокси-витамин D3); гель фосфата кальция; CAP™ (наночастицы фосфата кальция); холерный голотоксин, слитый белок холерный токсин-А1-белок-А-D-фрагмент, субъединица В холерного токсина; CRL 1005 (блок-сополимер Р1205); содержащие цитокин липосомы; DDA (диметилдиоктадециламмония бромид); DHEA (дегидроэпиандростерон); DMPC (димиристоилфосфатидилхолин); DMPG (димиристоилфосфатидилглицерин); комплекс DOC/квасцы (натриевая соль дезоксихолиновой кислоты); полный адъювант Фрейнда; неполный адъювант Фрейнда; инулин-гамма; адъювант Гербу (смесь, содержащая: I) N-ацетилглюкозаминил-(Р1-4)-N-ацетилмурамоил-L-аланил-035 глутамин (GMDP), II) диметилдиоктадециламмония хлорид (DDA), III) комплекс цинк-соль L-пролина (ZnPro-8); GM-CSF); GMDP (N-ацетилглюкозаминил-(b1-4)-N-ацетилмурамил-L47 аланил-D-изоглутамин); имиквимод (1-(2-метилпропил)-1Н-имидазо[4,5-с]хинолин-4-амин); ImmTher™ (N-ацетилглюкозаминил-N-ацетилмурамил-L-А1а-В-изоGlu-L-Ala-глицерина дипальмитат); DRV (иммунолипосомы, приготовленные из везикул, полученных методом гидратации-регидратации); интерферон-гамма; интерлейкин-1бета; интерлейкин-2; интерлейкин-7; интерлейкин-12; ISCOMSTM; ISCOPREP 7.0.3. ТМ; липосомы; LOXORIBINE™ (7-аллил-8-оксогуанозин); оральный адъювант LT 5 (лабильный энтеротоксин-протоксин из Е. coli); микросферы и микрочастицы любого состава; MF59TM; (водная эмульсия сквалена); MONTANIDE ISA 51™ (очищенный неполный адъювант Фрейнда); MONTANIDE ISA 720™ (метаболизируемый масляный адъювант); MPL™ (3-Q-дезацил-4'-монофосфорил-липид А); липосомы МТР-РЕ и МТР-РЕ ((N-ацетил-L-аланил-D-изоглутаминил-L-аланин-2-(1,2-дипальмитоил-sn-глицеро-3-(гидроксифосфорилокси))этиламид, однонатриевая соль); MURAMETIDE™ (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINE™ и DMURAPALMITINE™ (Nac-Mur-L-Thr-D-изоGIn-sn-глицериндипальмитоил); NAGO (нейраминидаза-галактозооксидаза); наносферы или наночастицы любого состава; NISV (везикулы из неионогенного поверхностно-активного вещества); PLEURAN™ (β-глюкан); PLGA, PGA и PLA (гомо- и сополимеры молочной кислоты и гликолевой кислоты; микросферы/наносферы); ПЛЮРОНИК L121™; РММА (полиметилметакрилат); PODDS™ (протеноидные микросферы); полиэтиленкарбаматные производные; поли-rA:поли-rU (комплекс полиадениловая кислота-полиуридиновая кислота); полисорбат 80 (Твин 80); белковые кохлеаты (фирма Avanti Polar Lipids, Inc., Алабастер, шт. Алабама); STIMULON™ (QS-21); Quil-A (сапонин Quil-A); S-28463 (4-аминоотекдиметил-2-этоксиметил-1Н-имидазо[4,5-с]хинолин-1-этанол); SAF-1™ («композиция адъювантов фирмы Syntex»); протеолипосомы вируса Сендаи и липидные матрицы, содержащие вирус Сендаи; Спан-85 (сорбитантриолеат); Specol (эмульсия Marcol 52, Спан 85 и Твин 85); сквален или Robane® (2,6,10,15,19,23-гексаметилтетракозан и 2,6,10,15,19,23-гексаметил-2,6,10,14,18,22-тетракозагексан); стеарилтирозин (октадецилтирозина гидрохлорид); Theramid® (М-ацетилглюкозаминил-N-ацетилмурамил-L-Ala-D-isoGlu-L-Ala-дипальмитоксипропиламид); Theronyl-MDP (Termurtide™ или [thr 1]-MDP; N-ацетилмурамил-L-треонил-D-изоглутамин); Ту-частицы (Ту-ВПЧ или вирусоподобные частицы); липосомы Уолтера-Рида (липосомы, содержащие липид А, адсорбированный на гидроксиде алюминия) и липопептиды, включая Pam3Cys, прежде всего соли алюминия, такие как адъю-фос (Adju-phos), алгидрогель, регидрагель и т.д., эмульсии, такие как CFA, SAF, IFA, MF59, провакс, TiterMax, монтанид, ваксфектин и т.д., сополимеры, такие как оптивакс (Optivax, CRL1005), L121, полоксамер 4010) и т.д., липосомы, такие как «липосомы-невидимки (Stealth)» и т.д., кохлеаты, такие как BIORAL, и т.д., адъюванты растительного происхождения, такие как QS21, Quil A, Iscomatrix, ISCOM; адъюванты, пригодные для костимуляции, включая томатин, биополимеры, такие как PLG, РММ, инулин и т.д., адъюванты микробного происхождения, такие как ромуртид, DETOX, MPL, CWS, манноза, нуклеотидные последовательности CpG, CpG7909, лиганды человеческого TLR 1-13, ISS-1018, 35 IC31, имидазохинолины, амплиген, Ribi529, IMOxine, IRIV, ВПЧ, холерный токсин, термолабильный токсин, Pam3Cys, флагеллин, GPI (гликозилфосфатидилинозитол)-якорь, LNFPIII/Lewis X, противомикробные пептиды, UC-1V150, слитый белок RSV, cdiGMP; и адъюванты, пригодные в качестве антагонистов, включая нейропептид CGRP.Such an adjuvant can be selected from any adjuvant known to the person skilled in the art and suitable for the case in question, i. to maintain the induction of an immune response in a mammal. Preferably, the adjuvant can be selected from the group including (but not limited to) TDM, MDP, muramyl dipeptide, pluronics, alum solution, aluminum hydroxide, ADJUMER™ (polyphosphazene); aluminum phosphate gel; glucans isolated from algae; algammulin; aluminum hydroxide gel (alum); highly protein-absorbing aluminum hydroxide gel; a low viscosity aluminum hydroxide gel; AF or SPT (emulsion containing Squalane (5%), Tween 80 (0.2%), Pluronic L121 (1.25%), phosphate buffered saline, pH 7.4); AVRIDINE™ (propanediamine); BAY R1005™ ((N-(2-deoxy-2-L-leucylamino-D-glucopyranosyl)-N-octadecylamide hydroacetate); CALCITRIOL™ (1-alpha,25-dihydroxy vitamin D3); calcium phosphate gel; CAP™ (calcium phosphate nanoparticles); cholera holotoxin, fusion protein cholera toxin-A1 protein-A-D fragment, cholera toxin subunit B; CRL 1005 (P1205 block copolymer); cytokine-containing liposomes; DDA (dimethyldioctadecylammonium bromide); DHEA ( dehydroepiandrosterone); DMPC (dimyristoylphosphatidylcholine); DMPG (dimyristoylphosphatidylglycerol); DOC/alum complex (deoxycholic acid sodium salt); complete Freund's adjuvant; incomplete Freund's adjuvant; inulin-gamma; Gerbu's adjuvant (mixture containing: I) N-acetylglucosaminyl-( P1-4)-N-acetylmuramoyl-L-alanyl-035 glutamine (GMDP), II) dimethyldioctadecylammonium chloride (DDA), III) L-proline zinc salt complex (ZnPro-8); GM-CSF); GMDP (N-acetylglucosaminyl-(b1-4)-N-acetylmuramyl-L47 alanyl-D-isoglutamine); imiquimod (1-(2-methylpropyl)-1H-imidazo[4,5-c]quinoline-4-amine); ImmTher™ (N-acetylglucosaminyl-N-acetylmuramyl-L-A1a-B-isoGlu-L-Ala-glycerol dipalmitate); DRV (immunoliposomes prepared from vesicles obtained by the hydration-rehydration method); interferon-gamma; interleukin-1beta; interleukin-2; interleukin-7; interleukin-12; ISCOMSM; ISCOPREP 7.0.3. TM; liposomes; LOXORIBINE™ (7-allyl-8-oxoguanosine); oral adjuvant LT 5 (labile enterotoxin-protoxin from E. coli); microspheres and microparticles of any composition; MF59TM; (water emulsion of squalene); MONTANIDE ISA 51™ (purified incomplete Freund's adjuvant); MONTANIDE ISA 720™ (metabolizable oil adjuvant); MPL™ (3-Q-deacyl-4'-monophosphoryl lipid A); liposomes MTP-PE and MTP-PE ((N-acetyl-L-alanyl-D-isoglutaminyl-L-alanine-2-(1,2-dipalmitoyl-sn-glycero-3-(hydroxyphosphoryloxy)) ethylamide, single sodium salt) ; MURAMETIDE™ (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINE™ and DMURAPALMITINE™ (Nac-Mur-L-Thr-D-isoGIn-sn-glycerindipalmitoyl); NAGO (neuraminidase-galactose oxidase); nanospheres or nanoparticles of any composition; NISV (nonionic surfactant vesicles); PLEURAN™ (β-glucan); PLGA, PGA and PLA (homo- and copolymers of lactic acid and glycolic acid; microspheres/nanospheres); PLURONIC L121™; PMMA (polymethyl methacrylate); PODDS™ (protenoid microspheres); polyethylene carbamate derivatives; poly-rA:poly-rU (polyadenylic acid-polyuridic acid complex); polysorbate 80 (Tween 80); protein cochleates (Avanti Polar Lipids, Inc., Alabaster, Alabama); STIMULON™ (QS-21); Quil-A (Quil-A saponin); S-28463 (4-aminootecdimethyl-2-ethoxymethyl-1H-imidazo[4,5-c]quinoline-1-ethanol ); SAF-1™ ("composition of adjuvants from Synte x"); Sendai virus proteoliposomes and lipid matrices containing Sendai virus; Span-85 (sorbitan trioleate); Specol (emulsion Marcol 52, Span 85 and Twin 85); squalene or Robane® (2,6,10,15,19,23-hexamethyltetracosane and 2,6,10,15,19,23-hexamethyl-2,6,10,14,18,22-tetracoshexane); stearyltyrosine (octadecyltyrosine hydrochloride); Theramid® (M-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-dipalmitoxypropylamide); Theronyl-MDP (Termurtide™ or [thr 1]-MDP; N-acetylmuramyl-L-threonyl-D-isoglutamine); Tu-particles (Tu-HPV or virus-like particles); Walter-Read liposomes (liposomes containing lipid A adsorbed on aluminum hydroxide) and lipopeptides, including Pam3Cys, especially aluminum salts such as Adju-phos, alhydrogel, rehydragel, etc., emulsions such as like CFA, SAF, IFA, MF59, provax, TiterMax, montanide, vaxfectin, etc., copolymers like optivax (Optivax, CRL1005), L121, poloxamer 4010) etc., liposomes like "liposomes stealth (Stealth), etc., cochleates such as BIORAL, etc., herbal adjuvants such as QS21, Quil A, Iscomatrix, ISCOM; adjuvants suitable for costimulation including tomatine, biopolymers such as PLG, PMM, inulin, etc., adjuvants of microbial origin such as romurtide, DETOX, MPL, CWS, mannose, CpG nucleotide sequences, CpG7909, human TLR 1 ligands -13, ISS-1018, 35 IC31, imidazoquinolines, ampligen, Ribi529, IMOxine, IRIV, HPV, cholera toxin, thermolabile toxin, Pam3Cys, flagellin, GPI (glycosylphosphatidylinositol)-anchor, LNFPIII/Lewis X, antimicrobial peptides, UC-1V150 , RSV fusion protein, cdiGMP; and adjuvants useful as antagonists, including the neuropeptide CGRP.
Пригодные адъюванты можно выбирать также из катионных или поликатионных соединений, при этом адъювант предпочтительно получают путем образования комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор, входящую/входящий в фармацевтическую композицию, и катионное или поликатионное соединение. Ассоциация или образование комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор входящую/входящий в фармацевтическую композицию, и катионные или поликатионные соединения, указанные в настоящем описании, предпочтительно обеспечивает присущие адъюванту свойства и оказывает стабилизирующее действие на искусственную молекулу нуклеиновой кислоты или вектор, входящую/входящий в фармацевтическую композицию. Наиболее предпочтительно такие катионные или поликатионные соединения выбирают из катионных или поликатионных пептидов или белков, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, такие как поли-L-лизин (PLL), полиаргинин, основные полипептиды, обладающие способностью проникать в клетку пептиды (СРР), такие как ВИЧ-связывающие пептиды. Tat ВИЧ-1 (ВИЧ), выведенные из Tat пептиды, пенетратин, полученные из VP22 пептиды или аналоги, VP22 HSV (вирус герпеса простого), MAP, KALA или домены трансдукции белков (PTD), РрТ620, богатые пролином пептиды, богатые аргинином пептиды, богатые лизином пептиды, МРС-пептид(ы), Рер-1, L-олигомеры, пептид(ы) кальцитонина, выведенные из Antennapedia пептиды (прежде всего, выведенные из Drosophila antennapedid), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB(1), pVEC, выведенные из hCT пептиды, SAP или гистоны. Другими предпочтительными катионными или поликатионными соединениями могут являться катионные полисахариды, например хитозан, полибрен, катионные полимеры, например, полиэтиленимин (PEI), катионные липиды, например, DOTMA: хлорид [1-(2,3-сиолеилокси)пропил)]-N,N,N-триметиламмония, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI: бромид димиристооксипропилдиметилгидроксиэтиламмония, DOTAP: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: хлорид O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламина, CLIP1: хлорид рац-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмония, CLIP6: рац-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: рац-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные полиаминокислоты, такие как полимеры β-аминокислот, или обратимые полиамиды и т.д., модифицированные полиэтилены, такие как PVP (бромид поли(N-этил-4-винилпиридиния)) и т.д. модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, такие как рАМАМ (поли(амидоамин)) и т.д., модифицированный сложный полибетааминоэфир (РВАЕ), например, с модифицированным диаминовым концом сополимеры 1,4-бутандиолдиакрилата и 5-амино-1-пентанола, и т.д. дендримеры, например, дендримеры полипропиламина или дендримеры на основе рАМАМ, и т.д. полиимин(ы), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахарного каркаса, такие как полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозан и т.д. полимеры на основе силанового каркаса, например, сополимеры PMOXA-PDMS и т.д., блок-сополимеры, состоящие из комбинации одного или несколько катионных блоков (например, выбранных из катионного полимера, указанного выше) и одного или нескольких гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.д.Suitable adjuvants can also be selected from cationic or polycationic compounds, whereby the adjuvant is preferably prepared by forming a complex comprising an artificial nucleic acid molecule or vector included/included in a pharmaceutical composition and a cationic or polycationic compound. The association or formation of a complex comprising an artificial nucleic acid molecule or vector in/in a pharmaceutical composition and the cationic or polycationic compounds described herein preferably provides inherent adjuvant properties and has a stabilizing effect on the artificial nucleic acid molecule or vector in/in into a pharmaceutical composition. Most preferably, such cationic or polycationic compounds are selected from cationic or polycationic peptides or proteins, including protamine, nucleolin, spermine or spermidine, or other cationic peptides or proteins such as poly-L-lysine (PLL), polyarginine, basic polypeptides having the ability penetrate the cell peptides (CPP), such as HIV-binding peptides. Tat HIV-1 (HIV), Tat-derived peptides, penetratin, VP22-derived peptides or analogs, VP22 HSV (herpes simplex virus), MAP, KALA or protein transduction domains (PTDs), PpT620, proline-rich peptides, arginine-rich peptides , lysine-rich peptides, MPC peptide(s), Pep-1, L-oligomers, calcitonin peptide(s), Antennapedia derived peptides (primarily derived from Drosophila antennapedid), pAntp, pIsl, FGF, lactoferrin, transportan, buforin-2, Vas715-24, SynB, SynB(1), pVEC, hCT derived peptides, SAP or histones. Other preferred cationic or polycationic compounds may be cationic polysaccharides, eg chitosan, polybrene, cationic polymers, eg polyethyleneimine (PEI), cationic lipids, eg DOTMA:[1-(2,3-sioleyloxy)propyl)]-N chloride, N,N-trimethylammonium, DMRIE, di-C14-amidine, DOTIM, SAINT, DC-Chol, BGTC, STAR, DOPC, DODAP, DOPE: dioleylphosphatidylethanolamine, DOSPA, DODAB, DOIC, DMEPC, DOGS: dioctadecylamidoglycylspermine, DIMRI: dimyristooxypropyldimethylhydroxyethylammonium bromide , DOTAP: dioleoyloxy-3-(trimethylammonio)propane, DC-6-14: O,O-ditradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride, CLIP1: rac-[(2,3-dioctadecyloxypropyl)(2- hydroxyethyl)]dimethylammonium, CLIP6: rac-[2(2,3-dihexadecyloxypropyloxymethyloxy)ethyl]trimethylammonium, CLIP9: rac-[2(2,3-dihexadecyloxypropyloxysuccinyloxy)ethyl]trimethylammonium, oligofectamine, or cationic or polycationic polymers, e.g. polyamino acids such as β-amino polymers acid, or reversible polyamides, etc., modified polyethylenes such as PVP (poly(N-ethyl-4-vinylpyridinium) bromide), etc. modified acrylates such as pDMAEMA (poly(dimethylaminoethyl methyl acrylate)) etc. modified amidoamines such as pAMAM (poly(amidoamine)) etc. modified polybetaaminoester (PBAE) e.g. modified diamine terminus copolymers 1,4-butanediol diacrylate and 5-amino-1-pentanol, etc. dendrimers, for example polypropylamine dendrimers or pAMAM based dendrimers, etc. polyimine(s), e.g. PEI: poly(ethyleneimine), poly(propyleneimine), etc., polyallylamine, sugar backbone polymers such as cyclodextrin-based polymers, dextran-based polymers, chitosan, etc. silane backbone polymers, e.g. PMOXA-PDMS copolymers, etc., block copolymers consisting of a combination of one or more cationic blocks (e.g. selected from the cationic polymer above) and one or more hydrophilic or hydrophobic blocks ( e.g. polyethylene glycol); etc.
Кроме того, предпочтительные катионные или поликатионные белки или пептиды, которые можно применять в качестве адъюванта путем образования комплекса с искусственной молекулой нуклеиновой кислоты или вектором, предпочтительно РНК, включенной/включенным в композицию, можно выбирать из представленных ниже белков или пептидов, имеющих следующую общую формулу (I): (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x, в которой l+m+n+o+х=8-15 и l, m, n или о независимо друг от друга могут обозначать любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, при условии, что общее содержание Arg, Lys, His и Orn составляет по меньшей мере 50% от общего содержания аминокислот в олигопептиде; и Хаа может обозначать любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или ненативных аминокислот за исключением Arg, Lys, His или Orn; и х может обозначать любое число, выбранное из 0, 1, 2, 3 или 4, при условии, что общее содержание Хаа не должно превышать 50% от всех аминокислота олигопептиде. Наиболее предпочтительными олигоаргининами в данном контексте являются, например, Arg7, Arg8, Arg9, Arg7, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R и т.д.In addition, preferred cationic or polycationic proteins or peptides that can be used as an adjuvant by complexing with an artificial nucleic acid molecule or vector, preferably RNA included/included in the composition, can be selected from the following proteins or peptides having the following general formula (I): (Arg) l ;(Lys) m ;(His) n ;(Orn) o ;(Xaa) x , where l+m+n+o+x=8-15 and l, m, n or o independently of each other can be any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15, provided that the total the content of Arg, Lys, His and Orn is at least 50% of the total content of amino acids in the oligopeptide; and Xaa may be any amino acid selected from native (ie, naturally occurring) or non-native amino acids with the exception of Arg, Lys, His, or Orn; and x may be any number selected from 0, 1, 2, 3, or 4, provided that the total Xaa content should not exceed 50% of all amino acids in the oligopeptide. The most preferred oligoarginines in this context are, for example, Arg 7 , Arg 8 , Arg 9 , Arg 7 , H 3 R 9 , R 9 H 3 , H 3 R 9 H 3 , YSSR 9 SSY, (RKH) 4 , Y( RKH) 2 R etc.
Соотношение между искусственной нуклеиновой кислотой или вектором и катионным или поликатионным соединением можно рассчитывать на основе отношения содержания азота к содержанию фосфата (N/P-отношение) во всем включающем нуклеиновую кислоту комплексе. Например, 1 мкг РНК, как правило, содержит примерно 3 нмоля остатков фосфата, при условии, что для РНК характерно статистическое распределение оснований. Кроме того, 1 мл пептида, как правило, содержит примерно х нмолей остатков азота в зависимости от молекулярной массы и количества основных аминокислот. Если в качестве примера сделать расчет для (Arg)9 (молекулярная масса 1424 г/моль, 9 атомов азота), то 1 мкг (Arg)9 содержит примерно 700 пмолей (Arg)9 и, следовательно, 700×9=6300 пмолей основных аминокислот, т.е. 6,3 нмолей атомов азота. Можно рассчитать, что для массового соотношения РНК/(Arg)9, составляющего примерно 1:1, отношение N/P должно составлять примерно 2. Если в качестве примера сделать расчет для протамина (молекулярная масса примерно 4250 г/моль, 21 атом азота, если применяют протамин из лосося) при массовом соотношении, составляющем примерно 2:1, то для 2 мкг РНК РНК дает 6 нмолей фосфата; 1 мкг протамина содержит примерно 235 пмолей молекул протамина и, следовательно, 235×21=4935 пмолей атомов азота, т.е. 4,9 нмолей атомов азота. Можно рассчитать, что для массового соотношения РНК/протамин, составляющего примерно 2:1, отношение N/P должно составлять примерно 0,81. Можно рассчитать, что для массового соотношения РНК/протамин, составляющего примерно 8:1, отношение N/P должно составлять примерно 0,2. В контексте настоящего изобретения касательно соотношения нуклеиновая кислота:пептид в комплексе N/P-отношение предпочтительно находится примерно в пределах 0,1-10, предпочтительно примерно в пределах 0,3-4, и наиболее предпочтительно примерно в пределах 0,5-2 или 0,7-2, и наиболее предпочтительно примерно в пределах 0,7-1,5.The ratio between the artificial nucleic acid or vector and the cationic or polycationic compound can be calculated based on the nitrogen to phosphate ratio (N/P ratio) of the entire nucleic acid complex. For example, 1 μg of RNA typically contains approximately 3 nmol of phosphate residues, provided that the RNA is characterized by a statistical distribution of bases. In addition, 1 ml of the peptide typically contains about x nmol of nitrogen residues, depending on the molecular weight and the number of basic amino acids. If, as an example, a calculation is made for (Arg) 9 (molecular weight 1424 g / mol, 9 nitrogen atoms), then 1 μg of (Arg) 9 contains approximately 700 pmoles (Arg) 9 and, therefore, 700 × 9 = 6300 pmoles of basic amino acids, i.e. 6.3 nmol nitrogen atoms. It can be calculated that for an RNA/(Arg) 9 weight ratio of about 1:1, the N/P ratio should be about 2. If, as an example, the calculation is made for protamine (molecular weight about 4250 g/mol, 21 nitrogen atoms, if protamine from salmon is used) at a weight ratio of approximately 2:1, then for 2 μg of RNA, RNA provides 6 nmol of phosphate; 1 µg of protamine contains approximately 235 pmoles of protamine molecules and therefore 235×21=4935 pmoles nitrogen atoms, i.e. 4.9 nmol nitrogen atoms. It can be calculated that for an RNA/protamine weight ratio of about 2:1, the N/P ratio would be about 0.81. It can be calculated that for an RNA/protamine weight ratio of about 8:1, the N/P ratio would be about 0.2. In the context of the present invention, regarding the ratio of nucleic acid:peptide in the complex, the N/P ratio is preferably in the range of 0.1-10, preferably in the range of 0.3-4, and most preferably in the range of 0.5-2 or 0.7-2, and most preferably in the range of 0.7-1.5.
В заявке на патент WO 2010/037539, содержание которой включено в настоящее описание в качестве ссылки, описана иммуностимулирующая композиция и методы получения иммуностимулирующей композиции. Так, в предпочтительном варианте осуществления изобретения композицию получают, осуществляя две отдельные стадии для достижения и эффективного иммуностимулирующего действия, и эффективной трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении. Для этого на первой стадии получают так называемый «адъювантный компонент» путем образования комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно РНК, входящую в адъювантный компонент, и катионное или поликатионное соединение в конкретном соотношении для формирования стабильного комплекса. В этом контексте важно, чтобы в адъювантном компоненте отсутствовало или сохранялось лишь в ничтожно малых количествах свободное катионное или поликатионное соединение после образования комплекса с нуклеиновой кислотой. Таким образом, соотношение между нуклеиновой кислотой и катионным или поликатионным соединением в адъювантном компоненте, как правило, выбирают в таком диапазоне, чтобы нуклеиновая кислота была полностью включена в комплекс и отсутствовало или сохранялось лишь в ничтожно малых количествах свободное катионное или поликатионное соединение. Предпочтительно соотношение в адъювантном компоненте, т.е. соотношение между мРНК и катионным или поликатионным соединением, выбирают из диапазона, составляющего от примерно 6:1 (мас./мас.) до примерно 0,25:1 (мас./мас.), более предпочтительно от примерно 5:1 (мас./мас.) до примерно 0,5:1 (мас./мас.), еще более предпочтительно от примерно 4:1 (мас./мас.) до примерно 1:1 (мас./мас.) или от примерно 3:1 (мас./мас.) до примерно 1:1 (мас./мас.) и наиболее предпочтительно от примерно 3:1 (мас./мас.) до примерно 2:1 (мас./мас.).Patent application WO 2010/037539, the contents of which are incorporated herein by reference, describes an immunostimulatory composition and methods for preparing an immunostimulatory composition. Thus, in a preferred embodiment of the invention, the composition is prepared by performing two separate steps to achieve both an effective immunostimulatory effect and efficient translation of the artificial nucleic acid molecule of the invention. To do this, in the first stage, the so-called "adjuvant component" is obtained by forming a complex that includes an artificial nucleic acid molecule or a vector, preferably RNA, which is part of the adjuvant component, and a cationic or polycationic compound in a specific ratio to form a stable complex. In this context, it is important that the adjuvant component is free from or retains only negligible amounts of free cationic or polycationic compound after complexation with the nucleic acid. Thus, the ratio between the nucleic acid and the cationic or polycationic compound in the adjuvant component is generally chosen to be in the range such that the nucleic acid is completely incorporated into the complex and there is no or only negligible free cationic or polycationic compound present. Preferably the ratio in the adjuvant component, ie. the ratio between mRNA and cationic or polycationic compound is selected from the range of from about 6:1 (wt./wt.) to about 0.25:1 (wt./wt.), more preferably from about 5:1 (wt. ./wt.) to about 0.5:1 (wt./wt.), even more preferably from about 4:1 (wt./wt.) to about 1:1 (wt./wt.) or from about 3:1 (w/w) to about 1:1 (w/w) and most preferably from about 3:1 (w/w) to about 2:1 (w/w).
Согласно предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно молекулу РНК, предлагаемую/предлагаемый в изобретении, добавляют на второй стадии к входящей в комплекс молекуле нуклеиновой кислоты, предпочтительно РНК, адъювантного компонента для получения (иммуностимулирующей) композиции, предлагаемой в изобретении. При этом искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно молекулу РНК, предлагаемую/предлагаемый в изобретении, добавляют в виде свободной нуклеиновой кислоты, т.е. нуклеиновой кислоты, которая не входит в комплекс с другими соединениями. Перед добавлением свободную искусственную молекулу нуклеиновой кислоты или вектор не включают в комплекс и предпочтительно после добавления адъювантного компонента она/он не должна/должен подвергаться какой-либо поддающейся обнаружению или значимой реакции комплексообразования.According to a preferred embodiment of the invention, an artificial nucleic acid molecule or a vector, preferably an RNA molecule according to the invention, is added in a second step to the complexed nucleic acid molecule, preferably RNA, of the adjuvant component to obtain an (immunostimulatory) composition according to the invention. In this case, an artificial nucleic acid molecule or a vector, preferably an RNA molecule according to the invention, is added in the form of a free nucleic acid, i.e. nucleic acid that is not complexed with other compounds. Prior to addition, the free artificial nucleic acid molecule or vector is not complexed, and preferably after addition of the adjuvant component, it/it should not undergo any detectable or significant complexation reaction.
Приемлемые адъюванты можно выбирать также из нуклеиновых кислот, имеющих формулу (II): GlXmGn, в которой: G обозначает гуанозин, урацил или аналог гуанозина или урацила; Х обозначает гуанозин, урацил, аденозин, тимидин, цитозин или аналог вышеуказанных нуклеотидов; 1 обозначает целое число от 1 до 40, при этом, когда 1=1, то G представляет собой гуанозин или его аналог, когда 1>1, то по меньшей мере 50% нуклеотидов представляют собой гуанозин или его аналог; m обозначает целое число и обозначает по меньшей мере 3; при этом, когда m=3, то Х представляет собой урацил или его аналог, когда m>3, то по присутствуют меньшей мере 3 последовательно расположенных урацилов или аналогов урацила; n обозначает целое число от 1 до 40, при этом, когда n=1, то G представляет собой гуанозин или его аналог, когда n>1, то по меньшей мере 50% нуклеотидов представляет собой гуанозин или его аналог.Suitable adjuvants can also be selected from nucleic acids having the formula (II): G l X m G n in which: G is guanosine, uracil or an analogue of guanosine or uracil; X is guanosine, uracil, adenosine, thymidine, cytosine, or an analogue of the above nucleotides; 1 denotes an integer from 1 to 40, while when 1=1, then G is guanosine or its analogue, when 1>1, then at least 50% of the nucleotides are guanosine or its analogue; m is an integer and is at least 3; when m=3, then X is uracil or its analogue, when m>3, then there are at least 3 consecutive uracils or analogues of uracil; n denotes an integer from 1 to 40, while when n=1, then G is guanosine or its analogue, when n>1, then at least 50% of the nucleotides is guanosine or its analogue.
Другие приемлемые адъюванты можно выбирать также из нуклеиновых кислот, имеющих формулу (III): ClXmCn, в которой: С обозначает цитозин, урацил или аналог цитозина или урацила; Х обозначает гуанозин, урацил, аденозин, тимидин, цитозин или аналог вышеуказанных нуклеотидов; 1 обозначает целое число от 1 до 40, при этом, когда 1=1, то С представляет собой цитозин или его аналог, когда 1>1, то по меньшей мере 50% нуклеотидов представляют собой цитозин или его аналог; m обозначает целое число и обозначает по меньшей мере 3; когда m=3, Х представляет собой урацил или его аналог, когда m>3, то присутствуют по меньшей мере 3 последовательно расположенных урацила или аналогов урацила; n обозначает целое число от 1 до 40, при этом, когда n=1, то С представляет собой цитозин или его аналог, когда n>1, то по меньшей мере 50% нуклеотидов представляют собой цитозин или его аналог.Other suitable adjuvants can also be selected from nucleic acids having the formula (III): C l X m C n in which: C is cytosine, uracil or analog of cytosine or uracil; X is guanosine, uracil, adenosine, thymidine, cytosine, or an analogue of the above nucleotides; 1 denotes an integer from 1 to 40, while when 1=1, then C is a cytosine or its analogue, when 1>1, then at least 50% of the nucleotides are cytosine or its analogue; m is an integer and is at least 3; when m=3, X is uracil or an analogue thereof; when m>3, then at least 3 consecutive uracil or analogues of uracil are present; n denotes an integer from 1 to 40, while when n=1, then C is a cytosine or its analogue, when n>1, then at least 50% of the nucleotides are cytosine or its analogue.
Предлагаемая в настоящем изобретении фармацевтическая композиция предпочтительно содержит в «безопасном и эффективном количестве» компоненты фармацевтической композиции, прежде всего предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты, вектор и/или клетки, представленные в настоящем описании. В контексте настоящего описания понятие «безопасное и эффективное количество» обозначает количество, достаточное для значимой индукции положительной модификации заболевания или нарушения, указанного в настоящем описании. Однако в то же время «безопасное и эффективное количество» должно быть таким, чтобы избегать серьезных побочных действий и обеспечивать разумное соотношение между преимуществом и риском. Определение этих пределов, как правило, находится в компетенции осуществляющего лечение врача.The pharmaceutical composition according to the present invention preferably contains in a "safe and effective amount" the components of the pharmaceutical composition, especially the artificial nucleic acid molecule according to the invention, the vector and/or the cells presented in the present description. In the context of the present description, the term "safe and effective amount" means an amount sufficient to significantly induce a positive modification of the disease or disorder specified in the present description. However, at the same time, a "safe and effective amount" should be such as to avoid serious side effects and provide a reasonable balance between benefit and risk. The determination of these limits, as a rule, is within the competence of the treating physician.
Следующим объектом настоящего изобретения является искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, предназначенная/предназначенный для применения в качестве лекарственного средства, например, в качестве вакцины (для генетической вакцинации), или в генной терапии.Another object of the present invention is an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention intended/intended for use as a drug, for example, as a vaccine (for genetic vaccination), or in gene therapy.
Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, наиболее пригодны для любого медицинского применения, в котором используется терапевтическое действие или эффект пептидов, полипептидов или белков, или в котором требуется добавление конкретного пептида или белка. Таким образом, в настоящем изобретении предложены искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, предназначенные для применения при лечении или предупреждении заболеваний или нарушений, поддающихся лечению посредством терапевтического действия или эффекта пептидов, полипептидов или белков, или поддающихся лечению путем добавления пептида, полипептида или белка. Например, искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять для лечения или предупреждения генетических заболеваний, аутоиммунных заболеваний, раковых или связанных с опухолью заболеваний, инфекционных заболеваний, хронических заболеваний или т.п., например, путем генетической вакцинации или генной терапии.The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are most suitable for any medical application that uses the therapeutic action or effect of peptides, polypeptides or proteins, or in which the addition of a particular peptide or protein is required. Thus, the present invention provides an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention for use in the treatment or prevention of diseases or disorders. treatable by the therapeutic action or effect of the peptides, polypeptides or proteins, or treatable by the addition of a peptide, polypeptide or protein. For example, an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention can be used to treat or prevent genetic diseases, autoimmune diseases, cancer, or related with tumor diseases, infectious diseases, chronic diseases or the like, for example, by genetic vaccination or gene therapy.
В частности, такие терапевтические обработки, польза от которых определяется стабильным и пролонгированным присутствием терапевтических пептидов, полипептидов или белков в организме индивидуума, подлежащего лечению, являются наиболее пригодными в качестве медицинского подхода в контексте настоящего изобретения, поскольку предлагаемый в изобретении 3'-UTR-элемент обеспечивает стабильную и пролонгированную экспрессию пептида или белка, кодируемого предлагаемой в изобретении искусственной молекулой нуклеиновой кислоты или предлагаемым в изобретении вектором. Так, наиболее пригодным медицинским применением искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, вектора, предлагаемого в настоящем изобретении, клетки, предлагаемой в настоящем изобретении, или фармацевтической композиции, предлагаемой в настоящем изобретении, является вакцинация. Таким образом, в настоящем изобретении предложены искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, для вакцинации индивидуума, предпочтительно млекопитающего, более предпочтительно человека. Предпочтительными видами вакцинации являются вакцинация против инфекционных заболеваний, таких как бактериальные, вызываемые простейшими или вирусные инфекции, и противоопухолевая вакцинация. Такие виды вакцинации можно осуществлять в профилактических или терапевтических целях.In particular, such therapeutic treatments, the benefit of which is determined by the stable and prolonged presence of therapeutic peptides, polypeptides or proteins in the body of the individual to be treated, are most suitable as a medical approach in the context of the present invention, since the inventive 3'-UTR element provides stable and prolonged expression of the peptide or protein encoded by the artificial nucleic acid molecule of the invention or the vector of the invention. Thus, the most suitable medical application of the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention is vaccination. Thus, the present invention provides an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention for vaccinating a subject, preferably a mammal, more preferably a human. . The preferred types of vaccination are vaccination against infectious diseases such as bacterial, protozoan or viral infections and antitumor vaccination. Such types of vaccination can be carried out for prophylactic or therapeutic purposes.
Можно выбирать ОРС в зависимости от заболевания, подлежащего лечению. Например, открытая рамка считывания может кодировать белок, который требуется поставлять в организм пациента, страдающего от полной потери или по меньшей мере от частичной потери функции белка, например, в организм пациента, страдающего генетическим заболеванием. Кроме того, открытую рамку считывания можно выбирать из ОРС, кодирующих пептид или белок, который оказывает благоприятное действие на заболевание или состояние пациента. Кроме того, открытая рамка считывания может кодировать пептид или белок, который осуществляет понижающую регуляцию патологического сверхпроизводства встречающегося в естественных условиях пептида или белка или элиминацию клеток, патологически экспрессирующих белок или пептид. Такое отсутствие, потеря функции или сверхпроизводство могут иметь место, например, в случае опухоли или неоплазии, при аутоиммунных заболеваниях, аллергиях, инфекциях или хронических заболеваниях, или т.п.Кроме того, открытая рамка считывания может кодировать антиген или иммуноген, например, эпитоп патогена или опухолевого антигена. Так, в предпочтительных вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты или вектор, предлагаемая/предлагаемый в настоящем изобретении, содержит ОРС, кодирующую аминокислотную последовательность, содержащую или состоящую из последовательности антигена или иммуногена, например, эпитопа патогена или опухоль-ассоциированного антигена, 3'-UTR-элемент, указанный выше, и необязательно другие компоненты, такие как поли(А)-последовательность и т.п.You can choose ORS depending on the disease to be treated. For example, the open reading frame may encode a protein that is to be delivered to a patient suffering from a complete loss or at least a partial loss of protein function, such as a patient suffering from a genetic disease. In addition, the open reading frame can be selected from ORFs encoding a peptide or protein that has a beneficial effect on the disease or condition of the patient. In addition, the open reading frame may encode a peptide or protein that down-regulates abnormal overproduction of a naturally occurring peptide or protein, or elimination of cells abnormally expressing the protein or peptide. Such absence, loss of function, or overproduction may occur, for example, in the case of a tumor or neoplasia, in autoimmune diseases, allergies, infections, or chronic diseases, or the like. pathogen or tumor antigen. Thus, in preferred embodiments of the invention, the artificial nucleic acid molecule or vector proposed / proposed in the present invention contains an ORF encoding an amino acid sequence containing or consisting of an antigen or immunogen sequence, for example, a pathogen epitope or tumor-associated antigen, 3'- The UTR element as above, and optionally other components such as a poly(A) sequence, and the like.
В контексте медицинского применения, прежде всего в контексте вакцинации, предпочтительно, чтобы искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, представляла собой РНК, предпочтительно мРНК, поскольку ДНК несет риск вызывания иммунного анти-ДНК-ответа и имеет тенденцию к встраиванию в геномную ДНК. Однако в некоторых вариантах осуществления изобретения, например, когда применяют вирусный носитель для доставки, такой как аденовирусный носитель для доставки, для доставки искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении, например, в контексте различных видов генного терапии, может оказаться желательным, чтобы искусственная молекула нуклеиновой кислоты или вектор представляла/представлял собой молекулу ДНК.In the context of medical applications, especially in the context of vaccination, it is preferable that the artificial nucleic acid molecule of the present invention is RNA, preferably mRNA, since DNA carries the risk of inducing an immune anti-DNA response and tends to be integrated into genomic DNA . However, in some embodiments of the invention, for example, when a viral delivery vehicle, such as an adenoviral delivery vehicle, is used to deliver an artificial nucleic acid molecule or vector of the present invention, for example, in the context of various types of gene therapy, it may be desirably, the artificial nucleic acid molecule or vector is/is a DNA molecule.
Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить орально, парентерально, путем ингаляции с использованием спрея, местно, ректально, интраназально, трансбуккально, вагинально, с использованием имплантированного резервуара или посредством струйной инъекции. В контексте настоящего описания понятие «парентерально» включает методы подкожной, внутривенной, внутримышечной, внутрисуставной, интрасиновиальной, надчревной, внутриоболочечной, внутрипеченочной, осуществляемой в область повреждения, внутричерепной, трансдермальной (чрескожной), внутрикожной, внутрилегочной, внутрибрюшинной, внутрисердечной, внутриартериальной и подъязычной инъекции или инфузии. В предпочтительном варианте осуществления изобретения искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, вводят посредством безыгольной инъекции (например, струйной инъекции).The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention can be administered orally, parenterally, by inhalation using a spray, topically, rectally, intranasally , buccally, vaginally, using an implanted reservoir, or by bolus injection. In the context of the present description, the term "parenteral" includes the methods of subcutaneous, intravenous, intramuscular, intraarticular, intrasynovial, epigastric, intrathecal, intrahepatic, carried out in the area of damage, intracranial, transdermal (percutaneous), intradermal, intrapulmonary, intraperitoneal, intracardiac, intraarterial and sublingual injection or infusion. In a preferred embodiment, the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are administered by needleless injection (e.g., jet injection).
Предпочтительно искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, вводят парентерально, например, путем парентеральной инъекции, более предпочтительно с помощью методов подкожной, внутривенной, внутримышечной, внутрисуставной, интрасиновиальной, надчревной, внутриоболочечной, внутрипеченочной, осуществляемой в область повреждения, внутричерепной, трансдермальной (чрескожной), внутрикожной, внутрилегочной, внутрибрюшинной, внутрисердечной, внутриартериальной и подъязычной инъекции или инфузии. Наиболее предпочтительными являются внутрикожная и внутримышечная инъекции. Стерильные инъекционные формы предлагаемой в изобретении фармацевтической композиции могут представлять собой водную или масляную суспензию. Такие суспензии можно приготавливать с помощью методов, известных в данной области, с применением пригодных диспергирующих или смачивающих средств. Предпочтительно, растворы или суспензии вводят посредством безыгольной инъекции (например, струйной инъекции).Preferably, the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are administered parenterally, such as by parenteral injection, more preferably by subcutaneous, intravenous, intramuscular, intraarticular, intrasynovial, epigastric, intrathecal, intrahepatic, carried out in the area of damage, intracranial, transdermal (percutaneous), intradermal, intrapulmonary, intraperitoneal, intracardiac, intraarterial and sublingual injection or infusion. Most preferred are intradermal and intramuscular injections. Sterile injectable forms of the pharmaceutical composition according to the invention may be an aqueous or oily suspension. Such suspensions can be prepared using methods known in the art using suitable dispersing or wetting agents. Preferably, solutions or suspensions are administered by needleless injection (eg, jet injection).
Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить также орально в любой пригодной для орального введения лекарственной форме, включая (но, не ограничиваясь только ими) капсулы, таблетки, водные суспензии или растворы.The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention may also be orally administered in any oral dosage form, including (but, not limited to) capsules, tablets, aqueous suspensions or solutions.
Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить также местно, прежде всего в тех случаях, когда мишень для лечения включает области или органы, легко доступные для местного нанесения, включая, например, заболевания кожи или любой другой доступной эпителиальной ткани. Для каждой из таких областей или органов можно легко приготавливать пригодные для местной обработки композиции. Для местного нанесения искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно приготавливать в виде пригодной мази, суспендированной или растворенной в одном или нескольких носителях.An artificial nucleic acid molecule according to the present invention, a vector according to the present invention, a cell according to the present invention, or a pharmaceutical composition according to the present invention can also be administered topically, especially in cases where the target for treatment includes areas or organs readily available for topical application, including, for example, diseases of the skin or any other accessible epithelial tissue. For each of these areas or organs, compositions suitable for topical treatment can be easily prepared. For topical application, an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention may be formulated into a suitable ointment suspended or dissolved in one or more carriers.
В одном из вариантов осуществления изобретения применение в качестве лекарственного средства включает стадию трансфекции клеток млекопитающих, предпочтительно трансфекцию in vitro или ex vivo клеток млекопитающих, более предпочтительно трансфекцию in vitro клеток, выделенных из организма пациента, подлежащего лечению лекарственным средством. Если применение включает трансфекцию in vitro выделенных клеток, то применение может предусматривать также повторное введение трансфектированных клеток пациенту. Применение предлагаемых в изобретении искусственных молекул нуклеиновой кислоты или вектора в качестве лекарственного средства может включать также стадию отбора успешно трансфектированных выделенных клеток. Таким образом, может оказаться целесообразным, чтобы вектор содержал также маркер для селекции. Применение в качестве лекарственного средства может включать также трансфекцию in vitro выделенных клеток и очистку продукта экспрессии, т.е. кодируемого пептида или белка из указанных клеток. Этот очищенный пептид или белок можно затем вводить индивидууму, нуждающемуся в этом.In one embodiment, the use as a drug comprises the step of transfecting mammalian cells, preferably in vitro or ex vivo transfection of mammalian cells, more preferably in vitro transfection of cells isolated from the patient to be treated with the drug. If the use involves in vitro transfection of the isolated cells, then the use may also involve reintroduction of the transfected cells into the patient. The use of the artificial nucleic acid molecules or vector according to the invention as a drug may also include the step of selecting successfully transfected isolated cells. Thus, it may be desirable for the vector to also contain a selection marker. Use as a drug may also include in vitro transfection of isolated cells and purification of the expression product, i.e. encoded peptide or protein from said cells. This purified peptide or protein can then be administered to an individual in need thereof.
В настоящем изобретении предложен также способ лечения или предупреждения заболевания или нарушения, указанного выше, заключающийся в том, что вводят искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, индивидууму, нуждающемуся в этом.The present invention also provides a method for treating or preventing a disease or disorder as defined above, comprising administering an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition, proposed in the present invention, the individual in need of it.
Кроме того, предложен способ лечения или предупреждения заболевания или нарушения, заключающийся в том, что осуществляют трансфекцию клетки искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, или вектором, предлагаемым в настоящем изобретении. Указанную трансфекцию можно осуществлять in vitro, ex vivo или in vivo. В предпочтительном варианте осуществления изобретения трансфекцию клетки осуществляют in vitro и трансфектированную клетку вводят индивидууму, нуждающемуся в этом, предпочтительно больному человеку. Предпочтительно клетка, которую требуется трансфектировать in vitro, представляет собой клетку, выделенную из организма индивидуума, предпочтительно больного человека. Таким образом, в настоящем изобретении предложен способ лечения, заключающийся в том, что осуществляют стадии, на которых выделяют клетку из организма индивидуума, предпочтительно из организма больного человека, трансфектируют выделенную клетку искусственной нуклеиновой кислотой, предлагаемой в настоящем изобретении, или вектором, предлагаемым в настоящем изобретении, и вводят трансфектированную клетку индивидууму, предпочтительно больному человеку.In addition, a method for treating or preventing a disease or disorder is provided, comprising transfecting a cell with an artificial nucleic acid molecule of the present invention or a vector of the present invention. Said transfection can be carried out in vitro, ex vivo or in vivo. In a preferred embodiment of the invention, the cell is transfected in vitro and the transfected cell is administered to an individual in need thereof, preferably a sick individual. Preferably, the cell to be transfected in vitro is a cell isolated from the body of an individual, preferably a diseased human. Thus, the present invention provides a method of treatment comprising the steps of isolating a cell from an individual, preferably from a sick person, transfecting the isolated cell with an artificial nucleic acid of the present invention or a vector of the present invention. of the invention and administering the transfected cell to an individual, preferably a sick individual.
Способ лечения или предупреждения нарушения, предлагаемый в настоящем изобретении, предпочтительно представляет собой способ вакцинации или способ генной терапии, описанный выше.The method for treating or preventing a disorder according to the present invention is preferably a vaccination method or a gene therapy method as described above.
Как описано выше, предлагаемый в изобретении 3'-UTR-элемент обладает способностью стабилизировать молекулу мРНК и/или усиливать, стабилизировать и/или пролонгировать производство белка с молекулы мРНК. Таким образом, следующий объект настоящего изобретения относится к способу стабилизации молекулы РНК, предпочтительно молекулы мРНК, заключающийся в том, что выполняют стадию, на которой осуществляют ассоциацию молекулы РНК, предпочтительно молекулы мРНК, или вектора, кодирующего молекулу РНК, с 3'-UTR-элементом, содержащим или состоящим из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка, предпочтительно с 3'-UTR-элементом, описанным выше.As described above, the 3'UTR element of the invention has the ability to stabilize an mRNA molecule and/or enhance, stabilize and/or prolong protein production from an mRNA molecule. Thus, a further object of the present invention relates to a method for stabilizing an RNA molecule, preferably an mRNA molecule, comprising the step of associating an RNA molecule, preferably an mRNA molecule, or a vector encoding an RNA molecule, with a 3'-UTR- an element containing or consisting of a nucleotide sequence derived from the 3'UTR of a ribosomal protein gene or from a variant 3'UTR of a ribosomal protein gene, preferably with a 3'UTR element as described above.
Кроме того, настоящее изобретение относится к способу повышения, стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или с вектора, предпочтительно с молекулы мРНК, и/или стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или с вектора, предпочтительно с молекулы мРНК, заключающемуся в том, что выполняют стадию, на которой осуществляют ассоциацию искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно молекулы мРНК, с 3'-UTR-элементом, который содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка, предпочтительно с 3'-UTR-элементом, описанным выше.In addition, the present invention relates to a method for increasing, stabilizing and/or prolonging the production of a protein from an artificial nucleic acid molecule or from a vector, preferably from an mRNA molecule, and/or stabilizing and/or prolonging the production of a protein from an artificial nucleic acid molecule or from a vector, preferably from an mRNA molecule, comprising the step of associating an artificial nucleic acid molecule or vector, preferably an mRNA molecule, with a 3'-UTR element which contains or consists of a nucleotide sequence derived from the 3'-UTR a ribosomal protein gene or from a 3'UTR variant of a ribosomal protein gene, preferably with a 3'UTR element as described above.
Выражение «ассоциация искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом» в контексте настоящего изобретения предпочтительно означает функциональную ассоциацию или функциональное объединение искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом. Это означает, что осуществляют ассоциацию или связывание искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом, предпочтительно 3'-UTR-элементом, описанным выше, таким образом, чтобы осуществлялась функция 3'-UTR-элемента, например, функция стабилизации производства РНК и/или белка. Как правило, это означает, что 3'-UTR-элемент интегрируют в искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно в молекулу мРНК, с 3'-стороны относительно открытой рамки считывания, предпочтительно так, чтобы он непосредственно примыкал с 3'-стороны к открытой рамке считывания, предпочтительно располагался между открытой рамкой считывания и поли(А)-последовательностью или сигналом полиаденилирования. Предпочтительно 3'-UTR-элемент интегрируют в искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно в мРНК, в качестве 3'-UTR, т.е. так, чтобы 3'-UTR-элемент представлял собой 3'-UTR искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно мРНК, т.е. так, чтобы он простирался от 3'-стороны открытой рамки считывания до 5'-стороны поли(А)-последовательности или сигнала полиаденилирования, необязательно был присоединен посредством короткого линкера, такого как последовательность, содержащая или состоящая из одного или нескольких сайтов рестрикции. Таким образом, предпочтительно выражение «ассоциация искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом» означает функциональную ассоциацию 3'-UTR-элемента с открытой рамкой считывания, локализованной в искусственной молекуле нуклеиновой кислоты или векторе, предпочтительно в молекуле мРНК. 3'-UTR и ОРС представляют собой конструкции, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, предпочтительно ОРС и 3'-UTR являются гетерологичными, например, происходят из различных генов, как описано выше.The expression "association of an artificial nucleic acid molecule or vector with a 3'UTR element" in the context of the present invention preferably means the functional association or functional association of an artificial nucleic acid molecule or vector with a 3'UTR element. This means that an artificial nucleic acid molecule or vector is associated or linked to a 3'UTR element, preferably the 3'UTR element described above, in such a way that the function of the 3'UTR element is performed, for example, the stabilization function production of RNA and/or protein. Generally, this means that the 3'UTR element is integrated into an artificial nucleic acid molecule or vector, preferably into an mRNA molecule, on the 3' side of the open reading frame, preferably so that it is directly adjacent on the 3' side to open reading frame, preferably located between the open reading frame and the poly(A) sequence or polyadenylation signal. Preferably, the 3'UTR element is integrated into an artificial nucleic acid molecule or vector, preferably mRNA, as a 3'UTR, i. e. such that the 3'UTR element is the 3'UTR of an artificial nucleic acid molecule or vector, preferably mRNA, i. e. such that it extends from the 3' side of the open reading frame to the 5' side of the poly(A) sequence or polyadenylation signal, optionally attached via a short linker, such as a sequence containing or consisting of one or more restriction sites. Thus, preferably, the expression "association of an artificial nucleic acid molecule or vector with a 3'UTR element" means the functional association of a 3'UTR element with an open reading frame located in an artificial nucleic acid molecule or vector, preferably an mRNA molecule. The 3'-UTR and ORF are the constructs described above for the artificial nucleic acid molecule of the present invention, eg, preferably the ORF and 3'-UTR are heterologous, eg are from different genes as described above.
Следующим объектом настоящего изобретения является применение 3'-UTR-элемента, предпочтительно 3'-UTR-элемента, описанного выше, для повышения стабильности молекулы РНК, предпочтительно молекулы мРНК, где 3'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка.Another object of the present invention is the use of a 3'-UTR element, preferably the 3'-UTR element described above, to improve the stability of an RNA molecule, preferably an mRNA molecule, where the 3'-UTR element contains or consists of a nucleotide sequence derived from 3'UTR of a ribosomal protein gene or from a variant 3'UTR of a ribosomal protein gene.
Кроме того, в настоящем изобретении предложено применение 3'-UTR-элемента, предпочтительно 3'-UTR-элемента, описанного выше, для повышения производства белка с искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно с молекулы мРНК, и/или для стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или векторной молекулы, предпочтительно с молекулы мРНК, где 3'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка.In addition, the present invention provides the use of a 3'-UTR element, preferably the 3'-UTR element described above, to increase protein production from an artificial nucleic acid molecule or vector, preferably from an mRNA molecule, and/or to stabilize and/ or prolonging protein production from an artificial nucleic acid molecule or a vector molecule, preferably from an mRNA molecule, where the 3'-UTR element contains or consists of a nucleotide sequence derived from the 3'-UTR of a ribosomal protein gene or from a variant of the 3'-UTR of a ribosomal gene squirrel.
Варианты применения, предлагаемые в настоящем изобретении, предпочтительно включают осуществление ассоциации искусственной молекулы нуклеиновой кислоты, вектора или РНК с 3'-UTR-элементом, описанным выше.The uses of the present invention preferably include the association of an artificial nucleic acid molecule, vector or RNA with a 3'UTR element as described above.
Соединения и ингредиенты предлагаемой в изобретении фармацевтической композиции можно также производить и продавать по отдельности друг от друга. Таким образом, изобретение относится также к набору или набору компонентов, содержащему искусственную молекулу нуклеиновой кислоты, предлагаемую в изобретении, вектор, предлагаемый в изобретении, клетку, предлагаемую в изобретении, и/или фармацевтическую композицию, предлагаемую в изобретении. Предпочтительно такой набор или набор компонентов может дополнительно содержать инструкции по применению, клетки для трансфекции, адъювант, средства для введения фармацевтической композиции, фармацевтически приемлемый носитель и/или фармацевтически приемлемый раствор для растворения или разведения искусственной молекулы нуклеиновой кислоты, вектора, клеток или фармацевтической композиции.The compounds and ingredients of the pharmaceutical composition according to the invention can also be produced and sold separately from each other. Thus, the invention also relates to a kit or kit of components comprising an artificial nucleic acid molecule according to the invention, a vector according to the invention, a cell according to the invention, and/or a pharmaceutical composition according to the invention. Preferably, such a kit or set of components may further comprise instructions for use, cells for transfection, an adjuvant, means for administering the pharmaceutical composition, a pharmaceutically acceptable carrier, and/or a pharmaceutically acceptable solution for dissolving or diluting the artificial nucleic acid molecule, vector, cells, or pharmaceutical composition.
Представленные ниже чертежи, последовательности и примеры предназначены для дополнительной иллюстрации изобретения. Они не направлены на ограничение сущности рассматриваемого изобретения.The following drawings, sequences and examples are intended to further illustrate the invention. They are not intended to limit the essence of the invention in question.
На чертежах показано:The drawings show:
На фиг. 1-3 последовательности, кодирующие мРНК, которые можно получать путем транскрипции in vitro. Используются следующие сокращения:In FIG. 1-3 mRNA coding sequences that can be obtained by in vitro transcription. The following abbreviations are used:
rpl32: 5'-UTR человеческого рибосомального белка большой субъединицы 32, в которой отсутствует 5'-концевой олигопиримидиновый тракт;rpl32: 5'-UTR of the human ribosomal protein large subunit 32, which lacks the 5'-terminal oligopyrimidine tract;
PpLuc (GC): последовательность мРНК с высоким содержанием GC (GC-обогащенная), кодирующая люциферазу Photinus pyralis;PpLuc (GC): high GC (GC-rich) mRNA sequence encoding Photinus pyralis luciferase;
• А64: поли(А)-последовательность, содержащая 64 аденилата;• A64: poly(A) sequence containing 64 adenylates;
• ag: центральная, α-комплекс-связывающая часть 3'-UTR человеческого α-глобина;• ag: central, α-complex-binding portion of the 3'-UTR of human α-globin;
• rps9: 3'-UTR-элемент, происходящий из 3'-UTR человеческого рибосомального белка малой субъединицы 9;• rps9: 3'UTR element derived from the 3'UTR of the human ribosomal small subunit protein 9;
• С30: поли(С)-последовательность, содержащая 30 цитидилатов;• C30: poly(C) sequence containing 30 cytidylates;
• гистонSL: последовательность гистоновой структуры типа «стебель-петля», взятая из публикации Cakmakci, Lerner, Wagner, Zheng и William F Marzluff, Mol. Cell. Biol. 28(3), 2008, сс. 1182-1194;• histone SL: histone stem-loop sequence taken from Cakmakci, Lerner, Wagner, Zheng and William F Marzluff, Mol. cell. Biol. 28(3), 2008, pp. 1182-1194;
альбумин: 3'-UTR человеческого альбумина;albumin: 3'-UTR of human albumin;
на фиг. 1 - представлена последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - А64 - С30 - гистонSL (SEQ ID NO: 8);in fig. 1 shows the sequence encoding mRNA rpl32 - PpLuc(GC) - A64 - C30 - histone SL (SEQ ID NO: 8);
на фиг. 2 - представлена последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - ag - А64 - С30 - гистонSL (SEQ ID NO: 9). Центральная, α-комплекс-связывающая часть 3'-UTR человеческого α-глобина встроена между ОРС и поли(А). ОРС PpLuc(GC) выделена курсивом. 3'-UTR-элемент, происходящий из α-глобина, подчеркнут;in fig. 2 shows the sequence encoding mRNA rpl32 - PpLuc(GC) - ag - A64 - C30 - histone SL (SEQ ID NO: 9). The central, α-complex-binding portion of the 3'-UTR of human α-globin is inserted between the ORF and poly(A). The PpLuc(GC) ORF is in italics. The 3'UTR element derived from α-globin is underlined;
на фиг. 3 - последовательность мРНК rpl32 - PpLuc(GC) - rps9 - А64 - С30 - hSL (SEQ ID NO: 7). 3'-UTR человеческого рибосомального белка малой субъединицы 9 встроена между ОРС и поли(А). ОРС PpLuc(GC) выделена курсивом, 3' UTR-элемент, происходящий из rps9, подчеркнут;in fig. 3 - mRNA sequence rpl32 - PpLuc(GC) - rps9 - A64 - C30 - hSL (SEQ ID NO: 7). The 3'UTR of the human ribosomal small subunit protein 9 is inserted between the ORF and poly(A). The PpLuc(GC) ORF is in italics, the 3' UTR element derived from rps9 is underlined;
на фиг. 4 - данные, демонстрирующие, что 3'-UTR рибосомального белка малой субъединицы 9 существенно повышает экспрессию белка с мРНК;in fig. 4 - data demonstrating that the 3'-UTR of the ribosomal protein of the small subunit 9 significantly increases the expression of the protein from mRNA;
Влияние предлагаемой в изобретении 3'-UTR человеческого рибосомального белка малой субъединицы 9 на экспрессию люциферазы с мРНК изучали в сравнении с экспрессией люциферазы с мРНК, в которой отсутствует 3'-UTR или которая содержит 3'-UTR человеческого α-глобина. Для этого различными мРНК трансфектировали путем липофекции человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 6, 24, 48 и 72 ч после трансфекции. Очевидно, что имела место экспрессия люциферазы с мРНК, в которой отсутствовала 3'-UTR. При этом экспрессия люциферазы не возрастала при включении хорошо известной 3'-UTR человеческого α-глобина. В отличие от этого, 3'-UTR рибосомального белка малой субъединицы 9 приводила к существенному повышению экспрессии люциферазы. Данные представлены на графике в виде средней величины для трех трансфекции, выраженной в относительных световых единицах (RLU)±SEM (стандартное отклонение). Результаты измерений в RLU обобщены в примере 5.1;The effect of the inventive human ribosomal small subunit 9 3'UTR on luciferase expression from mRNA was studied in comparison to luciferase expression from mRNA lacking the 3'UTR or containing the 3'UTR of human α-globin. For this, human dermal fibroblasts (HDFs) were transfected with various mRNAs by lipofection. Luciferase levels were measured 6, 24, 48 and 72 hours after transfection. Obviously, there was expression of luciferase with mRNA that lacked the 3'-UTR. At the same time, luciferase expression did not increase when the well-known 3'-UTR of human α-globin was included. In contrast, the 3'-UTR of the small subunit 9 ribosomal protein resulted in a significant increase in luciferase expression. Data are plotted as the average of three transfections expressed in relative light units (RLU)±SEM (standard deviation). The results of measurements in RLU are summarized in Example 5.1;
на фиг. 5 - последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - альбумин - А64 - С30 - гистонSL (SEQ ID NO: 206). 3'-UTR человеческого альбумина встраивали между ОРС и поли(А). OPC PpLuc(GC) выделена курсивом. 3'-UTR-элемент, происходящий из альбумина, подчеркнут;in fig. 5 - sequence encoding mRNA rpl32 - PpLuc(GC) - albumin - A64 - C30 - histone SL (SEQ ID NO: 206). The 3'UTR of human albumin was inserted between the ORF and poly(A). OPC PpLuc(GC) is in italics. The 3' UTR element derived from albumin is underlined;
на фиг. 6 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a повышают экспрессию белка с мРНК в HDF-клетках (человеческие кожные фибробласты) по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);in fig. 6 - data demonstrating that 3'-UTRs derived from the mouse ribosomal protein genes rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 and rpl23a increase protein expression with mRNA in HDF cells (human skin fibroblasts). ) at least to the same extent as mRNA containing the 3'-UTR of the albumin gene, which has already been shown to increase protein expression from mRNA (WO 2013/143698);
на фиг. 7 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a, повышают экспрессию белка с мРНК в HeLa-клетках по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);in fig. 7 - data demonstrating that 3'-UTRs derived from the mouse ribosomal protein genes rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 and rpl23a increase mRNA protein expression in HeLa cells at least to the same extent as mRNA containing the 3'-UTR of the albumin gene, which has already been shown to increase protein expression from mRNA (WO 2013/143698);
на фиг. 8 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38 повышают экспрессию белка с мРНК в HDF-клетках (человеческие кожные фибробласты) по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);in fig. 8 - data showing that 3'-UTRs derived from the mouse ribosomal protein genes rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 and rpl38 upregulates mRNA protein expression in HDF cells (human skin fibroblasts) at least to the same extent as mRNA containing the 3'-UTR of the albumin gene, which has already been shown to increase protein c mRNA expression (WO 2013 /143698);
на фиг. 9 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38, повышают экспрессию белка с мРНК в HeLa- по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698).in fig. 9 - data showing that 3'-UTRs derived from the mouse ribosomal protein genes rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 and rpl38 increase mRNA protein expression in HeLa- at least to the same extent as mRNA containing the 3'-UTR of the albumin gene, which has already been shown to increase protein expression from mRNA (WO 2013/143698).
ПримерыExamples
1. Получение ДНК-матриц1. Obtaining DNA templates
Конструировали вектор для транскрипции in vitro, содержащий промотор Т7 и GC-обогащенную последовательность, кодирующую люциферазу Photinus pyralis (PpLuc(GC)). 5'-нетранслируемую область (5'-UTR) рибосомального белка большой субъединицы 32 встраивали с 5'-стороны относительно PpLuc(GC). Содержащую 64 аденина (А64) поли(А)-последовательность, за которой следовала последовательность, состоящая из 30 цитозинов (С30), и последовательность структуры типа «стебель-петля», встраивали с 3'-стороны относительно PpLuc(GC). За последовательностью структуры типа «стебель-петля» находился сайт рестрикции, который использовали для линеаризации вектора перед осуществлением транскрипции in vitro. мРНК, полученную с этого вектора после транскрипции in vitro обозначили как «rpl32 - PpLuc(GC) - А64 - С30 - гистонSL».A vector for in vitro transcription was constructed containing the T7 promoter and a GC-rich sequence encoding Photinus pyralis luciferase (PpLuc(GC)). The 5'-untranslated region (5'-UTR) of the 32 large subunit ribosomal protein was inserted 5'-side of PpLuc(GC). A 64-adenine (A64) poly(A) sequence followed by a 30-cytosine (C30) sequence and a stem-loop sequence was inserted 3' to PpLuc(GC). Behind the stem-loop sequence was a restriction site that was used to linearize the vector prior to in vitro transcription. The mRNA obtained from this vector after in vitro transcription was designated as "rpl32 - PpLuc(GC) - A64 - C30 - histone SL".
Указанный вектор модифицировали так, чтобы он включал нетранслируемые последовательности с 3'-стороны относительно открытой рамки считывания (3'-UTR). В целом, создавали векторы, которые содержали следующие кодирующие последовательности мРНК (некоторые из кодирующих последовательностей мРНК представлены в качестве примеров на фиг. 1-3):The specified vector was modified so that it included untranslated sequences from the 3'-side relative to the open reading frame (3'-UTR). In general, vectors were created that contained the following mRNA coding sequences (some of the mRNA coding sequences are shown as examples in Figures 1-3):
rpl32 - PpLuc(GC) - А64 - С30 - гистонSL (SEQ ID NO: 8, фиг. 1);rpl32 - PpLuc(GC) - A64 - C30 - histone SL (SEQ ID NO: 8, Fig. 1);
rpl32 - PpLuc(GC) - ag - А64 - С30 - гистонSL (SEQ ID NO: 9, фиг. 2);rpl32 - PpLuc(GC) - ag - A64 - C30 - histone SL (SEQ ID NO: 9, Fig. 2);
rpl32 - PpLuc(GC) - rps9 - А64 - С30 - гистонSL (SEQ ID NO: 7, фиг. 3);rpl32 - PpLuc(GC) - rps9 - A64 - C30 - histone SL (SEQ ID NO: 7, Fig. 3);
rpl32 - PpLuc(GC) - rps21 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps21 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps29 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps29 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps9 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps9 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps27 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps27 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps28 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps28 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps19 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps19 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl35a - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rpl35a - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl13 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rpl13 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl36 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl36 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl23a - A64 - C30 гистонSL;rpl32 - PpLuc(GC) - rpl23a - A64 - C30 histone SL;
rpl32 - PpLuc(GC) - rpl23 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl23 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - uba52 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - uba52 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl22l1 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl22l1 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl36a - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl36a - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps4x - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps4x - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl27 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl27 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl3 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl3 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps23 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps23 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps13 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps13 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl26 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl26 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps17 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps17 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps18 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps18 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - Fau - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - Fau - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rps13 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps13 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl11 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl11 - A64 - C30 - histone SL;
rpl32 - PpLuc(GC) - rpl38 - A64 - C30 - гистонSL.rpl32 - PpLuc(GC) - rpl38 - A64 - C30 - histone SL.
2. Транскрипция in vitro2. Transcription in vitro
ДНК-матрицу, полученную согласно методу, описанному в примере 1, линеаризовали и транскрибировали in vitro с использованием Т7-РНК-полимеразы. Затем ДНК-матрицу расщепляли путем обработки ДНКазой. мРНК-транскрипты, содержащие 5'-кэп-структуру, получали путем добавления избытка N7-метил-гуанозин-5'-триптофосфат-5'-гуанозина в реакционную смесь для транскрипции. Полученную в результате этого мРНК очищали и ресуспендировали в воде.The template DNA prepared according to the method described in Example 1 was linearized and transcribed in vitro using T7 RNA polymerase. The template DNA was then digested by treatment with DNase. mRNA transcripts containing the 5' cap structure were generated by adding an excess of N7-methyl-guanosine-5'-tryptophosphate-5'-guanosine to the transcription reaction mixture. The resulting mRNA was purified and resuspended in water.
3. Экспрессия люциферазы после липофекции мРНК3. Luciferase expression after mRNA lipofection
Человеческие кожные фибробласты (HDF) или HeLa-клетки высевали в 24-луночные планшеты за три дня до трансфекции с плотностью 3×104 клеток на лунку в среду (среда RPMI 1640, содержащая L-глутамин и 25 мМ Hepes (фирма Lonza, Базель, Швейцария), в которую добавляли 10% FCS, 1% Pen/Strep, 1% глутамина). Непосредственно перед осуществлением липофекции клетки промывали в среде Opti-MEM. Клетки подвергали липофекции с использованием 25 нг мРНК, кодирующей PpLuc, на лунку, включенной в комплекс с липофектамином 2000. Для контроля эффективности трансфекции наряду с мРНК PpLuc (2,5 нг мРНК RrLuc на лунку) осуществляли трансфекцию мРНК, кодирующей люциферазу Renilla reniformis (RrLuc). Через 90 мин после начала трансфекции среду заменяли на Opti-MEM. Через 6, 24, 48 и 72 ч после трансфекции среду удаляли путем аспирации и клетки лизировали в 100 мкл буфера для лизиса (буфер для пассивного лизиса, фирма Promega). Лизаты хранили при -80° до осуществления измерений люциферазной активности.Human dermal fibroblasts (HDF) or HeLa cells were seeded in 24-well plates three days prior to transfection at a density of 3×10 4 cells per well on medium (RPMI 1640 medium containing L-glutamine and 25 mM Hepes (Lonza, Basel , Switzerland) supplemented with 10% FCS, 1% Pen/Strep, 1% glutamine). Immediately prior to lipofection, the cells were washed in Opti-MEM medium. Cells were lipofected with 25 ng mRNA encoding PpLuc per well, included in the complex with Lipofectamine 2000. To control the efficiency of transfection, along with mRNA PpLuc (2.5 ng mRNA RrLuc per well), mRNA encoding Renilla reniformis luciferase (RrLuc ). 90 min after the start of transfection, the medium was replaced with Opti-MEM. At 6, 24, 48 and 72 hours after transfection, the medium was removed by aspiration and the cells were lysed in 100 μl of lysis buffer (passive lysis buffer, Promega). The lysates were stored at -80° until the measurement of luciferase activity.
4. Измерение люциферазы4. Measurement of luciferase
Люциферазную активность измеряли в относительных световых единицах (RLU) с помощью ридера для планшетов Hidex Chameleon. Активность PpLuc измеряли в течение периода измерения, составлявшего 2 с, с использованием 20 мкл лизата и 50 мкл содержащего люциферин буфера (буфер Beetle-Juice, фирма PJK GmbH). Активность RrLuc измеряли в течение периода измерения, составлявшего 2 с, с использованием 20 мкл лизата и 50 мкл содержащего коэлентеразин буфера (буфер Renilla-Juice, фирма PJK GmbH).Luciferase activity was measured in relative light units (RLU) using a Hidex Chameleon plate reader. PpLuc activity was measured over a 2 second measurement period using 20 μl of lysate and 50 μl of luciferin-containing buffer (Beetle-Juice buffer, PJK GmbH). RrLuc activity was measured over a 2 second measurement period using 20 μl of lysate and 50 μl of buffer containing coelenterazine (Renilla-Juice buffer, PJK GmbH).
5. Результаты5. Results
5.1 3'-UTR генов рибосомального белка повышает экспрессию белка.5.1 The 3'-UTR of ribosomal protein genes increases protein expression.
Для изучения воздействия 3'-UTR генов рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК либо не содержали 3'-UTR, либо содержали центральную связывающую а-комплекс часть 3'-UTR человеческого α-глобина (ag), либо содержали 3'-UTR человеческого рибосомального белка малой субъединицы 9 (rps9). мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 6, 24, 48 и 72 ч после трансфекции. На основе этих данных рассчитывали общее количество экспрессированного белка в течение периода времени с 0 до 72 ч в виде площади под кривой (AUC) (см. представленную ниже таблицу 1 и фиг. 4).To study the effect of the 3'-UTR of ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNA either did not contain the 3'-UTR or contained the central α-complex-binding portion of the 3'-UTR of human α-globin (ag ) or contained the 3'-UTR of the human ribosomal small subunit protein 9 (rps9). mRNAs encoding luciferase were transfected into human dermal fibroblasts (HDF). Luciferase levels were measured 6, 24, 48 and 72 hours after transfection. Based on these data, the total amount of protein expressed over a period of time from 0 to 72 hours was calculated as area under the curve (AUC) (see Table 1 below and FIG. 4).
Очевидно, что имела место экспрессия люциферазы с мРНК, в которой отсутствует 3'-UTR. При этом экспрессия люциферазы не повышалась при наличии хорошо известной 3'-UTR α-глобина. В отличие от этого, 3'-UTR рибосомального белка малой субъединицы 9 существенно повышала экспрессию люциферазы.Clearly, luciferase was expressed with mRNA lacking the 3'-UTR. However, luciferase expression was not increased in the presence of the well-known α-globin 3'-UTR. In contrast, the 3'-UTR of the small subunit 9 ribosomal protein significantly increased luciferase expression.
5.2 3'-UTR генов мышиного рибосомального белка повышают экспрессию белка.5.2 The 3'-UTRs of mouse ribosomal protein genes increase protein expression.
Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a) и для сравнения 3'-UTR альбумина, которая, как известно, повышает экспрессию белка с мРНК (WO 2013/143698). мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 2 и фиг. 6).To study the effect of the 3'-UTR of mouse ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNAs containing 3'-UTRs of various mouse ribosomal proteins (rps21, rps29, rps9, rps27, rpl13, rpl36 and rpl23a) and for comparison the 3'-UTR of albumin, which is known to increase protein expression from mRNA (WO 2013/143698). mRNAs encoding luciferase were transfected into human dermal fibroblasts (HDF). Luciferase levels were measured 24, 48 and 72 hours after transfection (see Table 2 below and FIG. 6).
Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.The results indicate that mRNA containing the 3'-UTR of mouse ribosomal proteins expressed luciferase in greater amounts than mRNA containing the 3'-UTR of albumin, which has been described to increase protein production.
5.3 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.5.3 The 3'-UTR of the mouse ribosomal protein genes increases protein expression.
Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали HeLa-клетки. Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 3 и фиг. 7).To study the effect of the 3'-UTR of mouse ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNAs containing 3'-UTRs of various mouse ribosomal proteins (rps21, rps29, rps9, rps27, rpl13, rpl36 and rpl23a) and, for comparison, albumin 3'-UTR. mRNAs encoding luciferase were transfected into HeLa cells. Luciferase levels were measured 24, 48 and 72 hours after transfection (see Table 3 below and Figure 7).
Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.The results indicate that mRNA containing the 3'-UTR of mouse ribosomal proteins expressed luciferase in greater amounts than mRNA containing the 3'-UTR of albumin, which has been described to increase protein production.
5.4 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.5.4 The 3'-UTR of the mouse ribosomal protein genes increases protein expression.
Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 4 и фиг. 8).To study the effect of the 3'-UTR of mouse ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNAs containing 3'-UTRs of various mouse ribosomal proteins (rpl23, uba52, rpl2211, rpl36a, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 and rpl38) and albumin 3'-UTR for comparison. mRNAs encoding luciferase were transfected into human dermal fibroblasts (HDF). Luciferase levels were measured 24, 48 and 72 hours after transfection (see Table 4 below and FIG. 8).
Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.The results indicate that mRNA containing the 3'-UTR of mouse ribosomal proteins expressed luciferase in greater amounts than mRNA containing the 3'-UTR of albumin, which has been described to increase protein production.
5.5 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.The 5.5 3'-UTR of the mouse ribosomal protein genes increases protein expression.
Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали HeLa-клетки. Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 5 и фиг. 9).To study the effect of the 3'-UTR of mouse ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNAs containing 3'-UTRs of various mouse ribosomal proteins (rpl23, uba52, rpl22l1, rpl36a, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 and rpl38) and albumin 3'-UTR for comparison. mRNAs encoding luciferase were transfected into HeLa cells. Luciferase levels were measured 24, 48 and 72 hours after transfection (see Table 5 below and Figure 9).
Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.The results indicate that mRNA containing the 3'-UTR of mouse ribosomal proteins expressed luciferase in greater amounts than mRNA containing the 3'-UTR of albumin, which has been described to increase protein production.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> КуреВак ГмбХ<110> KureWack GmbH
<120> Искусственные молекулы нуклеиновой кислоты<120> Artificial nucleic acid molecules
<130> CU01P155WO1<130> CU01P155WO1
<160> 206 <160> 206
<170> PatentIn, версия 3.5<170> PatentIn version 3.5
<210> 1<210> 1
<211> 70<211> 70
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens<223> Homo sapiens ribosomal protein S9 (RPS9) 3-UTR element
<400> 1<400> 1
gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60
agcgctttac 70agcgctttac 70
<210> 2<210> 2
<211> 70<211> 70
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens<223> Homo sapiens ribosomal protein S9 (RPS9) 3-UTR element
<400> 2<400> 2
guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60
agcgcuuuac 70agcgcuuuac 70
<210> 3<210> 3
<211> 140<211> 140
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens + поли-А<223> Homo sapiens 3-UTR element of ribosomal protein S9 (RPS9) + poly-A
<400> 3<400> 3
gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60
agcgctttac agatctaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa
aaaaaaaaaa aaaaaaaaaa 140aaaaaaaaaaaaaaaaaaaa 140
<210> 4<210> 4
<211> 140<211> 140
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens + поли-А<223> Homo sapiens 3-UTR element of ribosomal protein S9 (RPS9) + poly-A
<400> 4<400> 4
guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60
agcgcuuuac agaucuaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa
aaaaaaaaaa aaaaaaaaaa 140aaaaaaaaaaaaaaaaaaaa 140
<210> 5<210> 5
<211> 24<211> 24
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> наиболее предпочтительная последовательность гистоновой структуры типа<223> the most preferred sequence of histone structure type
«стебель-петля» "stem-loop"
<400> 5<400> 5
caaaggctct tttcagagcc acca 24caaaggctct tttcagagcc acca 24
<210> 6<210> 6
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> 5-UTR человеческого рибосомального белка большой субъединицы 32 без<223> 5-UTR of human ribosomal large subunit protein 32 without
5-концевого олигопиримидинового тракта 5-terminal oligopyrimidine tract
<400> 6<400> 6
ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42
<210> 7<210> 7
<211> 1918<211> 1918
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> rpl32 PpLuc(GC) rps9 A64 C30 гистонSL<223> rpl32 PpLuc(GC) rps9 A64 C30 histoneSL
<400> 7<400> 7
ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60ggggcgctgc ctacgggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60
gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120
ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccggggcac gatcgccttc 180
accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240
ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300
gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360
gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420
ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480
ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540
tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600
ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660
ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720
cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780
ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840
gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900
cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960
aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020
gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 10801080
accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140
ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200
ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260ggcgtgaacc agcggggcga gctgtgcgtg cggggggccga tgatcatgag cggctacgtg 1260
aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320
atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380
aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 14401440
aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500
gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560
gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620
ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680
aagaagggcg gcaagatcgc cgtgtaagac tagtgtccac ctgtccctcc tgggctgctg 1740aagaagggcg gcaagatcgc cgtgtaagac tagtgtccac ctgtccctcc tgggctgctg 1740
gattgtctcg ttttcctgcc aaataaacag gatcagcgct ttacagatct aaaaaaaaaa 1800gattgtctcg ttttcctgcc 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc 18601860
cccccccccc cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1918cccccccccc cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1918
<210> 8<210> 8
<211> 1848<211> 1848
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> rpl32 PpLuc(GC) A64 C30 гистонSL<223> rpl32 PpLuc(GC) A64 C30 histoneSL
<400> 8<400> 8
ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60ggggcgctgc ctacgggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60
gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120
ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccggggcac gatcgccttc 180
accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240
ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300
gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360
gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420
ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480
ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540
tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600
ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660
ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720
cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780
ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840
gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900
cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960
aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020
gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 10801080
accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140
ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200
ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260ggcgtgaacc agcggggcga gctgtgcgtg cggggggccga tgatcatgag cggctacgtg 1260
aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320
atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380
aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 14401440
aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500
gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560
gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620
ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680
aagaagggcg gcaagatcgc cgtgtaagac tagtagatct aaaaaaaaaa aaaaaaaaaa 1740aagaagggcg gcaagatcgc cgtgtaagac tagtagatct aaaaaaaaaa aaaaaaaaaa 1740
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc cccccccccc 1800aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc cccccccccc 1800
cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1848cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1848
<210> 9<210> 9
<211> 1914<211> 1914
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> rpl32 PpLuc(GC) ag A64 C30 гистонSL<223> rpl32 PpLuc(GC) ag A64 C30 histoneSL
<400> 9<400> 9
ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60ggggcgctgc ctacgggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60
gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120
ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccggggcac gatcgccttc 180
accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240
ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300
gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360
gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420
ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480
ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540
tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600
ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660
ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720
cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780
ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840
gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900
cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960
aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020
gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 10801080
accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140
ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200
ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260ggcgtgaacc agcggggcga gctgtgcgtg cggggggccga tgatcatgag cggctacgtg 1260
aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320
atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380
aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 14401440
aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500
gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560
gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620
ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680
aagaagggcg gcaagatcgc cgtgtaagac tagttataag actgactagc ccgatgggcc 1740aagaagggcg gcaagatcgc cgtgtaagac tagttataag actgactagc ccgatgggcc 1740
tcccaacggg ccctcctccc ctccttgcac cgagattaat agatctaaaa aaaaaaaaaa 1800tcccaacggg ccctcctccc ctccttgcac cgagattaat agatctaaaa aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa tgcatccccc 18601860
cccccccccc cccccccccc ccccccaaag gctcttttca gagccaccag aatt 1914cccccccccc cccccccccc ccccccaaag gctcttttca gagccaccag aatt 1914
<210> 10<210> 10
<211> 109<211> 109
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 10<400> 10
gatctaagag ttacctggct acagaaagaa gatgccagat gacacttaag acctacttgt 60gatctaagag ttacctggct acagaaagaa gatgccagat gacacttaag acctacttgt 60
gatatttaaa tgatgcaata aaagacctat tgatttggac cttcttctt 109gatatttaaa tgatgcaata aaagacctat tgatttggac cttcttctt 109
<210> 11<210> 11
<211> 57<211> 57
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 11<400> 11
tgccaggaac agattttgca gttggtgggg tctcaataaa agttattttc cactgac 57tgccaggaac agattttgca gttggtgggg tctcaataaa agttatttttc cactgac 57
<210> 12<210> 12
<211> 91<211> 91
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 12<400> 12
actcttaaat ttgattattc cataaaggtc aaatcatttt ggacagcttc ttttgaataa 60actcttaaat ttgattattc cataaaggtc aaatcatttt ggacagcttc ttttgaataa 60
agacctgatt atacaggcag tgagaaacat g 91agacctgatt atacaggcag tgagaaacat g 91
<210> 13<210> 13
<211> 58<211> 58
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 13<400> 13
acccagcaat tttctatgat tttttcagat atagataata aacttatgaa cagcaact 58acccagcaat tttctatgat tttttcagat atagataata aacttatgaa cagcaact 58
<210> 14<210> 14
<211> 33<211> 33
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 14<400> 14
atgtcttaag aacctaatta aatagctgac tac 33atgtcttaag aacctaatta aatagctgac tac 33
<210> 15<210> 15
<211> 67<211> 67
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 15<400> 15
ggtgtctacc atgattattt ttctaagctg gttggttaat aaacagtacc tgctctcaaa 60ggtgtctacc atgattattt ttctaagctg gttggttaat aaacagtacc tgctctcaaa 60
ttgaaat 67ttgaaat 67
<210> 16<210> 16
<211> 59<211> 59
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 16<400> 16
atgtacactg ttgagttttc tgtacataaa aataattgaa ataatacaaa ttttccttc 59atgtacactg ttgagttttc tgtacataaa aataattgaa ataatacaaa ttttccttc 59
<210> 17<210> 17
<211> 50<211> 50
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 17<400> 17
attcccgttt ctatccaaaa gagcaataaa aagttttcag tgaaatgtgc 50attcccgttt ctatccaaaa gagcaataaa aagttttcag tgaaatgtgc 50
<210> 18<210> 18
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 18<400> 18
gcacaaagga aaacatttca ataaaggatc atttgacaac tggtgg 46gcacaaagga aaacatttca ataaaggatc atttgacaac tggtgg 46
<210> 19<210> 19
<211> 3787<211> 3787
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 19<400> 19
agccctcctg gggacttgga atcagtcggc agtcatgctg ggtctccacg tggtgtgttt 60agccctcctg gggacttgga atcagtcggc agtcatgctg ggtctccacg tggtgtgttt 60
cgtgggaaca actgggcctg ggatggggct tcactgctgt gacttcctcc tgccagggga 120cgtgggaaca actgggcctg ggatggggct tcactgctgt gacttcctcc tgccagggga 120
tttggggctt tcttgaaaga cagtccaagc cctggataat gctttacttt ctgtgttgaa 180tttggggctt tcttgaaaga cagtccaagc cctggataat gctttacttt ctgtgttgaa 180
gcactgttgg ttgtttggtt agtgactgat gtaaaacggt tttcttgtgg ggaggttaca 240gcactgttgg ttgtttggtt agtgactgat gtaaaacggt tttcttgtgg ggaggttaca 240
gaggctgact tcagagtgga cttgtgtttt ttctttttaa agaggcaagg ttgggctggt 300gaggctgact tcagagtgga cttgtgtttt ttctttttaa agaggcaagg ttgggctggt 300
gctcacagct gtaatcccag cactttgagg ttggctggga gttcaagacc agcctggcca 360gctcacagct gtaatcccag cactttgagg ttggctggga gttcaagacc agcctggcca 360
acatgtcaga actactaaaa ataaagaaat cagccatgct tggtgctgca cacttgtagt 420acatgtcaga actactaaaa ataaagaaat cagccatgct tggtgctgca cacttgtagt 420
tgcagctcct gggaggcaga ggtgagggat cacttaaccc aggaggcaga ggctgcactg 480tgcagctcct gggaggcaga ggtgagggat cacttaaccc aggaggcaga ggctgcactg 480
agccaggatc acgccactgc actctagcct gggcaacagt gagactgtct caaaaaaaaa 540agccaggatc acgccactgc actctagcct gggcaacagt gagactgtct caaaaaaaaa 540
aaaagagaca gggtcttcgg cacccaggct ggagtacagt gccacaatca tggctcactg 600aaaagagaca gggtcttcgg cacccaggct ggagtacagt gccacaatca tggctcactg 600
cagtcttgaa ctcatggcct caagcagtcc tccctcagcc tcccaagtag aggggtttat 660cagtcttgaa ctcatggcct caagcagtcc tccctcagcc tcccaagtag aggggtttat 660
aggcacgaga ccctgcaccc aacctagagt tgcctttttt aagcaaagca gtttctagtt 720aggcacgaga ccctgcaccc aacctagagt tgcctttttt aagcaaagca gtttctagtt 720
aatgtagcat cttggacttt ggggcgtcat tcttaagctt gttgtgcccg gtaaccatgg 780aatgtagcat cttggacttt ggggcgtcat tcttaagctt gttgtgcccg gtaaccatgg 780
tcctcttgct ctgattaacc cttccttcaa tgggcttctt cacccagaca ccaaggtatg 840tcctcttgct ctgattaacc cttccttcaa tgggcttctt cacccagaca ccaaggtatg 840
agatggccct gccaagtgtc ggcctctcct gttaaacaaa aacattctaa agccattgtt 900agatggccct gccaagtgtc ggcctctcct gttaaacaaa aacattctaa agccattgtt 900
cttgcttcat ggacaagagg cagccagaga gagtgccagg gtgccctggt ctgagctggc 960cttgcttcat ggacaagagg cagccagaga gagtgccagg gtgccctggt ctgagctggc 960
atccccatgt cttctgtgtc cgagggcagc atggtttctc gtgcagtgct cagacacagc 1020atccccatgt cttctgtgtc cgagggcagc atggtttctc gtgcagtgct cagacacagc 1020
ctgccctagt cctaccagct cacagcagca cctgctctcc ttggcagcta tggccatgac 1080ctgccctagt cctaccagct cacagcagca cctgctctcc ttggcagcta tggccatgac 1080
aaccccagag aagcagcttc agggaccgag tcagattctg ttttgtctac atgcctctgc 1140aacccgag aagcagcttc agggaccgag tcagattctg ttttgtctac atgcctctgc 1140
cgggtgccgg tattgaggca cccagggagc tgttactggc gtggaaatag gtgatgctgc 1200cgggtgccgg tattgaggca cccagggagc tgttactggc gtggaaatag gtgatgctgc 1200
tacctctgct gctgcactca cagccacact tgatacacga tgacaccttg cttgtttgga 12601260
aacatctaaa catctagtag atgacttgca ggctgttggc taccagtttc ctgtctgagg 1320aacatctaaa catctagtag atgacttgca ggctgttggc taccagtttc ctgtctgagg 1320
tgtatatgtt aacttcgtga tcagtttgta tgtttgggac tcttgtccta tgtaaagtta 13801380
aggtgggccg ggtgcagtgg ctcacgcctg taatcctaac actgggaggc cgaggcgggt 1440aggtggggccg ggtgcagtgg ctcacgcctg taatcctaac actgggaggc cgaggcgggt 1440
ggatcacctg atggtgaaac ctcatctcta ctgaaaatac aaaaattagc tgagtggtga 1500ggatcacctg atggtgaaac ctcatctcta ctgaaaatac aaaaattagc tgagtggtga 1500
cacacgcctg taatcccagc tacttggtag gcttgaaccc aggaggcaga gattgcagtg 1560cacacgcctg taatcccagc tacttggtag gcttgaaccc aggaggcaga gattgcagtg 1560
agccgagctg caccactgtg ctccagcctg ggtgacagcg agactcagtc tcaaaaaaag 1620agccgagctg caccactgtg ctccagcctg ggtgacagcg agactcagtc tcaaaaaaag 1620
ttgtacaagg tggatggttg gaagcttgag cctaggctcg aatccctctc acgtgagagg 1680ttgtacaagg tggatggttg gaagcttgag cctaggctcg aatccctctc acgtgagagg 1680
gcctgaagat ttctggtgga ttccaacctg gctgaagact ggccgtgggg ggtgcagggg 1740gcctgaagat ttctggtgga ttccaacctg gctgaagact ggccgtgggg ggtgcagggg 1740
tctccagcgc tctgccctcc agcctgcttc ctccctgccc acaccgcact aggggaaggg 1800tctccagcgc tctgccctcc agcctgcttc ctccctgccc acaccgcact aggggaaggg 1800
cctttcctgc tgcctgcggg gccgcacctg gagtaggtaa tgccatgtgg tgacgtgaat 1860cctttcctgc tgcctgcggg gccgcacctg gagtaggtaa tgccatgtgg tgacgtgaat 1860
ggagcagagg tctgtgcccc atcacaccgc cttgctgttt ttactgtggg acaaaagcac 1920ggagcagagg tctgtgcccc atcacaccgc cttgctgttt ttactgtggg acaaaagcac 1920
tctgatctgc gtgttccggg ggccctccta ccagccgact tgacgggaag tcagggttca 1980tctgatctgc gtgttccggg ggccctccta ccagccgact tgacgggaag tcagggttca 1980
ggtatcatct gtgcacctgg ggcggggtag tctgcactga acctgccaga gtcccctcct 2040ggtatcatct gtgcacctgg ggcggggtag tctgcactga acctgccaga gtcccctcct 2040
catttcactg aaagtcacag tctccagggc tgtgttgcta accttacgtt ctctccgttt 2100catttcactg aaagtcacag tctccagggc tgtgttgcta accttacgtt ctctccgttt 2100
gcttaatcta ttaagagccc taacaggaga ggatgggctt tctctgttgt ctggggccct 21602160
gctgttggcc ggtgctctta gcaagaggtc atttttctag gttgcgctgg gacattgtga 2220gctgttggcc ggtgctctta gcaagaggtc atttttctag gttgcgctgg gacattgtga 2220
gtttggtgag ggtcatggat gtgggctggg ctgggctggg ctgggccggg ctgcctgctg 2280gtttggtgag ggtcatggat gtgggctggg ctgggctggg ctgggccggg ctgcctgctg 2280
cctgctgctc ccctacctga aatgcagcta gtgcggctct gcccttcctg gggctgagga 2340cctgctgctc ccctacctga aatgcagcta gtgcggctct gcccttcctg gggctgagga 2340
aggcttctgc aggatagctg gggggctggg caggtgggtg aggcagcctc cctgctgaca 2400aggcttctgc aggatagctg gggggctggg caggtggggtg aggcagcctc cctgctgaca 2400
ctcagtcctt gtagctggag caagatctcc tgatccaggt acgggcctgt ctgctccaag 2460ctcagtcctt gtagctggag caagatctcc tgatccaggt acgggcctgt ctgctccaag 2460
aaagactctg ccaccagatg caaaggggcc ctttgtttta acttagtccc tggggaccgc 2520aaagactctg ccaccagatg caaaggggcc ctttgtttta acttagtccc tggggaccgc 2520
ctgattcagc acctgtcggc ccaggatacc ccgctggtgg ggacaagtgc ctgagtgtgg 2580ctgattcagc acctgtcggc ccaggatacc ccgctggtgg ggacaagtgc ctgagtgtgg 2580
gccgtgcccg agtgtggcca tccctgagtg gggccgtcct gactaggaag tggcttttca 2640gccgtgcccg agtgtggcca tccctgagtg gggccgtcct gactaggaag tggcttttca 2640
gttgtgatgt gtgggcctga cctagggggc gctgtggaac ccgggctgga accagccctc 2700gttgtgatgt gtgggcctga cctagggggc gctgtggaac ccggggctgga accagccctc 2700
tgtgccaggc cgcagacagg ttccgccggc cctgaggggc agctgccatg gcgtgggtca 2760tgtgccaggc cgcagacagg ttccgccggc cctgaggggc agctgccatg gcgtggggtca 2760
ctgggagctg agaggaaggg cccccaccgc acctcaggca aagcggctct gggaacacct 2820ctgggagctg agaggaaggg cccccaccgc acctcaggca aagcggctct gggaacacct 2820
tgatttcgtc catgtgagcc gtcccaggga gggcagccaa gctgtgaagc ctgagaaact 2880tgatttcgtc catgtgagcc gtcccaggga gggcagccaa gctgtgaagc ctgagaaact 2880
gacctgtgtg ccacgagctt gtggtctgct gcccggtgga ggaagtgcag gtgcgcccag 2940gacctgtgtg cccacgagctt gtggtctgct gcccggtgga ggaagtgcag gtgcgcccag 2940
gctcctcatt ccgttttgca ggattccttc ggggtgtgag catttcctat tcagcctgtc 3000gctcctcatt ccgttttgca ggattccttc ggggtgtgag catttcctat tcagcctgtc 3000
gcccccgggg agcacgggct ggctctgtgg tgcccgtggc cttttgtaga agcgttggtt 30603060
ttacggcagg ttcatctctg gggcagcctc ccacagtggg tggggctttg ccagcagtgc 3120ttacggcagg ttcatctctg gggcagcctc ccacagtggg tggggctttg ccagcagtgc 3120
ccacgggggt catggggcca ggcgcgctcc ggcgcctgca gaactgatcg gggatagtct 3180ccacgggggt catggggcca ggcgcgctcc ggcgcctgca gaactgatcg gggatagtct 3180
caggaggcgc tagtcacgtg ccccggtgat cggggatagt ctcagaaggc gctagtctcc 3240caggaggcgc tagtcacgtg ccccggtgat cggggatagt ctcagaaggc gctagtctcc 3240
tgccccggtg atcggggata gtctcaggag gcacgagtcg cctgcctcgg tgatgcaccg 3300tgccccggtg atcggggata gtctcaggag gcacgagtcg cctgcctcgg tgatgcaccg 3300
tttctcacac cggctgctct ggcccgagct aaaggggaag acgtgtgcgg ataggagctg 3360tttctcacac cggctgctct ggcccgagct aaaggggaag acgtgtgcgg ataggagctg 3360
cacacaattt tcctccatgt attgtttatt ttgctttttc ttttggctag acattaggaa 3420cacacaattt tcctccatgt attgtttatt ttgctttttc ttttggctag acattaggaa 3420
tttcagtttt cccaagttgt atttttcctt ttctatttta aaattatcat gcagggctgg 3480tttcagtttt cccaagttgt atttttcctt ttctatttta aaattatcat gcagggctgg 3480
gtgaggtcgc tcacgcctat agtctcaaaa ctttgggagg ctgagggggg aggatggcat 3540gtgaggtcgc tcacgcctat agtctcaaaa ctttgggagg ctgagggggg aggatggcat 3540
gagcccagga gtttaaggct gcagtgagcc gagatcgctc cactgtcctc cagcctgcat 3600gagccgga gtttaaggct gcagtgagcc gagatcgctc cactgtcctc cagcctgcat 3600
gacagagcga gaccctatct caggaaaaaa aaaaacaaaa ctattatgca gtagtttcga 3660gacagagcga gaccctatct caggaaaaaa aaaaacaaaa ctattatgca gtagtttcga 3660
ccctggaaga cgagtgtgca tctttgagtt gtaacacgtg tacctcgccc atccaggcgt 3720ccctggaaga cgagtgtgca tctttgagtt gtaacacgtg tacctcgccc atccaggcgt 3720
agtttcattt ggaatctggt tatcctgtag ttgctttgtt aaaaatatat gtaattgcaa 3780agtttcattt ggaatctggt tatcctgtag ttgctttgtt aaaaatatat gtaattgcaa 3780
atcattt 3787atcattt 3787
<210> 20<210> 20
<211> 63<211> 63
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 20<400> 20
ttctccagta tatttgtaaa aaataaaaaa aaaaactaaa cccattaaaa agtatttgtt 60ttctccagta tatttgtaaa aaataaaaaa aaaaactaaa cccattaaaa agtatttgtt 60
tgc 63tgc 63
<210> 21<210> 21
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 21<400> 21
ccctggatcc tactctctta ttaaaaagat ttttgctgac agtgc 45ccctggatcc tactctctta ttaaaaagat ttttgctgac agtgc 45
<210> 22<210> 22
<211> 61<211> 61
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 22<400> 22
gtgcagggcc ctcgtccggg tgtgccccaa ataaactcag gaacgccccg gtgctcgccg 60gtgcagggcc ctcgtccggg tgtgccccaa ataaactcag gaacgccccg gtgctcgccg 60
c 61c 61
<210> 23<210> 23
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 23<400> 23
aacctcccac tttgtctgta catactggcc tctgtgatta catagatcag ccattaaaat 60aacctcccac tttgtctgta catactggcc tctgtgatta catagatcag ccattaaaat 60
aaaacaagcc ttaatctgc 79aaaacaagcc ttaatctgc 79
<210> 24<210> 24
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 24<400> 24
taggtgttaa aaaaaaaaat aaaggacctc tgggctac 38taggtgttaa aaaaaaaaat aaaggacctc tgggctac 38
<210> 25<210> 25
<211> 1651<211> 1651
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 25<400> 25
atttcattta tctggaaaat tttgtatgag ttcttgaata aaacttggga accaaaatgg 60atttcattta tctggaaaat tttgtatgag ttcttgaata aaacttggga accaaaatgg 60
tggtttatcc ttgtatctct gcagtgtgga ttgaacagaa aattggaaat catagtcaaa 120tggtttatcc ttgtatctct gcagtgtgga ttgaacagaa aattggaaat catagtcaaa 120
gggcttccct tggttcgcca ctcatttatt tgtaacttga cttctttttt tttctgctta 180180
aaaatttcaa ttctcgtggt aataccagag tagaaggaga gggtgacttt accgaactga 240aaaatttcaa ttctcgtggt aataccagag tagaaggaga gggtgacttt accgaactga 240
cagccattgg ggaggcagat gcgggtgtgg aggtgtgggc tgaaggtagt gactgtttga 300cagccattgg ggaggcagat gcgggtgtgg aggtgtgggc tgaaggtagt gactgtttga 300
ttttaaaaag tgtgactgtc agttgtatct gttgcttttc tcaatgattc agggatacaa 360ttttaaaaag tgtgactgtc agttgtatct gttgcttttc tcaatgattc agggatacaa 360
atgggcttct ctcattcatt aaaagaaaac gcgacatctt tctaagattc tctgtgggaa 420atgggcttct ctcattcatt aaaagaaaac gcgacatctt tctaagattc tctgtgggaa 420
aatgactgtc aataaaatgc gggtttctgg gccattcgtc ttactttcat tttttgatta 480aatgactgtc aataaaatgc gggtttctgg gccattcgtc ttactttcat tttttgatta 480
caaatttctc ttgacgcaca caattatgtc tgctaatcct cttcttccta gagagagaaa 540caaatttctc ttgacgcaca caattatgtc tgctaatcct cttcttccta gagagagaaa 540
ctgtgctcct tcagtgttgc tgccataaag gggtttgggg aatcgattgt aaaagtccca 600ctgtgctcct tcagtgttgc tgccataaag gggtttgggg aatcgattgt aaaagtccca 600
ggttctaaat taactaaatg tgtacagaaa tgaacgtgta agtaatgttt ctacaggtct 660ggttctaaat taactaaatg tgtacagaaa tgaacgtgta agtaatgttt ctacaggtct 660
ttgcaacaaa ctgtcacttt cgtctccagc agagggagct gtaggaatag tgcttccaga 720ttgcaacaaa ctgtcacttt cgtctccagc agagggagct gtaggaatag tgcttccaga 720
tgtggtctcc cgtgtggggc ccagcaatgg gggcccctga tgccaagagc tctggaggtt 780tgtggtctcc cgtgtggggc ccagcaatgg gggcccctga tgccaagagc tctggaggtt 780
cttgaaagag gggacacgaa ggaggagtga ctgggaagcc tcccatgcca aggaggtggg 840cttgaaagag gggacacgaa ggaggagtga ctgggaagcc tcccatgcca aggagggtggg 840
aggtgccctg gaaatagctg cctcatgcca cttaggccat gactggattt aatgtcagtg 900aggtgccctg gaaatagctg cctcatgcca cttaggccat gactggattt aatgtcagtg 900
gtgtgccaca gtgcagaggc tagacaactg aaaggggcta ccaaggctgg gaaaaaaatg 960gtgtgccaca gtgcagaggc tagacaactg aaaggggcta ccaaggctgg gaaaaaaatg 960
caattgttgc tgtgagtgac tttgaaagac tctggtgcct tgtggtgccc ttctgaaatt 1020caattgttgc tgtgagtgac tttgaaagac tctggtgcct tgtggtgccc ttctgaaatt 1020
caaacagtaa tgcaaaagtg tctgcattag aatttacggt gtctaaaatt catgttttta 1080caaacagtaa tgcaaaagtg tctgcattag aatttacggt gtctaaaatt catgttttta 1080
aaagagcttg cctacagatg gtttccacac ttgaaattgt gccctgcgag ttgcatagct 11401140
ggaagttcaa tgctcagtcc taccttggct cccattaaac atttggtgct ctgtggattg 1200ggaagttcaa tgctcagtcc taccttggct cccattaaac atttggtgct ctgtggattg 1200
agttgaacgt gttgaggctt tgcaatttca cttgtgttaa aggctctggc atttttccat 1260agttgaacgt gttgaggctt tgcaatttca cttgtgttaa aggctctggc atttttccat 1260
ttctatgcaa atttctttga agcagaattg cttgcatatt tcttctctgc cgtcacagaa 1320ttctatgcaa atttctttga agcagaattg cttgcatatt tcttctctgc cgtcacagaa 1320
agcagagttt ctttcaaact tcactgaggc atcagttgct ctttggcaat gtcccttaac 1380agcagagttt ctttcaaact tcactgaggc atcagttgct ctttggcaat gtcccttaac 1380
catgattatt aactaagttt gtggcttgag tttacaaatt ctacttgttg cattgatgtt 1440catgattatt aactaagttt gtggcttgag tttacaaatt ctacttgttg cattgatgtt 1440
cccatgtagt aagtcatttt tagtttggtt gtgaaaaaac cctgggctga agttggcatt 1500cccatgtagt aagtcatttt tagtttggtt gtgaaaaaac cctgggctga agttggcatt 1500
tcagttaaaa gaaaaaaaga aactagtccc agatttgaaa acttgtaata aaattgaaac 1560tcagttaaaa gaaaaaaaga aactagtccc agatttgaaa acttgtaata aaattgaaac 1560
tcactggttt tctatgtctt tttgaactct tgtaatcgag ttttgatcat attttctatt 16201620
aaagtggcta acacctggct actcttactg t 1651aaagtggcta acacctggct actcttactg t 1651
<210> 26<210> 26
<211> 474<211> 474
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 26<400> 26
actgagtcca gctgcctaat tctgaatata tatatatata tatcttttca ccatatacat 60actgagtcca gctgcctaat tctgaatata tatatatata tatcttttca ccatatacat 60
gcctgtctgt caatttctgg ttgggctggg aggccacaca cacacactga catgacaggg 120gcctgtctgt caatttctgg ttgggctggg aggccacaca cacacactga catgacaggg 120
cttgggcaag actcctgttc tacttatcct tttgaaatac ctcaccctgc cactccacca 180cttgggcaag actcctgttc tacttatcct tttgaaatac ctcaccctgc cactccacca 180
tgtatgatca ttccagagat ctttgtgact agagttagtg tcctaggaaa accagaactc 240tgtatgatca ttccagagat ctttgtgact agagttagtg tcctaggaaa accagaactc 240
agaacttgcc tccatggttg agtaacaagc tgtacaagaa ccccttttat ccctggaaga 300agaacttgcc tccatggttg agtaacaagc tgtacaagaa ccccttttat ccctggaaga 300
ggctgtgtat gaaaccaatg cccagggttt gaagggtgtt agcatccatt tcaggggagt 360360
gtggattggc tggctctctg gtagcatttt gtcctcacac acccatctac tatgtccaac 420gtggattggc tggctctctg gtagcatttt gtcctcacac acccatctac tatgtccaac 420
cggtctgtct gcttccctca ccccttgccc aataaaggac aaggacttca gagg 474cggtctgtct gcttccctca ccccttgccc aataaaggac aaggacttca gagg 474
<210> 27<210> 27
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 27<400> 27
attcagcatt aaaataaatg taattaaaag gaaaag 36attcagcatt aaaataaatg taattaaaag gaaaag 36
<210> 28<210> 28
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 28<400> 28
actggcagat tagattttta aataaagatt ggattataac tctag 45actggcagat tagattttta aataaagatt ggattataac tctag 45
<210> 29<210> 29
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 29<400> 29
agtaatctta tatacaagct ttgattaaaa cttgaaacaa agagcctg 48agtaatctta tatacaagct ttgattaaaa cttgaaacaa agagcctg 48
<210> 30<210> 30
<211> 32<211> 32
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 30<400> 30
atgctttgtt ttgatcatta aaaattataa ag 32atgctttgtt ttgatcatta aaaattataa ag 32
<210> 31<210> 31
<211> 90<211> 90
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 31<400> 31
accttttcac ctacaaaatt tcacctgcaa accttaaacc tgcaaaattt tcctttaata 60accttttcac ctacaaaatt tcacctgcaa accttaaacc tgcaaaattt tcctttaata 60
aaatttgctt gttttaaaaa cattgtatct 90aaatttgctt gttttaaaaa cattgtatct 90
<210> 32<210> 32
<211> 4065<211> 4065
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 32<400> 32
agccacatgg agggagtttc attaaatgct aactactttt tccttgtggt gtgagtgtag 60agccacatgg agggagtttc attaaatgct aactactttt tccttgtggt gtgagtgtag 60
gttcttcagt ggcacctcta catcctgtgt gcattgggag cccaggttct agtacttagg 120gttcttcagt ggcacctcta catcctgtgt gcattgggag cccaggttct agtacttagg 120
gtatgaagac atggggtcct ctcctgactt ccctcaaata tatggtaaac gtaagaccaa 180gtatgaagac atggggtcct ctcctgactt ccctcaaata tatggtaaac gtaagaccaa 180
cacagacgtt ggccagttaa acatttctgt ttataaagtc agaataatac ctgttgatca 240cacagacgtt ggccagttaa acatttctgt ttataaagtc agaataatac ctgttgatca 240
ctgaaaggcc tgcatgtatt gtactctgaa ttttacagtg aatgagagaa tgtaccctaa 300ctgaaaggcc tgcatgtatt gtactctgaa ttttacagtg aatgagagaa tgtaccctaa 300
ttgttcaaca gggctcaaaa ggaaagattc cattttgatg ggtcacattc taaagagggg 360ttgttcaaca gggctcaaaa ggaaagattc cattttgatg ggtcacattc taaagagggg 360
cagtgtgata ggaatgagat ggtcctttag gacttaagtt ctcagcccaa ggtttttcca 420cagtgtgata ggaatgagat ggtcctttag gacttaagtt ctcagcccaa ggtttttcca 420
cgtggccccc tcatcttttt ttttttttta aacggagtct ctcttgccag gctggagtgc 480cgtggccccc tcatcttttt ttttttttta aacggagtct ctcttgccag gctggagtgc 480
agtggcacga tctcggctca ctgcagcctc cgcctcccag gttaagcgat tctcctgcct 540agtggcacga tctcggctca ctgcagcctc cgcctcccag gttaagcgat tctcctgcct 540
cagcttcctg actaactggg attacaggcg cccaccacca tgcccagcta atttttgtat 600cagcttcctg actaactggg attacaggcg cccaccacca tgcccagcta atttttgtat 600
tttcagtaga gatggggttt caccatgttg gccatgctgg tctctaactc ctaacctcaa 660tttcagtaga gatggggttt caccatgttg gccatgctgg tctctaactc ctaacctcaa 660
gtgatctgcc cacatcggcc tccaaaagtt ctgggattat agtgtgagcc actgcgcccg 720gtgatctgcc cacatcggcc tccaaaagtt ctgggattat agtgtgagcc actgcgcccg 720
gccatggctc cttaatcttg atccaaatta ttgttacatc cagaatgtga tgaatcaaaa 780gccatggctc cttaatcttg atccaaatta ttgttacatc cagaatgtga tgaatcaaaa 780
tctcgagatg ggggtccagc aatctgaaat ttcagtatgc cagggctttt ctgtatgtca 840tctcgagatg ggggtccagc aatctgaaat ttcagtatgc cagggctttt ctgtatgtca 840
aagtgggttt gaaatagtta atttttcttc tagtctgaaa tgtatcggga aaatttggaa 900aagtgggttt gaaatagtta atttttcttc tagtctgaaa tgtatcggga aaatttggaa 900
atcctgaagg ctggaaattg aaataagttt ttctaggatt tgtgtctctt gctattggaa 960atcctgaagg ctggaaattg aaataagttt ttctaggatt tgtgtctctt gctattggaa 960
aactgatggt gaccaattca tgtttacaaa taagatcctc atagatctcg gtaaattata 1020aactgatggt gaccaattca tgtttacaaa taagatcctc atagatctcg gtaaattata 1020
atttgctaca gttttatggt tcttcctgtg attttgagct ttttttgacc caaaataata 1080atttgctaca gttttatggt tcttcctgtg attttgagct ttttttgacc caaaataata 1080
cagtctaaaa ctatagacaa ataagatggc acttagactc ctgggtttta gttagtggag 1140cagtctaaaa ctatagacaa ataagatggc acttagactc ctgggtttta gttagtggag 1140
gtttccttag tgcactgtgg ggtcataata agccgagaac catggctgtc tatgggacac 1200gtttccttag tgcactgtgg ggtcataata agccgagaac catggctgtc tatgggacac 1200
atctgtcagg acaaccttta gaggatgttg gggatcaaat agaaggcaca gagaagcact 1260atctgtcagg acaaccttta gaggatgttg gggatcaaat agaaggcaca gagaagcact 1260
gaattggctt acataagaat aggctagaat tacaagtagt gaaacctcga ttcagctgga 1320gaattggctt acataagaat aggctagaat tacaagtagt gaaacctcga ttcagctgga 1320
caattttaaa caaatgtatc atttggcttg tatcttctgt tgtgctggag aagttagaaa 1380caattttaaa caaatgtatc atttggcttg tatcttctgt tgtgctggag aagttagaaa 1380
taagggctct ccagaccagc ctgaccaacc tggagaaacc ttgtctctac taaatacaca 1440taagggctct ccagaccagc ctgaccaacc tggagaaacc ttgtctctac taaatacaca 1440
aaattagcca ggcgtggtgg cacatgcctg taatcccagc tactttggag gctgagccag 1500aaattagcca ggcgtggtgg cacatgcctg taatcccagc tactttggag gctgagccag 1500
gagaatctcc aggaggcgga ggttgctgtg agccgagatc gtgccattgc actccagctt 1560gagaatctcc aggaggcggga ggttgctgtg agccgagatc gtgccattgc actccagctt 1560
gggcaacaag agtgaaactc tgtccacccc ccccaaaaaa agtaagggct ctccattagg 1620gggcaacaag agtgaaactc tgtccacccc ccccaaaaaa agtaagggct ctccattagg 1620
gcccatagag gacttgtaat atggaacctg aatccaagga tcccacaata agtggtcagt 1680gcccatagag gacttgtaat atggaacctg aatccaagga tcccacaata agtggtcagt 1680
agttcatgat gaattaaaag actcaatatt tggtcttcac ccaatacctg tgtgactttt 1740agttcatgat gaattaaaag actcaatatt tggtcttcac ccaatacctg tgtgactttt 1740
agtcctaatt tcctcatctt taaaatttca gtgaaagtgc ctacctgagg attgtgtaga 1800agtcctaatt tcctcatctt taaaatttca gtgaaagtgc ctacctgagg attgtgtaga 1800
ttaaaatgga aaccgtgcac ttaatttttt gttttgtttt gagacggagt ctcgctctgt 1860ttaaaatgga aaccgtgcac ttaatttttt gttttgtttt gagacggagt ctcgctctgt 1860
cgcccaggct ggagtgcagt ggtgcgatct cagatcactg caagctccgc ctcctaggtt 1920cgcccaggct ggagtgcagt ggtgcgatct cagatcactg caagctccgc ctcctaggtt 1920
cagaccattc tcctgcctca gcttcccaag tagctgggac tacaggcgcc cgccactgcg 1980cagaccattc tcctgcctca gcttcccaag tagctgggac tacaggcgcc cgccactgcg 1980
cccggctaat tttttgcatt tttagtagag acagggtttc accgtgttag ccaggatggt 2040accgtgttag ccaggatggt 2040
ctcgatctcc tgatctgccc gcctcagcct cccaaagtgc tgggattaca ggcatgagcc 2100ctcgatctcc tgatctgccc gcctcagcct cccaaagtgc tgggattaca ggcatgagcc 2100
accgcgcccg gcccaggcac ttaatttttg tgtttgactt agtaacttaa gtgcaaacta 2160accgcgcccg gcccaggcac ttaatttttg tgtttgactt agtaacttaa gtgcaaacta 2160
ttacgggagc agatggagtc aattggcctt catgtgattg tcagtgggaa attggtccaa 2220ttacgggagc agatggagtc aattggcctt catgtgattg tcagtgggaa attggtccaa 2220
gcagagggaa tactggttca ggaaactggt ttgggaaggt taggcaaacg ggaagtgcta 2280gcagagggaa tactggttca ggaaactggt ttgggaaggt taggcaaacg ggaagtgcta 2280
tggtggagag aaagattact ctggccgggc tgtaaaggac ggctacaatg ggaggctgaa 2340tggtggagag aaagattact ctggccgggc tgtaaaggac ggctacaatg ggaggctgaa 2340
ggcagaacca agaaaatggg agtgagtatg gaaaaggtac gattcagacg gcataatgga 2400ggcagaacca agaaaatggg agtgagtatg gaaaaggtac gattcagacg gcataatgga 2400
cgggacttgg agactgaatt gtagtgggcc gaccacaaaa tgataaggca tggaaggaag 24602460
tagagtttgg ggggaaggat ccctagtccc ttaatggcta ccttcttccc caggagttgt 2520tagagtttgg ggggaaggat ccctagtccc ttaatggcta ccttcttccc caggagttgt 2520
taggccatcc gatcccctgg cctgggaaag aaacactgat ttcgttgctg gcttgttcac 2580taggccatcc gatcccctgg cctgggaaag aaacactgat ttcgttgctg gcttgttcac 2580
tcaccagaag ctacagctac taacagttct aaaaactgtt tcatgtgatg aggaacagac 2640tcaccagaag ctacagctac taacagttct aaaaactgtt tcatgtgatg aggaacagac 2640
gaaaatagtt ttgagcccta agtccgccga ttccagtgct ttcttgaacc cgcatttact 2700gaaaatagtt ttgagccta agtccgccga ttccagtgct ttcttgaacc cgcatttact 2700
aaaatatttt catgactgcc aagctttgaa tagcctgctg tgttcatgga ggctcatact 2760aaaatatttt catgactgcc aagctttgaa tagcctgctg tgttcatgga ggctcatact 2760
ggcgatctct agtggctggc taaagcttga attgcaaaag atctaatttc tggtctaatg 2820ggcgatctct agtggctggc taaagcttga attgcaaaag atctaatttc tggtctaatg 2820
tatatatgcc ttaaatatag ttgcgttcaa acgtgggagc tgcaggtgca acttgatttt 2880tatatatgcc ttaaatatag ttgcgttcaa acgtgggagc tgcaggtgca acttgatttt 2880
atgacaaatg gctgccacat aatttgcaca agcagtgctc gtcaagggca gctaaatcag 2940atgacaaatg gctgccacat aatttgcaca agcagtgctc gtcaagggca gctaaatcag 2940
gcgagctttc aatcaaaata aatgtactac taaaccctac ttagcggcta actagcccaa 3000gcgagctttc aatcaaaata aatgtactac taaaccctac ttagcggcta actagcccaa 3000
gagcagacag cccacggacg gactgcaagt cggaagcgcg ggcggaagct gtgcagcgcc 30603060
cacctggtgg ctccatcggc cgcgttcatc agtcagcacg acccgacctc agtggcgtcc 3120cacctggtgg ctccatcggc cgcgttcatc agtcagcacg acccgacctc agtggcgtcc 3120
tcacaacaca gaccggacct tgggtcttac cccggcacct gagaaccact tccggtgagt 31803180
agcttctact tccggagacg atgactcccc cgcgtcccag accggaagaa gcccggcgga 3240agcttctact tccggagacg atgactcccc cgcgtcccag accggaagaa gcccggcgga 3240
gaccggcctc gctcggccac ttccggcaag ggcggagccg gccagtggtg cgcgagcgca 3300gaccggcctc gctcggccac ttccggcaag ggcggagccg gccagtggtg cgcgagcgca 3300
gataactccc ctggagaggc gggatgttca actccacccc tggtccttgg gcggccgtgg 3360gtaactccc ctggagaggc gggatgttca actccacccc tggtccttgg gcggccgtgg 3360
gtccccttcg aagcggagga atggccaacc tcgccgcact tcgagcccct ttagggtgcg 3420gtccccttcg aagcggagga atggccaacc tcgccgcact tcgagcccct ttagggtgcg 3420
tttaagaaca gtgggcgtgg cctttacgta aatcttcgag atgggaacct ccagaatttg 3480tttaagaaca gtgggcgtgg cctttacgta aatcttcgag atgggaacct ccagaatttg 3480
tctcaattgt ctaaaaggta atgagcgtca gcgacattca agggcacttt gggctaaaaa 3540tctcaattgt ctaaaaggta atgagcgtca gcgacattca agggcacttt gggctaaaaa 3540
agaaagtgct tgtacacgga tggaaatatt ctagaagaac ataaaaggaa tttcctctta 3600agaaagtgct tgtacacgga tggaaatatt ctagaagaac ataaaaggaa tttcctctta 3600
ggaggttagg gaaatgagca cgaagtatgt tttggtgcag ttttttgttc aacccaatgc 3660ggaggttagg gaaatgagca cgaagtatgt ttttggtgcag ttttttgttc aacccaatgc 3660
gtattttcat attgagaggc aatataaatg gagcgaaagt atcttgagaa aaaaaaaaaa 3720gtattttcat attgagaggc aatataaatg gagcgaaagt atcttgagaa aaaaaaaaaa 3720
actaccagaa cttgccgttg ctgaaaagta atattttctc tttcgagagt tttcatggcc 3780actaccagaa cttgccgttg ctgaaaagta atattttctc tttcgagagt tttcatggcc 3780
ttttaaatta cacccccacc tccacaggca aataaatttg ttttggaatg cataccacat 3840ttttaaatta cacccccacc tccacaggca aataaatttg ttttggaatg cataccacat 3840
catctggctc tagaaacgta ttttgtgtag ctcccctagc aagaatatag gttaaagcgt 3900catctggctc tagaaacgta ttttgtgtag ctcccctagc aagaatatag gttaaagcgt 3900
aaatttaatt cctggctcta ttttacatcc caatttttat tttcctctca ttcccacttt 39603960
acgttgtttc aaataaccta gtttgtgtat ccctgtaagt cattttggta taaagtaggt 4020acgttgtttc aaataaccta gtttgtgtat ccctgtaagt cattttggta taaagtaggt 4020
tataagtgta catgcgaaaa gatgttttta acaaaaatgt aactg 4065tataagtgta catgcgaaaa gatgttttta acaaaaatgt aactg 4065
<210> 33<210> 33
<211> 3865<211> 3865
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 33<400> 33
gccttgctct gctcccccgc ccccaggcag ccatccgcag ggccagcgcc atcctgcgca 60gccttgctct gctcccccgc ccccaggcag ccatccgcag ggccagcgcc atcctgcgca 60
gccagaagcc tgtgatggtg aagaggaagc ggacccgccc caccaagagc tcctgagccc 120gccagaagcc tgtgatggtg aagaggaagc ggacccgccc caccaagagc tcctgagccc 120
cctgccccca gagcaataaa gtcagctggc tttctcacct gcctcgactg ggcctccctt 180cctgccccca gagcaataaa gtcagctggc tttctcacct gcctcgactg ggcctccctt 180
tttgaaacgc tctggggagc tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa 240tttgaaacgc tctggggagc tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa 240
ctctgcatgt caccttgtcc atctggaggt gatgtcaatg gctggccatg caggaggggt 300ctctgcatgt caccttgtcc atctggaggt gatgtcaatg gctggccatg caggaggggt 300
ggggtagctg ccttgtccct ggtgagggca agggtcactg tcttcacaga aaaagtttgc 360ggggtagctg ccttgtccct ggtgagggca agggtcactg tcttcacaga aaaagtttgc 360
tgacttgtga ttgagaccta ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg 420tgacttgtga ttgagaccta ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg 420
cagtggcttc cattcagaag aagaaaggcc ttttctagcc cagaagggtg caggctgagg 480cagtggcttc cattcagaag aagaaaggcc ttttctagcc cagaagggtg caggctgagg 480
gctgggccct gggccctggt gctgtagcac ggtttgggga cttggggtgt tcccaagacc 540gctggggccct gggccctggt gctgtagcac ggtttgggga cttggggtgt tcccaagacc 540
tgggggacga cagacatcac gggaggaaga tgagatgact tttgcatcca gggagtgggt 600tgggggacga cagacatcac gggaggaaga tgagatgact tttgcatcca gggagtgggt 600
gcagccacat ttggagggga tgggctttac ttgatgcaac ctcatctctg agatgggcaa 660gcagccacat ttggagggga tgggctttac ttgatgcaac ctcatctctg agatgggcaa 660
cttggtgggt ggtggcttat aactgtaagg gagatggcag ccccagggta cagccagcag 720cttggtgggt ggtggcttat aactgtaagg gagatggcag ccccagggta cagccagcag 720
gcattgagca gccttagcat tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc 780gcattgagca gccttagcat tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc 780
cctgtctctt tgagctggct cttgtcactt aggtctcatc tcagtggccg ctcctgggcc 840cctgtctctt tgagctggct cttgtcactt aggtctcatc tcagtggccg ctcctgggcc 840
accctgtcac ccaagctttc ctgattgccc agccctcttg tttcctttgg cctgtttgct 900accctgtcac ccaagctttc ctgattgccc agccctcttg tttcctttgg cctgtttgct 900
ccctagtgtt tattacagct tgtgaggcca ggagtttgag accatcctag gcaacataat 960ccctagtgtt tattacagct tgtgaggcca ggagtttgag accatcctag gcaacataat 960
gagacaccgt ctctaaaata aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag 1020gagacaccgt ctctaaaata aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag 1020
ctcctcagag gttgagtaga ggctgaggtg agcggagcac ttgagccaag agtatgaggc 1080ctcctcagag gttgagtaga ggctgaggtg agcggagcac ttgagccaag agtatgaggc 1080
tgcagtgagc ccatgagccc caccactaca ctccagcctg gaagacacca tgacacacag 11401140
tgaggcctgg atggggaaag agtcctgctg ttgatcctca catgtttcct gggcacctaa 1200tgaggcctgg atggggaaag agtcctgctg ttgatcctca catgtttcct gggcacctaa 1200
ctctgtcagc cactgccagg gaccaaggat ccagcatcca tggcacccct ggttcctgcc 1260ctctgtcagc cactgccagg gaccaaggat ccagcatcca tggcacccct ggttcctgcc 1260
atcctggggt acccgattca aagaaggact ctgctccctg tctgagacca cccccggctc 1320atcctggggt acccgattca aagaaggact ctgctccctg tctgagacca cccccggctc 1320
tgactgagag taaggggact gtcagggcct cgacttgcca ttggttgggg tcgtacgggg 13801380
ctgggagccc tgcgttttga ggcagaccac tgcccttccg acctcagtcc tgtctgctcc 1440ctgggagccc tgcgttttga ggcagaccac tgcccttccg acctcagtcc tgtctgctcc 1440
agtcttgccc agctcgaagg agagcagatc tgaccacttg ccagcccctg tctgctgtga 1500agtcttgccc agctcgaagg agagcagatc tgaccacttg ccagcccctg tctgctgtga 1500
attaccattt cctttgtcct tcccttagtt gggtctatta gctcagattg agaggtgttg 1560attaccattt cctttgtcct tcccttagtt gggtctatta gctcagattg agaggtgttg 1560
ccttaaaact gagttgggtg acttggtacc tgctcaggac cccccgcact gtcccaatcc 1620ccttaaaact gagttgggtg acttggtacc tgctcaggac cccccgcact gtcccaatcc 1620
cactcaggcc cacctccagc tggcctcact ccgctggtga cttcgtacct gctcaggagc 1680cactcaggcc cacctccagc tggcctcact ccgctggtga cttcgtacct gctcaggagc 1680
ccccactgtc ccagtcccac tcaggcccat ctctggctgg cctcactgcg ctgggactcc 1740ccccactgtc ccagtcccac tcaggcccat ctctggctgg cctcactgcg ctgggactcc 1740
gccttcataa ggagagctca ctgctcacgt tagtagatgg ccccttctcg tgaggcctct 1800gccttcataa ggagagctca ctgctcacgt tagtagatgg ccccttctcg tgaggcctct 1800
cccctggcac ctgcttcagt tgtcctccac agcactgatt tgcagcccac aagctggcag 1860cccctggcac ctgcttcagt tgtcctccac agcactgatt tgcagcccac aagctggcag 1860
gtttatctgt ctcatgtttg tcttgtgctg gtgggcaagg ggtttgtcta gcacaccagc 19201920
atataatgag atgcttgatg aatggtgcat attgaatgta taaagcccac cggtcctgag 1980atataatgag atgcttgatg aatggtgcat attgaatgta taaagcccac cggtcctgag 1980
agtttgctca ctggagactt tctggagatg gagtctcgct ctgttgccca ggctggcgag 2040agtttgctca ctggagactt tctggagatg gagtctcgct ctgttgccca ggctggcgag 2040
tgcaatggcg cgatcttggc tcactgcagc ctccacctcc tgggttcaag cgattctcct 2100tgcaatggcg cgatcttggc tcactgcagc ctccacctcc tgggttcaag cgattctcct 2100
gcctcagcct cccgagtagc tgggattaca ggtgggtgtc accacaccca gctcagtatt 2160gcctcagcct cccgagtagc tgggattaca ggtgggtgtc accacaccca gctcagtatt 2160
gtatttttag cagagatggg gtttcaccat tttgcccagg ctggtttgga actcctgact 2220gtatttttag cagagatggg gtttcaccat tttgcccagg ctggtttgga actcctgact 2220
tcaaattacc cacctgcctc agcctcccaa agtgctggca ttacaggcgc tcgaggcttt 22802280
ctgatgtggc tgctgctgct cagaaggcct tgtccttaac cacctccttg cctgccctgg 2340ctgatgtggc tgctgctgct cagaaggcct tgtccttaac cacctccttg cctgccctgg 2340
aggcttgtgc ctctaggccc caccccctgt ggagtcctgc tggctttctc catccctatc 2400aggcttgtgc ctctaggccc caccccctgt ggagtcctgc tggctttctc catccctatc 2400
tgaatcctcc ctgctgtgtg gcctcccctg gtctcatccg taacacagcc cagcttagtg 2460tgaatcctcc ctgctgtgtg gcctcccctg gtctcatccg taacacagcc cagcttagtg 2460
ggcctctgtt cctgcgggtg gccagcctgt ctgtgtggct gggctgggga ggccacgtct 2520ggcctctgtt cctgcgggtg gccagcctgt ctgtgtggct gggctgggga ggccacgtct 2520
ggtatctgaa tgctatcggt gggttggggt ggaggaacca ggagagggct ggagggaggg 2580ggtatctgaa tgctatcggt gggttggggt ggaggaacca ggagaggggct ggagggaggg 2580
agatggtctc agccccacag agtttggagt cctcagtgtg ctgagcaaac gtggagacac 2640agatggtctc agccccacag agtttggagt cctcagtgtg ctgagcaaac gtggagacac 2640
catttccctc ctctagacct catcttggag agagagatgt tggatggggc catctattcc 2700catttccctc ctctagacct catcttggag agagagatgt tggatggggc catctattcc 2700
agctttattc acacaaatca tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa 2760agcttttattc acacaaatca tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa 2760
aacatgatat taagaaaaca ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca 2820aacatgatat taagaaaaca ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca 2820
aaattgggag aacaaaagaa aagcgtcttg tcacatacag aaggtccctg ataaagttag 2880aaattgggag aacaaaagaa aagcgtcttg tcacatacag aaggtccctg ataaagttag 2880
tagctgccct catcagaaac caggcccagg cagtggggac acatccagag tgctgaaaga 2940tagctgccct catcagaaac caggcccagg cagtggggac acatccagag tgctgaaaga 2940
acctccccca ggtcatccta tccccaagag tgatgcccgg cagcattccc agctcagggc 3000acctccccca ggtcatccta tccccaagag tgatgcccgg cagcattccc agctcaggggc 3000
taatggttca cggaagccag gaatcaaact gcctgggttc cagtcccagc tctgccagtt 30603060
atgcccagct gtggggactt gggcagctcg tttagtagca ccgtgcctca gtttcccata 3120atgcccagct gtggggactt gggcagctcg tttagtagca ccgtgcctca gtttcccata 3120
tgtaaaaggc cattttgagt gcctttcaca gccctgcata aggcaggtgt ctcagtgttc 3180tgtaaaaggc cattttgagt gcctttcaca gccctgcata aggcaggtgt ctcagtgttc 3180
actgctgtct ctccagctct tagtccagta gctgcatggt gagtgagcgt agggcgcacc 3240actgctgtct ctccagctct tagtccagta gctgcatggt gagtgagcgt agggcgcacc 3240
ctggaaggct gccaagccca aagttgtgca gagcgctggg gactccagac tccccacagc 3300ctggaaggct gccaagccca aagttgtgca gagcgctggg gactccagac tccccacagc 3300
agcagagact cgggactgag gcatcctctg ttcacaggac atgctggcat ctactgggtc 3360agcagagact cgggactgag gcatcctctg ttcacaggac atgctggcat ctactgggtc 3360
agggctctgc tgctcggtgg ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct 3420agggctctgc tgctcggtgg ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct 3420
tcgtaccctc atctgtaaca tgcgtgtcga tagaccctac tactcagggt tgatgagaag 3480tcgtaccctc atctgtaaca tgcgtgtcga tagaccctac tactcagggt tgatgagaag 3480
attaaatgtg caaaacctgc ttgactgtgc ccacaaatcc tgattgtagg aataaattaa 3540attaaatgtg caaaacctgc ttgactgtgc ccacaaatcc tgattgtagg aataaattaa 3540
tgacttttta taaatatttt gatcagatgg actcatgatc acagatgtct tcacatgcct 3600tgacttttta taaatatttt gatcagatgg actcatgatc acagatgtct tcacatgcct 3600
atgactaatt tgtacacaaa ctaatgctcg tgtttcccaa gcacctggaa gacatgccag 36603660
atccatgtgc agtaatgcct ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga 3720atccatgtgc agtaatgcct ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga 3720
gctttcccag cctcctgccc gtgtttgtga atatcattct gtcctcagct gcatttccag 3780gctttcccag cctcctgccg gtgtttgtga atatcattct gtcctcagct gcatttccag 3780
cccaggctgt ttggcgctgc ccaggaatgg tatcaattcc cctgtttctc ttgtagccag 3840cccaggctgt ttggcgctgc cgggaatgg tatcaattcc cctgtttctc ttgtagccag 3840
ttactagaat aaaatcatct acttt 3865ttactagaat aaaatcatct acttt 3865
<210> 34<210> 34
<211> 288<211> 288
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 34<400> 34
ttttttactg tcaggcagga agagcggtaa ctgccatcgc ggcgggcatc cctggcgcca 60ttttttactg tcaggcagga agagcggtaa ctgccatcgc ggcgggcatc cctggcgcca 60
gggtgttggt ctgggtaccg gcttccctct cggccgactt gtcagctctg tgagccgcgc 120gggtgttggt ctgggtaccg gcttccctct cggccgactt gtcagctctg tgagccgcgc 120
gcgtctgagc ccgtgtcctc acctgtaaag tggagaaatg aaaaaggacc tgaacttcct 180gcgtctgagc ccgtgtcctc acctgtaaag tggagaaatg aaaaaggacc tgaacttcct 180
cggtggttgt tgagagttaa ggcacggggt tgatgttttc agatgaaatt ctcaaagcaa 240240
gtcagggtgg ggatggatgg tttcatccca caggtgggaa gattgagg 288gtcagggtgg ggatggatgg tttcatccca caggtgggaa gattgagg 288
<210> 35<210> 35
<211> 430<211> 430
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 35<400> 35
gtttttctca ggtccttgat tggaactgcc tcagagccaa gggtcctttt actcagtggc 60gtttttctca ggtccttgat tggaactgcc tcagagccaa gggtcctttt actcagtggc 60
agcaacaaac gcagtctgtt ggctagtgat cctcctgtct cagggacacg tagtccaggg 120agcaacaaac gcagtctgtt ggctagtgat cctcctgtct cagggacacg tagtccaggg 120
agcagccaat tgcttggcac ttggggaccc cgttctgggg agtcctgaaa gctttcacct 180agcagccaat tgcttggcac ttggggaccc cgttctgggg agtcctgaaa gctttcacct 180
cttggattgc cgaatacatg ggtggccctt cctagactaa gggactggcc tgagtgaggc 240cttggattgc cgaatacatg ggtggccctt cctagactaa gggactggcc tgagtgaggc 240
tgggcctctc agccaagctg atgttgaacc actgctgtgg ggatgggcct ggggttcctg 300tgggcctctc agccaagctg atgttgaacc actgctgtgg ggatggggcct ggggttcctg 300
ggaagctgtt catacccatt gccaggagcg tgggctctgg ctggacctgg atcagatcct 360ggaagctgtt catacccatt gccaggagcg tgggctctgg ctggacctgg atcagatcct 360
aactgaagcg gcagctttct ggcatgagaa aggagtgttt tcatggtgga cagaattggg 420aactgaagcg gcagctttct ggcatgagaa aggagtgttt tcatggtgga cagaattgggg 420
ctatgagtgt 430ctatgagtgt 430
<210> 36<210> 36
<211> 120<211> 120
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 36<400> 36
atatctctgc caacatgagg acagaaggac tggtgcgacc ccccaccccc gcccctgggc 60atatctctgc caacatgagg acagaaggac tggtgcgacc ccccaccccc gcccctgggc 60
taccatctgc atggggctgg ggtcctcctg tgctatttgt acaaataaac ctgaggcagg 120taccatctgc atggggctgg ggtcctcctg tgctatttgt acaaataaac ctgaggcagg 120
<210> 37<210> 37
<211> 655<211> 655
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 37<400> 37
agggagccct cctggaagtg gatgaggcct tgggtctcgg ctcttcattg cttcctgagc 60agggagccct cctggaagtg gatgaggcct tgggtctcgg ctcttcattg cttcctgagc 60
tgcagcagat gcctttacaa ccaagctcac cgaggacgtc tgtctcccat attaccctgg 120tgcagcagat gcctttacaa ccaagctcac cgaggacgtc tgtctcccat attaccctgg 120
cagagggcca ggcctgttct acacggccgg ggtttcaaca aggtactgat gtcttctgcc 180cagaggggcca ggcctgttct acacggccgg ggtttcaaca aggtactgat gtcttctgcc 180
cttgcctctt cgacaggcaa gtaataagac ttaagtgaag agaattcttt aggcacacaa 240cttgcctctt cgacaggcaa gtaataagac ttaagtgaag agaattcttt aggcacacaa 240
attcacattt gatgtaatct cattatactt cctgatctgt gattgaaaac tttcatttcg 300attcacattt gatgtaatct cattatactt cctgatctgt gattgaaaac tttcatttcg 300
taactagtat gtctgtccca cctttaaaaa gtttttcatt atgaaagtaa gtatttgtta 360360
gaattaagtc tatttaaatg aaaaaaactt agatatgagt ctgcatggcc tcaggaaaat 420gaattaagtc tatttaaatg aaaaaaactt agatatgagt ctgcatggcc tcaggaaaat 420
gatgttttaa aatagagatt ttaggttgtc tgcactctag cttttttgtc gttttcttaa 480gatgttttaa aatagagatt ttaggttgtc tgcactctag cttttttgtc gttttcttaa 480
ggctttttta actgcatcaa aaattcagat acgaaacata cactaaaaaa taatacatca 540ggctttttta actgcatcaa aaattcagat acgaaacata cactaaaaaa taatacatca 540
tatcttaatt tccactgaac ttgatttaaa ttcagagtta cacagtatga atatcacaat 600600
cagatatgtt caaaaaggtc tgaacaattg attttctgaa accatgaagg actac 655cagatatgtt caaaaaggtc tgaacaattg attttctgaa accatgaagg actac 655
<210> 38<210> 38
<211> 331<211> 331
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 38<400> 38
agccatttaa attcattaga aaaatgtcct tacctcttaa aatgtgaatt catctgttaa 60agccatttaa attcattaga aaaatgtcct tacctcttaa aatgtgaatt catctgttaa 60
gctaggggtg acacacgtca ttgtaccctt tttaaattgt tggtgtggga agatgctaaa 120gctagggggtg acacacgtca ttgtaccctt tttaaattgt tggtgtggga agatgctaaa 120
gaatgcaaaa ctgatccata tctgggatgt aaaaaggttg tggaaaatag aatgcccaga 180gaatgcaaaa ctgatccata tctgggatgt aaaaaggttg tggaaaatag aatgcccaga 180
cccgtctaca aaaggttttt agagttgaaa tatgaaatgt gatgtgggta tggaaattga 240240
ctgttacttc ctttacagat ctacagacag tcaatgtgga tgagaactaa tcgctgatcg 300ctgttacttc ctttacagat ctacagacag tcaatgtgga tgagaactaa tcgctgatcg 300
tcagatcaaa taaagttata aaattgcctt c 331tcagatcaaa taaagttata aaattgcctt c 331
<210> 39<210> 39
<211> 1152<211> 1152
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 39<400> 39
gcagctcatg tgcacgtttt ctgtttaaat aaatgtaaaa actgccatct ggcatcttcc 60gcagctcatg tgcacgtttt ctgtttaaat aaatgtaaaa actgccatct ggcatcttcc 60
ttccttgatt ttaagtcttc agcttcttgg ccaacttagt ttgccacaga gattgttctt 120ttccttgatt ttaagtcttc agcttcttgg ccaacttagt ttgccacaga gattgttctt 120
ttgcttaagc ccctttggaa tctcccattt ggaggggatt tgtaaaggac actcagtcct 180ttgcttaagc ccctttggaa tctcccattt ggaggggatt tgtaaaggac actcagtcct 180
tgaacagggg aatgtggcct caagtgcaca gactagcctt agtcatctcc agttgaggct 240tgaacagggg aatgtggcct caagtgcaca gactagcctt agtcatctcc agttgaggct 240
gggtatgagg ggtacagact tggccctcac accaggtagg ttctgagaca cttgaagaag 300gggtatgagg ggtacagact tggccctcac accaggtagg ttctgagaca cttgaagaag 300
cttgtggctc ccaagccaca agtagtcatt cttagccttg cttttgtaaa gttaggtgac 360cttgtggctc ccaagccaca agtagtcatt cttagccttg cttttgtaaa gttaggtgac 360
aagttattcc atgtgatgct tgtgagaatt gagaaaatat gcatggaaat atccagatga 420aagttattcc atgtgatgct tgtgagaatt gagaaaatat gcatggaaat atccagatga 420
atttcttaca cagattctta cgggatgcct aaattgcatc ctgtaacttc tgtccaaaaa 480atttcttaca cagattctta cgggatgcct aaattgcatc ctgtaacttc tgtccaaaaa 480
gaacaggatg atgtacaaat tgctcttcca ggtaatccac cacggttaac tggaaaagca 540gaacaggatg atgtacaaat tgctcttcca ggtaatccac cacggttaac tggaaaagca 540
ctttcagtct cctataaccc tcccaccagc tgctgcttca ggtataatgt tacagcagtt 600ctttcagtct cctataaccc tcccaccagc tgctgcttca ggtataatgt tacagcagtt 600
tgccaaggcg gggacctaac tggtgacaat tgagcctctt gactggtact cagaatttag 660tgccaaggcg gggacctaac tggtgacaat tgagcctctt gactggtact cagaatttag 660
tgacacgtgg tcctgatttt ttttggagac ggggtcttgc tctcacccag gctgggagtg 720tgacacgtgg tcctgatttt ttttggagac ggggtcttgc tctcacccag gctgggagtg 720
cagtggcaca ctgactacag ccttgacctc cccaggctca ggtgatcttc ccacctcagc 780cagtggcaca ctgactacag ccttgacctc cccaggctca ggtgatcttc ccacctcagc 780
cttccaagta gctgggacta cagatgcaca cctccaaacc tgggtagttt ttgaagtttt 840cttccaagta gctgggacta cagatgcaca cctccaaacc tgggtagttt ttgaagtttt 840
tttgtagagg tggtctagcc atgttgccta ggctcccgaa ctcctgagct caagcaatcc 900tttgtagagg tggtctagcc atgttgccta ggctcccgaa ctcctgagct caagcaatcc 900
tgcttcagcc tcccaaagta ctgggattac aggcatcttc tgtagtatat aggtcatgag 960tgcttcagcc tcccaaagta ctgggattac aggcatcttc tgtagtatat aggtcatgag 960
ggatatggga tgtggtactt atgagacaga aatgcttaca ggatgttttt ctgtaaccat 1020ggatatggga tgtggtactt atgagacaga aatgcttaca ggatgttttt ctgtaaccat 1020
cctggtcaac ttagcagaaa tgctgcgctg ggtataataa agcttttcta cttctagtct 1080cctggtcaac ttagcagaaa tgctgcgctg ggtataataa agcttttcta cttctagtct 1080
agacaggaat cttacagatt gtctcctgtt caaaacctag tcataaatat ttataatgca 1140agacaggaat cttacagatt gtctcctgtt caaaacctag tcataaatat ttataatgca 1140
aactggtcct tc 1152aactggtcct tc 1152
<210> 40<210> 40
<211> 75<211> 75
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 40<400> 40
actaacgaaa aatcaataaa taaatgtgga tttgtgctct tgtattttta agtggattaa 60actaacgaaa aatcaataaa taaatgtgga tttgtgctct tgtattttta agtggattaa 60
aaaacttact acctt 75aaaacttact acctt 75
<210> 41<210> 41
<211> 1176<211> 1176
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 41<400> 41
gaatgtcaac gattagtcat gcaataaatg ttctggtttt aaaaaataca tatctggttt 60gaatgtcaac gattagtcat gcaataaatg ttctggtttt aaaaaataca tatctggttt 60
tggtaaggta tttttaatca attaggcttg tagtatcagt gaaatactgt aggtttaggg 120tggtaaggta tttttaatca attaggcttg tagtatcagt gaaatactgt aggtttaggg 120
actgggctag cttcatatca gatttacttg ttaagtgact gttttggaat gtttactttt 180actgggctag cttcatatca gatttacttg ttaagtgact gttttggaat gtttactttt 180
ggactgggtt tgtaacacgg ttaaaggcaa tgagaaacaa gcagaattcc aggagtcctt 240ggactgggtt tgtaacacgg ttaaaggcaa tgagaaacaa gcagaattcc aggagtcctt 240
gaagcagagg gcactggaag acaatatagc agattaaaat agcacagctc atgtggcata 300gaagcagagg gcactggaag acaatatagc agattaaaat agcacagctc atgtggcata 300
ggtgggtatt ttagatgttt gagtaaattt gaaagagtat gatgtttaaa ttacctttag 360ggtgggtatt ttagatgttt gagtaaattt gaaagagtat gatgtttaaa ttacctttag 360
caacatgttc atctgctatg ctgtcatgac tagggggatg attattagtc acatagagct 420caacatgttc atctgctatg ctgtcatgac tagggggatg attattagtc acatagagct 420
tgggagtacc actggaaacg tatgggtagg agtttaggtg gcttctgttt ttcaaaagat 480tgggagtacc actggaaacg tatgggtagg agtttaggtg gcttctgttt ttcaaaagat 480
gatcttatcc tagtatctgt aatgctcact tggcacacct gacttgtggg ctgtgtgtaa 540gatcttatcc tagtatctgt aatgctcact tggcacacct gacttgtggg ctgtgtgtaa 540
ggtggctagc taagtgaaaa aagcctgcta ggtgtgagtc aacttaagaa tatgtaaata 600ggtggctagc taagtgaaaa aagcctgcta ggtgtgagtc aacttaagaa tatgtaaata 600
ggtttgagaa aaagtagggc ttgggtgcaa gtaaagattg agcaggaaat aaaggaaaat 660ggtttgagaa aaagtagggc ttgggtgcaa gtaaagattg agcaggaaat aaaggaaaat 660
caagtataat ccctgagatt tgtagactaa aggcaatgat gtgggactac ttggtcgaat 720caagtataat ccctgagatt tgtagactaa aggcaatgat gtgggactac ttggtcgaat 720
ttttttagcc ctcaacttgg taattgggtg tttctgtgtt aaagcactga aacttgctgt 780ttttttagcc ctcaacttgg taattgggtg tttctgtgtt aaagcactga aacttgctgt 780
cgtgccttcc tagttttcgt ggtttattga cagggttggg ggtttttttt gtttttttaa 840cgtgccttcc tagttttcgt ggtttattga cagggttggg ggtttttttt gtttttttaa 840
aatgaaggga caaagtcaac tggactgctg agtgagaggg caggggcagt tgaagggaac 900aatgaaggga caaagtcaac tggactgctg agtgagaggg caggggcagt tgaagggaac 900
atgaattgct ggaacagcta cataaaatag tgatgtagcc aagtcatgct atttaaatta 960atgaattgct ggaacagcta cataaaatag tgatgtagcc aagtcatgct atttaaatta 960
taattctcca ctgtgtttag aataacatct gaggttctta acctggcctt ggaagggtat 1020taattctcca ctgtgtttag aataacatct gaggttctta acctggcctt ggaagggtat 1020
cacttttact tgtaacctgg aatggcttta taatgtgcta gctaattgct actctcatct 1080cacttttact tgtaacctgg aatggcttta taatgtgcta gctaattgct actctcatct 1080
tgtattttaa ctcctaattt acccttcagg tctcagcttc agaacattca cttataaaga 1140tgtattttaa ctcctaattt acccttcagg tctcagcttc agaacattca cttataaaga 1140
aaccctgctg attaaatctc tcttgggctt cctccc 1176aaccctgctg attaaatctc tcttgggctt cctccc 1176
<210> 42<210> 42
<211> 59<211> 59
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 42<400> 42
acgctcctct actctttgag acatcactgg cctataataa atgggttaat ttatgtaac 59acgctcctct actctttgag acatcactgg cctataataa atgggttaat ttatgtaac 59
<210> 43<210> 43
<211> 49<211> 49
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 43<400> 43
accagacaca ctgattggaa ctgtattata ttaaaatact aaaaatcct 49accagacaca ctgattggaa ctgtattata ttaaaatact aaaaatcct 49
<210> 44<210> 44
<211> 178<211> 178
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 44<400> 44
ggaattgcac atgagatggc acacatattt atgctgtctg aaggtcacga tcatgttacc 60ggaattgcac atgagatggc acacatattt atgctgtctg aaggtcacga tcatgttacc 60
atatcaagct gaaaatgtca ccactatctg gagatttcga cgtgttttcc tctctgaatc 120atatcaagct gaaaatgtca ccactatctg gagatttcga cgtgttttcc tctctgaatc 120
tgttatgaac acgttggttg gctggattca gtaataaata tgtaaggcct ttcttttt 178tgttatgaac acgttggttg gctggattca gtaataaata tgtaaggcct ttcttttt 178
<210> 45<210> 45
<211> 73<211> 73
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 45<400> 45
tcaccaaaaa gcaaccaact tagccagttt tatttgcaaa acaaggaaat aaaggcttac 60tcaccaaaaa gcaaccaact tagccagttt tatttgcaaa acaaggaaat aaaggcttac 60
ttctttaaaa agt 73ttctttaaaa agt 73
<210> 46<210> 46
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 46<400> 46
acctctttta taacatgttc aataaaaagc tgaacttt 38acctctttta taacatgttc aataaaaagc tgaacttt 38
<210> 47<210> 47
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 47<400> 47
attcctgctc ccctgcaaat aaagcctttt tacacatctc 40attcctgctc ccctgcaaat aaagcctttt tacacatctc 40
<210> 48<210> 48
<211> 1301<211> 1301
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 48<400> 48
cagggtctcc ttggcagctg tattctggag tctggatgtt gctctctaaa gacctttaat 60cagggtctcc ttggcagctg tattctggag tctggatgtt gctctctaaa gacctttaat 60
aaaattttgt acaaagacac aaggtctgac tagactgttc agtattcaga ctgaggggca 120aaaattttgt acaaagacac aaggtctgac tagactgttc agtattcaga ctgaggggca 120
tgttggcctc tggagcatta catatcttct tggttttaac catacttgtg gtatttgcaa 180tgttggcctc tggagcatta catatcttct tggttttaac catacttgtg gtatttgcaa 180
gggccagaac agtaagaccc aagcagagcc aaccagagaa ataatatttg tgtgatagag 240gggccagaac agtaagaccc aagcagagcc aaccagagaa ataatatttg tgtgatagag 240
aaggctgata gcaagcaagg cagcaccttg attcgttgtc ctgtagttca ggattgtagg 300aaggctgata gcaagcaagg cagcaccttg attcgttgtc ctgtagttca ggattgtagg 300
tttagaagag ggatatgttt gagtttttcc tatgcataag gcgatccacg ttgcacatag 360360
aaagtgaata taaatggcca ttatattttg tgtcatgctg tgctctaagt gttctttaca 420aaagtgaata taaatggcca ttatattttg tgtcatgctg tgctctaagt gttctttaca 420
tatgtactcg ttaatcaacc tctctaaagt gtaaaggaaa tttgcttgca ccactgaagg 480tatgtactcg ttaatcaacc tctctaaagt gtaaaggaaa tttgcttgca ccactgaagg 480
cacataaggc tcagaagtaa atttgcctaa gcagtataaa gctatcatta gaatccacat 540cacataaggc tcagaagtaa atttgcctaa gcagtataaa gctatcatta gaatccacat 540
tcctaagttg tgttctctta ggggatcatg gaaccagtca ttggtactac aggctattat 600tcctaagttg tgttctctta ggggatcatg gaaccagtca ttggtactac aggctattat 600
gttctggaga actgtgaaga acatttaaat tgtctctgat tttatctatc aatgttttga 660gttctggaga actgtgaaga acatttaaat tgtctctgat tttatctatc aatgttttga 660
agtattttct accagtgtct gtacttcaca agaaattcgg cactattttt tcaggcaaaa 720agtattttct accagtgtct gtacttcaca agaaattcgg cactattttt tcaggcaaaa 720
ctagtgaggg acaggttggc ttgaaaatca tgagactgtt gttaaatcag atgctggttg 780ctagtgaggg acaggttggc ttgaaaatca tgagactgtt gttaaatcag atgctggttg 780
atcacagagg ggacttccag ggaaagctgt tatcaggtgg ctgcttcctg gtgatgcagc 840atcacagagg ggacttccag ggaaagctgt tatcaggtgg ctgcttcctg gtgatgcagc 840
ctggctgatg agataaccct ggctccacag atggcttagc aggtgctgtg atgatttggt 900ctggctgatg agataaccct ggctccacag atggcttagc aggtgctgtg atgatttggt 900
tttcttctca attagactga gctgcacatg gtgtttatat tgcttggcac atggtaaggg 960tttcttctca attagactga gctgcacatg gtgtttatat tgcttggcac atggtaaggg 960
cttaatattt gaggtaatta tgtagggcgt acactgacaa gtatctgacc cccccttcct 1020cttaatattt gaggtaatta tgtagggcgt acactgacaa gtatctgacc cccccttcct 1020
ttttgactca taaattggtc atcttaacca tttaagtgta cacttctata gtgacagagt 1080ttttgactca taaattggtc atcttaacca tttaagtgta cacttctata gtgacagagt 1080
tagccctctg tccaagggat ttgcatctgt ggattcaacc aactttgggt caaaaataat 1140tagccctctg tccaagggat ttgcatctgt ggattcaacc aactttggggt caaaaataat 1140
caaaaaggat ggttgtgtgt gtattgaaca tgtagactta tttttcttat tttcaaaata 12001200
ctatattttc ttgtcactta ttttcttgta cactgcagtt gtaacagcta tgtagcatgt 1260ctatattttc ttgtcactta ttttcttgta cactgcagtt gtaacagcta tgtagcatgt 1260
acattaggta ttaaaagtaa tccagtgaag attgaaagtc t 1301acattaggta ttaaaagtaa tccagtgaag attgaaagtc t 1301
<210> 49<210> 49
<211> 576<211> 576
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 49<400> 49
cagcctcttc catgagtggg gagcccgctg cttgtctcca gctcctagca gtgagtcctg 60cagcctcttc catgagtggg gagcccgctg cttgtctcca gctcctagca gtgagtcctg 60
ataatctcaa atttaaggac agtaactttg tctgggatga gtgtgggaaa ggatgtgttt 120ataatctcaa atttaaggac agtaactttg tctgggatga gtgtgggaaa ggatgtgttt 120
gggaacagac gcgagcctgc agaggtgttt gtaaccatct ctttctaagt ggtgggaagc 180gggaacagac gcgagcctgc agaggtgttt gtaaccatct ctttctaagt ggtgggaagc 180
agacatttta ttctttaact gttaatatat atagtgtgtg ttttttatgc atgaaatatt 240agacatttta ttctttaact gttaatatat atagtgtgtg ttttttatgc atgaaatatt 240
ttatagtttt taaaaatgcc cacactacta ttttgaaagt aaatgaggta atgtatgtgt 300ttatagtttt taaaaatgcc cacactacta ttttgaaagt aaatgaggta atgtatgtgt 300
cagaacccaa tacccaaagc gatcgtagta agaggtgggg cctttgggaa ggcattaaat 360cagaacccaa tacccaaagc gatcgtagta agaggtgggg cctttgggaa ggcattaaat 360
tgcttaggga atgagggtgg aaccctcatg aatgagatta gagccttata ggagaggttg 420tgcttaggga atgagggtgg aaccctcatg aatgagatta gagccttata ggagaggttg 420
gagggagttg cctggcctcc ctctcccatg tgaagactca gcaagaaaac attatttagg 480gagggagttg cctggcctcc ctctcccatg tgaagactca gcaagaaaac attatttagg 480
aagcagagag ccctcatcaa acaccagatc tgctggccac ctgatctggc actttccagc 540aagcagagag ccctcatcaa acaccagatc tgctggccac ctgatctggc actttccagc 540
cttcagaact gtgagaaata aatttctgtt gtctat 576cttcagaact gtgagaaata aatttctgtt gtctat 576
<210> 50<210> 50
<211> 57<211> 57
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 50<400> 50
agttcagact tcaaatagtg gcaaataaaa agtgctattt gtgatggttt gcttctg 57agttcagact tcaaatagtg gcaaataaaa agtgctattt gtgatggttt gcttctg 57
<210> 51<210> 51
<211> 1324<211> 1324
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 51<400> 51
agctcacgtt gatgtcaaga ctaccgatgg ttacttgctt cgtctgttct gtgttggttt 60agctcacgtt gatgtcaaga ctaccgatgg ttacttgctt cgtctgttct gtgttggttt 60
tactaaaaaa cgcaacaatc agatacggaa gacctcttat gctcagcacc aacaggtccg 120tactaaaaaa cgcaacaatc agatacggaa gacctcttat gctcagcacc aacaggtccg 120
ccaaatccgg aagaagatga tggaaatcat gacccgagag gtgcagacaa atgacttgaa 180ccaaatccgg aagaagatga tggaaatcat gacccgagag gtgcagacaa atgacttgaa 180
agaagtggtc aataaattgt aagtgtttct ttgcttcctc acacaacaca accttgagta 240agaagtggtc aataaattgt aagtgtttct ttgcttcctc acacaacaca accttgagta 240
ttggattatt cctgagatga gagaacgcat atgagacaag gtaaaggtct gttgaaatcc 300ttggattatt cctgagatga gagaacgcat atgagacaag gtaaaggtct gttgaaatcc 300
tgtctgtgaa tccttctagc tatatctctt taagtgaaag agtgttaagt actcagtaaa 360360
tatgattatt attactatta ttatttgagt cagagtcttg ctctgttgcc caggctcgag 420tatgattatt attactatta ttatttgagt cagagtcttg ctctgttgcc caggctcgag 420
tgcagtattg tgatcctcct tggctcactg taaccactgc ttcctgggtt caagcagttc 480tgcagtattg tgatcctcct tggctcactg taaccactgc ttcctggggtt caagcagttc 480
ttgagcctca gcctcctgag tatctgggaa tacaggggac tgccaccata cccagctaat 540ttgagcctca gcctcctgag tatctgggaa tacaggggac tgccaccata cccagctaat 540
ttttttaaat ttttagtaga gatggggttt catcatgttg gccaggctgg tcttgaactc 600ttttttaaat ttttagtaga gatggggttt catcatgttg gccaggctgg tcttgaactc 600
ctgacttcag gtgatctgcc agtactctaa atgataacag ttttttcgtg tttatttatt 660ctgacttcag gtgatctgcc agtactctaa atgataacag ttttttcgtg tttatttatt 660
ttgaatgaag ctgtctcaca gtagatggag ttgaaggaca ggaaatgttt ttcccctact 720ttgaatgaag ctgtctcaca gtagatggag ttgaaggaca ggaaatgttt ttccctact 720
tggaaaatac actgaataag ttgagtgggg tgggatgtgc ctggagtccc agctactcag 780tggaaaatac actgaataag ttgagtgggg tgggatgtgc ctggagtccc agctactcag 780
gaggctgagg tggtaggatt gtttgagccc aggagtttga ggccagcctg ggcaatatag 840gaggctgagg tggtaggatt gtttgagccc aggagtttga ggccagcctg ggcaatatag 840
ggagaccctg tcccaaaaaa taaaaaatat acgtatatat atatacacac acaaagaaaa 900ggagaccctg tcccaaaaaa taaaaaatat acgtatatat atatacacac acaaagaaaa 900
aatacactga atagacaaaa cctttcatga ttaatgatgc acgggaataa gtgatgaaaa 960aatacactga atagacaaaa cctttcatga ttaatgatgc acgggaataa gtgatgaaaa 960
aagtttcggt cccagatgat ggccagtgat aacaacattt ttctgatgtt cccatgcaat 1020aagtttcggt cccagatgat ggccagtgat aacaacattt ttctgatgtt cccatgcaat 1020
atacagttag ctaagagggt gtaatggaaa aagcataagg cttggactca gaagactcta 1080atacagttag ctaaaggggt gtaatggaaa aagcataagg cttggactca gaagactcta 1080
ctaactttgc cactagctag ctatgtaatt cagatcatct atcctttaca tgtgaaaggt 1140ctaactttgc cactagctag ctatgtaatt cagatcatct atcctttaca tgtgaaaggt 1140
aaataatggc ttatcttaac aggaggattt atgcaggtta aatgaggtag gtgttatgtg 1200aaataatggc ttatcttaac aggaggattt atgcaggtta aatgaggtag gtgttatgtg 1200
taggtttatt ccaaggcttc tctactttta aaggaaatgg cttatatctg agaactagga 1260taggtttatt ccaaggcttc tctactttta aaggaaatgg cttatatctg agaactagga 1260
cttttagaaa aaaatttact gttactggtt tgcaggattc cagacagcat tggaaaagac 1320cttttagaaa aaaatttact gttactggtt tgcaggattc cagacagcat tggaaaagac 1320
atag 1324atag 1324
<210> 52<210> 52
<211> 68<211> 68
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 52<400> 52
aatgggtccc tgggtgacat gtcagatctt tgtacgtaat taaaaatatt gtggcaggat 60aatgggtccc tgggtgacat gtcagatctt tgtacgtaat taaaaatatt gtggcaggat 60
taatagca 68taatagca 68
<210> 53<210> 53
<211> 60<211> 60
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 53<400> 53
attgcagtag cagcatatct ttttttcttt gcacaaataa acagtgaatt ctcgtttctt 60attgcagtag cagcatatct ttttttcttt gcacaaataa acagtgaatt ctcgtttctt 60
<210> 54<210> 54
<211> 53<211> 53
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 54<400> 54
ttttcccagc tgctgcccaa taaacctgtc tgccctttgg ggcagtccca gcc 53ttttcccagc tgctgcccaa taaacctgtc tgccctttgg ggcagtccca gcc 53
<210> 55<210> 55
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 55<400> 55
gattttttga gtaacaaata aataagatca gactctg 37gattttttga gtaacaaata aataagatca gactctg 37
<210> 56<210> 56
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 56<400> 56
acaaaaatga ctaaataaaa agtatatatt cacagt 36acaaaaatga ctaaataaaa agtatatatt cacagt 36
<210> 57<210> 57
<211> 55<211> 55
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 57<400> 57
atccttgttt tgtcttcacc catgtaataa aggtgtttat tgttttgttc ccaca 55atccttgttt tgtcttcacc catgtaataa aggtgtttat tgttttgttc ccaca 55
<210> 58<210> 58
<211> 70<211> 70
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 58<400> 58
gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60
agcgctttac 70agcgctttac 70
<210> 59<210> 59
<211> 50<211> 50
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 59<400> 59
aattggagag gattcttttg cattgaataa acttacagcc aaaaaacctt 50aattggagag gattcttttg cattgaataa acttacagcc aaaaaacctt 50
<210> 60<210> 60
<211> 77<211> 77
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 60<400> 60
ggctggacat cggcccgctc cccacaatga aataaagtta ttttctcatt cccaggccag 60ggctggacat cggcccgctc cccacaatga aataaagtta ttttctcatt cccaggccag 60
acttgggatc ttccgcg 77acttgggatc ttccgcg 77
<210> 61<210> 61
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 61<400> 61
agaaataaat ctttggctca c 21agaaataaat ctttggctca c 21
<210> 62<210> 62
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 62<400> 62
atttgtctgt gtactcaagc aataaaatga ttgtttaact a 41atttgtctgt gtactcaagc aataaaatga ttgtttaact a 41
<210> 63<210> 63
<211> 31<211> 31
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 63<400> 63
tggctcagct aataaaggcg cacatgactc c 31tggctcagct aataaaggcg cacatgactc c 31
<210> 64<210> 64
<211> 53<211> 53
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 64<400> 64
ggatgtaata catatattta caaataaaat gcctcatgga ctctggtgct tcc 53ggatgtaata catatattta caaataaaat gcctcatgga ctctggtgct tcc 53
<210> 65<210> 65
<211> 64<211> 64
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 65<400> 65
gcccatcgtg actcaaaact cacttgtata ataaacagtt tttgagggat tttaaagttt 60gcccatcgtg actcaaaact cacttgtata ataaacagtt tttgagggat tttaaagttt 60
caag 64caag 64
<210> 66<210> 66
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 66<400> 66
aacaaaccat gctgggttaa taaattgcct cattcgt 37aacaaaccat gctgggttaa taaattgcct cattcgt 37
<210> 67<210> 67
<211> 386<211> 386
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 67<400> 67
ctgcattctc ctccgccaaa aaagtgacca agcagagtct ttctctgtca cccaggctgg 60ctgcattctc ctccgccaaa aaagtgacca agcagagtct ttctctgtca cccaggctgg 60
agtgcaatgg cgtgatctca gctcactgca acctctgcct cctgggttca agtgattctc 120agtgcaatgg cgtgatctca gctcactgca acctctgcct cctgggttca agtgattctc 120
gtgtctcagc ctcctgagta gctgagacta caggtgtgca ccagtgttcc cagctgattt 180gtgtctcagc ctcctgagta gctgagacta caggtgtgca ccagtgttcc cagctgatt 180
ttgtatttta tgtagagatg gggttatgcc attttggcca ggctagtctc gaactcctga 240ttgtatttta tgtagagatg gggttatgcc attttggcca ggctagtctc gaactcctga 240
gctcaggtga tacacacacc tcagcaaatc ttttaaatta tacattctgt gatatttcct 300gctcaggtga tacacacacc tcagcaaatc ttttaaatta tacattctgt gatatttcct 300
tgactttctt atccagcact tgtattgatt atttttcatt ttgataatgt tgggttttta 360360
aaaactcctt tatgatggaa aatttc 386aaaactcctt tatgatggaa aatttc 386
<210> 68<210> 68
<211> 281<211> 281
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 68<400> 68
gtcaactatt ttaataaatt gatgaccagt tgttaacttc tgttggtttt tattcagaat 60gtcaactatt ttaataaatt gatgaccagt tgttaacttc tgttggtttt tattcagaat 60
actggcagat tttaggaata taaaggtgta ctatgagact tccacttttc aggtggaata 120actggcagat tttaggaata taaaggtgta ctatgagact tccacttttc aggtggaata 120
tatgggtatc ttagagtggt ctatcctgtt ttcgttgtcg tttgagtcat ttgaaaactg 180180
gattccgtta actacataat atgtgagacc tgactggttt tattggacac tggcagttta 240gattccgtta actacataat atgtgagacc tgactggttt tattggacac tggcagttta 240
taactttggc atactctaga taaattctga ttggtatggg g 281taactttggc atactctaga taaattctga ttggtatggg g 281
<210> 69<210> 69
<211> 53<211> 53
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 69<400> 69
ctggagagaa tcacagatgt ggaatatttg tcataaataa ataatgaaaa cct 53ctggagagaa tcacagatgt ggaatatttg tcataaataa ataatgaaaa cct 53
<210> 70<210> 70
<211> 2785<211> 2785
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 70<400> 70
atattaatgg tgaaaacact gtagtaataa attttcatat gccaaaaaat gtttgtatct 60atattaatgg tgaaaacact gtagtaataa attttcatat gccaaaaaat gtttgtatct 60
tactgtcccc tgttctcacc acgaagatca tgttcattac caccaccacc cccccttatt 120tactgtcccc tgttctcacc acgaagatca tgttcattac caccaccacc cccccttatt 120
ttttttatcc taaaccagca aacgcaggac ctgtaccaat tttaggagac aataagacag 180ttttttatcc taaaccagca aacgcaggac ctgtaccaat tttaggagac aataagacag 180
ggttgtttca ggattctcta gagttaataa catttgtaac ctggcacagt ttccctcatc 240ggttgtttca ggattctcta gagttaataa catttgtaac ctggcacagt ttccctcatc 240
ctgtggaata agaaaatggg atagatctgg aataaatgtg cagtattgta gtattacttt 300ctgtggaata agaaaatggg atagatctgg aataaatgtg cagtattgta gtattacttt 300
aagaacttta agggaacttc aaaaactcac tgaaattcta gtgagatact ttctttttta 360aagaacttta agggaacttc aaaaactcac tgaaattcta gtgagatact ttctttttta 360
ttcttggtat tttccatatc gggtgcaaca cttcagttac caaatttcat tgcacataga 420ttcttggtat tttccatatc gggtgcaaca cttcagttac caaatttcat tgcacataga 420
ttatcttagg tacccttgga aatgcacatt cttgtatcca tcttacaggg gcccaagatg 480ttatcttagg tacccttgga aatgcacatt cttgtatcca tcttacaggg gcccaagatg 480
ataaatagta aactcaaaat tgctccccac tctgtttatt atttaaaggt gtcaggatct 540ataaatagta aactcaaaat tgctccccac tctgtttatt atttaaaggt gtcaggatct 540
gtgttgtaat gtgtctacat taatgtgttt aggagaatac aggcattgga tcatttagtt 600gtgttgtaat gtgtctacat taatgtgttt aggagaatac aggcattgga tcatttagtt 600
gatggaagta tatgccaggc aagggagata aggtatacga caagactgat gttttcagta 660gatggaagta tatgccaggc aagggagata aggtatacga caagactgat gttttcagta 660
tcttctcatg aggttgtcag agaccttcat gtcttcaaag actagtcagc aaatgaagtg 720tcttctcatg aggttgtcag agaccttcat gtcttcaaag actagtcagc aaatgaagtg 720
gtttagtgta gagacaagat tggttgtgtt ttgataattt aagctaggta ttgagtacat 780gtttagtgta gagacaagat tggttgtgtt ttgataattt aagctaggta ttgagtacat 780
gtggattttg ctgtccacaa atacttgttt cagagttttc atggatacag tggcatggtt 840gtggattttg ctgtccacaa atacttgttt cagagttttc atggatacag tggcatggtt 840
gaaatgaagc tgtgagcctt ctgctttaaa tctgatgtaa gaaactcctg ttaacaaata 900gaaatgaagc tgtgagcctt ctgctttaaa tctgatgtaa gaaactcctg ttaacaaata 900
gtaagtatgg gttaattagc cctttgatca aagcctagct ttacattgtt taggatcttt 960gtaagtatgg gttaattagc cctttgatca aagcctagct ttacattgtt taggatcttt 960
ggaaaacaat tggtttggtt gcccactttc cgtaggatca agagcagaac ctttcacatg 1020ggaaaacaat tggtttggtt gcccactttc cgtaggatca agagcagaac ctttcacatg 1020
gcacagaaga acccaggttg cgcttcatac ctgcatattc cagccttagc ctgccatttc 1080gcacagaaga acccaggttg cgcttcatac ctgcatattc cagccttagc ctgccatttc 1080
tctccttggc actttgtgct ccagcaacac tggtctcagt tggtcatcct caaacttggg 1140tctccttggc actttgtgct ccagcaacac tggtctcagt tggtcatcct caaacttggg 1140
ttccatatcc agcctcagga cctctgttcc tgttactatg gttccttgca tgtcgcctgc 1200ttccatatcc agcctcagga cctctgttcc tgttactatg gttccttgca tgtcgcctgc 1200
tcttactaaa gagctcgtgt gttttccagc acacttcggt ttatctcttg atgatgatgc 1260tcttactaaa gagctcgtgt gttttccagc acacttcggt ttatctcttg atgatgatgc 1260
tagtctctcc ctccgcaagg gcggaaaggc tgcctgttgg tttgtaccag tgtttcctaa 13201320
cgtgtagctg cagtcagtat ttggctaagc tgttcccagg ggctcaacag atgctttcgg 1380cgtgtagctg cagtcagtat ttggctaagc tgttcccagg ggctcaacag atgctttcgg 1380
atgagcctta actgacccaa tcctttgtga tgcgggagag attgctaggc ctcgctcacc 1440atgagcctta actgacccaa tcctttgtga tgcggggagag attgctaggc ctcgctcacc 1440
tggccagaac cagggaaaga ggccgcggtt gcagcgcgat tccaggccct gggcgtcagg 1500tggccagaac cagggaaaga ggccgcggtt gcagcgcgat tccaggccct gggcgtcagg 1500
cgcggggtgg gcagctctcc ccgggcggtg gggcccttgt gaccgcgagg cggggcgcac 15601560
caggaaggga gtgggacagc gcgggcgccc agggatgtgg cctggttacc tgccttctct 1620caggaaggga gtgggacagc gcgggcgccc agggatgtgg cctggttacc tgccttctct 1620
gatacgtcaa gacaccttca acaatggctt gcagctgtac cctgttggct gcacccagga 1680gatacgtcaa gacaccttca acaatggctt gcagctgtac cctgttggct gcaccagga 1680
cgcccttttc actgctaagc agtcctacct gaggcccagg ggctgccaga ttgacccata 1740cgcccttttc actgctaagc agtcctacct gaggcccagg ggctgccaga ttgacccata 1740
aataatctcc ggcgcctcag atccagaagc tgctgagcct gatcttagtg ccttctcctt 1800aataatctcc ggcgcctcag atccagaagc tgctgagcct gatcttagtg ccttctcctt 1800
tctctgtgtg gccccccagc ccctttcccc actgccttgt gtccaaggcc ctttccttca 1860tctctgtgtg gccccccagc ccctttcccc actgccttgt gtccaaggcc ctttccttca 1860
tgtatccatg gaggagagac aaaaatacac atcaataaaa taagataggg aatccataaa 1920tgtatccatg guggagagac aaaaatacac atcaataaaa taagataggg aatccataaa 1920
tagacattca gaagtatggc caacggattt atcttaaaac caatggagga agaagagttt 1980tagacattca gaagtatggc caacggattt atcttaaaac caatggagga agaagagttt 1980
caataaatgt tgtggacttc catttgtcaa agaccaaaac aaaggaaccc caaccttaca 2040caataaatgt tgtggacttc catttgtcaa agaccaaaac aaaggaaccc caaccttaca 2040
tgtaatacaa acttaactca aaatggatca tatatctaaa tgtaaaatgg aaagctataa 2100tgtaatacaa acttaactca aaatggatca tatatctaaa tgtaaaatgg aaagctataa 2100
aactgaaaac agactatctt tacaacctag gcgtaggtat agtttttaga cattacacca 2160aactgaaaac agactatctt tacaacctag gcgtaggtat agtttttaga cattacacca 2160
aaagcacatg ccgtaaaaga aaaaatagat aaattggtgg atttcattaa aattaaaaaa 2220aaagcacatg ccgtaaaaga aaaaatagat aaattggtgg atttcattaa aattaaaaaa 2220
ctttttctct ctgaaaaatc ctgttaagct gggcgctgtg gttcatgcct gtaatcccag 2280ctttttctct ctgaaaaatc ctgttaagct gggcgctgtg gttcatgcct gtaatcccag 2280
cactttggga ggctgagttg ggaagaaatt aatagcttga ggccaggagt tcaagatcat 2340cactttggga ggctgagttg ggaagaaatt aatagcttga ggccaggagt tcaagatcat 2340
cctgggcagc aaagtcatac actcttgagg gaagagagag accttctcat attgttttat 2400cctgggcagc aaagtcatac actcttgagg gaagagagag accttctcat attgttttat 2400
attgttttat actcagtacc tgttttaaga aaaaaacaag gaagtgaaat caaagacagg 2460attgttttat actcagtacc tgttttaaga aaaaaacaag gaagtgaaat caaagacagg 2460
cagcccggca ccaggcctga aaccagccct gggcctgcct ggcctaaacc tagtagttaa 2520cagccggca ccaggcctga aaccagccct gggcctgcct ggcctaaacc tagtagttaa 2520
aaatcaactt acgacttaga acctgatgtt atccgtagat tccaagcatt gtataaaaaa 2580aaatcaactt acgacttaga acctgatgtt atccgtagat tccaagcatt gtataaaaaa 2580
attgtgaaac tccctgttgt gttctgtacc agtgcatgaa acccctgtca catatcccct 2640attgtgaaac tccctgttgt gttctgtacc agtgcatgaa acccctgtca catatcccct 2640
agattgctca atcaatcacg accctttcat gtgaaatctt tagtgttgtg agcccttaaa 2700agattgctca atcaatcacg accctttcat gtgaaatctt tagtgttgtg agcccttaaa 2700
agggacagaa attgtgcact tgaggagctc agattttaag gctgtagctt gccgatgctc 2760agggacagaa attgtgcact tgaggagctc agattttaag gctgtagctt gccgatgctc 2760
ccagctgaat aaagcccttc cttct 2785ccagctgaat aaagcccttc cttct 2785
<210> 71<210> 71
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 71<400> 71
ataggtccaa ccagctgtac atttggaaaa ataaaacttt attaaatc 48ataggtccaa ccagctgtac atttggaaaa ataaaacttt attaaatc 48
<210> 72<210> 72
<211> 67<211> 67
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 72<400> 72
ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60
tgtactt 67tgtactt 67
<210> 73<210> 73
<211> 62<211> 62
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 73<400> 73
aagcactctg agtcaagatg agtgggaaac catctcaata aacacatttt ggataaatcc 60aagcactctg agtcaagatg agtgggaaac catctcaata aacacatttt ggataaatcc 60
tg 62tg 62
<210> 74<210> 74
<211> 276<211> 276
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 74<400> 74
ctgtatgagt taataaaaga catgaactaa catttattgt tgggttttat tgcagtaaaa 6060
agaatggttt ttaagcacca aattgatggt cacaccattt ccttttagta gtgctactgc 120agaatggttt ttaagcacca aattgatggt cacaccattt ccttttagta gtgctactgc 120
tatcgctgtg tgaatgttgc ctctggggat tatgtgaccc agtggttctg tatacctgcc 180tatcgctgtg tgaatgttgc ctctggggat tatgtgaccc agtggttctg tatacctgcc 180
aggtgccaac cacttgtaaa ggtcttgata ttttcaattc ttagactacc tatactttgg 240aggtgccaac cacttgtaaa ggtcttgata ttttcaattc ttagactacc tatactttgg 240
cagaagttat atttaatgta agttgtctaa atataa 276cagaagttat atttaatgta agttgtctaa atataa 276
<210> 75<210> 75
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 75<400> 75
gcttggctgc tcgctgggtc ttggatgtcg ggttcgacca cttggccgat gggaatggtc 60gcttggctgc tcgctgggtc ttggatgtcg ggttcgacca cttggccgat gggaatggtc 60
tgtcacagtc tgctcctttt ttttgtccgc cacacgtaac tgagatgctc ctttaaataa 120tgtcacagtc tgctcctttt ttttgtccgc cacacgtaac
agcgtttgtg tttcaagtt 139agcgtttgtg tttcaagtt 139
<210> 76<210> 76
<211> 94<211> 94
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 76<400> 76
atgctcttcc ttcagaggat tatccggggc atctactcaa tgaaaaacca tgataattct 60atgctcttcc ttcagaggat tatccggggc atctactcaa tgaaaaacca tgataattct 60
ttgtatataa aataaacatt tgaaaaaacc cttc 94ttgtatataa aataaacatt tgaaaaaacc cttc 94
<210> 77<210> 77
<211> 1355<211> 1355
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 77<400> 77
tataagtaaa gtttgtaaaa ttcatactta ataaacaatt taggacagtc atgtctgctt 60tataagtaaa gtttgtaaaa ttcatactta ataaacaatt taggacagtc atgtctgctt 60
acaggtgtta tttgtctgtt aaaactagtc tgcagatgtt tcttgaatgc tttgtcaaat 120120
taagaaagtt aaagtgcaat aatgtttgaa gacaataagt ggtggtgtat cttgtttcta 180taagaaagtt aaagtgcaat aatgtttgaa gacaataagt ggtggtgtat cttgtttcta 180
ataagataaa cttttttgtc tttgctttat cttattaggg agttgtatgt cagtgtataa 240ataagataaa cttttttgtc tttgctttat cttattaggg agttgtatgt cagtgtataa 240
aacatactgt gtggtataac aggcttaata aattctttaa aaggagagaa ctgaaactag 300aacatactgt gtggtataac aggcttaata aattctttaa aaggagagaa ctgaaactag 300
ccctgtagat ttgtctggtg catgtgatga aacctgcagc tttatcggag tgatggcaat 360ccctgtagat ttgtctggtg catgtgatga aacctgcagc tttatcggag tgatggcaat 360
gctctgctgg tttattttca agtggctgcg ttttttttag tttggcaggt gtagactttt 420gctctgctgg tttattttca agtggctgcg tttttttttag tttggcaggt gtagactttt 420
taagttgggc tttagaaaat ctgggttagc ctgaagaaaa ttgcctcagc ctccacagta 480taagttgggc tttgaaaat ctgggttagc ctgaagaaaa ttgcctcagc ctccacagta 480
ccattttaaa ttcacataaa aggtgaaagc tcctggttca gtgccatggc ttcatggcat 540ccattttaaa ttcacataaa aggtgaaagc tcctggttca gtgccatggc ttcatggcat 540
tcagtgatta gtggtaatgg taaacactgg tgtgttttga agttgaatgt gcgataaaat 600tcagtgatta gtggtaatgg taaacactgg tgtgttttga agttgaatgt gcgataaaat 600
tattagcctt aagattggta agctagcaat gaatgctagg gtgggaagct ggtgagccag 660tattagcctt aagattggta agctagcaat gaatgctagg gtgggaagct ggtgagccag 660
tggccattag ataaatacct ttcaagtgtg agcttagacg tcaaccctaa aatacttaac 720tggccattag ataaatacct ttcaagtgtg agcttagacg tcaaccctaa aatacttaac 720
cgtaatgcta attgtgatca ttatgaatcc cttcagtcac attaggggga aagtagttgg 780cgtaatgcta attgtgatca ttatgaatcc cttcagtcac attaggggga aagtagttgg 780
ctataagtac gtcattctta gtccagtcag tcttaaaaac atcttgggtt acccactctg 840ctataagtac gtcattctta gtccagtcag tcttaaaaac atcttgggtt acccactctg 840
tccactccca taggctacag aaaaagtcac aagcgcatgg tttccaacca tatgtgtttt 900tccactccca taggctacag aaaaagtcac aagcgcatgg tttccaacca tatgtgtttt 900
ctgcagttat ttctcttgtt ctggccaaac aaccctaaaa atccttacca ttccacaaag 960ctgcagttat ttctcttgtt ctggccaaac aaccctaaaa atccttacca ttccacaaag 960
ttggaccatc acttgtgcac ccactttgac tatgagtata ccaccacatt gcatttctgt 1020ttggaccatc acttgtgcac ccactttgac tatgagtata ccaccacatt gcatttctgt 1020
ttgcaccatg tcttccagga gactagacta ctgttgtcca gggtcaattt gagtgtaaag 1080ttgcaccatg tcttccagga gactagacta ctgttgtcca gggtcaattt gagtgtaaag 1080
aaaatgtaga caaggaattg cccaatttta aattctgact ttgctgactt aatttaaatg 1140aaaatgtaga caaggaattg cccaatttta aattctgact ttgctgactt aatttaaatg 1140
ctcgttctga accaattttc tcctatcttc tctaggggtt tcaaaagact cagttaattg 1200ctcgttctga accaattttc tcctatcttc tctaggggtt tcaaaagact cagttaattg 1200
atttccagga agtactcata gcaagttcat aaaagttctt gagacctaaa tttcttcaca 12601260
aaaaaagaaa agatcttaag tcatacattt taattgtgta gaggttgttc aactgaagga 13201320
ataaatgtct attaaactaa aacaaatgga ccttc 1355ataaatgtct attaaactaa aacaaatgga ccttc 1355
<210> 78<210> 78
<211> 2017<211> 2017
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 78<400> 78
gcaattcttc tgcctcggcc tcccaaatag ccaggactac aggcgcacac tgccatgccc 60gcaattcttc tgcctcggcc tcccaaatag ccaggactac aggcgcacac tgccatgccc 60
agctaagttt tgtattttta gtagagactg ggtttcacta tgttggccag gctggtctcg 120agctaagttt tgtattttta gtagagactg ggtttcacta tgttggccag gctggtctcg 120
aactcctgac ctcaagtgat ccacctgcct tggcctccca aagtgctggg attacaggcg 180aactcctgac ctcaagtgat ccacctgcct tggcctccca aagtgctggg attacaggcg 180
tgagccacca cccccagccc aatttttatt ttttgtacag acaggatctc actatgttgc 240tgagccacca cccccagccc aattttttatt ttttgtacag acaggatctc actatgttgc 240
ccaggttggt ctcaaactac tggcctcaag caatcctgcc ttggcctccc aaagtgctgg 300ccaggttggt ctcaaactac tggcctcaag caatcctgcc ttggcctccc aaagtgctgg 300
aattatagga atgagccacc acaccgggcc caaatttact ttagtaataa caacaattgg 360aattatagga atgagccacc acaccggggcc caaatttact ttagtaataa caacaattgg 360
ctgggtgcgg tggctcacgc ctgcaatccc aacactttcg gtaaccaagg tgggcttgag 420ctgggtgcgg tggctcacgc ctgcaatccc aacactttcg gtaaccaagg tgggcttgag 420
ctcatgagtt agagagcagc ctgagcaacg tggtgagagc ccatctcaca aaaaataaca 480ctcatgagtt agagagcagc ctgagcaacg tggtgagagc ccatctcaca aaaaataaca 480
aatcagctgg gcatggtgtt gcacgcctgt agtctccgaa atcacaccac tgcactccca 540aatcagctgg gcatggtgtt gcacgcctgt agtctccgaa atcacaccac tgcactccca 540
tcttgggtga tagagccaga acttgtctca aaaataacaa ttggtttctt acaatcccaa 600tcttgggtga tagagccaga acttgtctca aaaataacaa ttggtttctt acaatcccaa 600
aaggtgcagt tactagtatt aatccttttt tgccaatgag gaaacacaaa gatgaagcaa 660aaggtgcagt tactagtatt aatccttttt tgccaatgag gaaacacaaa gatgaagcaa 660
cttgctcaaa gtcatacagt gacagtctga attcaaatcc tatacactta aagtttattt 720cttgctcaaa gtcatacagt gacagtctga attcaaatcc tatacactta aagtttattt 720
gttttgtttt ggtttttttt gagatggagt ctcactgtgt cgcaaggctg gagtgcagtg 780gttttgtttt ggtttttttt gagatggagt ctcactgtgt cgcaaggctg gagtgcagtg 780
gcacgatctc agctcactgc aacccgggtt caagcgattc tcctgcctca gcctcccgag 840gcacgatctc agctcactgc aacccggggtt caagcgattc tcctgcctca gcctcccgag 840
tagctgggac tacaggcacg caccaccaca cccagctaat ttttgtattt ttagtagaga 900tagctgggac tacaggcacg caccaccaca cccagctaat ttttgtattt ttagtagaga 900
cggtttcacc atgttggcca ggatggtctc gagctcctga cctcaggtga tcctcccgcc 960cggtttcacc atgttggcca ggatggtctc gagctcctga cctcaggtga tcctcccgcc 960
ttggcctccc aaagtgccgg gattacaggt gtcagccact gcacgtggcc aacttaaagt 1020ttggcctccc aaagtgccgg gattacaggt gtcagccact gcacgtggcc aacttaaagt 1020
ttttgataga taatacatta acgttaaaaa ttcaaaagat aagtataggc tctacagtac 1080ttttgataga taatacatta acgttaaaaa ttcaaaagat aagtataggc tctacagtac 1080
aaacccttct gcctcctagt tcctctccct ggaggcaagg tgatcagttt aacaatattt 1140aaacccttct gcctcctagt tcctctccct ggaggcaagg tgatcagttt aacaatattt 1140
ttttattttg agacagggtc tcactgttgc ccaggctgga gtgtagtggc gcgttcacaa 1200ttttattttg agacagggtc tcactgttgc ccaggctgga gtgtagtggc gcgttcacaa 1200
cttactgtag cctcaacctc ctggctcaag caatcctccc acctcagcct gtcgagtagc 1260cttactgtag cctcaacctc ctggctcaag caatcctccc acctcagcct gtcgagtagc 1260
tggaaccaca ggtgcacacc accatgccag gctaattttt gtattttttg tagagacagg 1320tggaaccaca ggtgcacacc accatgccag gctaattttt gtattttttg tagagacagg 1320
gtttcaccat gttgttcagg ctggtctcaa agtcctgggc tcaagcaatc ttcctgtctc 13801380
tgcttcccaa agtgctggga ttacagatgt gggccacggt gcctggccta catatgtatt 1440tgcttcccaa agtgctggga ttacagatgt gggccacggt gcctggccta catatgtatt 1440
ttttcctttt cttccccaag tggtaggata tgatacacat tgttgatttt tttgtttagt 1500ttttcctttt cttccccaag tggtaggata tgatacacat tgttgatttt tttgtttagt 1500
tatgtatctc agagcttatt ctttatcagc tcatgaggaa cttcattttt tttttttttt 15601560
ttgagatgta gttttgctct tatagcccag gttggagtac agtaacacaa tcttggctcg 1620ttgagatgta gttttgctct tatagcccag gttggagtac agtaacacaa tcttggctcg 1620
cagcaacttc tgcctcccag gttcaagcga ttctcctgcc tcagcctccg agtagctagg 1680cagcaacttc tgcctcccag gttcaagcga ttctcctgcc tcagcctccg agtagctagg 1680
attacaggtg cctgccacta catccagcta tttttgtatt ttcagtagag acggggtttc 1740attacaggtg cctgccacta catccagcta tttttgtatt ttcagtagag acggggtttc 1740
accattttgg ccaagctggt ctcgaactcc tgacctcagg tgatccgccc atctcagcct 1800accattttgg ccaagctggt ctcgaactcc tgacctcagg tgatccgccc atctcagcct 1800
cccaaagtag tgggattaca ggcatgagca accgtgcccg gctggaactt cattcttttg 18601860
gtataactgc atggtatccc atcatgtgga tgtaccatga ttcattggat gtggaccctc 1920gtataactgc atggtatccc atcatgtgga tgtaccatga ttcattggat gtggaccctc 1920
ctgatggaca tttaaatttc ttccaatctg ttgctattac aaaaagaaaa atgtgtgcat 1980ctgatggaca tttaaatttc ttccaatctg ttgctattac aaaaagaaaa atgtgtgcat 1980
acatctttat tcatctgtag aataaattct tagaagt 2017acatctttat tcatctgtag aataaattct tagaagt 2017
<210> 79<210> 79
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 79<400> 79
ggtttttata caagaaaaat aaagtgaatt aagcgtg 37ggtttttata caagaaaaat aaagtgaatt aagcgtg 37
<210> 80<210> 80
<211> 140<211> 140
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 80<400> 80
gtggcaatca taaaaagtaa taaaggttct ttttgacctg ttgacaaatg tatttaagcc 60gtggcaatca taaaaagtaa taaaggttct ttttgacctg ttgacaaatg tatttaagcc 60
tttggattta aagcctgttg aggctggagt taggaggcag attgatagta ggattataat 120tttggattta aagcctgttg aggctggagt taggaggcag attgatagta ggattataat 120
aaacattaaa taatcagttc 140aaacattaaataatcagttc 140
<210> 81<210> 81
<211> 55<211> 55
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 81<400> 81
acaagattcc tcaaaatatt ttctgttaat aaattgcctt catgtaaact gtttc 55acaagattcc tcaaaatatt ttctgttaat aaattgcctt catgtaaact gtttc 55
<210> 82<210> 82
<211> 1485<211> 1485
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 82<400> 82
gggcttccaa tgtgctgccc ccctcttaat actcaccaat aaattctact tcctgtccac 60gggcttccaa tgtgctgccc ccctcttaat actcaccaat aaattctact tcctgtccac 60
ctatgtcttt gtatctacat tcttgacggg gaaggaactt cctctgggaa cctttgggtc 120ctatgtcttt gtatctacat tcttgacggg gaaggaactt cctctgggaa ccttttgggtc 120
attgcccttt cacttcagaa acaggttgac aactcagccc tgctcatgag gcagcaaacc 180attgcccttt cacttcagaa acaggttgac aactcagccc tgctcatgag gcagcaaacc 180
ctgcaaaggg ctgggactgg tggccttatg tcagttgtct actctggagc ttgacttgga 240ctgcaaaggg ctgggactgg tggccttatg tcagttgtct actctggagc ttgacttgga 240
cctccccagg tcctaggcag taggttgaaa aacactgaag tgcttttcat gaagcacagc 300cctccccagg tcctagggcag taggttgaaa aacactgaag tgcttttcat gaagcacagc 300
tgcagcaaag ccttgcaatc ccaggctggg gtcagcctac agttgtgttg cttattacaa 360tgcagcaaag ccttgcaatc ccaggctggg gtcagcctac agttgtgttg cttattacaa 360
cacatgcgga ccaagagggg cttgtgggct agaggctgac cagcagcgtt tatttagcaa 420cacatgcgga ccaagagggg cttgtgggct agaggctgac cagcagcgtt tatttagcaa 420
gggtaggtgt gcatcacatt gggcttgttc tcacccatct ggtttggcca ttcctccttg 480gggtaggtgt gcatcacatt gggcttgttc tcacccatct ggtttggcca ttcctccttg 480
gtgggaatca tccaggtact gctgaggtca cctgcgattt gccccatttc ctatctctag 540gtgggaatca tccaggtact gctgaggtca cctgcgattt gccccatttc ctatctctag 540
caacctcctg ggccccatgc ccccacccct tctagaacct gcattcccag ggccttcacc 600caacctcctg ggccccatgc ccccacccct tctagaacct gcattcccag ggccttcacc 600
acctgaccaa aggtctaggc taacctttgg tcatttgtaa caagacctcg gaacagacac 660acctgaccaa aggtctaggc taacctttgg tcatttgtaa caagacctcg gaacagacac 660
gtgtgtggca tggtttggcc tggggatctt agatgtctga cctgaactat tgtagaacag 720gtgtgtggca tggtttggcc tggggatctt agatgtctga cctgaactat tgtagaacag 720
cgctggcttt tgggggagca gcaaaaatga gaggagtgct aggtgggtgg cctgagcatc 780cgctggcttt tgggggagca gcaaaaatga gaggagtgct aggtgggtgg cctgagcatc 780
tgtatccagg gacaggactc caaaggcttt tggtcccaga gctggggtat gttggcccca 840tgtatccagg gacaggactc caaaggcttt tggtcccaga gctggggtat gttggcccca 840
gcccccagcc tgtggctccc aaaaggcctc tggttttttg taatctcagt ttacagccat 900gcccccagcc tgtggctccc aaaaggcctc tggttttttg taatctcagt ttacagccat 900
ttcttaggtt tttaattacc tttattttat tttgccaaac atacctggga atacctttta 960ttcttaggtt tttaattacc tttattttat tttgccaaac atacctggga atacctttta 960
tttttttttt accttggggt gatggttcca aaccataaat gtgattatag ttaacacatg 1020tttttttttt accttggggt gatggttcca aaccataaat gtgattatag ttaacacatg 1020
acccttctag cgtcccagcc agtgtttttc ctgacctctg ttctttggag aggaggatgg 1080acccttctag cgtcccagcc agtgtttttc ctgacctctg ttctttggag aggaggatgg 1080
aagggagggg tccggcacgc tgctggcatt ttgctgtgtc ctgcagcccc tttccgggac 1140aagggagggg tccggcacgc tgctggcatt ttgctgtgtc ctgcagcccc tttccgggac 1140
acctgggttc acacagcttt ttagcttaca taactggtgc agattttctg tgtggagatg 1200acctgggttc acacagcttt ttagcttaca taactggtgc agattttctg tgtggagatg 1200
ttgccttgac cagccttggc tggactttac caggcatgca gaagcctgta ccaacacaga 1260ttgccttgac cagccttggc tggactttac caggcatgca gaagcctgta ccaacacaga 1260
ctacagcacc caggaggtgc gagtgtggct gctcagcggt tataacaggc ctgactgcat 1320ctacagcacc caggaggtgc gagtgtggct gctcagcggt tataacaggc ctgactgcat 1320
tgttcaccgg attataatga gccaaaatgt ttcccggtgt ttgctggttt cagggaagga 1380tgttcaccgg attataatga gccaaaatgt ttcccggtgt ttgctggttt cagggaagga 1380
gtttgatata gcagattaac caccctcctt gtagctattg gggcttaatg gtttcctggt 1440gtttgatata gcagattaac caccctcctt gtagctattg gggcttaatg gtttcctggt 1440
gattcttacc aatccacaat aaacatggcc cattggcata tctgc 1485gattcttacc aatccacaat aaacatggcc cattggcata tctgc 1485
<210> 83<210> 83
<211> 31<211> 31
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 83<400> 83
ggcacatttg aataaattct attaccagtt c 31ggcacatttg aataaattct attaccagtt c 31
<210> 84<210> 84
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 84<400> 84
ggggcgcatt gtcaataaag cacagctggc tgagactgc 39ggggcgcatt gtcaataaag cacagctggc tgagactgc 39
<210> 85<210> 85
<211> 486<211> 486
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 85<400> 85
gcccaataaa gactgttaat tcctcatgcg ttgcctgccc ttcctccatt gttgccctgg 60gcccaataaa gactgttaat tcctcatgcg ttgcctgccc ttcctccatt gttgccctgg 60
aatgtacggg acccaggggc agcagcagtc caggtgccac aggcagccct gggacatagg 120aatgtacggg acccaggggc agcagcagtc caggtgccac aggcagccct gggacatagg 120
aagctgggag caaggaaagg gtcttagtca ctgcctcccg aagttgcttg aaagcactcg 180aagctgggag caaggaaagg gtcttagtca ctgcctcccg aagttgcttg aaagcactcg 180
gagaattgtg caggtgtcat ttatctatga ccaataggaa gagcaaccag ttactatgag 240gagaattgtg caggtgtcat ttatctatga ccaataggaa gagcaaccag ttactatgag 240
tgaaagggag ccagaagact gattggaggg ccctatcttg tgagtggggc atctgttgga 300tgaaagggag ccagaagact gattggaggg ccctatcttg tgagtggggc atctgttgga 300
ctttccacct ggtcatatac tctgcagctg ttagaatgtg caagcacttg gggacagcat 360ctttccacct ggtcatatac tctgcagctg ttagaatgtg caagcacttg gggacagcat 360
gagcttgctg ttgtacacag ggtatttcta gaagcagaaa tagactggga agatgcacaa 420gagcttgctg ttgtacacag ggtatttcta gaagcagaaa tagactggga agatgcacaa 420
ccaaggggtt acaggcatcg cccatgctcc tcacctgtat tttgtaatca gaaataaatt 480ccaaggggtt acaggcatcg cccatgctcc tcacctgtat tttgtaatca gaaataaatt 480
gctttt 486gctttt 486
<210> 86<210> 86
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 86<400> 86
gcccctcccc tgccctctcc ctgaaataaa gaacagcttg acag 44gcccctcccc tgccctctcc ctgaaataaa gaacagcttg acag 44
<210> 87<210> 87
<211> 406<211> 406
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 87<400> 87
gtgtcatctt ttattatgaa gacaataaaa tcttgagttt atgttcactt catttgtttg 60gtgtcatctt ttattatgaa gacaataaaa tcttgagttt atgttcactt catttgtttg 60
ctgttcatct tttgggaggg aataagctag agccatcaat acaattccgc ttgtggggaa 120ctgttcatct tttgggggg aataagctag agccatcaat acaattccgc ttgtggggaa 120
atttatgcct cttactggta ctacttgttt tgcattgaag ctgactggtt gagttcacat 180180
catatgttgc aattttctaa tttggcactt caatcactag gggccttatg aggcagtttg 240catatgttgc aattttctaa tttggcactt caatcactag gggccttatg aggcagtttg 240
tcattatgca atggttattg gttatcatgt gagtagacac atttcaggct aatagggaga 300tcattatgca atggttattg gttatcatgt gagtagacac atttcaggct aatagggaga 300
agtcagtaac acattcatag tgaatatgag atgtctttgc taagagttaa gtgtcagatc 360agtcagtaac acattcatag tgaatatgag atgtctttgc taagagttaa gtgtcagatc 360
tttgttataa cagttaattt aataaagaat tttggcattg ttcttc 406tttgttataa cagttaattt aataaagaat tttggcattg ttcttc 406
<210> 88<210> 88
<211> 1994<211> 1994
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 88<400> 88
ttgccgtaag gatatgcact tgtctctagt ccacacactt catgatatag gtatagcgtt 60ttgccgtaag gatatgcact tgtctctagt ccacacactt catgatatag gtatagcgtt 60
agtttagcga agttttcact gcactgatat atctagtagg tgatggagct gggaatgcaa 120agtttagcga agttttcact gcactgatat atctagtagg tgatggagct gggaatgcaa 120
ctcatgtctg actagtccac aatactgcac tatttcagtg tttacgattt tttatccttt 180180
cccttctgaa gaggcaaaaa attgaggaat gtgccctgct ttcctaagaa ctgaagtgtg 240cccttctgaa gaggcaaaaa attgaggaat gtgccctgct ttcctaagaa ctgaagtgtg 240
agtacactgg taaatccttt catttgcctt gttccttatc tgtcaatatg tctgaatcct 300agtacactgg taaatccttt catttgcctt gttccttatc tgtcaatatg tctgaatcct 300
cgcttgttgg ttgcactaag aattgttctg ttgtttctca tcacagaaat ctgcagtcaa 360360
ctacctgttc tcgtgaagtc ttaaaactct tatagaatag ccatttaggc ctttctgcta 420ctacctgttc tcgtgaagtc ttaaaactct tatagaatag ccatttaggc ctttctgcta 420
gcctcctgaa ttctgtattc tcaggctgag cgagtttctg tttactctca aaccttaggt 480gcctcctgaa ttctgtattc tcaggctgag cgagtttctg tttactctca aaccttaggt 480
gatttggcta actcttaaag taattagcac gatgattgga acggagcatt ctctccaaca 540gatttggcta actcttaaag taattagcac gatgattgga acggagcatt ctctccaaca 540
cagcatttct tttggcactt tgcttcttgt gcagtttagc tccagaaagt attaaggaat 600cagcatttct tttggcactt tgcttcttgt gcagtttagc tccagaaagt attaaggaat 600
gactttagtg ctcatttgga tgcagtaagt ggtttgatct cagggtggca aaaagaatgc 660gactttagtg ctcatttgga tgcagtaagt ggtttgatct cagggtggca aaaagaatgc 660
tttttttata ccttttcaca ttcggataac ttgtttagaa gacagaggtt ctaactaggt 720tttttttata ccttttcaca ttcggataac ttgtttagaa gacagaggtt ctaactaggt 720
tttggcctat taagaactgc aaactagcag cagcagaact ctggctaaag gggcaagctt 780tttggcctat taagaactgc aaactagcag cagcagaact ctggctaaag gggcaagctt 780
attaggaaat tgagtattta aaagttgagc taccatatga tccaacaatc ccactgctgg 840attaggaaat tgagtattta aaagttgagc taccatatga tccaacaatc ccactgctgg 840
gtatataccc agaagaaaat cggtatatca aagagatatc tgcactccta tgtttgttgt 900gtatataccc agaagaaaat cggtatatca aagagatatc tgcactccta tgtttgttgt 900
agcactgttt ataatagcta agatttagaa gcaaccttag tgtccatcgg gatgaatgga 960agcactgttt ataatagcta agatttagaa gcaaccttag tgtccatcgg gatgaatgga 960
taaagaaaat gtacctatac gcggccaggc acggtggctt gtgcctagca ctttggaaag 1020taaagaaaat gtacctatac gcggccaggc acggtggctt gtgcctagca ctttggaaag 1020
ccgaggcggg tggatcacct gaggtcagga gttcgagacc agcctggcca agatagtgaa 1080ccgaggcggg tggatcacct gaggtcagga gttcgagacc agcctggcca agatagtgaa 1080
accccgtctc tagtaaaaat acaaaaatta gccgggcttg tggtgtgggc ctgtaatctc 1140accccgtctc tagtaaaaat acaaaaatta gccgggcttg tggtgtgggc ctgtaatctc 1140
agccacccgg gaggctgagg caggagaatc gctggaacct gggaggcaga ggctgcagtg 1200agccacccgg gaggctgagg caggagaatc gctggaacct gggaggcaga ggctgcagtg 1200
agccgagatc acgccactgt actccagcct gggcgacaga gcaagactcc atctcaaaaa 1260agccgagatc acgccactgt actccagcct gggcgacaga gcaagactcc atctcaaaaa 1260
aaaaaaaaaa aaaaagggaa aaagaaaatg cacctataca cagtggtact attcagccat 1320aaaaaaaaaa aaaaagggaa aaagaaaatg cacctataca cagtggtact attcagccat 1320
aaaaagaatg agatccagtc atttacaaca acatgggtgg aactggagat cgttatgtta 13801380
agtgaaatag gcacacaaag acaagcatca catgttcttg tttgtgggat ctaaaaatca 1440agtgaaatag gcacacaaag acaagcatca catgttcttg tttgtgggat ctaaaaatca 1440
aaacaagtgg acttgtcata tagagagtag aaggatggtt accagaagct gagaacttct 1500aaacaagtgg acttgtcata tagagagtag aaggatggtt accagaagct gagaacttct 1500
ggtggcggga ggtggggatg gttaatgggt acaaaaagaa aaaagaatga attagaccaa 1560ggtggcggga ggtggggatg gttaatggggt acaaaaagaa aaaagaatga attagaccaa 1560
ctatttgata gcacgacagc gtgactaaag tcaataactt agttacatat tttaaaataa 1620ctatttgata gcacgacagc gtgactaaag tcaataactt agttacatat tttaaaataa 1620
cttagagtgt aattggattg tttgtacctc aaagaaaaaa tgcaataaaa ctttacagtg 16801680
gagaaaccta acaagcacta cctcagccag gtaatcaagg ttaacatcaa cagtcacgag 1740gagaaaccta acaagcacta cctcagccag gtaatcaagg ttaacatcaa cagtcacgag 1740
tcatgttgat atataccctt gataaggtgt gatgaaaatg acacttaaac ctaaaaatcc 1800tcatgttgat atataccctt gataaggtgt gatgaaaatg acacttaaac ctaaaaatcc 1800
ataaccctat ctaatgagaa aaataacaaa tcccaagagg ggcattttac aaaatacttg 1860ataaccctat ctaatgagaa aaataacaaa tcccaagagg ggcattttac aaaatacttg 1860
accagtagtg cggaaattgt caaggtcatc aaaaaagtct gagaaattgc cacagccaaa 1920accagtagtg cggaaattgt caaggtcatc aaaaaagtct gagaaattgc cacagccaaa 1920
ggagtctaga gacatgatga ctaaatgtta ggtggtgtcc tgcgtggggt cctagaacag 1980ggagtctaga gacatgatga ctaaatgtta ggtggtgtcc tgcgtggggt cctagaacag 1980
aaaaaggaca ttag 1994aaaaaggaca ttag 1994
<210> 89<210> 89
<211> 307<211> 307
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 89<400> 89
accgctagct tgttgcaccg tggaggccac aggagcagaa acatggaatg ccagacgctg 60accgctagct tgttgcaccg tggaggccac aggagcagaa acatggaatg ccagacgctg 60
gggatgctgg tacaagttgt gggactgcat gctactgtct agagcttgtc tcaatggatc 120gggatgctgg tacaagttgt gggactgcat gctactgtct agagcttgtc tcaatggatc 120
tagaacttca tcgccctctg atcgccgatc acctctgaga cccaccttgc tcataaacaa 180tagaacttca tcgccctctg atcgccgatc acctctgaga cccaccttgc tcataaacaa 180
aatgcccatg ttggtcctct gccctggacc tgtgacattc tggactattt ctgtgtttat 240aatgcccatg ttggtcctct gccctggacc tgtgacattc tggactattt ctgtgtttat 240
ttgtggccga gtgtaacaac catataataa atcacctctt ccgctgtttt agctgaagaa 300ttgtggccga gtgtaacaac catataataa atcacctctt ccgctgtttt agctgaagaa 300
ttaaatc 307ttaaatc 307
<210> 90<210> 90
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 90<400> 90
gtctgtaggc cttgtctgtt aataaatagt ttatatac 38gtctgtaggc cttgtctgtt aataaatagt ttatatac 38
<210> 91<210> 91
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 91<400> 91
agtgtctagc agtgagctgg agattggatc acagccgaag gagtaaaggt gctgcaatga 60agtgtctagc agtgagctgg agattggatc acagccgaag gagtaaaggt gctgcaatga 60
tgttagctgt ggccactgtg gatttttcgc aagaacatta ataaactaaa aacttcatgt 120tgttagctgt ggccactgtg gatttttcgc aagaacatta ataaactaaa aacttcatgt 120
gtctggttgt ttg 133gtctggttgt ttg 133
<210> 92<210> 92
<211> 1802<211> 1802
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 92<400> 92
tgtcactgcc atggccgcct tgctgcattt ctgaggatgc ttcatctctc caccttcttc 60tgtcactgcc atggccgcct tgctgcattt ctgaggatgc ttcatctctc caccttcttc 60
tccactcagc agccagcagg gcactgtgga aatcggagtc acatgagctg gcacctctgt 120tccactcagc agccagcagg gcactgtgga aatcggagtc acatgagctg gcacctctgt 120
tcagaaccct ccagggctcc acatctctct cacccaaatg ccaaagacct ccccacgccc 180tcagaaccct ccagggctcc acatctctct cacccaaatg ccaaagacct cccccgccc 180
ccacaatccc ccacgacctg gccactggcc tcccaccacc ttccagctcc agcggctcct 240ccacaatccc ccacgacctg gccactggcc tcccaccacc ttccagctcc agcggctcct 240
accacattta aggctttcct tcctagtttt aatttttcct cgtcagcagt tgattttatt 300accacattta aggctttcct tcctagtttt aatttttcct cgtcagcagt tgattttatt 300
attttcttgt ttattggtat tttcccacta gaaatgaagc tgcgtgaagt tagagatttt 360360
tttttttggt ctgtgttcct aattagctca ttgctatacc cctggcgccc agaacaatgc 420tttttttggt ctgtgttcct aattagctca ttgctatacc cctggcgccc agaacaatgc 420
cttggacaca gtacgcagta gactaaataa atacttgttg aatgactgac tgacggaatg 480cttggacaca gtacgcagta gactaaataa atacttgttg aatgactgac tgacggaatg 480
acggctgtgt ggggagtgga ttgggtcgtg aggcagaggc tgcggtggaa actcaggcag 540acggctgtgt ggggagtgga ttgggtcgtg aggcagaggc tgcggtggaa actcaggcag 540
gaggtgatgg tggttcttgg ggctgcggaa tgccaagttt agaagctctt cctctgctgt 600gaggtgatgg tggttcttgg ggctgcggaa tgccaagttt agaagctctt cctctgctgt 600
ggcacatgaa ccggtcactc gagaaggctt ttagatttac tttgcctaat cccctcttag 660ggcacatgaa ccggtcactc gagaaggctt ttagatttac tttgcctaat cccctcttag 660
tgcatgtggg gaaactgagg tacacaaaag gaattcccca ccaagttagg ggcagaacct 720tgcatgtggg gaaactgagg tacacaaaag gaattcccca ccaagttagg ggcagaacct 720
agcccccttg tctcccagat ggatatcttc tttttttttt gagacggagt cttgctctgt 780agcccccttg tctcccagat ggatatcttc tttttttttt gagacggagt cttgctctgt 780
tgcccaggct ggagtgcagt ggtaccatct tggctcactg caacctctgc ttcccaggtt 840tgcccaggct ggagtgcagt ggtaccatct tggctcactg caacctctgc ttcccaggtt 840
caagcgattc tcctgcctca gcctcctgag tgtctgcgat tacaggtgca cacaaccacg 900caagcgattc tcctgcctca gcctcctgag tgtctgcgat tacaggtgca cacaaccacg 900
cctggctaat ttttgtattt ttagtagaga cggggtttca ccgtgttggt cagggtgacc 960cctggctaat ttttgtattt ttagtagaga cggggtttca ccgtgttggt cagggtgacc 960
tcaaactcct gacctcatga tccacccagc tcagcctccc aacgtgctgg gattacaggc 1020tcaaactcct gacctcatga tccacccagc tcagcctccc aacgtgctgg gattacaggc 1020
atgagccacc gtgcctggct ggacatcttg ttattaaagc ttcttctctc tttgtagggg 1080atgagccacc gtgcctggct ggacatcttg ttattaaagc ttcttctctc tttgtagggg 1080
agggggagat gcctctggtg gagaagacca gtgtggcagt gactgtgtct gttagtgaac 1140agggggagat gcctctggtg gagaagacca gtgtggcagt gactgtgtct gttagtgaac 1140
ctggtggctg gttgagggtc tgtcgtggtg actgaggaca catacaaagt gcttttctca 1200ctggtggctg gttgagggtc tgtcgtggtg actgaggaca catacaaagt gcttttctca 1200
gtggtcacct tggtgttggt gaataagggt cagaagatgg ctcctgtcct agggcactgc 1260gtggtcacct tggtgttggt gaataagggt cagaagatgg ctcctgtcct agggcactgc 1260
cagtcggttt ggaagctgaa atgcctgctt agcagtttga ggaaacacag accttggagg 1320cagtcggttt ggaagctgaa atgcctgctt agcagtttga ggaaacacag accttggagg 1320
atcttctggt tgcctcttca agaattcatt ctattcccct tctgctcccc aaatttgctt 1380atcttctggt tgcctcttca agaattcatt ctattcccct tctgctcccc aaatttgctt 1380
ttcttggggt gggtcttggt tggcctaagc caagaaagta tggcatctac tccttccata 1440ttcttggggt gggtcttggt tggcctaagc caagaaagta tggcatctac tccttccata 1440
gcaatagctc aggaataggc agtgacccag acctgaacca atcagtgcat ggaattaccc 1500gcaatagctc aggaataggc agtgacccag acctgaacca atcagtgcat ggaattaccc 1500
ctggccaaag tggttgattg aggctgggtg caagcagagt tgtgagaagg ctcccatttg 15601560
gtggttggag agatcgcact tgctccagag gtcataatgt gcagatctga ggcttggaac 1620gtggttggag agatcgcact tgctccagag gtcataatgt gcagatctga ggcttggaac 1620
tgctgcagac attttgctac cacaagtgaa gccaccctga cgacacagtt gacaatttgg 16801680
agcagggcag agctgagaga acagcaggga aacagccaga gtcttgctca agcctccctg 1740agcagggcag agctgagaga acagcaggga aacagccaga gtcttgctca agcctccctg 1740
aagtatctat acccctggac tctagttatg ggggctaata aatgttatat actgtttaag 1800aagtatctat acccctggac tctagttatg ggggctaata aatgttatat actgtttaag 1800
gt 1802gt 1802
<210> 93<210> 93
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 93<400> 93
tgctgagggc ctcaataaag tttgtgttta tgcc 34tgctgagggc ctcaataaag tttgtgttta tgcc 34
<210> 94<210> 94
<211> 502<211> 502
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 94<400> 94
aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 6060
tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120
ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180
cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240
catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300
caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360
cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420cttattaata cttcgattct gtaaaagtt tagggtttga ttttataaaa tccaaaatga 420
gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480gcctttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480
aattaaaaat cttgcaaagg gg 502aattaaaaat cttgcaaagg gg 502
<210> 95<210> 95
<211> 502<211> 502
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 95<400> 95
aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 6060
tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120
ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180
cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240
catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300
caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360
cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420cttattaata cttcgattct gtaaaagtt tagggtttga ttttataaaa tccaaaatga 420
gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480gcctttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480
aattaaaaat cttgcaaagg gg 502aattaaaaat cttgcaaagg gg 502
<210> 96<210> 96
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 96<400> 96
attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48attttttctg tagtgctgta ttatttttcaa taaatctggg acaacagc 48
<210> 97<210> 97
<211> 171<211> 171
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 97<400> 97
gctgttcttg cataggctct taagcagcat ggaaaaatgg ttgatggaaa ataaacatca 60gctgttcttg cataggctct taagcagcat ggaaaaatgg ttgatggaaa ataaacatca 60
gtttctaaaa gttgtcttca tttagtttgc tttttactcc agatcagaat acctgggatt 120gtttctaaaa gttgtcttca tttagtttgc tttttactcc agatcagaat acctgggatt 120
gcatatcaaa gcataataat aaatacatgt ctcgacatga gttgtacttc t 171gcatatcaaa gcataataat aaatacatgt ctcgacatga gttgtacttc t 171
<210> 98<210> 98
<211> 2309<211> 2309
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 98<400> 98
ggtggttctt tccttgaagg gcagcctcct gcccaggccc cgtggccctg gagcctcaat 60ggtggttctt tccttgaagg gcagcctcct gcccaggccc cgtggccctg gagcctcaat 60
aaagtgtccc tttcattgac tggagcagca attggtgtcc tcatggctga tctgtccagg 120aaagtgtccc tttcattgac tggagcagca attggtgtcc tcatggctga tctgtccagg 120
gaggtggctg aagagtgggc atctccctta gggactctac tcagcactcc attctgtgcc 180gaggtggctg aagagtgggc atctccctta gggactctac tcagcactcc attctgtgcc 180
acctgtgggg tcttctgtcc tagattctgt cacatcggca ttggtccctg ccctatgccc 240acctgtgggg tcttctgtcc tagattctgt cacatcggca ttggtccctg ccctatgccc 240
ctgactctgg atttgtcatc tgtaaaactg gagtaaaaac ctcagtcgtg taattggtgg 300ctgactctgg atttgtcatc tgtaaaactg gagtaaaaac ctcagtcgtg taattggtgg 300
gactgaggat cagttttgtc attgctggga tcctgtcagg cactttgagg tgtccctcag 360gactgaggat cagttttgtc attgctggga tcctgtcagg cactttgagg tgtccctcag 360
gccttggccc tgaagtgtct aggtgtgtgg agatgggtag aaaattaggt acacccaatg 420gccttggccc tgaagtgtct aggtgtgtgg agatgggtag aaaattaggt acacccaatg 420
gtgtagaacg ttgattctca aattttttta ttttatacaa atggggtctc actatgttgt 480gtgtagaacg ttgattctca aattttttta ttttatacaa atggggtctc actatgttgt 480
ccaggctggt cttgaactcc tgggctcaag ccatccgccc atctcagccc ctcaaagtgt 540ccaggctggt cttgaactcc tgggctcaag ccatccgccc atctcagccc ctcaaagtgt 540
tgggattaca agcaagaact gccatgcctg acccagttct cagttttttg tttgtttgtt 600tgggattaca agcaagaact gccatgcctg acccagttct cagttttttg tttgtttgtt 600
tgtttgtttg ttttgagacg gagtcttgct ctgtcgccca ggctggagtg cagtggcgca 660tgtttgtttg ttttgagacg gagtcttgct ctgtcgccca ggctggagtg cagtggcgca 660
gtctcggctt actacaacct ctgcctccgg ggttcacatc cttctcctgc ctcagcctcc 720gtctcggctt actacaacct ctgcctccgg ggttcacatc cttctcctgc ctcagcctcc 720
cgagtagctg ggactacagg tgcccgccac aactcctggc taattttttg tatttttagt 780cgagtagctg ggactacagg tgcccgccac aactcctggc taatttttttg tatttttagt 780
agagacgggg tttcactggg ttagccaggt tggtctcgat ctcctgacct tgtgatccat 840agagacgggg tttcactgggg ttagccaggt tggtctcgat ctcctgacct tgtgatccat 840
tcgccttggc ctcccagaat gctggtatta caggcgtgag ccagcacgcc tggcccagtt 900tcgccttggc ctcccagaat gctggtatta caggcgtgag ccagcacgcc tggcccagtt 900
actcagtttt gaatctgagg ccgtgacatc actcatggtc tgcagtcagt gctctgcccc 960actcagtttt gaatctgagg ccgtgacatc actcatggtc tgcagtcagt gctctgcccc 960
tgagctgtac cctctcctat gataatcact cttaagaagg gcaacccttg gtgttttccc 1020tgagctgtac cctctcctat gataatcact cttaagaagg gcaacccttg gtgttttccc 1020
cttaaggtca cccaggctgg aatgcagtgg tgtggtcatg gctccctgta ccctggaact 1080cttaaggtca cccaggctgg aatgcagtgg tgtggtcatg gctccctgta ccctggaact 1080
caggcttggg tgatcctctc tcctttgcct ccgaagtagc caggactaca ggtgtgcacc 1140caggcttggg tgatcctctc tcctttgcct ccgaagtagc caggactaca ggtgtgcacc 1140
caccaccaca ctcagataat tgctttggtg tttttaaagc ttgtaatgat cagtaggctg 1200caccaccaca ctcagataat tgctttggtg tttttaaagc ttgtaatgat cagtaggctg 1200
aggtgggcaa atcataaggt caagagtttt ttagatgggg tgagcacaga ccaattcctg 12601260
ttttatttac tgatttaaaa ttttgagaca gtctcactgt cacccaggtt ggggtgcagt 1320ttttatttac tgatttaaaa ttttgagaca gtctcactgt cacccaggtt ggggtgcagt 1320
ggtaggatca tagcttgctg cagccttgat ctcccaggat cttgcctcag cctcccgagt 1380ggtaggatca tagcttgctg cagccttgat ctcccaggat cttgcctcag cctcccgagt 1380
agctgggact gcatgcttgt gccaccacac tcggttaata ttttgtagag atggggtctt 1440agctgggact gcatgcttgt gccaccacac tcggttaata ttttgtagag atggggtctt 1440
gctatgttgc ccaggctggc ttcaaactcc tgaacttaaa agcctcctgt ttagttttgg 1500gctatgttgc ccaggctggc ttcaaactcc tgaacttaaa agcctcctgt ttagttttgg 1500
ttttttatca cttttttttt ttttttttga gatggagcct tgctcccatc gtgcaggctg 1560ttttttatca cttttttttt ttttttttga gatggagcct tgctcccatc gtgcaggctg 1560
gagtgcggtg gcgcagtctc ggctcactgc agcttctgcc tctcgggttc aagcgattct 1620gagtgcggtg gcgcagtctc ggctcactgc agcttctgcc tctcgggttc aagcgattct 1620
cctttctcag cctcttgagt agctggaatt accagtgtgc gccaccacca ccacgcctgg 1680cctttctcag cctcttgagt agctggaatt accagtgtgc gccaccacca ccacgcctgg 1680
ctagtttttc tgtttttagt agagacaggg ttttgctatg ttggccaggc tggtcttgaa 1740ctagtttttc tgtttttagt agagacaggg ttttgctatg ttggccaggc tggtcttgaa 1740
ctactgacct cttgtgatct acctgtcttg gccttccaaa gtgctaggat tacaagcgta 1800ctactgacct cttgtgatct acctgtcttg gccttccaaa gtgctaggat tacaagcgta 1800
agccacagcg cctggccttg ctacattttt tttttttttt ttttttttac agacatggtc 1860agccacagcg cctggccttg ctacattttt tttttttttt ttttttttac agacatggtc 1860
tcgctatgtt gcccagaatg gttttgcact gggtccaagc agttctgccg cagcctccca 1920tcgctatgtt gcccagaatg gttttgcact gggtccaagc agttctgccg cagcctccca 1920
aagtgctggg attacagggg tgaggcacct tgctggcccc tgttttgatt agggtgcagt 1980aagtgctggg attacagggg tgaggcacct tgctggcccc tgttttgatt agggtgcagt 1980
gctggtgaag ccggtgcacg aggccagtga tgcatcctaa tgaggggtgg agttggcggg 2040gctggtgaag ccggtgcacg aggccagtga tgcatcctaa tgaggggtgg agttggcggg 2040
acttcctggg ccagtttggg gactttcaca aaagaccccc atgactcagg gttttgagtt 2100acttcctggg ccagtttgggg gactttcaca aaagaccccc atgactcagg gttttgagtt 2100
cttaactgat cgaatgaagg attcaaaatt aaccactcca aggggggatt gaaggaagaa 2160cttaactgat cgaatgaagg attcaaaatt aaccactcca aggggggatt gaaggaagaa 2160
ccactcttaa tggacaaaaa gaaagaaagg ggagggagta acagggatat gagctctagc 2220ccactcttaa tggacaaaaa gaaagaaagg ggagggagta acagggatat gagctctagc 2220
cgcccaagct agcaatggca acccttctgg gtccccttcc agcatgtgga agctttcctt 2280cgccaagct agcaatggca acccttctgg gtccccttcc agcatgtgga agctttcctt 2280
tcgcttcatt caataaacag ctgctgctc 2309tcgcttcatt caataaacag ctgctgctc 2309
<210> 99<210> 99
<211> 58<211> 58
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 99<400> 99
gtcttttgta attctggctt tctctaataa aaaagccact tagttcagtc atcgaaaa 58gtcttttgta attctggctt tctctaataa aaaagccact tagttcagtc atcgaaaa 58
<210> 100<210> 100
<211> 1502<211> 1502
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 100<400> 100
gcaaaggctc cccttacagg gctttgctta ttaataaaat aaatgaagta tacatgagaa 60gcaaaggctc cccttacagg gctttgctta ttaataaaat aaatgaagta tacatgagaa 60
ataccaagaa attggctttt agtttatcag tgaataaaaa atattatact cttgaacttt 120ataccaagaa attggctttt agtttatcag tgaataaaaa atattatact cttgaacttt 120
tgtctcattt ttttgagtat gctgtttata tgattttgat ttccctctga taactatcaa 180tgtctcattt ttttgagtat gctgtttata tgattttgat ttccctctga taactatcaa 180
cagtatttaa atagcttata gctggtataa ttttttccca cgatttccaa aatcttttat 240cagtatttaa atagcttata gctggtataa ttttttccca cgatttccaa aatcttttat 240
gtactcaggt aaaagtagcg ttatatagga aatctttttt ttagacactc tcgttctgtc 300gtactcaggt aaaagtagcg ttatatagga aatctttttt ttagacactc tcgttctgtc 300
acccaggctg gagtgcagtg actcagcttc ctaaatagct ggaattacag gtgtgagcca 360acccaggctg gagtgcagtg actcagcttc ctaaatagct ggaattacag gtgtgagcca 360
ccatgcccgg ctaatttttt gtacttttag tagagtaggg tttggccatg ttggccaggc 420ccatgcccgg ctaatttttt gtacttttag tagagtaggg tttggccatg ttggccaggc 420
tggtttcaaa ctcctgacct caagtgatct acccacctcg gcttcccaaa gtgctgatta 480tggtttcaaa ctcctgacct caagtgatct acccacctcg gcttcccaaa gtgctgatta 480
tagctgtgaa ccaccatgcc cggccaggaa atcttactgt agaacaattt tttatatagc 540tagctgtgaa ccaccatgcc cggccaggaa atcttactgt agaacaattt tttatatagc 540
tgtataaaat gtatatgatt gtcttgacag tctcaaatac tgtttttaat agcttgtaaa 600tgtataaaat gtatatgatt gtcttgacag tctcaaatac tgtttttaat agcttgtaaa 600
tgtaatctca agtgcttaga acagttctta catataagtt gctctgtagt ttgctcttat 660tgtaatctca agtgcttaga acagttctta catataagtt gctctgtagt ttgctcttat 660
agttagccca aagactctgg gtgtgaggcc tgctgtaaac caatgttaaa ctgcttatta 720agttagccca aagactctgg gtgtgaggcc tgctgtaaac caatgttaaa ctgcttatta 720
gaaagcccta accacctgct ttgtaggcac cagaaactca aaaccaaatc tcaactcagc 780gaaagcccta accacctgct ttgtaggcac cagaaactca aaaccaaatc tcaactcagc 780
tacagaatct actgtggtcc ttgtctgaaa aaattagttc actcggttgg aatcttgtct 840tacagaatct actgtggtcc ttgtctgaaa aaattagttc actcggttgg aatcttgtct 840
cagagcatcc tcatctcttt ctcaaaagcc cctaccccaa caccggcgtg ttggttgtct 900cagagcatcc tcatctcttt ctcaaaagcc cctaccccaa caccggcgtg ttggttgtct 900
attgaaactt acaagtggat ggaccctttc tcccgaataa actggccttt gaaagctcta 960attgaaactt acaagtggat ggaccctttc tcccgaataa actggccttt gaaagctcta 960
atcgaaatgg tttggcaaaa tccatactgc aggagattag ggaggacaag aatgatgtgc 1020atcgaaatgg tttggcaaaa tccatactgc aggagattag ggaggacaag aatgatgtgc 1020
ctttttgtac tgctgagcct gatggtggtg ccactacttc aggtacttag atgagtcttg 1080ctttttgtac tgctgagcct gatggtggtg ccactacttc aggtacttag atgagtcttg 1080
atgctaatag aattgtgtcg ccaaacatat ctggacagtt acaacctaat ctatgcatta 1140atgctaatag aattgtgtcg ccaaacatat ctggacagtt acaacctaat ctatgcatta 1140
attggtttgg gaattgcttg aaattattgt ttaattcaat gttttaattc gttttcctaa 1200attggtttgg gaattgcttg aaattattgt ttaattcaat gttttaattc gttttcctaa 1200
aaatttaagt gcccccatca tcgtgcaata cctcagtgca gcaactcctt gattcttgga 1260aaatttaagt gcccccatca tcgtgcaata cctcagtgca gcaactcctt gattcttgga 1260
tgactgaact tcctaacttg gctctgcccc attgttccca tttttcatgt ttttcacaaa 1320tgactgaact tcctaacttg gctctgcccc attgttccca tttttcatgt ttttcacaaa 1320
tagttaacca ggtacctact actgtgcacc gctgcagagc attgaggatg tatgtgatga 1380tagttaacca ggtacctact actgtgcacc gctgcagagc attgaggatg tatgtgatga 1380
gtaaaaacac ccagcctgct ctgctgtgtt agtattatga cggaaactga tcaaatcaca 1440gtaaaaacac ccagcctgct ctgctgtgtt agtattatga cggaaactga tcaaatcaca 1440
tgtgaacaaa tttactgcta caaaagggag ggcttaataa aaggaatttc atctgggaag 1500tgtgaacaaa tttactgcta caaaagggag ggcttaataa aaggaatttc atctgggaag 1500
gc 1502gc 1502
<210> 101<210> 101
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 101<400> 101
attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48attttttctg tagtgctgta ttatttttcaa taaatctggg acaacagc 48
<210> 102<210> 102
<211> 193<211> 193
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 102<400> 102
ggaattgcac atgagatggc acacatattt atgctgtatc aagttcacga tcatcttacg 60ggaattgcac atgagatggc acacatattt atgctgtatc aagttcacga tcatcttacg 60
atatcaagct gaaaatgtca ccactacctg gacagttgca catgttttac tgggaatatt 120atatcaagct gaaaatgtca ccactacctg gacagttgca catgttttac tgggaatatt 120
tttttctgtt tttctgtatg ctctgtgcta gtagggtgga ttcagtaata aatatgtgaa 180tttttctgtt tttctgtatg ctctgtgcta gtagggtgga ttcagtaata aatatgtgaa 180
agcttttgtt tcc 193agcttttgtt tcc 193
<210> 103<210> 103
<211> 73<211> 73
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 103<400> 103
aggttttggc agtactgtct ccttgggcca tgctggtctg acttatgctt actaataaat 60aggttttggc agtactgtct ccttgggcca tgctggtctg acttatgctt actaataaat 60
tctgtttact ggc 73tctgtttact ggc 73
<210> 104<210> 104
<211> 93<211> 93
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 104<400> 104
actttgggat atttttcttc aattttgaag agaaaatggt gaagccatag aaaagttacc 60actttgggat atttttcttc aattttgaag agaaaatggt gaagccatag aaaagttacc 60
cgagggaaaa taaatacagt gatattctta cgc 93cgagggaaaa taaatacagt gatattctta cgc 93
<210> 105<210> 105
<211> 257<211> 257
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 105<400> 105
gctgtgtggg gtggatgaac cctgaagcgc accgcactgt ctgccccaat gtctaacaaa 60gctgtgtggg gtggatgaac cctgaagcgc accgcactgt ctgccccaat gtctaacaaa 60
ggccggaggc gactcttcct gcgaggtctc agagcgctgt gtaaccgccc aaggggttca 120ggccgggaggc gactcttcct gcgaggtctc agagcgctgt gtaaccgccc aaggggttca 120
ccttgcctgc tgcctagaca aagccgattc attaagacag gggaattgca atagagaaag 180ccttgcctgc tgcctagaca aagccgattc attaagacag gggaattgca atagagaaag 180
agtaattcac acagagctgg ctgtgcggga gaccggagtt ttatgtttta ttattactca 240agtaattcac acagagctgg ctgtgcggga gaccggagtt ttatgtttta ttattactca 240
aatcgatctc tttgagc 257aatcgatctc tttgagc 257
<210> 106<210> 106
<211> 692<211> 692
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 106<400> 106
tgattcaaac agcttcctga attttaattt tgtgttgtct cacagaaagc cttatcataa 60tgattcaaac agcttcctga attttaattt tgtgttgtct cacagaaagc cttatcataa 60
attccataat tctaattaat ttaccaagat aatgtaatta catttggttt tgtaaggtat 120attccataat tctaattaat ttaccaagat aatgtaatta catttggttt tgtaaggtat 120
acagcagtaa tctcctattt tggtgtcagt ttttcaataa agttttgatt atgggcaaat 180acagcagtaa tctcctattt tggtgtcagt ttttcaataa agttttgatt atgggcaaat 180
cccctctttt tcttttttta aaatatattt gagtatgcca tacatttata tatatggtgt 240240
atatgaattt ggtttaaaca ttttaaaatt tattctgatt agtttgtgtc tttttttttt 300300
tttttgagag agagagtcct gctctgtcac tcaagctgga gtgcagtggt gcgatctcgg 360tttttgagag agagagtcct gctctgtcac tcaagctgga gtgcagtggt gcgatctcgg 360
ctcactgcaa cctccgcctc ccaggtccaa gcaattctct tgccttgtcc tcccaagtag 420ctcactgcaa ccctccgcctc ccaggtccaa gcaattctct tgccttgtcc tcccaagtag 420
ctgggattat aggcacacac caccatgcct ggctaatttg tgtctcattt tcaagagtag 480ctgggattat aggcacacac caccatgcct ggctaatttg tgtctcattt tcaagagtag 480
aaaccctaaa tattttattt tcattccttt tccaaattgc tatgaatggg attaaaggat 540aaaccctaaa tattttattt tcattccttt tccaaattgc tatgaatggg attaaaggat 540
tacagatgta aagtctatta tttgtgaatt ctaaatgtag ttctgctgtt gtacctgtgg 600tacagatgta aagtctatta tttgtgaatt ctaaatgtag ttctgctgtt gtacctgtgg 600
aaacatctta aagaagtaca tattttgcac gtcctgcacg tgtaccccag aacttaaact 660aaacatctta aagaagtaca tattttgcac gtcctgcacg tgtaccccag aacttaaact 660
ataattaaaa agaatagttt caaaaaaata ca 692ataattaaaa agaatagttt caaaaaaata ca 692
<210> 107<210> 107
<211> 228<211> 228
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 107<400> 107
atagaacctg ttgtgcaacc acggtttaac cggagatttt gaggctaggg tgtgtttctt 60atagaacctg ttgtgcaacc acggtttaac cggagatttt gaggctaggg tgtgtttctt 60
tcgaactttt cggaatgtct ggaacatttc atttcctgtt ttgttacctg tgcctctgta 120tcgaactttt cggaatgtct ggaacatttc atttcctgtt ttgttacctg tgcctctgta 120
aatctacttt tgcaatttta agtaataatt ttatgaataa aaatgggaaa tgcttcctaa 180aatctacttt tgcaatttta agtaataatt ttatgaataa aaatgggaaa tgcttcctaa 180
ttccacatag tatttgcatt gttttataaa taaattccac ttactatc 228ttccacatag tatttgcatt gttttataaa taaattccac ttactatc 228
<210> 108<210> 108
<211> 529<211> 529
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 108<400> 108
acccaggtga ggcagggctg aaaactgccc ttgggctgac ttttgatagg ccatgccttg 60acccaggtga ggcagggctg aaaactgccc ttgggctgac ttttgatagg ccatgccttg 60
ccactttaca agttcttttt gcatttacta gtatttaaga gtaaccttga gattgggagg 120ccactttaca agttcttttt gcatttacta gtatttaaga gtaaccttga gattgggagg 120
aatagaggag gctggtacaa atagatggag acctgctggg atcagtgaat gcctgattag 180aatagaggag gctggtacaa atagatggag acctgctggg atcagtgaat gcctgattag 180
gacatggggc tatgcatagc ctaagagtta taggcttaaa gatgtcgagt aactaaaaac 240gacatggggc tatgcatagc ctaagagtta taggcttaaa gatgtcgagt aactaaaaac 240
tgtattgctg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggccaag 300tgtattgctg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggccaag 300
gcgggcagac catgaggtca ggagattgag accatcctgg ccaacatggt gaaaccctgt 360gcgggcagac catgaggtca ggagattgag accatcctgg ccaacatggt gaaaccctgt 360
ctctactaaa aatacaaaaa tgagctgggt gtggtggcac gtgcctgtag tcccagctac 420ctctactaaa aatacaaaaa tgagctgggt gtggtggcac gtgcctgtag tcccagctac 420
tcgagaggct aaggcaggaa aatcgcttga acccaggagg cagagattgc agtgagccaa 480tcgagaggct aaggcaggaa aatcgcttga acccaggagg cagagattgc agtgagccaa 480
gattgcacca gtgcactcca gctgggcgac agagcgagac tccatctcg 529gattgcacca gtgcactcca gctgggcgac agagcgagac tccatctcg 529
<210> 109<210> 109
<211> 174<211> 174
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 109<400> 109
gtggaaaaga acatgaaaaa gaaaactgac aaatacacac aggtctcctc aagatccatg 60gtggaaaaga acatgaaaaa gaaaactgac aaatacacac aggtctcctc aagatccatg 60
gacttctggt ctgagcctaa taaagactgt ttgtttattc ctcaaaaaca aacaaacaaa 120gacttctggt ctgagcctaa taaagactgt ttgtttattc ctcaaaaaca aacaaacaaa 120
aaaaaaccct ctgtattata aattattctg tgtaatggtg tgttaccata catt 174aaaaaaccct ctgtattata aattattctg tgtaatggtg tgttaccata catt 174
<210> 110<210> 110
<211> 156<211> 156
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 110<400> 110
atgctcctct actctttgag acatctctgg cctataacaa atgggttaat ttatgttaaa 60atgctcctct actctttgag acatctctgg cctataacaa atgggttaat ttatgttaaa 60
aaaaaaaaaa gagagagaga gtgaaacaac aatctacaca atcagagaaa atatttgcaa 120aaaaaaaaaa gagagagaga gtgaaacaac aatctacaca atcagagaaa atatttgcaa 120
atcttatatc tgattagaaa ttagtatctg gaacat 156atcttatatc tgattagaaa ttagtatctg gaacat 156
<210> 111<210> 111
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 111<400> 111
aattggagag gattatttca cattgaataa acttacagcc aaaaaa 46aattggagag gattatttca cattgaataa acttacagcc aaaaaa 46
<210> 112<210> 112
<211> 67<211> 67
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 112<400> 112
ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60
tgtactt 67tgtactt 67
<210> 113<210> 113
<211> 294<211> 294
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 113<400> 113
ggaattgaac atgagatggc acacatattt atgctgtcta aaggtcacaa tcatgttacc 60ggaattgaac atgagatggc acacatattt atgctgtcta aaggtcacaa tcatgttacc 60
atatcaagct gaaaatgtca ccactatctg gacagttgga catgtttttt tgggaatata 120atatcaagct gaaaatgtca ccactatctg gacagttgga catgtttttt tgggaatata 120
ctttttctct ctgaatctgt taggaacttt ctggttggct gggttccgta ataaatacat 180ctttttctct ctgaatctgt taggaacttt ctggttggct gggttccgta ataaatacat 180
gagacctttc atttcaaaaa aaagaaaaat aggcctcctt cccaggggct ccggatttca 240gagacctttc atttcaaaaa aaagaaaaat aggcctcctt cccaggggct ccggatttca 240
tcagccttct gtgcatgccc agccatacaa accacgcagg gatggctcca agtg 294tcagccttct gtgcatgccc agccatacaa accacgcagg gatggctcca agtg 294
<210> 114<210> 114
<211> 171<211> 171
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 114<400> 114
tcaccaaaaa gcaaccaact tagccagctt tatttgcaaa acaaggaaat aaaggcttac 60tcaccaaaaa gcaaccaact tagccagctt tatttgcaaa acaaggaaat aaaggcttac 60
ttctttaaaa aataaataaa taaataaata aataaataat aaataaataa ataaataaat 120ttctttaaaa aataaataaa taaataaata aataaataat aaataaataa ataaataaat 120
aaatagataa ataaataaaa agttttctac tcacactgaa gtgacgaagt c 171aaatagataa ataaataaaa agttttctac tcacactgaa gtgacgaagt c 171
<210> 115<210> 115
<211> 49<211> 49
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 115<400> 115
gcccccttcc cctgccctct ccctgaaata aagaatagct tgacagaaa 49gcccccttcc ccctgccctct ccctgaaata aagaatagct tgacagaaa 49
<210> 116<210> 116
<211> 88<211> 88
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 116<400> 116
ggaggcctca gttcctggcc ccagaaacga gatcctgacc acatgaacaa tttgggctct 60ggaggcctca gttcctggcc ccagaaacga gatcctgacc acatgaacaa tttgggctct 60
tttgggagaa taaaagactt atatattg 88tttgggagaa taaaagactt atatattg 88
<210> 117<210> 117
<211> 69<211> 69
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 117<400> 117
ttccaggacc actttgtgca gatggtgggg tctcaccaat aaaatatttc tactcacact 60ttccaggacc actttgtgca gatggtgggg tctcaccaat aaaatatttc tactcacact 60
ggttttccc 69ggttttccc 69
<210> 118<210> 118
<211> 118<211> 118
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 118<400> 118
actattaaaa attgttaaat tccagagagc aagtagagac cgcatatttc aataaatcaa 60actattaaaa attgttaaat tccagagagc aagtagagac cgcatatttc aataaatcaa 60
acatgtggtg acaaaccctt gtgtgactct taaattgtgg atgtttccaa gccccttg 118acatgtggtg acaaaccctt gtgtgactct taaattgtgg atgtttccaa gccccttg 118
<210> 119<210> 119
<211> 1008<211> 1008
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 119<400> 119
agcagttttc tatgaagatt ttttcataaa gacaataaac atattgatca agcagctttt 60agcagttttc tatgaagatt ttttcataaa gacaataaac atattgatca agcagctttt 60
tctgtgttaa gctgttatta atgagactat aggaaatagt gtgaaattac aaaagcaaag 120tctgtgttaa gctgttatta atgagactat aggaaatagt gtgaaattac aaaagcaaag 120
aagtagatag ttatttaatt aattaaatta attttacctt ttgtgttgca ccataaccta 180aagtagatag ttatttaatt aattaaatta attttacctt ttgtgttgca ccataaccta 180
ccactggtgg gattaagggc aagtattacc atgcctagct gagagtcttt ctccaggaaa 240ccactggtgg gattaagggc aagtattacc atgcctagct gagagtcttt ctccaggaaa 240
aaccagctta catgggttcc tgcaaatctc atgagtgttt cttgggtttc tagtcttcct 300aaccagctta catgggttcc tgcaaatctc atgagtgttt cttgggtttc tagtcttcct 300
gggaggtgtc cttatctttc agattttcag atctggtaat tagcatgatc atcaggacat 360gggaggtgtc cttatctttc agattttcag atctggtaat tagcatgatc atcaggacat 360
ttattacaaa caaattgatt agtgggaaga aagtatctca aggtcaatct tggaagtgaa 420ttattacaaa caaattgatt agtgggaaga aagtatctca aggtcaatct tggaagtgaa 420
caactggtgc taatccatgg ctttaaagat ttgagaacaa cggtgaaatt tggtttgagg 480caactggtgc taatccatgg ctttaaagat ttgagaacaa cggtgaaatt tggtttgagg 480
agaagggggt gtctaggacg tttcattttt atggtacatg ccagacatga atgtacatag 540agaaggggggt gtctaggacg tttcattttt atggtacatg ccagacatga atgtacatag 540
gaaaataact tgaaagggtc aaatattaaa ccttgaatat caggttcact tgggaaagca 600gaaaataact tgaaagggtc aaatattaaa ccttgaatat caggttcact tgggaaagca 600
ttaggtgctt atgcctctta gtaaatagcc cttcatccca gaaggagcaa gaattgtctt 660ttaggtgctt atgcctctta gtaaaatagcc cttcatccca gaaggagcaa gaattgtctt 660
cctgacttaa tccagtctta gctgaggtgc tgtgcatctt tatcatcttt gccttgcctc 720cctgacttaa tccagtctta gctgaggtgc tgtgcatctt tatcatcttt gccttgcctc 720
acagtgtcag gctctgtggt actggggcta cacaggtcag gtaaacagtt aactgcttac 780acagtgtcag gctctgtggt actggggcta cacaggtcag gtaaacagtt aactgcttac 780
ctacatcccc agcaaagata atgtgacgat actaagatga acctatcaga gcttaaagat 840ctacatcccc agcaaagata atgtgacgat actaagatga acctatcaga gcttaaagat 840
aatgagtttc agtcacagtg ataactgcat gctaacttca gcatgtagaa tatatgccga 900aatgagtttc agtcacagtg ataactgcat gctaacttca gcatgtagaa tatatgccga 900
agctaaaagc cattccacag ttgactccat ctgaagttaa agtgtgtaag tacacagtaa 960agtgtgtaag tacacagtaa 960
atcatgctat attaactgaa ctttttaata aatgagtcat ttgaattt 1008atcatgctat attaactgaa ctttttaata aatgagtcat ttgaattt 1008
<210> 120<210> 120
<211> 306<211> 306
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 120<400> 120
attgttaacc taattaaaca gcttcatagg ttcttttggt gtcctttttg tgtgttgtgt 6060 attgttaacc taattaaaca
gtgcacatgt ttgttgggtg ggtgttttgc tggtgtcttt tcctctgtgt cttcctctgg 120120
ccctttctgg aaagacctgc ttaatctgaa gcatgtgagc taggctagtc cactgggtcc 180ccctttctgg aaagacctgc ttaatctgaa gcatgtgagc taggctagtc cactgggtcc 180
tgctctctgc ccatccccag ctggctttgg attagaggca catacactgc catggctgcc 240tgctctctgc ccatccccag ctggctttgg attagaggca catacactgc catggctgcc 240
ttttactgtg gctgtggttt tgcccttttt ttttaagcaa atagaaaatg ctgctgacta 300ttttactgtg gctgtggttt tgcccttttt ttttaagcaa atagaaaatg ctgctgacta 300
tactgg 306tactgg 306
<210> 121<210> 121
<211> 63<211> 63
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 121<400> 121
ggtgtcaccc attgtatttt tgtaatctgg tcagttaata aacagtcaca gcttggcaaa 60ggtgtcaccc attgtatttt tgtaatctgg tcagttaata aacagtcaca gcttggcaaa 60
ttg 63ttg 63
<210> 122<210> 122
<211> 49<211> 49
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 122<400> 122
atgtacacta aattttctgt acctaaatat aattacaaaa ttatcttga 49atgtacacta aattttctgt acctaaatat aattacaaaa ttatcttga 49
<210> 123<210> 123
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 123<400> 123
acttgatcca aaaagctaat aaaattttct cagaaatgc 39acttgatcca aaaagctaat aaaattttct cagaaatgc 39
<210> 124<210> 124
<211> 47<211> 47
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 124<400> 124
gaagcaacaa gaaaatattc caataaaaga ctatctgata accagtg 47gaagcaacaa gaaaatattc caataaaaga ctatctgata accagtg 47
<210> 125<210> 125
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 125<400> 125
ttctgtgttg gagagctgca ataaattttc cataaagcaa aa 42ttctgtgttg gagagctgca ataaattttc cataaagcaa aa 42
<210> 126<210> 126
<211> 556<211> 556
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 126<400> 126
ttctccagtg tatttgtaaa atatattcat taaagtctct gctctgagag ctggtcttct 60ttctccagtg tatttgtaaa atatattcat taaagtctct gctctgagag ctggtcttct 60
tgacaccttt tccaatatca gctttgcaga aggaaactta aatttcagtt cagggcatga 120tgacaccttt tccaatatca gctttgcaga aggaaactta aatttcagtt cagggcatga 120
ccttcatgac cttgcagaac ttcttcactt tccaggttaa gtaaaggcga tctttagggg 180ccttcatgac cttgcagaac ttcttcactt tccaggttaa gtaaaggcga tctttaggggg 180
ctgtccagat ggatcagcta taaagattca attgtagaag gttcacgtct caatgcccac 240ctgtccagat ggatcagcta taaagattca attgtagaag gttcacgtct caatgcccac 240
gtggtagctg taacttcaat taaaaaacaa aaacagccgg gcgtggtggt gcacgccttt 300gtggtagctg taacttcaat taaaaaacaa aaacagccgg gcgtggtggt gcacgccttt 300
aatcccagca cttgggaggc agaggcaggc ggatttctga ggccagcctg atctacagag 360aatcccagca cttgggaggc agaggcaggc ggatttctga ggccagcctg atctacagag 360
tgagttccag gacagccagg aatacacaga gaaacccttg tctccaaaaa ccaaaaaaaa 420tgagttccag gacagccagg aatacacaga gaaacccttg tctccaaaaa ccaaaaaaaa 420
caaaacacgc attcttttca ggtctttgct gggaccaggt acacataaca cagataaata 480caaaacacgc attcttttca ggtctttgct gggaccaggt acacataaca cagataaata 480
ttagagcaaa ccatgcacat atggtaaatt atctttgggt tttgggtccc taaaataaag 540ttagagcaaa ccatgcacat atggtaaatt atctttggggt tttggggtccc taaaataaag 540
tggtgtgttc attgtg 556tggtgtgttc attgtg 556
<210> 127<210> 127
<211> 47<211> 47
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 127<400> 127
ccctggatct taactgttaa taaaaaaaac attggatgat gatggta 47ccctggatct taactgttaa taaaaaaaac attggatgat gatggta 47
<210> 128<210> 128
<211> 693<211> 693
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 128<400> 128
acacagagac ccactgaata aaaacttgag actgtccttg cttgtttgct tctatgtccc 60acacagagac ccactgaata aaaacttgag actgtccttg cttgtttgct tctatgtccc 60
tggagaggtc ccagttggtc ccgtccctaa caacatgcta gccctgctca cctgcctgtc 120tggagaggtc ccagttggtc ccgtccctaa caacatgcta gccctgctca cctgcctgtc 120
agccttgctc agtggcatct ttccataggt gtgtatcccc ttagattagc ttcagcccca 180agccttgctc agtggcatct ttccataggt gtgtatcccc ttagattagc ttcagcccca 180
ctacgatttg tctaggacat agcctgagcc ctgcctgtga cactgagggg tagcagtctg 240ctacgatttg tctaggacat agcctgagcc ctgcctgtga cactgagggg tagcagtctg 240
tttctggact ccagggtgct gctgtctcag gcctaagaat tccagacatg actataatcc 300tttctggact ccagggtgct gctgtctcag gcctaagaat tccagacatg actataatcc 300
aagcctgggg acctggttga gctttttatc ctgctggctc taagcttcag ctaggtggaa 360aagcctgggg acctggttga gctttttatc ctgctggctc taagcttcag ctaggtggaa 360
atgaggccag ccaagcccca cagtgagctt gcaagcttta gatggggaca gggttacgct 420atgaggccag ccaagcccca cagtgagctt gcaagcttta gatggggaca gggttacgct 420
ttggtgaatg atggaggaaa catgggggtt ccttttgttg ggtgcagcca gcacggcatc 480ttggtgaatg atggaggaaa catgggggtt ccttttgttg ggtgcagcca gcacggcatc 480
atcatggtgc ccaatcttga aagggcacag gcctgaagct tcctgggact gttctgtcac 540atcatggtgc ccaatcttga aagggcacag gcctgaagct tcctgggact gttctgtcac 540
agggaggaac ctactgcagt tgcctacaat tgctacctct gagggacttg cctctggccc 600agggaggaac ctactgcagt tgcctacaat tgctacctct gagggacttg cctctggccc 600
cttgtagaca tttccatgtc tacacatggc ccagagtact ttcagggata gcaatgtgtg 660cttgtagaca tttccatgtc tacacatggc ccagagtact ttcagggata gcaatgtgtg 660
aatggcactt agaagataac atgtgaaagc cat 693aatggcactt agaagataac atgtgaaagc cat 693
<210> 129<210> 129
<211> 98<211> 98
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 129<400> 129
agcttccctc gtgtctgtac atagcggcct ggctgtggcc tcatgtggat cagtctttaa 60agcttccctc gtgtctgtac atagcggcct ggctgtggcc tcatgtggat cagtctttaa 60
aataaaacaa gcctttgtct gttgccctct tgtttagc 98aataaaacaa gcctttgtct gttgccctct tgtttagc 98
<210> 130<210> 130
<211> 1077<211> 1077
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 130<400> 130
tgtacacaaa gaaataaaat accagcacca ggactgtgaa gtgttttcct tagactgtag 60tgtacacaaa gaaataaaat accagcacca ggactgtgaa gtgttttcct tagactgtag 60
tgtggggttt gctcattggc tttcttgttc agattttact aattgttcta aatgatacag 120tgtggggttt gctcattggc tttcttgttc agattttact aattgttcta aatgatacag 120
cttagtgtgc agaaaatatc ctcttgattg gaaaatagcc aaatatttac aaaacaggta 180cttagtgtgc agaaaatatc ctcttgattg gaaaatagcc aaatatttac aaaacaggta 180
tactagtttg aagaggctct atatgggggg agggggtgct ggaaaacatt agtgggtgac 240tactagtttg aagaggctct atatgggggg agggggtgct ggaaaacatt agtgggtgac 240
cagtaatggt ggtacagctc taactcctag caccaggagt ccgaggcagg gggatcttca 300cagtaatggt ggtacagctc taactcctag caccaggagt ccgaggcagg gggatcttca 300
ggctgcatga tgtgcatagt agcatgctgg tattagggag tgggtatctg tggttcccac 360ggctgcatga tgtgcatagt agcatgctgg tattagggag tgggtatctg tggttcccac 360
tttgaaaata accaaaattc tccaaagtgg gcagacctaa gccaggagag ggctggccac 420tttgaaaata accaaaattc tccaaagtgg gcagacctaa gccaggagag ggctggccac 420
agacatttgg tactgcttgc tgagaaagca ctgattgttt tcctaaccta aagattatat 480agacatttgg tactgcttgc tgagaaagca ctgattgttt tcctaaccta aagattatat 480
atggcccacc ataccatctt tgaaacaatg tgtactggcc tttggttcac ctttcttgtc 540atggcccacc ataccatctt tgaaacaatg tgtactggcc tttggttcac ctttcttgtc 540
tttgaagttg tacttggtgg gtgcatttaa ccttgccaca gagtggggag gatagagtct 600tttgaagttg tacttggtgg gtgcatttaa ccttgccaca gagtggggag gatagagtct 600
aatggacctt aagtggtctc tggtggccat gtcggcagtg cttaggttgt agcccagggt 660aatggacctt aagtggtctc tggtggccat gtcggcagtg cttaggttgt agcccagggt 660
tggagtcggc agtgacaagc aaataactat attcttgctt gctgtggcag ctatacagaa 720tggagtcggc agtgacaagc aaataactat attcttgctt gctgtggcag ctatacagaa 720
atttacggta taggtaagag ggttctctag aagtactacc tgtcttagtg aaagagattg 780atttacggta taggtaagag ggttctctag aagtactacc tgtcttagtg aaagagattg 780
cttggttaac atcctgttat gtagtggggc tacttttaaa ctgtgtgaag tccccattag 840cttggttaac atcctgttat gtagtggggc tacttttaaa ctgtgtgaag tccccattag 840
ccacctccat aggcaatgga gctaacattc ttgctacagt ggccgcagct cattaacacc 900ccacctccat aggcaatgga gctaacattc ttgctacagt ggccgcagct cattaacacc 900
taatgatgtg tttaacatgt gtccacatgg tgtgaatgtg ggtacgcatg tgcccagtat 960taatgatgtg tttaacatgt gtccacatgg tgtgaatgtg ggtacgcatg tgcccagtat 960
tcagttcaca gaattgtcat catcttccat catgtcttca gtgagggact ctgcagatgc 1020tcagttcaca gaattgtcat catcttccat catgtcttca gtgagggact ctgcagatgc 1020
ccaccccagt ccttggttgt ggtgattctg ttagcattaa atgcactgga gagcttc 1077ccaccccagt ccttggttgt ggtgattctg ttagcattaa atgcactgga gagcttc 1077
<210> 131<210> 131
<211> 1658<211> 1658
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 131<400> 131
gacacattgg tctgcaatgt tttgtattaa ttcataaata aaatttagga acaaaaccgg 60gacacattgg tctgcaatgt tttgtattaa ttcataaata aaatttagga acaaaaccgg 60
tggtttatcc ttgcatctct gcagtgtgga ttggacagga agttggaaat gacagggact 120tggtttatcc ttgcatctct gcagtgtgga ttggacagga agttggaaat gacagggact 120
ttaactgggc tgctgctcct ttgtatatag acactttttt cctgctcaga aacttgagtt 180180
ctccagtagc aatggccaaa cagaagaacc aggctagggg gctgcatctg acagagcaag 240ctccagtagc aatggccaaa cagaagaacc aggctaggggg gctgcatctg acagagcaag 240
tagacgagag gctgggtggt gggctccggc cagcccgagt cttagagctg gtggttggtt 300tagacgagag gctgggtggt gggctccggc cagcccgagt cttagagctg gtggttggtt 300
atatctggtg cctgtctcga ggagggcttg agacacagtg tggtgctcct cagaagcaga 360atatctggtg cctgtctcga ggagggcttg agacacagtg tggtgctcct cagaagcaga 360
caggtgattt ctttgtgtga tttttctttt cccctgggac aatgacagtc agtaagacag 420caggtgattt ctttgtgtga ttttcttttt cccctgggac aatgacagtc agtaagacag 420
gtttcaggga cttttgtgtc caggtctgag cactagtcgc tcacagttgt gtgtactaac 480gtttcaggga cttttgtgtc caggtctgag cactagtcgc tcacagttgt gtgtactaac 480
cttcttcctt cctattgaaa tggcaggggt ctttgagtct cactgctgca tgttctgcct 540cttcttcctt cctattgaaa tggcaggggt ctttgagtct cactgctgca tgttctgcct 540
tcatagggat ctgtaagtat gctgggcatc tgggctttta gggggctctc tatagggtgt 600tcatagggat ctgtaagtat gctgggcatc tgggctttta gggggctctc tatagggtgt 600
ctgagataga ggtcaacaag ggcttataga caactcaaac aaagcccatg gcttgagcaa 660ctgagataga ggtcaacaag ggcttataga caactcaaac aaagcccatg gcttgagcaa 660
gtctgcaaca agctgtttgt ctagcctcca gcagagggcg agggagacag cttccagatg 720gtctgcaaca agctgtttgt ctagcctcca gcagagggcg agggagacag cttccagatg 720
ttcccagtag gtggagcccc tccaagccca gggctcagga ggcttacagg gtgggaactc 780ttcccagtag gtggagcccc tccaagccca gggctcagga ggcttacagg gtgggaactc 780
caatactggt ggagggagga gggcgtttga tgggaagata gggaagttgc tgcttcctaa 840caatactggt ggagggagga gggcgtttga tgggaagata gggaagttgc tgcttcctaa 840
actgtcacaa ctgggcttgg ataggagtca tagtctggga ccacagccct gtggtagaat 900actgtcacaa ctgggcttgg ataggagtca tagtctggga ccacagccct gtggtagaat 900
gctagcctgg tgtgctccag gtttaatctc catcactgca gaaatgagtc caagctgtgt 960gctagcctgg tgtgctccag gtttaatctc catcactgca gaaatgagtc caagctgtgt 960
gtacctccag ggcactgggc atggggttcc cttgccattg tgtgtgcccg gagaactggc 1020gtacctccag ggcactggggc atggggttcc cttgccattg tgtgtgcccg gagaactggc 1020
aggcgggaaa tgtctttatc aagggttacc ttggaagagg tcccaacact gtagggtgct 1080aggcgggaaa tgtctttatc aagggttacc ttggaagagg tcccaacact gtagggtgct 1080
cctgttgtca aaacctatgc agaggcatct gcttgctctc taataacagt atgcaatgct 1140cctgttgtca aaacctatgc agaggcatct gcttgctctc taataacagt atgcaatgct 1140
aaagggctcg cttacagccg gtggccacac tggaggcctg cacatcaggt ggccacaagt 1200aaagggctcg cttacagccg gtggccacac tggaggcctg cacatcaggt ggccacaagt 1200
tctgctgctg cgcctccgag gaaacacttg gtcctccgat cgattttaac ctgttgaggc 1260tctgctgctg cgcctccgag gaaacacttg gtcctccgat cgattttaac ctgttgaggc 1260
tttgcaatcc ccctgtggca aaggctccag tgttttctat ttctatgcaa atttcttgaa 1320tttgcaatcc ccctgtggca aaggctccag tgttttctat ttctatgcaa atttcttgaa 1320
gcagaactgt tactgtcttt ctcctctgcc ctgggaggag gcgctagcgt ttccttccaa 1380gcagaactgt tactgtcttt ctcctctgcc ctgggaggag gcgctagcgt ttccttccaa 1380
cttcaggtgc agcccccctc gtggttagcg gtcttaagtt cgtgacttgg gtttgcagat 1440cttcaggtgc agcccccctc gtggttagcg gtcttaagtt cgtgacttgg gtttgcagat 1440
cttttttgtt acatcgccgg accatgtggt ggtctttagc tgtaaacaac attaaccctg 1500cttttttgtt acatcgccgg accatgtggt ggtctttagc tgtaaacaac attaaccctg 1500
ggttgattag catatgcttc taaaagatgg tcccagattc tgcgacttgt aataaaatgg 1560ggttgattag catatgcttc taaaagatgg tcccagattc tgcgacttgt aataaaatgg 1560
aaacttgctg gtttttatgc ctttctaact cttgtatttg aatgaatgtt gatcactttt 16201620
tgtattaaag tggctgacac atggctactg tcactgtg 1658tgtattaaag tggctgacac atggctactg tcactgtg 1658
<210> 132<210> 132
<211> 1795<211> 1795
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 132<400> 132
aatatctcac caaaaaatat ttgaagaaga acaacctccg agactggctg cgtgttgtcg 60aatatctcac caaaaaatat ttgaagaaga acaacctccg agactggctg cgtgttgtcg 60
ccaacagcaa agagagttac gagctgcgtt acttccagat taaccaggat gaagaggagg 120ccaacagcaa agagagttac gagctgcgtt acttccagat taaccaggat gaagagggagg 120
aggaagacga ggattaggac acattggtct gcaatgtttt gtattaattc ataaataaaa 180aggaagacga ggattaggac acattggtct gcaatgtttt gtattaattc ataaataaaa 180
tttaggaaca aaaccggtgg tttatccttg catctctgca gtgtggattg gacaggaagt 240tttaggaaca aaaccggtgg tttatccttg catctctgca gtgtggattg gacaggaagt 240
tggaaatgac agggacttta actgggctgc tgctcctttg tatatagaca cttttttcct 300tggaaatgac agggacttta actgggctgc tgctcctttg tatatagaca cttttttcct 300
gctcagaaac ttgagttctc cagtagcaat ggccaaacag aagaaccagg ctagggggct 360gctcagaaac ttgagttctc cagtagcaat ggccaaacag aagaaccagg ctagggggct 360
gcatctgaca gagcaagtag acgagaggct gggtggtggg ctccggccag cccgagtctt 420gcatctgaca gagcaagtag acgagaggct gggtggtggg ctccggccag cccgagtctt 420
agagctggtg gttggttata tctggtgcct gtctcgagga gggcttgaga cacagtgtgg 480agagctggtg gttggttata tctggtgcct gtctcgagga gggcttgaga cacagtgtgg 480
tgctcctcag aagcagacag gtgatttctt tgtgtgattt ttcttttccc ctgggacaat 540tgctcctcag aagcagacag gtgatttctt tgtgtgattt ttcttttccc ctgggacaat 540
gacagtcagt aagacaggtt tcagggactt ttgtgtccag gtctgagcac tagtcgctca 600gacagtcagt aagacaggtt tcagggactt ttgtgtccag gtctgagcac tagtcgctca 600
cagttgtgtg tactaacctt cttccttcct attgaaatgg caggggtctt tgagtctcac 660cagttgtgtg tactaacctt cttccttcct attgaaatgg caggggtctt tgagtctcac 660
tgctgcatgt tctgccttca tagggatctg taagtatgct gggcatctgg gcttttaggg 720tgctgcatgt tctgccttca tagggatctg taagtatgct gggcatctgg gcttttaggg 720
ggctctctat agggtgtctg agatagaggt caacaagggc ttatagacaa ctcaaacaaa 780ggctctctat agggtgtctg agatagaggt caacaagggc ttatagacaa ctcaaacaaa 780
gcccatggct tgagcaagtc tgcaacaagc tgtttgtcta gcctccagca gagggcgagg 840gcccatggct tgagcaagtc tgcaacaagc tgtttgtcta gcctccagca gagggcgagg 840
gagacagctt ccagatgttc ccagtaggtg gagcccctcc aagcccaggg ctcaggaggc 900gagacagctt ccagatgttc ccagtaggtg gagcccctcc aagcccaggg ctcaggaggc 900
ttacagggtg ggaactccaa tactggtgga gggaggaggg cgtttgatgg gaagataggg 960ttacagggtg ggaactccaa tactggtgga gggaggaggg cgtttgatgg gaagataggg 960
aagttgctgc ttcctaaact gtcacaactg ggcttggata ggagtcatag tctgggacca 1020aagttgctgc ttcctaaact gtcacaactg ggcttggata ggagtcatag tctgggacca 1020
cagccctgtg gtagaatgct agcctggtgt gctccaggtt taatctccat cactgcagaa 1080cagccctgtg gtagaatgct agcctggtgt gctccaggtt taatctccat cactgcagaa 1080
atgagtccaa gctgtgtgta cctccagggc actgggcatg gggttccctt gccattgtgt 1140atgagtccaa gctgtgtgta cctccagggc actgggcatg gggttccctt gccattgtgt 1140
gtgcccggag aactggcagg cgggaaatgt ctttatcaag ggttaccttg gaagaggtcc 1200gtgcccggag aactggcagg cgggaaatgt ctttatcaag ggttaccttg gaagaggtcc 1200
caacactgta gggtgctcct gttgtcaaaa cctatgcaga ggcatctgct tgctctctaa 1260caacactgta gggtgctcct gttgtcaaaa cctatgcaga ggcatctgct tgctctctaa 1260
taacagtatg caatgctaaa gggctcgctt acagccggtg gccacactgg aggcctgcac 1320taacagtatg caatgctaaa gggctcgctt acagccggtg gccacactgg aggcctgcac 1320
atcaggtggc cacaagttct gctgctgcgc ctccgaggaa acacttggtc ctccgatcga 1380atcaggtggc cacaagttct gctgctgcgc ctccgaggaa acacttggtc ctccgatcga 1380
ttttaacctg ttgaggcttt gcaatccccc tgtggcaaag gctccagtgt tttctatttc 1440ttttaacctg ttgaggcttt gcaatccccc tgtggcaaag gctccagtgt tttctatttc 1440
tatgcaaatt tcttgaagca gaactgttac tgtctttctc ctctgccctg ggaggaggcg 1500tatgcaaatt tcttgaagca gaactgttac tgtctttctc ctctgccctg ggaggaggcg 1500
ctagcgtttc cttccaactt caggtgcagc ccccctcgtg gttagcggtc ttaagttcgt 15601560
gacttgggtt tgcagatctt ttttgttaca tcgccggacc atgtggtggt ctttagctgt 16201620
aaacaacatt aaccctgggt tgattagcat atgcttctaa aagatggtcc cagattctgc 1680aaacaacatt aaccctgggt tgattagcat atgcttctaa aagatggtcc cagattctgc 1680
gacttgtaat aaaatggaaa cttgctggtt tttatgcctt tctaactctt gtatttgaat 1740gacttgtaat aaaatggaaa cttgctggtt tttatgcctt tctaactctt gtatttgaat 1740
gaatgttgat cactttttgt attaaagtgg ctgacacatg gctactgtca ctgtg 1795gaatgttgat cactttttgt attaaagtgg ctgacacatg gctactgtca ctgtg 1795
<210> 133<210> 133
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 133<400> 133
actgagtcca gatggctaat tctaaatata tacttttttc accataaa 48actgagtcca gatggctaat tctaaatata tacttttttc accataaa 48
<210> 134<210> 134
<211> 140<211> 140
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 134<400> 134
attcagcata aaataaaggc agataaagtt aaaggtcttc tggtggtctt taatgagccc 60attcagcata aaataaaggc agataaagtt aaaggtcttc tggtggtctt taatgagccc 60
tgttgggagt gaggtgcttt aacatggaga agcatgttat taaacagtga aatagatggt 120tgttgggagt gaggtgcttt aacatggaga agcatgttat taaacagtga aatagatggt 120
tcaaaaccac gtgaccatgt 140tcaaaaccac gtgaccatgt 140
<210> 135<210> 135
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 135<400> 135
tgtggtagag cagagttgga aataaagctc tatctttaac tctagg 46tgtggtagag cagagttgga aataaagctc tatctttaac tctagg 46
<210> 136<210> 136
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 136<400> 136
agacatctcg tgcacggctt tcattaaaga ctgcttaagt 40agacatctcg tgcacggctt tcattaaaga ctgcttaagt 40
<210> 137<210> 137
<211> 109<211> 109
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 137<400> 137
gtatattttt gttttggtca ttaaaaatta aaaaaaaaaa aatacaagtg tctgcctatt 60gtatattttt gttttggtca ttaaaaatta aaaaaaaaaa aatacaagtg tctgcctatt 60
gcatttgtgt gggaagagac tggggaaata aaacaggtgt gctgttgtg 109gcatttgtgt gggaagagac tggggaaata aaacaggtgt gctgttgtg 109
<210> 138<210> 138
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 138<400> 138
acaagaaagt tttcctttaa taaaactttg ccagagctcc ttttg 45acaagaaagt tttcctttaa taaaactttg ccagagctcc ttttg 45
<210> 139<210> 139
<211> 640<211> 640
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 139<400> 139
aagccacacc ggaggttaat taaatgctaa cattttccat gtggtctttg catccttcct 60aagccacacc ggaggttaat taaatgctaa cattttccat gtggtctttg catccttcct 60
tgtctgcatg ttggaaatct gcctaacatt ctaggaagag gtgaggtgtg ggcccttgag 120tgtctgcatg ttggaaatct gcctaacatt ctaggaagag gtgaggtgtg ggcccttgag 120
agtcagtctg tgggaataag tgtagcccaa ctatgcacag ttgtaaattc ctacatcccc 180agtcagtctg tgggaataag tgtagcccaa ctatgcacag ttgtaaattc ctacatcccc 180
gtgtgtattg gtcttgatat tcaaagaatt gatgaatgcc attactttca gtccaaagtg 240gtgtgtattg gtcttgatat tcaaagaatt gatgaatgcc attactttca gtccaaagtg 240
aagaaacctg gtctcaaaaa atcccgagga ccagaaatga gatgggtttt cctgaaaatc 300aagaaacctg gtctcaaaaa atcccgagga ccagaaatga gatgggtttt cctgaaaatc 300
taaagttctt gaaaaacctt gccatccaga ttgctagcaa ctgcctagct ttgtaagctt 360taaagttctt gaaaaacctt gccatccaga ttgctagcaa ctgcctagct ttgtaagctt 360
actgtgatgg acaggtagct caggacgact ggtcacttaa tactggacag attagcatgg 420actgtgatgg acaggtagct caggacgact ggtcacttaa tactggacag attagcatgg 420
aaaacttaag gggaggagga ggtagtaggt tccatccagc ttcgctttgt tggtggcatc 480aaaacttaag gggaggagga ggtagtaggt tccatccagc ttcgctttgt tggtggcatc 480
taggtgttgt tccaagggag catgcctacc tgcaacagga catcactggt tgggaatact 540taggtgttgt tccaagggag catgcctacc tgcaacagga catcactggt tgggaatact 540
gtagaaccag agctgtgacc tttgaactac tagaaagatg aaattttatg taaagagtac 600gtagaaccag agctgtgacc tttgaactac tagaaagatg aaattttatg taaaagagtac 600
cttggagtaa ataaataaag cccaagatcc tgattgtcta 640cttggagtaa ataaataaag cccaagatcc tgattgtcta 640
<210> 140<210> 140
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 140<400> 140
gccccacacg cccgaagcaa taaagagtcc actgacttcc 40gccccacacg cccgaagcaa taaaagtcc actgacttcc 40
<210> 141<210> 141
<211> 124<211> 124
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 141<400> 141
aaaaggctcc tgccagtgtg aagacagacg gactgctgtg acacacctcc ccacacacta 60aaaaggctcc tgccagtgtg aagacagacg gactgctgtg acacacctcc ccacacacta 60
tttgcagatg accagtgtcc tatgctgttc ttacaaataa actcaggcaa gatctgttag 120tttgcagatg accagtgtcc tatgctgttc ttacaaataa actcaggcaa gatctgttag 120
cttg 124cttg 124
<210> 142<210> 142
<211> 575<211> 575
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 142<400> 142
cctgctcgtg tcaaataaag ttgcagaact gccttcaggg tttggttttc ctttctgttg 60cctgctcgtg tcaaataaag ttgcagaact gccttcaggg tttggttttc ctttctgttg 60
tctgcctcat gggtggaatt tttgggtcta cagggtgttg gaaattaatc tgagaatctc 120tctgcctcat gggtggaatt tttgggtcta cagggtgttg gaaattaatc tgagaatctc 120
tgttctgggt acatgggaaa ttagaaatac gtgaaacatt cttttcacag aagtcacttt 180tgttctgggt acatgggaaa ttagaaatac gtgaaacatt cttttcacag aagtcacttt 180
attaggattg tggatttggg ttggttttga aacagggttt cttgtggcac tgcttgttct 240attaggattg tggatttgggg ttggttttga aacagggttt cttgtggcac tgcttgttct 240
atagaatagg gtggccttga actcagaaat ccacctgcct tttcctccct agtattggca 300atagaatagg gtggccttga actcagaaat ccacctgcct ttttcctccct agtattggca 300
attaaatgcc cagcttgttt gtaagctctc attttcagtt ccaggtttat gtgtgagcct 360attaaatgcc cagcttgttt gtaagctctc attttcagtt ccaggtttat gtgtgagcct 360
aagattaggt aaagattgag gttataactt aaacgtactg aattaactta tgttgtgtgg 420aagattaggt aaagattgag gttataactt aaacgtactg aattaactta tgttgtgtgg 420
gtcccaggaa ttggacctgg gacatcaact ctgcctttcc agccatcttt gccaaccagt 480gtccggaa ttggacctgg gacatcaact ctgcctttcc agccatcttt gccaaccagt 480
agctcatctc tgggatgtgt ctgccctcaa aatgacattt taaaaaagtc agtacaaaag 540agctcatctc tgggatgtgt ctgccctcaa aatgacattt taaaaaagtc agtacaaaag 540
aacgattttt attaaaaacc ttgaggacaa acatt 575aacgattttt attaaaaacc ttgaggacaa acatt 575
<210> 143<210> 143
<211> 54<211> 54
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 143<400> 143
atggcttgtg tgcatgtttt atgtttaaat aaaatcacaa aacctgccgt cgta 54atggcttgtg tgcatgtttt atgtttaaat aaaatcacaa aacctgccgt cgta 54
<210> 144<210> 144
<211> 68<211> 68
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 144<400> 144
actaatggag agtaaataaa taaaagtaga tttgtgctct tgtatttttt tttcacatct 60actaatggag agtaaataaa taaaagtaga tttgtgctct tgtatttttt tttcacatct 60
gtcctaaa 68gtcctaaa 68
<210> 145<210> 145
<211> 504<211> 504
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 145<400> 145
ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aattctgtgg tgatctaagg 60ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aattctgtgg tgatctaagg 60
tactttaaca tcggttcaga gttcggttat atgattgctc tgggatccta cgcttcttcc 120tactttaaca tcggttcaga gttcggttat atgattgctc tgggatccta cgcttcttcc 120
ttcatagttc ctgtgggtcc gaagctggga ggggctgggt ggactctcgg gaaagatact 180ttcatagttc ctgtgggtcc gaagctggga ggggctgggt ggactctcgg gaaagatact 180
ctgagcctgt ctcggtcccc atcgtgtttg cttggccctg ggcatggaag tgggtgagtg 240ctgagcctgt ctcggtcccc atcgtgtttg cttggccctg ggcatggaag tgggtgagtg 240
atgagctgaa cgagcaggct tgctagagat gaggacagtt actggtgtgg ttatatcact 300atgagctgaa cgagcaggct tgctagagat gaggacagtt actggtgtgg ttatatcact 300
accatgccta cagtgtctta agacgcttac agtctgtaag ggacttaaat gatttgagct 360accatgccta cagtgtctta agacgcttac agtctgtaag ggacttaaat gatttgagct 360
cttacttatc ctgtagtttc tgatttttaa catttacttg aataaagcca agcaagataa 420cttacttatc ctgtagtttc tgatttttaa catttacttg aataaagcca agcaagataa 420
gcctttattc ccagcacttg gtgacaggtg gatctatgag ttggggatca gagctacaca 480gcctttattc ccagcacttg gtgacaggtg gatctatgag ttggggatca gagctacaca 480
ttaaaactct taattcatct tact 504ttaaaactct taattcatct tact 504
<210> 146<210> 146
<211> 306<211> 306
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 146<400> 146
ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aaaaaaaaaa attaatcctc 60ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aaaaaaaaaa attaatcctc 60
tgtgatggcc agcagttaac attcaacagt ttctctctag gctcttgatt ctctgactat 120tgtgatggcc agcagttaac attcaacagt ttctctctag gctcttgatt ctctgactat 120
tgtagggatt cgatcagcac tcgcatacca gaagtgtgag atggtccgtc ctttttcaag 180tgtagggatt cgatcagcac tcgcatacca gaagtgtgag atggtccgtc ctttttcaag 180
acaagatttc tctgtgtagc cctggctgtc ctggaaccca ctctgtagac caggctggcc 240acaagatttc tctgtgtagc cctggctgtc ctggaaccca ctctgtagac caggctggcc 240
ttgaatttac agagatcccc ttgcctccgc ttgctgagtg ctaggattaa aggcatgcgc 300ttgaatttac aggatcccc ttgcctccgc ttgctgagtg ctaggattaa aggcatgcgc 300
actatg 306actatg 306
<210> 147<210> 147
<211> 246<211> 246
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 147<400> 147
aagccctgct gtctgagact tgcctagcct gcaataaacg ggttatttac gtaacttttt 60aagccctgct gtctgagact tgcctagcct gcaataaacg ggttatttac gtaacttttt 60
tttttttgcc ttgtttgtgg ttaattaaaa catttggtgt gtgttctatt ttttattttc 120tttttttgcc ttgtttgtgg ttaattaaaa catttggtgt gtgttctatt ttttattttc 120
gaaagatgct tgttttgaga catactgtgt gaccctggct ggccttgagt gcctggttct 180gaaagatgct tgttttgaga catactgtgt gaccctggct ggccttgagt gcctggttct 180
ccttacaagt gtagatacat ctggcttaag attttagtct ttcagaaata aaaatgttgc 240ccttacaagt gtagatacat ctggcttaag attttagtct ttcagaaata aaaatgttgc 240
taagac 246tagac 246
<210> 148<210> 148
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 148<400> 148
accagccctc tgcgtgtgac tattaaaaac cctgaaaagt g 41accagccctc tgcgtgtgac tattaaaaac cctgaaaagt g 41
<210> 149<210> 149
<211> 181<211> 181
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 149<400> 149
ggattcacac aatggcaaga ctgaggattt atactgaatt gtcatcaatc agtcctacca 60ggattcacac aatggcaaga ctgaggattt atactgaatt gtcatcaatc agtcctacca 60
gatggatttc aacatttaaa cctggagact cttcgtgtct tgaattagga tgtttgtcca 120gatggatttc aacatttaaa cctggagact cttcgtgtct tgaattagga tgtttgtcca 120
gtaataaaat atagaacctt tcaaaatgct tttctggttt ataaagtact gaattgccct 180gtaataaaat atagaacctt tcaaaatgct tttctggttt ataaagtact gaattgccct 180
t 181t 181
<210> 150<210> 150
<211> 285<211> 285
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 150<400> 150
tcccgccaaa gcaaccaagt cagcctgctt aatttgagaa agatggaaat aaaggcttac 60tcccgccaaa gcaaccaagt cagcctgctt aatttgagaa agatggaaat aaaggcttac 60
ttctcttaaa actccggtct ggatttattt agtttgttca cttaagcagg atgaaaaagc 120ttctcttaaa actccggtct ggatttattt agtttgttca cttaagcagg atgaaaaagc 120
aaaaccgcta ctgtttactt tgtgttggca tctttgtttc taaaattaaa gctcctagtg 180180
tttttgtggg ctttgtttgt tttttgagac agtctcttga cttggtgcca tagctagtct 240tttttgtggg ctttgtttgt tttttgagac agtctcttga cttggtgcca tagctagtct 240
gggacaaaga ttttccaggt gtgaattaaa ggtgtatgtc atcaa 285gggacaaaga ttttccaggt gtgaattaaa ggtgtatgtc atcaa 285
<210> 151<210> 151
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 151<400> 151
actgcttttg ttaagttggc taataaagag ctgaacctgt 40actgcttttg ttaagttggc taataaagag ctgaacctgt 40
<210> 152<210> 152
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 152<400> 152
attcctgctc ccctgcaaat aaagtctttt tatgtatctt ga 42attcctgctc ccctgcaaat aaagtctttt tatgtatctt ga 42
<210> 153<210> 153
<211> 1059<211> 1059
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 153<400> 153
cagggtcttg gcagctgcat ctggaggcat ttaataaaat aaagacattt aataaaatct 60cagggtcttg gcagctgcat ctggaggcat ttaataaaat aaagacattt aataaaatct 60
tgaacaaaga caaggcctga ctggattgtg tccagtattc aactgagtta tgttgtctat 120tgaacaaaga caaggcctga ctggattgtg tccagtattc aactgagtta tgttgtctat 120
ggagccatgc ttattctgtt ggtttaagct ggagggcatg agcagagctg accagagaag 180ggagccatgc ttattctgtt ggtttaagct ggagggcatg agcagagctg accagagaag 180
tcatgaagtt ggtgaccctg tgttgaacaa ttgagggtta gaagagcagt ttggttttgg 240240
tgctcttgat ggaacccagg tgcttggaca tagtaagcac acataagaca gagtaagact 300tgctcttgat ggaacccagg tgcttggaca tagtaagcac acataagaca gagtaagact 300
gctgtgtctc tggcctggag tagtctttct tgcttttttt tttttttttt tttttctcta 360360
gaatgaaagc agatggccca gcgagttagg tgcttcctat gaaagcatgt gtgctggttt 420gaatgaaagc agatggccca gcgagttagg tgcttcctat gaaagcatgt gtgctggttt 420
gtcatgcaca cagccctgca ggagagagta tggcaacaca gccgctcagc atcccaagat 480gtcatgcaca cagccctgca ggagagagta tggcaacaca gccgctcagc atcccaagat 480
aaaaagggag tttctactgc cattttgagc ttgggagttt gaaatgtaaa gcctgtccat 540aaaaagggag tttctactgc cattttgagc ttgggagttt gaaatgtaaa gcctgtccat 540
atgttttaag gatccatgta tttctgtttt gtttgttttt caaaacaggg tttctctgta 600atgttttaag gatccatgta tttctgtttt gtttgttttt caaaacaggg tttctctgta 600
gccctggctg tcctggaacc cactctgtat gtagaccagg ctggccttga actcagaaat 660gccctggctg tcctggaacc cactctgtat gtagaccagg ctggccttga actcagaaat 660
ccacctgcct ctggcgatcc atatatttct aagtcctgta cttagacgct gttttggaaa 720ccacctgcct ctggcgatcc atatatttct aagtcctgta cttagacgct gttttggaaa 720
attcattttg gaagcattta ctgttggtgt gttttgtggg gaatgaatga tagcttggga 780attcattttg gaagcattta ctgttggtgt gttttgtggg gaatgaatga tagcttggga 780
attcttttct gtttggtgag agtgaagctg tcagcccggt tgtagcctgg ctggtgctca 840attcttttct gtttggtgag agtgaagctg tcagcccggt tgtagcctgg ctggtgctca 840
aaggctttct ctcattgtct tcacctacgt agctttacgt ggggtaagga cttaagttac 900aaggctttct ctcattgtct tcacctacgt agctttacgt ggggtaagga cttaagttac 900
ttaagttggg tgcacactga ccatgtccac aacctgttaa ccaactctac atgatgagta 960ttaagttggg tgcacactga ccatgtccac aacctgttaa ccaactctac atgatgagta 960
cagatgtacc tttttagaaa gtgttaatgt gtagccctgg ctggcctctg cctcagggta 1020cagatgtacc tttttagaaa gtgttaatgt gtagccctgg ctggcctctg cctcagggta 1020
ttatgaataa agtgtgcaac cttcatctgg ttgattaaa 1059ttatgaataa agtgtgcaac cttcatctgg ttgattaaa 1059
<210> 154<210> 154
<211> 49<211> 49
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 154<400> 154
aatccagatt tttaatagtg acaaataaaa agtcctattt gtgatcgtt 49aatccagatt tttaatagtg acaaataaaa agtcctattt gtgatcgtt 49
<210> 155<210> 155
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 155<400> 155
aatggtctct aggagacatg ctggaaaagt gtttgtacaa gcctttctag gcaacataca 60aatggtctct aggagacatg ctggaaaagt gtttgtacaa gcctttctag gcaacataca 60
tgctagatta aacagcatgg tgaaact 87tgctagatta aacagcatgg tgaaact 87
<210> 156<210> 156
<211> 100<211> 100
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 156<400> 156
agtggactct gagggacatt gcggggaagg ggcgtttacg tttgtttata cttaaaagtt 60agtggactct gagggacatt gcgggggaagg ggcgtttacg tttgtttata cttaaaagtt 60
ttttaagcag catgttgaat taaaaaagaa agcaagcttc 100ttttaagcag catgttgaat taaaaaagaa agcaagcttc 100
<210> 157<210> 157
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 157<400> 157
tttcccagct gctgcctaat aaactgtgtc ctttggaaca actat 45tttcccagct gctgcctaat aaactgtgtc ctttggaaca actat 45
<210> 158<210> 158
<211> 603<211> 603
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 158<400> 158
gtctttaaga gcaacaaata aataatgacc ttgaatcttt cattggcttt cattaatagt 60gtctttaaga gcaacaaata aataatgacc ttgaatcttt cattggcttt cattaatagt 60
gtaactagat aaatgatggg aaagatgaga cagaagaagg aatacatcta taggactgct 120gtaactagat aaatgatggg aaagatgaga cagaagaagg aatacatcta taggactgct 120
agaatatggg gagagtgatt attttcaaat taatatgtat cgagcttcta ccccaaggta 180agaatatggg gagagtgatt attttcaaat taatatgtat cgagcttcta ccccaaggta 180
aataaataac atttggagac cattaaaatg taggatggca tagaagaggc ctttactaag 240aataaataac atttggagac cattaaaatg taggatggca tagaagaggc ctttactaag 240
attaataatt aaagaaacac agcctttaaa gtaaaaaaca cactgtgcct ttgaaacttg 300attaataatt aaagaaacac agcctttaaa gtaaaaaaca cactgtgcct ttgaaacttg 300
ctaaaaagat taacttctgt cccaaaaggt atcagccatg cgctaccagc ctccctgccc 360ctaaaaagat taacttctgt cccaaaaggt atcagccatg cgctaccagc ctccctgccc 360
ctacagtggc agtggctgca ttcttggtga atggtagtgg aagggattaa acctaggcct 420ctacagtggc agtggctgca ttcttggtga atggtagtgg aagggattaa acctaggcct 420
cagtcatgct tcccagtcac tggtactgat ttgtatgcac ccgcttaggt gtgaaggtag 480cagtcatgct tcccagtcac tggtactgat ttgtatgcac ccgcttaggt gtgaaggtag 480
ttttggtgtg tatcacaagt tagcctgtgt agcgaagaca ggttttctcc accgtgtttt 540ttttggtgtg tatcacaagt tagcctgtgt agcgaagaca ggttttctcc accgtgtttt 540
ttgttacaca tgactattca caaatgtgct gcagacagta aaatgagaaa tacccttcca 600ttgttacaca tgactattca caaatgtgct gcagacagta aaatgagaaa tacccttcca 600
agg 603agg 603
<210> 159<210> 159
<211> 269<211> 269
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 159<400> 159
agaaaatgac tgaataaagt gtcattcata gtatttggtt gtagtaactt gtcaaaatct 60agaaaatgac tgaataaagt gtcattcata gtatttggtt gtagtaactt gtcaaaatct 60
cagggccatg ggtgcacgac agcagtagct tcttgaatga actgaagttt tcaagaggtg 120cagggccatg ggtgcacgac agcagtagct tcttgaatga actgaagttt tcaagaggtg 120
cctggaaggt gaaaaacaca ctgaagccag tcatgttgat atgggggcat tctgctgctg 180cctggaaggt gaaaaacaca ctgaagccag tcatgttgat atgggggcat tctgctgctg 180
tgaaacagac tggggttcac acccaccttg cgggattaga acttcactgc cctccaactt 240tgaaacagac tggggttcac acccaccttg cgggattaga acttcactgc cctccaactt 240
ctttctttgt aaacaactgt ccacatttt 269ctttctttgt aaacaactgt ccacatttt 269
<210> 160<210> 160
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 160<400> 160
gcctcatgtg tagtgtaata aaggtgtctg ctgttctatc tg 42gcctcatgtg tagtgtaata aaggtgtctg ctgttctatc tg 42
<210> 161<210> 161
<211> 69<211> 69
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 161<400> 161
ttaatacttg gctgaactgg aggattgtct agttttccag ctgaaaaata aaaaagaatt 60ttaatacttg gctgaactgg aggattgtct agttttccag ctgaaaaata aaaaagaatt 60
gatacttgg 69gatacttgg 69
<210> 162<210> 162
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 162<400> 162
agttggagtt tatgttgtat tgaataaact ttaaag 36agttggagtt tatgttgtat tgaataaact ttaaag 36
<210> 163<210> 163
<211> 47<211> 47
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 163<400> 163
ggggactctg gccaatgccc tagaacaaat aaagttattt tccaacg 47ggggactctg gccaatgccc tagaacaaat aaagttattt tccaacg 47
<210> 164<210> 164
<211> 50<211> 50
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 164<400> 164
ataaattttg gctgattttt ctcttgtatt tcttgtttgc tggtataaaa 50ataaattttg gctgattttt ctcttgtatt tcttgtttgc tggtataaaaa 50
<210> 165<210> 165
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 165<400> 165
atgctgttgt gtgcacaagc aataaaatca ctttgagtaa ctt 43atgctgttgt gtgcacaagc aataaaatca ctttgagtaa ctt 43
<210> 166<210> 166
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 166<400> 166
ccgaggccaa taaagactgg ttttggtccc tgga 34ccgaggccaa taaagactgg ttttggtccc tgga 34
<210> 167<210> 167
<211> 3272<211> 3272
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 167<400> 167
acgtaaagca taaataaaaa gcctttgtgg actgtgctca gggtcagtcc ttttgaatct 60acgtaaagca taaataaaaa gcctttgtgg actgtgctca gggtcagtcc ttttgaatct 60
ctgcagcaga gtagctggct gtgctgactg gtgacacttc tggtgatgct cagctgtgag 120ctgcagcaga gtagctggct gtgctgactg gtgacacttc tggtgatgct cagctgtgag 120
gttttatgta gatattgaaa gcatgaccat tgtcttcact tcacctccag cttgggttgt 180180
atgccagtaa catcagcata aggtggttaa tgacaggatg gtcccttgag tgtgcagtga 240atgccagtaa catcagcata aggtggttaa tgacaggatg gtcccttgag tgtgcagtga 240
gtctggttta tttgccaatg agaagcacag gcctcctgta tgggtctttg cctacagccc 300gtctggttta tttgccaatg agaagcacag gcctcctgta tgggtctttg cctacagccc 300
cctttcatca cccagacttg gtagacttac attctgtcac actgttggct cttaatctca 360cctttcatca ccgacttg gtagacttac attctgtcac actgttggct cttaatctca 360
gccctgaaaa atgccatttc ttgggtatca aggctagtct agattcagaa accatataaa 420gccctgaaaa atgccatttc ttgggtatca aggctagtct agattcagaa accatataaa 420
ggttgacagc tggtttaaaa aaaaaaaggc ttggagcttg agttgggttc gcaggttatt 480ggttgacagc tggtttaaaa aaaaaaaggc ttggagcttg agttggggttc gcaggtttatt 480
ccagggtatc tgtctgcact ttgtctccca gatttaaagg taagtgccac catgcctagc 540ccagggtatc tgtctgcact ttgtctccca gatttaaagg taagtgccac catgcctagc 540
atggtgactt attagctttg ttgctgtgga acatacatca aatgaaacat tggtatggct 600atggtgactt attagctttg ttgctgtgga acatacatca aatgaaacat tggtatggct 600
ctggtttcac tgtccatggt tagtatctgg tgggtggaca cctggtggaa ccaagctgct 660660
catcccagaa ctaaggagcc attccccaga gacttgtctt cctactaagt tccatcccta 720catcccagaa ctaaggagcc attccccaga gacttgtctt cctactaagt tccatcccta 720
cagcttctag tagtagcttc agaggttgtg aattgtggac ttagtctgcc ataacattta 780cagcttctag tagtagcttc agaggttgtg aattgtggac ttagtctgcc ataacattta 780
aaataggtat taaattcaag tcatttggtc actcagcacc cacgtggctc ttcagaacaa 840aaataggtat taaattcaag tcatttggtc actcagcacc cacgtggctc ttcagaacaa 840
cagaagcccc tcggacttgt ctgttggaaa aaccagtttg aaataatgta cctgctttag 900cagaagcccc tcggacttgt ctgttggaaa aaccagtttg aaataatgta cctgctttag 900
ttgagaaaac gctacaactg gtgctgtgtc ctgccatgct gatgagctct gctctgcgac 960ttgagaaaac gctacaactg gtgctgtgtc ctgccatgct gatgagctct gctctgcgac 960
ctgccgaact tgggggatct ctacccccag actttgctca gatctgttga tgatttgtcc 1020ctgccgaact tgggggatct ctacccccag actttgctca gatctgttga tgatttgtcc 1020
atgcaggaaa gtttacaagg tctctgtgtg tctactactt actagttgct gtgacaaaaa 1080atgcaggaaa gtttacaagg tctctgtgtg tctactactt actagttgct gtgacaaaaa 1080
tactgaaagt gtttactgtg tgtgaggcac aaagtttgtg ggaagctgta ccctccctca 1140tactgaaagt gtttactgtg tgtgaggcac aaagtttgtg ggaagctgta ccctccctca 1140
ttttggtgct gctcctgcct tgactgacag gatgagctgc cccaaccatc gttgccatct 1200ttttggtgct gctcctgcct tgactgacag gatgagctgc cccaaccatc gttgccatct 1200
tccataagaa gcaggtggct ctattgagtt ccctggaggt gatcccaagg gaaggaggag 1260tccataagaa gcaggtggct ctattgagtt ccctggaggt gatcccaagg gaaggaggag 1260
cctgggaaag tggatctcaa gtcccctagt ctggcagttg gctgtttagg aaagtccagt 1320cctgggaaag tggatctcaa gtcccctagt ctggcagttg gctgtttagg aaagtccagt 1320
gtcagtgttt gatatgttgt aaggaaacaa attcagtttt atttagctta ttggctctgg 1380gtcagtgttt gatatgttgt aaggaaacaa attcagtttt atttagctta ttggctctgg 1380
ggaaatggca gttcccatta attggtgctg tctttctctt tgaggatcaa aattagcttc 1440ggaaatggca gttcccatta attggtgctg tctttctctt tgaggatcaa aattagcttc 1440
ctgttcagtt gttaagcata tttcatagtc aaataatcct cttatcttta caagtgaggt 1500ctgttcagtt gttaagcata tttcatagtc aaataatcct cttatcttta caagtgaggt 1500
tttccttcga gtggatatca gagtccctcc cacggcttct atccctccta tccttgtgta 1560tttccttcga gtggatatca gagtccctcc cacggcttct atccctccta tccttgtgta 1560
ggaagttaag cttgctcatt tgtagattag tggtcggtta cactgcaatt tagagtatca 16201620
tgtgtactct acacatgatt gattctaagc ccccttccct ttccatgtcc ttcaaaaatt 1680tgtgtactct acacatgatt gattctaagc ccccttccct ttccatgtcc ttcaaaaatt 1680
tttttattct gagacagtgt taggattttt cctgggctag ccaaatgcaa gaagtgttgg 1740tttttattct gagacagtgt taggattttt cctgggctag ccaaatgcaa gaagtgttgg 1740
tcccagactt gtaatctttc tgccttagcc tcccaaattc taggattata gatttatgtc 1800tcccagactt gtaatctttc tgccttagcc tcccaaattc taggattata gatttatgtc 1800
atgtgatgag tggtctttta aagattatct tttatttttt ttgagatggg gtttttctgt 18601860
gtagttttgg ctttcttggg acttgctctg tagacccagg atggtcttta ctcagatctg 1920gtagttttgg ctttcttggg acttgctctg tagacccagg atggtcttta ctcagatctg 1920
cttgcctctg cctcccaact gctaggatta aagcatgagc ctgagccttc atgcctggct 1980cttgcctctg cctcccaact gctaggatta aagcatgagc ctgagccttc atgcctggct 1980
gacaggtgaa ttctcaatac ctacctagcc atagggaaag tgattgtgtc cccttcctca 2040gacaggtgaa ttctcaatac ctacctagcc atagggaaag tgattgtgtc cccttcctca 2040
tagaggggca tagtcaccca ggccatacct ttagcttggg cttttggtca gtgaagaagt 2100tagaggggca tagtcaccca ggccatacct ttagcttggg cttttggtca gtgaagaagt 2100
atgaagggac aagaacacta tcaagagcct aatgtgctct ggcctggatg gtcagcacaa 2160atgaagggac aagaacacta tcaagagcct aatgtgctct ggcctggatg gtcagcacaa 2160
aatgaataga cttaccaaat tctgctgtct ccttggtaga tgtgaagttg ttggaagagt 22202220
cctaaattta gcagactata ctgtcagcct atcagactat aggctgccgg agggcaagtc 2280cctaaattta gcagactata ctgtcagcct atcagactat aggctgccgg agggcaagtc 2280
tgctacctat ttccatctca tgcctgcatt gttcatcccc ctatgtaacc cacctacctg 2340tgctacctat ttccatctca tgcctgcatt gttcatcccc ctatgtaacc cacctacctg 2340
tcactcattc ctccatccaa aaactattgt aggttcagtg gaaatttcaa gcttgcctgt 2400tcactcattc ctccatccaa aaactattgt aggttcagtg gaaatttcaa gcttgcctgt 2400
ctcagcatct ttcttacctt acccctaagg atggcatctc tcttggctac atctttggtt 2460ctcagcatct ttcttacctt acccctaagg atggcatctc tcttggctac atctttggtt 2460
tatctggaga tccttgatta atttgaacaa gagctacctt gggttatgca gtttatgcct 25202520
ccagtgtccc agagaccggc atttgagaga tccctgatag caaacccata gggtggcctt 2580ccagtgtccc agagaccggc atttgagaga tccctgatag caaacccata gggtggcctt 2580
tttttcatcc accccattct ccctcccacc tccctctttt gaccttgagt cctcaccaga 2640tttttcatcc accccattct ccctcccacc tccctctttt gaccttgagt cctcaccaga 2640
gagaaaccag gcccacttaa ttagttctac atgtgtacac tacatgggtg cagtgcccaa 2700gagaaaccag gcccacttaa ttagttctac atgtgtacac tacatgggtg cagtgcccaa 2700
gcaggagagg tgttagattc ccttttaact atagttaata gacagttttt aagccccagt 2760gcaggagagg tgttagattc ccttttaact atagttaata gacagttttt aagccccagt 2760
ggatgctggg aagcaaacct acatcctcta gaagagcagc tatttctctg agccatttct 2820ggatgctggg aagcaaacct acatcctcta gaagagcagc tatttctctg agccatttct 2820
ccagcaccat tttcccctct tttaaaagca ggtcttgcag tgtggcctag tctggccccc 2880ccagcaccat tttcccctct tttaaaagca ggtcttgcag tgtggcctag tctggccccc 2880
tgaggtgttt gcattgcatg gcaggcatgt ccacaggaac accatagttc tcaccactcg 2940tgaggtgttt gcattgcatg gcaggcatgt ccacaggaac accatagttc tcaccactcg 2940
tacagcacag caagtggggt gccgcagggg attatcactt gagtataaaa taagggttgc 3000tacagcacag caagtggggt gccgcagggg attatcactt gagtataaaa taagggttgc 3000
tttagattga ataggataac cacgcgttct cagaacaatc aaggaaggct ggggtgagcc 3060tttagattga ataggataac cacgcgttct cagaacaatc aaggaaggct ggggtgagcc 3060
agcaccgacc ttaattgttt acttagtaaa ctactaaatg tatgcacgtg taagcttttg 3120agcaccgacc ttaattgttt acttagtaaa ctactaaatg tatgcacgtg taagcttttg 3120
ccttgattga ggtcaagctg tcgagaaatg gttctcttta cagtggatcc agtcaggatt 31803180
ggcagcaagc acctttgcct gctgagccta catgttgtat agaatggcaa cgttgtgtag 3240ggcagcaagc acctttgcct gctgagccta catgttgtat agaatggcaa cgttgtgtag 3240
aatggcagta cattaaatgg gtttttcatt ta 3272aatggcagta cattaaatgg gtttttcatt ta 3272
<210> 168<210> 168
<211> 59<211> 59
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 168<400> 168
gcccatctca aggatcgggg tttacctttg taataaacat cctaggattt taacgttcc 59gcccatctca aggatcgggg tttacctttg taataaacat cctaggattt taacgttcc 59
<210> 169<210> 169
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 169<400> 169
aacaaaggat gctgggttaa taaattgcct cattc 35aacaaaggat gctgggttaa taaattgcct cattc 35
<210> 170<210> 170
<211> 3167<211> 3167
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 170<400> 170
gacaactgaa taaatcgtct taatggtcaa attttgctgg cttttgttca ggtttttttt 60gacaactgaa taaatcgtct taatggtcaa attttgctgg cttttgttca ggtttttttt 60
ttttaattca tgtttatgag tgtaaatgtg tgtgtcacag gggtgtcaga tgttctttga 120ttttaattca tgtttatgag tgtaaatgtg tgtgtcacag gggtgtcaga tgttctttga 120
accaccatgt aggtgctgga aacccaacct gcatcctcgg agagaacagg ttccttaacc 180accaccatgt aggtgctgga aacccaacct gcatcctcgg agagaacagg ttccttaacc 180
actgagcaag tactgaagca ttaaactgct tttaaaaatg aaggtgtgct aacagattgg 240actgagcaag tactgaagca ttaaactgct tttaaaaatg aaggtgtgct aacagattgg 240
tcaggtgaaa aagagacgtt aggtttcctg cagggggcgc taagccaatt taaagactaa 300tcaggtgaaa aagagacgtt aggtttcctg cagggggcgc taagccaatt taaagactaa 300
gttgggttag aaaagagcag attgcatcct tgatctttta agcctgggga ttttgttttg 360gttgggttag aaaagagcag attgcatcct tgatctttta agcctgggga ttttgttttg 360
ttttgggata gggtcccaac acagaacagg ctgacctcat taaatatcaa tcttatttga 420ttttgggata gggtcccaac acagaacagg ctgacctcat taaatatcaa tcttatttga 420
ttgcctctgc tcccagagta ctggaattaa aggcagggac cactgtatta gccattctga 480ttgcctctgc tccgagta ctggaattaa aggcagggac cactgtatta gccattctga 480
gttatttgaa atggactctg caggccatac ttggtcaaaa ttctgccttc tcaattacag 540gttatttgaa atggactctg caggccatac ttggtcaaaa ttctgccttc tcaattacag 540
gcatgagcca ctatgcctgg tttacttact aatagatgtc caaagactag tgtatgaaaa 600gcatgagcca ctatgcctgg tttacttact aatagatgtc caaagactag tgtatgaaaa 600
ttttgctttt ccaggtgatt tgtgaaaggc agggtggcct ctcccatgtc acactacttg 660ttttgctttt ccaggtgatt tgtgaaaggc agggtggcct ctcccatgtc acactacttg 660
ggttactcat gttgcaacat atctgcaact ttaggttgag gggatttgag cctgcatgtg 720ggttactcat gttgcaacat atctgcaact ttaggttgag gggatttgag cctgcatgtg 720
ccactttggc caactgaact aatctttaat tccatctaaa acttttaaat ctcagtcatg 780ccactttggc caactgaact aatctttaat tccatctaaa acttttaaat ctcagtcatg 780
tgttcaactg gaaaataacc tagagtgtgc tatgttgact tcaggtacac atcaaagcag 840tgttcaactg gaaaataacc tagagtgtgc tatgttgact tcaggtacac atcaaagcag 840
gttttagtga tgtagaagct gtgtttgagt tgaactagtg ttgaggctag gcttaggtac 900gttttagtga tgtagaagct gtgtttgagt tgaactagtg ttgaggctag gcttaggtac 900
catagaactt tggtttttca agacagggtt tctctgtgta gccctggctg tcctggaact 960catagaactt tggtttttca agacagggtt tctctgtgta gccctggctg tcctggaact 960
cactgtagac caggctggcc ttgaactcag aaatctgcct gcctgtgcct cccaacacac 1020cactgtagac caggctggcc ttgaactcag aaatctgcct gcctgtgcct cccaacacac 1020
ccagctctag ctttaaattc cttgcaccaa gagatgcttt atccctccgc tgagaataca 1080ccagctctag ctttaaattc cttgcaccaa gagatgcttt atccctccgc tgagaataca 1080
ggtgcatgtc agcatgctaa actctagata aaatttcatc ttgtttgaaa ggacaataat 1140ggtgcatgtc agcatgctaa actctagata aaatttcatc ttgtttgaaa ggacaataat 1140
ataagaaaag tgtatttgca ctgtatacca tgcccttttg tgtttaaagt taaactggca 1200ataagaaaag tgtatttgca ctgtatacca tgcccttttg tgtttaaagt taaactggca 1200
acagtgtccc atagaggttc cagaagaaac tgcttctaag gggaggacca taaagggaaa 1260acagtgtccc atagaggttc cagaagaaac tgcttctaag gggaggacca taaagggaaa 1260
tgcttaccat agaacttttt aaatgttcct acaggttgta ctctggatag gtatatgaac 1320tgcttaccat agaacttttt aaatgttcct acaggttgta ctctggatag gtatatgaac 1320
acctttctat tagaacagtt ttatagtagt acttagtgaa tatgtaaata atactatttg 1380acctttctat tagaacagtt ttatagtagt acttagtgaa tatgtaaata atactatttg 1380
tgaaatagtt tgaggtttct ctatagtcct ggctggcttg agctctatac cagattggct 1440tgaaatagtt tgaggtttct ctatagtcct ggctggcttg agctctatac cagattggct 1440
tctaaatcag aaatctgcct ctatctcctg aatggttatg atagagatgc aagttactta 1500tctaaatcag aaatctgcct ctatctcctg aatggttatg atagagatgc aagttactta 1500
atttcttaca tgaattgcac tttgtacatg cttttggata tgggcctagg cttttgcttt 15601560
tggattagac tgtctttatt acatttactg gcttgatact ttacagtctt aagcccactt 1620tggattagac tgtctttatt acatttactg gcttgatact ttacagtctt aagcccactt 1620
gcctgggtgt gatgcacacc tttaatccca gcactttggg atttctgagt tccaggacag 1680gcctgggtgt gatgcacacc tttaatccca gcactttggg atttctgagt tccaggacag 1680
ccagggctac gcagagaaac cctgtcttgg aggggaaaaa aagaaacttt ggaaatcaaa 1740ccagggctac gcagagaaac cctgtcttgg aggggaaaaa aagaaacttt ggaaatcaaa 1740
acttcttgga aagccacttt tagagacttg aatctaagga taactaacca ggtagtaacc 1800acttcttgga aagccacttt tagagacttg aatctaagga taactaacca ggtagtaacc 1800
acgagtcatt gattctgtga atcttgtatg agtgggttac aggcagaaat taacttcctc 1860acgagtcatt gattctgtga atcttgtatg agtgggttac aggcagaaat taacttcctc 1860
tgagagcact gctgttttag aaatgcgacc tagtaattac caaaggcatt gaagccactt 1920tgagagcact gctgttttag aaatgcgacc tagtaattac caaaggcatt gaagccactt 1920
gactacagtc tcaggtttct gcatctgaca ttgctgggac tgtgtggggt ttatgggtgt 1980gactacagtc tcaggtttct gcatctgaca ttgctgggac tgtgtggggt ttatgggtgt 1980
aaaataaaac aggcgaaagg atgttgagtg gaaagctttg gcttcagaat caaattccaa 2040aaaataaaac aggcgaaagg atgttgagtg gaaagctttg gcttcagaat caaattccaa 2040
atcaattacc agatcaaatc aaatgccaga tcaaattaca agacttcctt atgactaaat 2100atcaattacc agatcaaatc aaatgccaga tcaaattaca agacttcctt atgactaaat 2100
tcttcagtga cttaggatac taatagtatc tgcctcaaaa gtgtatgtgg ttatttttgt 21602160
cccagtgaag ccaagattca catgctatgg gcatggattt cctgaggaca tgctagccta 2220cccagtgaag ccaagattca catgctatgg gcatggattt cctgaggaca tgctagccta 2220
tggtatgagt tacttgaaag gactctgaga aatcttagtc cccagctgtg aggtttttaa 2280tggtatgagt tacttgaaag gactctgaga aatcttagtc cccagctgtg aggtttttaa 2280
agatcatgct caatggaaag tggggcagta atttgagagc atggcacaaa tgaggtttta 2340agatcatgct caatggaaag tggggcagta atttgagagc atggcacaaa tgaggtttta 2340
tcttttgaaa ctaagtgaat ctatgtcctt ggactagcat attttaaatc acacatcaaa 2400tcttttgaaa ctaagtgaat ctatgtcctt ggactagcat attttaaatc acacatcaaa 2400
tgaaatttct gttcaattcc tataaacagt ttatttcata ttttgtagtt accattttca 2460tgaaatttct gttcaattcc tataaacagt ttatttcata ttttgtagtt accattttca 2460
ttaacagcat acacccttca attgtgttgc taaaactgag tcacattatt ctgtaagaac 2520ttaacagcat acacccttca attgtgttgc taaaactgag tcacattatt ctgtaagaac 2520
ttactccagt atcacaactt ggtgctcatc caatattttt attttcattc tattttccct 2580ttactccagt atcacaactt ggtgctcatc caatattttt attttcattc tattttccct 2580
gtctagccac gtatggccct attctctctt cttggattga ccctagcttc aacacaagaa 2640gtctagccac gtatggccct attctctctt cttggattga ccctagcttc aacacaagaa 2640
agcttgcagt attttttttt tgcgcctggt tcattgtttt gtcctcaagt tctatccatg 2700agcttgcagt attttttttt tgcgcctggt tcattgtttt gtcctcaagt tctatccatg 2700
tgtccagaaa ttcgaggatt ttttaaaatt tacttttctg cctaaatact ggtatgtgga 2760tgtccagaaa ttcgaggatt ttttaaaatt tacttttctg cctaaatact ggtatgtgga 2760
tagtctgtta tttttactgt tggttgcata tctgtagcat atttctgtat ttgcaatgac 2820tagtctgtta tttttactgt tggttgcata tctgtagcat atttctgtat ttgcaatgac 2820
tacattgaat gtcccttagt taacctcatt cttcttaact attttgtagg cgtttgctat 2880tacattgaat gtcccttagt taacctcatt cttcttaact attttgtagg cgtttgctat 2880
tcaaagcaca atctcaatta aaatgttttt aatagcatct ttccacttgg atgtgtaaag 2940tcaaagcaca atctcaatta aaatgttttt aatagcatct ttccacttgg atgtgtaaag 2940
aaagtatttc tagaagtctg aatttttgtt gcattgtaga tgtgtacaca atagggctgg 3000aaagtatttc tagaagtctg aatttttgtt gcattgtaga tgtgtacaca atagggctgg 3000
gaaagtagct cacagtgggt aaaagccatt tgttgccaat cctaacagcc tgagttcaat 30603060
cccagaatct ataaggtaga agaaaaaaac cccagctccc acaagttatc tggccctctg 3120cccagaatct ataaggtaga agaaaaaaac cccagctccc acaagttatc tggccctctg 3120
cacacatata aatagtgcaa taaaaattaa ccatttaaaa atataaa 3167cacacatata aatagtgcaa taaaaattaa ccatttaaaa atataaa 3167
<210> 171<210> 171
<211> 58<211> 58
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 171<400> 171
gcagaagaaa tcgggaattt gttacaaata aaagttttaa gtacctgtga cagttaag 58gcagaagaaa tcgggaattt gttacaaata aaagttttaa gtacctgtga cagttaag 58
<210> 172<210> 172
<211> 49<211> 49
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 172<400> 172
aatttgacaa tggaaacaca gtaataaatt ttcatattct gaaaaaata 49aatttgacaa tggaaacaca gtaataaatt ttcatattct gaaaaaata 49
<210> 173<210> 173
<211> 264<211> 264
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 173<400> 173
acaggttcaa tcagctgtac atttggaaaa ataaaacttt attgaatcaa atgaatgggt 60acaggttcaa tcagctgtac atttggaaaa ataaaacttt attgaatcaa atgaatgggt 60
gcatctgttt cctaaggcag ccggggagga tttggtctta ggaataatag ctggaattgg 120gcatctgttt cctaaggcag ccggggagga tttggtctta ggaataatag ctggaattgg 120
tttgttggcc atgaagtcag atgcaattgc gcctgggaac cttcagcttt tccctttacg 180tttgttggcc atgaagtcag atgcaattgc gcctgggaac cttcagcttt tccctttacg 180
tggttgcttg cttcttgttg cagcttcggt tttgaattga tgcctgaaag aaaataaaaa 240tggttgcttg cttcttgttg cagcttcggt tttgaattga tgcctgaaag aaaataaaaa 240
cttagcaaga ctaatggtaa atct 264cttagcaaga ctaatggtaa atct 264
<210> 174<210> 174
<211> 71<211> 71
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 174<400> 174
agaggccgtt ttgtaaggac ggaaggaaaa ttaccctgga aaaataaaat ggaagttgta 60agaggccgtt ttgtaaggac ggaaggaaaa ttaccctgga aaaataaaat ggaagttgta 60
ctttacatgg c 71ctttacatgg c 71
<210> 175<210> 175
<211> 56<211> 56
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 175<400> 175
aagcccctga ttgaagatga gtgggaacct tcccaataaa cacgttttgg atatat 56aagcccctga ttgaagatga gtgggaacct tcccaataaa cacgttttgg atatat 56
<210> 176<210> 176
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 176<400> 176
ttgtgtatgc gttaataaaa agaaggaact cgtactta 38ttgtgtatgc gttaataaaa agaaggaact cgtactta 38
<210> 177<210> 177
<211> 92<211> 92
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 177<400> 177
tcttgcagct gggttctgga tatccactac ttagcccacg gaatgatctg caactgttaa 60tcttgcagct gggttctgga tatccactac ttagcccacg gaatgatctg caactgttaa 60
ataaagcatt tatattaatt cttgtctaga aa 92ataaagcatt tatattaatt cttgtctaga aa 92
<210> 178<210> 178
<211> 91<211> 91
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 178<400> 178
gcgaccttga atggattcga ctgactacta ccaagtggaa ccgatcatgc tagtctttgt 60gcgaccttga atggattcga ctgactacta ccaagtggaa ccgatcatgc tagtctttgt 60
acacaaagaa taaaaatgtg aagaacttta a 91acacaaagaa taaaaatgtg aagaacttta a 91
<210> 179<210> 179
<211> 1187<211> 1187
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 179<400> 179
tacacgtgat atttgtaaaa ttcatatcca ataaacaatt taggacagtc atttctgctt 60tacacgtgat atttgtaaaa ttcatatcca ataaacaatt taggacagtc atttctgctt 60
aaaggtgtta tttgttaaaa ctagtctaca gattgtcatg agtgttctgt gaaaatgtag 120aaaggtgtta tttgttaaaa ctagtctaca gattgtcatg agtgttctgt gaaaatgtag 120
aagttaagtg caataattga aaactgcagg tgatggcata tcttgtttct gatgtacttt 180aagttaagtg caataattga aaactgcagg tgatggcata tcttgtttct gatgtacttt 180
gcattatctg cttatgagat taagtgtata tagtgtttgt gccaagtggt gttctgtgtg 240240
taagaccctg taagaggtaa aaagtcctga aactgaccct ggatgtgttg gtgcatgaga 300taagaccctg taagaggtaa aaagtcctga aactgaccct ggatgtgttg gtgcatgaga 300
tagaatctac agctttacga tggcatcttt tggttcactg aagtggctgc ttgggagttt 360tagaatctac agctttacga tggcatcttt tggttcactg aagtggctgc ttgggagttt 360
gatgagtaca aactttatag agttggattt tgcttagaaa tgtgtaggaa gagagggttt 420gatgagtaca aactttatag agttggattt tgcttagaaa tgtgtaggaa gagagggttt 420
caaaacctgt tttgtgcata gaaaagtgag atcaactata acccacattt tgagaattga 480caaaacctgt tttgtgcata gaaaagtgag atcaactata acccacattt tgagaattga 480
atccagtgtt attttcagaa gaccaggtaa atttgttgga agaggtttca ctttctgttg 540atccagtgtt attttcagaa gaccaggtaa atttgttgga agaggtttca ctttctgttg 540
gatctagagt atggatttgg agatgaaggt tgaacattgg atgtagtagg gcttatttag 600gatctagagt atggatttgg agatgaaggt tgaacattgg atgtagtagg gcttatttag 600
ggcagattat ttccattaga tttgtaaact tggttgtggt tgcaagttaa tatcaaccaa 660ggcagattat ttccattaga tttgtaaact tggttgtggt tgcaagttaa tatcaaccaa 660
gcaaatataa gtttgattaa gcttgcagac attaagcttt tctagcagct ggtgtgtgca 720gcaaatataa gtttgattaa gcttgcagac attaagcttt tctagcagct ggtgtgtgca 720
gaggcagatg gctctctggt tccaggacta cctacaatat agagaaattt tctctattcc 780gaggcagatg gctctctggt tccaggacta cctacaatat agagaaattt tctctattcc 780
agtcaattca tcatgggtaa gaatagtcca ttttggtagt gttatttcat cgtttacaat 840agtcaattca tcatgggtaa gaatagtcca ttttggtagt gttatttcat cgtttacaat 840
ctacctatgg gtagtggctg gtaactgcct ggatgttgac atttcacaaa ggccatactt 900ctacctatgg gtagtggctg gtaactgcct ggatgttgac atttcacaaa ggccatactt 900
aaccacactt ttatttctat ttgtgcgatg ccttggagta gtttcccaaa gtgattttga 960aaccacactt ttatttctat ttgtgcgatg ccttggagta gtttcccaaa gtgattttga 960
gtgtggaaga aatggtattg tccccgaaca gctggcttgg tctcaaaatc taattgatgc 1020gtgtggaaga aatggtattg tccccgaaca gctggcttgg tctcaaaatc taattgatgc 1020
ttttattaaa ttggttttcc tttggagatt ttaaaaggat gatttgattt ccagaaaata 1080ttttattaaa ttggttttcc tttggagatt ttaaaaggat gatttgattt ccagaaaata 1080
ctagactcaa aatcttgata gctaaaattc ttttctattc agcaaaacaa gtcactgtat 1140ctagactcaa aatcttgata gctaaaattc ttttctattc agcaaaacaa gtcactgtat 1140
agaggttgtt caaatcaact aaagtaataa atgtcttaaa caagtgg 1187agaggttgtt caaatcaact aaagtaataa atgtcttaaa caagtgg 1187
<210> 180<210> 180
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 180<400> 180
gggtttttat atgagaaaaa taaaagaatt aagtctgctg att 43gggtttttat atgagaaaaa taaaagaatt aagtctgctg att 43
<210> 181<210> 181
<211> 259<211> 259
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 181<400> 181
ggctacacag aataataaag gttctttttg acggtggtaa atctcatgtg tggactctaa 60ggctacacag aataataaag gttctttttg acggtggtaa atctcatgtg tggactctaa 60
gcttgtcgcc aagtgggaaa tagactggtg ggattgtaga taggatgggc tacttaaact 120gcttgtcgcc aagtgggaaa tagactggtg ggattgtaga taggatgggc tacttaaact 120
cattctaccc aggccttagt acttagcata cagccagagt caaactgatc ctttatacag 180cattctaccc aggccttagt acttagcata cagccagagt caaactgatc ctttatacag 180
ggggtaccat gacagtacaa cagtgtcgtt aaccctaaca aataaatttc ccaccaacgg 240ggggtaccat gacagtacaa cagtgtcgtt aaccctaaca aataaatttc ccaccaacgg 240
gtggaattcc ttcattttg 259gtggaattcc ttcattttg 259
<210> 182<210> 182
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 182<400> 182
acaggacttc tcattatttt ctgttaataa attgctttgt gtaagcta 48acaggacttc tcattatttt ctgttaataa attgctttgt gtaagcta 48
<210> 183<210> 183
<211> 67<211> 67
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 183<400> 183
aggcttcaat agttctccta taccctacca aatcgttcaa taataaaatc tcgcatcaag 60aggcttcaat agttctccta taccctacca aatcgttcaa taataaaatc tcgcatcaag 60
ttcgctt 67ttcgctt 67
<210> 184<210> 184
<211> 33<211> 33
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 184<400> 184
gatgctccaa taaacctcac tgctgccact cag 33gatgctccaa taaacctcac tgctgccact cag 33
<210> 185<210> 185
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 185<400> 185
gatgacaacg acaataaagt gcgagactga ctggct 36gatgacaacg acaataaagt gcgagactga ctggct 36
<210> 186<210> 186
<211> 388<211> 388
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 186<400> 186
acccaataaa gactgtttgc ctcatgcctg cctggcctgc ccttcctccg ccgccaacta 60acccaataaa gactgtttgc ctcatgcctg cctggcctgc ccttcctccg ccgccaacta 60
gggaagtggg gaccaaaggt tccttaggca ctgctcctgt gggtagaggg gacattagag 120gggaagtggg gaccaaaggt tccttaggca ctgctcctgt gggtagaggg gacattagag 120
agctgacagc gcaccacctg catgagtttt tattaaagtg caaaccatgg gatgaatcag 180agctgacagc gcaccacctg catgagtttt tattaaagtg caaaccatgg gatgaatcag 180
ttgagcttca gtgttgaaaa tgagtagcag ggctgcccca cccacctgac caagtaccct 240ttgagcttca gtgttgaaaa tgagtagcag ggctgcccca cccacctgac caagtaccct 240
attctgcagc tatgaaaatg agatctgcac atgagctggg gttcacaagt gcacacttgg 300attctgcagc tatgaaaatg agatctgcac atgagctggg gttcacaagt gcacacttgg 300
agcactgcct tgctccttcc cagcagacca caaagcagta tttttctgga ggattttatg 360360
tgctaataaa ttatttgact taagtgtg 388tgctaataaa ttatttgact taagtgtg 388
<210> 187<210> 187
<211> 32<211> 32
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 187<400> 187
tgaaccctcc cccaataaaa gatggttcct ac 32tgaaccctcc cccaataaaa gatggttcct ac 32
<210> 188<210> 188
<211> 103<211> 103
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 188<400> 188
gcagattttg ttatgaagac aataaaatct tgacctttca acccctttga ttgcagttgt 6060
tcgtttggga gggaatacat taaaagcttt cagaaattac ctg 103tcgtttggga gggaatacat taaaagcttt cagaaattac ctg 103
<210> 189<210> 189
<211> 277<211> 277
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 189<400> 189
gccagcccgt gcacctacga cgcctgcagg agcagaagtg agggatgctg agggccggga 60gccagcccgt gcacctacga cgcctgcagg agcagaagtg agggatgctg agggccggga 60
caagctatcg gactgtgtgc tgccatcggt aatgagtctc agtagacctg gaacgtcacc 120caagctatcg gactgtgtgc tgccatcggt aatgagtctc agtagacctg gaacgtcacc 120
tcgccgcgat cgcctggaga aatgaccgcc tttcttacaa ccaaaacagt ccctctgccc 180tcgccgcgat cgcctggaga aatgaccgcc tttcttacaa ccaaaacagt ccctctgccc 180
tggacccccg gcactctgga ctagctctgt tctcttgtgg ccaagtgtag ctcgtgtaca 240tggacccccg gcactctgga ctagctctgt tctcttgtgg ccaagtgtag ctcgtgtaca 240
ataaaccctc ttgcagtcag ctgaagaatc aaactgc 277ataaaccctc ttgcagtcag ctgaagaatc aaactgc 277
<210> 190<210> 190
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 190<400> 190
gtctctgggc ctttgctgtt aataaatagt ttatatacct atga 44gtctctggggc ctttgctgtt aataaatagt ttatatacct atga 44
<210> 191<210> 191
<211> 404<211> 404
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 191<400> 191
aatacctagc agtgagtgga gattggatac agccaaagga gtagatctgc ggtgacttga 60aatacctagc agtgagtgga gattggatac agccaaagga gtagatctgc ggtgacttga 60
tgttttgctg tgatgtgcag atttctgaga ggacaaataa actaaaaagc tcctacacgt 120tgttttgctg tgatgtgcag atttctgaga ggacaaataa actaaaaagc tcctacacgt 120
ctgctctgct gcttattggg cattagaaga atcaggtggc tgcttgggtg ttgatgcagt 180ctgctctgct gcttattggg cattagaaga atcaggtggc tgcttgggtg ttgatgcagt 180
caagtgcact gggcttggtg aaaagcccag tgtaagaggc cggtacagat ccttcctggc 240caagtgcact gggcttggtg aaaagcccag tgtaagaggc cggtacagat ccttcctggc 240
agagggtggt gatggagaga acataaataa ctacatgggc aaagtgtagg accaattacc 300agagggtggt gatggagaga acataaataa ctacatgggc aaagtgtagg accaattacc 300
ctgttagcat cgtctttgct caacaccttt ctgtgtccct agactctgag tttttttcta 360ctgttagcat cgtctttgct caacaccttt ctgtgtccct agactctgag tttttttcta 360
attgattttt attgaacact gagtgttttg aggttttatt tttt 404attgattttt attgaacact gagtgttttg aggttttatt tttt 404
<210> 192<210> 192
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 192<400> 192
agttcaggag ctaataaagt acgtcctttg gctaatccg 39agttcaggag ctaataaagt acgtcctttg gctaatccg 39
<210> 193<210> 193
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 193<400> 193
atatgcacat tttttaagta ataaaaatca agacttgatc tacgcttc 48atatgcacat tttttaagta ataaaaatca agacttgatc tacgcttc 48
<210> 194<210> 194
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 194<400> 194
tctgttatgc catattttca ataaacctga aaacaa 36tctgttatgc catattttca ataaacctga aaacaa 36
<210> 195<210> 195
<211> 875<211> 875
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 195<400> 195
gctgctgtgc aggtgcctga gcaaagggaa aaaagatgga aggaaaataa agttgctaaa 60gctgctgtgc aggtgcctga gcaaagggaa aaaagatgga aggaaaataa agttgctaaa 60
agctgtctta tggtcctcac tgcagactgt acctggattg gcatttggct atacaacaga 120agctgtctta tggtcctcac tgcagactgt acctggattg gcatttggct atacaacaga 120
ggcatggtcc tactgacatg ttttgtgttg aatacttaag catgtgaaca catgggtttt 180ggcatggtcc tactgacatg ttttgtgttg aatacttaag catgtgaaca catgggtttt 180
tttttttttt aatgtaaaat gtagtaacac aatgtttagg tggctttggt gttagctctg 240tttttttttt aatgtaaaat gtagtaacac aatgtttagg tggctttggt gttagctctg 240
gagacttcat gtgtcatcta ggtgaggtgt tctttaacac agggtctctg ttctgtcatg 300gagacttcat gtgtcatcta ggtgaggtgt tctttaacac agggtctctg ttctgtcatg 300
cctcatagat ccttctacct ccagattgga gagggaaaag gcttatgtca ctgaacctgg 360cctcatagat ccttctacct ccagattgga gagggaaaag gcttatgtca ctgaacctgg 360
ccagattggg attttgtgtc ccaggaacaa agttaatgct aaaaagttaa tgccttggtg 420ccagattggg attttgtgtc cggaacaa agttaatgct aaaaagttaa tgccttggtg 420
agactgatag tctgatggtg tgaattcaca gtaagtggtt gggattgcca gatggaattc 480agactgatag tctgatggtg tgaattcaca gtaagtggtt gggattgcca gatggaattc 480
cctgagctgc cgtgacaggt ggcattgcag aagtgaagga ttcaggaatt tgagtgttgg 540cctgagctgc cgtgacaggt ggcattgcag aagtgaagga ttcaggaatt tgagtgttgg 540
gtgggggcct gtgaatagca cttgggctgg gaggggagac tgctgcccct gaatgtcctg 600gtggggggcct gtgaatagca cttgggctgg gaggggagac tgctgcccct gaatgtcctg 600
gaattcaagg acagtacctg gttaaatgtt tttctagctt ttctaaaaag tttgttaggc 660660
ctggcattgg cggcgcacac ctttaatccc agcacttggg agtcaggcag gtggatttct 720ctggcattgg cggcgcacac ctttaatccc agcacttggg agtcaggcag gtggatttct 720
ggcctggtct acagagagtt ccaggatagc cagggataca cagaaatcct gcctcaggaa 780ggcctggtct acagagagtt ccaggatagc cagggataca cagaaatcct gcctcaggaa 780
aaaaccaaaa agaagtttgc taaaaataag catttttgct tgatggtatt gaagattgta 840aaaaccaaaa agaagtttgc taaaaataag catttttgct tgatggtatt gaagattgta 840
agacattaaa ttgtgtcatt acttctccag gtact 875agacattaaa ttgtgtcatt acttctccag gtact 875
<210> 196<210> 196
<211> 67<211> 67
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 196<400> 196
agctgtggtc atacctggca tgtgaccccg ggaccaaata aagtcccctt ccatccactg 60agctgtggtc atacctggca tgtgaccccg ggaccaaata aagtcccctt ccatccactg 60
gagcagc 67gagcagc 67
<210> 197<210> 197
<211> 50<211> 50
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 197<400> 197
gtcctattgc caccctgcca tgctaataaa gccactgtgt ccagacttct 50gtcctattgc caccctgcca tgctaataaa gccactgtgt ccagacttct 50
<210> 198<210> 198
<211> 84<211> 84
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 198<400> 198
ttggcctctg cttgtaatac aatgaaagta ttctaaagaa atataaaatt ggactttatg 60ttggcctctg cttgtaatac aatgaaagta ttctaaagaa atataaaatt ggactttatg 60
agaaaataaa agtcatttca ctct 84agaaaataaa agtcatttca ctct 84
<210> 199<210> 199
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 199<400> 199
tctgttatgc catattttca ataaacctga aaacaa 36tctgttatgc catattttca ataaacctga aaacaa 36
<210> 200<210> 200
<211> 446<211> 446
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 200<400> 200
ggaaccacac gtacttatgc tgtaacttac tgtagcgttt acagcgttac cgctgtctgg 60ggaaccacac gtacttatgc tgtaacttac tgtagcgttt acagcgttac cgctgtctgg 60
acagctgagt gtgtttctta ggaatataag ttttctttct gtgctttagt gagttcattc 120acagctgagt gtgtttctta ggaatataag ttttctttct gtgctttagt gagttcattc 120
agcagttcag taataaatat gtgaaacctt ttgtttcgaa aaaaattgct tctgtgttac 180agcagttcag taataaatat gtgaaacctt ttgtttcgaa aaaaattgct tctgtgttac 180
aacttacttt gttttatggt tcaggatcat ctgcataata gacaagtatt ctatcagtga 240aacttacttt gttttatggt tcaggatcat ctgcataata gacaagtatt ctatcagtga 240
gcgatatcct ggatcttgtt tgtgtagttt ggggttgaga caagtccaga ctgccctaaa 300gcgatatcct ggatcttgtt tgtgtagttt ggggttgaga caagtccaga ctgccctaaa 300
actcacgatc ttccttcctc ggccttctaa atgattggag gactccaaac ctaagtgatg 360actcacgatc ttccttcctc ggccttctaa atgattggag gactccaaac ctaagtgatg 360
gaagtaaaaa gaaacttata tgtcaagact cattttctct atcatttcat gtgacaattg 420gaagtaaaaa gaaacttata tgtcaagact cattttctct atcatttcat gtgacaattg 420
aaattagatt atttcttttt tcaatc 446aaattagatt atttcttttt tcaatc 446
<210> 201<210> 201
<211> 332<211> 332
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 201<400> 201
ggactttgct ggcagaaaag aagtacagat gaggttatag tttgaaaaac gttaattccg 60ggactttgct ggcagaaaag aagtacagat gaggttatag tttgaaaaac gttaattccg 60
tttattgact ttagaatgtt actttgcata gtatagacca ttacaatgga aagtacctgc 120tttattgact ttagaatgtt actttgcata gtatagacca ttacaatgga aagtacctgc 120
cttaagaaac aagaaaactg cagtttatag agaaagaatt ttcaattttg acccatgtac 180cttaagaaac aagaaaactg cagtttatag agaaagaatt ttcaattttg acccatgtac 180
ttaaaatttt tggtgtatac tgcagtgtag caaatgtttt gtggtgacgg tataaatggt 240ttaaaatttt tggtgtatac tgcagtgtag caaatgtttt gtggtgacgg tataaatggt 240
actgtttgtt atcttggatt aagagtggct agagaagttg gaagacgtgt gagaagttct 300actgtttgtt atcttggatt aagagtggct agagaagttg gaagacgtgt gagaagttct 300
ttatagagaa ttaaacatga aaattacatc tc 332ttatagagaa ttaaacatga aaattacatc tc 332
<210> 202<210> 202
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 202<400> 202
aacttgtgtt ctctgagagg aaaatactga agcagtagag aaatgacctg ctagagaata 60aacttgtgtt ctctgagagg aaaatactga agcagtagag aaatgacctg ctagagaata 60
aagttactgt taatgatacc 80aagttactgt taatgatacc 80
<210> 203<210> 203
<211> 93<211> 93
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 203<400> 203
gatgtctgga atggagcaca cctgggatgt agcactcttg ctatctgtcc ggtccttttt 60gatgtctgga atggagcaca cctgggatgt agcactcttg ctatctgtcc ggtccttttt 60
gttcaataaa gtcctgaggc aactctctct gtc 93gttcaataaa gtcctgaggc aactctctct gtc 93
<210> 204<210> 204
<211> 152<211> 152
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 204<400> 204
tgagctatga agttccggaa tttgtgtttt tcacagaaag ccttaccaac ttcagttact 60tgagctatga agttccggaa tttgtgtttt tcacagaaag ccttaccaac ttcagttact 60
ttaccaagac aatgtaatta ttgtttgatt ttataaagtc tacaacaatg atctcctatt 120ttaccaagac aatgtaatta ttgtttgatt ttataaagtc tacaacaatg atctcctatt 120
ttggtgtcag tttttcaata aagttttaat ta 152ttggtgtcag tttttcaata aagttttaat ta 152
<210> 205<210> 205
<211> 1841<211> 1841
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 205<400> 205
agcaggagca ggttttccaa aagcacccct cggaagtgtt tttgtcgtcg tttaaaatta 60agcaggagca ggttttccaa aagcacccct cggaagtgtt tttgtcgtcg tttaaaatta 60
tcaagtatct tcagagaaga ttattttctg ccttcagaaa ctgaaggaag gcttgggcct 120tcaagtatct tcagagaaga ttatttttctg ccttcagaaa ctgaaggaag gcttgggcct 120
agagaacgac agtaaggtgc gagcaccgga gacacttaac acagctcagt ccatggaagg 180agagaacgac agtaaggtgc gagcaccggga gacacttaac acagctcagt ccatggaagg 180
acgagttccc tcattggctg cctgtctcga aatccacgca agctgtggag gaaagaatta 240acgagttccc tcattggctg cctgtctcga aatccacgca agctgtggag gaaagaatta 240
ccctgctcat cctgccttct atcttggtgt ttaatgttgg gtgggcaaca agcacaaacc 300ccctgctcat ccctgccttct atcttggtgt ttaatgttgg gtgggcaaca agcacaaacc 300
tccctcccac cccctccaag actgttagag cagtgggcca gaccaagcgg cgcacttgaa 360tccctcccac cccctccaag actgttagag cagtgggcca gaccaagcgg cgcacttgaa 360
catggatcaa gagggtcccg gttttacttt ttatttttgt cagggtaggc agtcttgtgt 420catggatcaa gagggtcccg gttttacttt ttatttttgt cagggtaggc agtcttgtgt 420
ttgctttgtt caaagcaggg tctccctgtt ggccctggct ggccttatac tccacagcag 480ttgctttgtt caaagcaggg tctccctgtt ggccctggct ggccttatac tccacagcag 480
tcctgcctcc tcctcctagg tgctgggatt aaaggcgtgc gccaccacgc ccggctacag 540tcctgcctcc tcctcctagg tgctgggatt aaaggcgtgc gccaccacgc ccggctacag 540
cctgcatttt tatgcacatt ggtctgttaa gctagttgca ttctgtgcta ccggagggga 600cctgcatttt tatgcacatt ggtctgttaa gctagttgca ttctgtgcta ccggagggga 600
ctgaagttta atcacttgtc ttctattaaa aactagtgtt tgcctgggcc tggtgtgtat 660aactagtgtt tgcctgggcc tggtgtgtat 660
acctttagtt gcagcgcttg ggaggcagag gcaggcagac ttcatgagtt cagggacagg 720acctttagtt gcagcgcttg ggaggcagag gcaggcagac ttcatgagtt cagggacagg 720
caagcctgct ctacagattt ccaggatacc cagggctaca catagagaaa atgttaaaga 780caagcctgct ctacagattt ccaggatacc cagggctaca catagagaaa atgttaaaga 780
taaacaaaaa gctggacagt gggggagcac acctttaatc ccagcactcg ggaggcagag 840taaacaaaaa gctggacagt gggggagcac acctttaatc ccagcactcg ggaggcagag 840
gcaggcggat ttctgagttc gaggccagcc tggtctacag agtgagttcc aggacagcca 900gcaggcggat ttctgagttc gaggccagcc tggtctacag agtgagttcc aggacagcca 900
ggactacaca gagaaaccct gtctcagaaa aaaaacaaaa caaaaaccaa tgcagtgata 960ggactacaca gagaaaccct gtctcagaaa aaaaacaaaa caaaaaccaa tgcagtgata 960
gattgttgtt tcctaaacca catgtaccca ggaaatgccc actaaatttc acctggatca 1020gattgttgtt tcctaaacca catgtaccca ggaaatgccc actaaatttc acctggatca 1020
gtgttaactg atcattggga aatgaggtga ccaaaaatgc atcgcaacct tggacaaaca 1080gtgttaactg atcattggga aatgaggtga ccaaaaatgc atcgcaacct tggacaaaca 1080
gcatggctat ttaacattct gggatcctgc agaatcctgc atcttcctaa gtagggaagc 1140gcatggctat ttaacattct gggatcctgc agaatcctgc atcttcctaa gtagggaagc 1140
actgtagcat tggagagagg cctgggcgag cagagctaag gcttccattt ctggcttgct 1200actgtagcat tggagagagg cctgggcgag cagagctaag gcttccattt ctggcttgct 1200
tggaatttaa aacaagcttt tttctatata gtaaaagatt gtttttaaga tttttgcgtg 12601260
tgagtacatg ccaaagtagc caggaagtgt cacttgccct ggagctagaa ttactggcaa 1320tgagtacatg ccaaagtagc caggaagtgt cacttgccct ggagctagaa ttactggcaa 1320
atgaaggctc agaggtggat gctgggacca attctaggcc ctctgagaaa gcaggtgcac 1380atgaaggctc agaggtggat gctgggacca attctaggcc ctctgagaaa gcaggtgcac 1380
ttggcttgtg cctccagccc caaaggcgat ggcttattgt gagcctgagg ccagccaggg 1440ttggcttgtg cctccagccc caaaggcgat ggcttattgt gagcctgagg cgccaggg 1440
ttacagagac tcaagaaaca agtggggttg tccatgttgc tggagatgac ccaggtctat 1500tcagagac tcaagaaaca agtggggttg tccatgttgc tggagatgac ccaggtctat 1500
taggaccttg actacatgga tagacattct ggcagctagt atactgccat tggggcctat 1560taggaccttg actacatgga tagacattct ggcagctagt atactgccat tggggcctat 1560
ggagaagtag ccaccgagcc tatttagaaa gaaggactgc tggcaagctt ggtgtcacta 1620ggagaagtag ccaccgagcc tatttagaaa gaaggactgc tggcaagctt ggtgtcacta 1620
tgaaggcaga caaagatcga tgtattaacg accccgactc caaaaacact cgagggggcc 1680tgaaggcaga caaagatcga tgtattaacg accccgactc caaaaacact cgaggggggcc 1680
caaggtgggc tcagtggtta agagccgttc gcccaggggc tggagagttg gctcagtggt 1740caaggtgggc tcagtggtta agagccgttc gcccaggggc tggagagttg gctcagtggt 1740
accacatggt ggctcacaac catctgtaat gagatctgac gccctcttct ggtgtatctg 1800accacatggt ggctcacaac catctgtaat gagatctgac gccctcttct ggtgtatctg 1800
aagacagcta cagtgtactt acataaaata aataaatctt t 1841aagacagcta cagtgtactt acataaaata aataaatctt t 1841
<210> 206<210> 206
<211> 2035<211> 2035
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - альбумин - A64<223> mRNA coding sequence rpl32 - PpLuc(GC) - albumin - A64
- C30 - гистонSL - C30 - histoneSL
<400> 206<400> 206
ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60ggggcgctgc ctacgggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60
gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120
ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccggggcac gatcgccttc 180
accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240
ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300
gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360
gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420
ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480
ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540
tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600
ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660
ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720
cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780
ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840
gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900
cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960
aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020
gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 10801080
accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140
ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200
ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260ggcgtgaacc agcggggcga gctgtgcgtg cggggggccga tgatcatgag cggctacgtg 1260
aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320
atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380
aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 14401440
aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500
gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560
gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620
ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680
aagaagggcg gcaagatcgc cgtgtaagac tagtgcatca catttaaaag catctcagcc 1740aagaagggcg gcaagatcgc cgtgtaagac tagtgcatca catttaaaag catctcagcc 1740
taccatgaga ataagagaaa gaaaatgaag atcaatagct tattcatctc tttttctttt 1800taccatgaga ataagagaaa gaaaatgaag atcaatagct tattcatctc tttttctttt 1800
tcgttggtgt aaagccaaca ccctgtctaa aaaacataaa tttctttaat cattttgcct 1860tcgttggtgt aaagccaaca ccctgtctaa aaaacataaa tttctttaat cattttgcct 1860
cttttctctg tgcttcaatt aataaaaaat ggaaagaacc tagatctaaa aaaaaaaaaa 1920cttttctctg tgcttcaatt aataaaaaat ggaaagaacc tagatctaaa aaaaaaaaaa 1920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa atgcatcccc 1980aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa atgcatcccc 1980
cccccccccc cccccccccc cccccccaaa ggctcttttc agagccacca gaatt 2035cccccccccc cccccccccc cccccccaaa ggctcttttc agagccacca gaatt 2035
<---<---
Claims (37)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EPPCT/EP2013/003946 | 2013-12-30 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016131391A Division RU2717986C2 (en) | 2013-12-30 | 2014-12-30 | Artificial molecules of nucleic acid |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2774415C1 true RU2774415C1 (en) | 2022-06-21 |
Family
ID=
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116004696A (en) * | 2023-02-01 | 2023-04-25 | 郑州贝贝生物科技有限公司 | 3' -UTR (UTR) stem-loop added structure gene capable of being combined with IRES (IRES), application thereof and mRNA (messenger ribonucleic acid) expression system |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007068265A1 (en) * | 2005-12-12 | 2007-06-21 | Research Corporation Technologies, Inc. | Hybrid 3’ untranslated regions suitable for efficient protein expression in mammalian cells |
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007068265A1 (en) * | 2005-12-12 | 2007-06-21 | Research Corporation Technologies, Inc. | Hybrid 3’ untranslated regions suitable for efficient protein expression in mammalian cells |
Non-Patent Citations (1)
Title |
---|
LEDDA M., Effect of 3'UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, 2005, v.344, p.213-220. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116004696A (en) * | 2023-02-01 | 2023-04-25 | 郑州贝贝生物科技有限公司 | 3' -UTR (UTR) stem-loop added structure gene capable of being combined with IRES (IRES), application thereof and mRNA (messenger ribonucleic acid) expression system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2717986C2 (en) | Artificial molecules of nucleic acid | |
JP7245878B2 (en) | Artificial nucleic acid molecule | |
KR102580696B1 (en) | Novel artificial nucleic acid molecules | |
US11345920B2 (en) | Artificial nucleic acid molecules for improved protein expression | |
US20160304883A1 (en) | Artificial nucleic acid molecules | |
AU2014375402A1 (en) | Artificial nucleic acid molecules | |
US11254951B2 (en) | Artificial nucleic acid molecules | |
RU2774415C1 (en) | Artificial nucleic acid molecules | |
EP3090053B1 (en) | Artificial nucleic acid molecules | |
RU2772349C2 (en) | Artificial nucleic acid molecules |